APP下载微信 注册登录
010-65363526rmzk001@163.com
首页 > 栏目 > 科学 > 正文

微软开源DeepSpeed Chat帮用户训练模型

2023-04-15 19:50:42    澎湃新闻

微软宣布开源DeepSpeed Chat,训练速度可提升15倍以上。

当地时间4月12日,微软宣布开源系统框架DeepSpeed Chat,帮助用户训练类似于ChatGPT的模型。与现有系统相比,DeepSpeed Chat的速度快15倍以上,可提升模型的训练和推理效率。

ChatGPT是OpenAI于去年11月推出的聊天机器人,其训练基础是为RLHF(Reinforcement Learning from Human Feedback),即基于人工反馈进行强化学习。

对于想要开发类似于ChatGPT模型的研究人员而言,难题之一是市面上缺乏支持端到端的RLHF系统框架。为此,微软开源其系统框架DeepSpeed Chat,帮助数据科学家和研究者更易于使用ChatGPT类型的模型。

据介绍,DeepSpeed Chat能够简化ChatGPT类型模型的训练过程、强化推理体验。其中的DeepSpeed-RLHF系统能够在推理和训练两种模式之间进行切换,使复杂的RLHF训练速率更快、易于大规模推广。

根据微软,DeepSpeed-HE比现有系统快15倍以上,且成本更低。在微软云Azure上,该系统只需9小时即可训练一个OPT-13B模型,只需18小时即可训练一个OPT-30B模型,且这两种训练分别花费不到300美元和600美元(OPT为脸书母公司Meta发布的语言模型)。

此外,面对于拥有1750亿参数的模型,DeepSpeed-HE的训练时间只需不到一天的时间。

对于微软开源DeepSpeed Chat,海外知名科技社区Hacker News的用户总结道,微软不仅向OpenAI投资了100亿美元,同时还为公众提供一种免费工具,帮助他们研发OpenAI同款产品。也有用户认为,微软选择开源DeepSpeed Chat,是为了在业内获得领先优势。

还有用户认为这一系统框架前景可期,“我可以预见,未来每家公司都会拥有自己的‘AI模型助理’,其能够定期对公司内部数据进行培训或更新。公司的电子邮件、slack/team消息、文档等或许都将成为AI模型的数据来源。”

微软和OpenAI的合作可以追溯到2019年,在这一年OpenAI获得了微软10亿美元的投资,并对微软独家授权部分AI技术,双方合作替微软云Azure开发人工智能技术。

今年2月初,微软推出搭载ChatGPT同源功能的新版必应(Bing),使得该软件的全球下载量在一夜之间猛增10倍,并蹿升至苹果App Store应用商店最受欢迎的免费应用榜中的第十位。(杨阳)

(责编:赵珊)

相关热词搜索:

上一篇:张晟:在科技赛场上奔跑
下一篇:科学家试图建立廉价易得的原料转化“细胞工厂”

人民周刊网版权及免责声明:

1.凡本网注明“来源:人民周刊网”或“来源:人民周刊”的所有作品,版权均属于人民周刊网(本网另有声明的除外);未经本网授权,任何单位及个人不得转载、摘编或以其它方式使用上述作品;已经与本网签署相关授权使用协议的单位及个人,应注意作品中是否有相应的授权使用限制声明,不得违反限制声明,且在授权范围内使用时应注明“来源:人民周刊网”或“来源:人民周刊”。违反前述声明者,本网将追究其相关法律责任。

2.本网所有的图片作品中,即使注明“来源:人民周刊网”及/或标有“人民周刊网(www.peopleweekly.cn)”“人民周刊”水印,但并不代表本网对该等图片作品享有许可他人使用的权利;已经与本网签署相关授权使用协议的单位及个人,仅有权在授权范围内使用图片中明确注明“人民周刊网记者XXX摄”或“人民周刊记者XXX摄”的图片作品,否则,一切不利后果自行承担。

3.凡本网注明“来源:XXX(非人民周刊网或人民周刊)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

4.如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。

※ 联系电话:010-65363526 邮箱:rmzk001@163.com