人手一个专属ChatGPT？微软开源“傻瓜式”工具训练速度提升15倍-环球信息

发布日期：2023-04-13 13:10:44 来源：科创板日报

《科创板日报》4月13日讯（编辑郑远方）当地时间4月12日，微软宣布开源DeepSpeed-Chat，帮助用户轻松训练类ChatGPT等大语言模型，人人都有望拥有专属ChatGPT。

开源地址：https://github.com/microsoft/DeepSpeed

OpenAI之前明确表示拒绝开源GPT-4，也收获了无数“OpenAI并不open”的吐槽。而AI开源社区已推出LLaMa、Vicuna、Alpaca等多个模型，帮助开发者开发类ChatGPT模型。

即便如此，现有解决方案下训练数千亿参数的最先进类ChatGPT模型依旧困难，主要瓶颈便在于缺乏RLHF训练普及——而微软本次开源的DeepSpeed-Chat，便补齐了最后这一块“短板”，帮助在模型训练中加入完整RLHF流程的系统框架。

(资料图片)

仅需一个脚本，便可以完成RLHF训练的全部三个阶段，类ChatGPT大语言模型生成唾手可得，堪称“傻瓜式操作”。

图|DeepSpeed-Chat的RLHF 训练流程图示，包含了一些可选择功能（来源：微软）

这还不是DeepSpeed-Chat唯一的优势，微软提供了中、英、日三语文档，作出了详细介绍。总体来说，其核心功能与性能包括：

1. 简化类ChatGPT模型训练、强化推理体验。

2. DeepSpeed-RLHF模块复刻了InstructGPT论文中的训练模式。同时，DeepSpeed将训练引擎与推理引擎共同整合到了一个统一混合引擎用于RLHF训练。

3. 高效性和经济性：可将训练速度提升15倍以上，并大幅度降低成本。例如，DeepSpeed-HE若在Azure云上训练一个OPT-30B模型，仅需18小时、花费不到300美元。

4. 卓越的扩展性：可支持训练数千亿参数模型，并在多节点多GPU系统上扩展性突出，只需1.25小时就可完成训练一个130亿参数模型。

5. 实现RLHF训练普及化：仅凭单个GPU，DeepSpeed-HE就能支持训练超过130亿参数的模型。因此无法使用多GPU系统的数据科学家和研究者，不仅能创建轻量级RLHF模型，还能创建大型且功能强大的模型。

此外，与Colossal-AI、HuggingFace等其他RLHF系统相比，DeepSpeed-RLHF在系统性能和模型可扩展性方面表现出色：

就吞吐量而言，DeepSpeed在单个GPU上的RLHF训练中实现10倍以上改进；多GPU设置中，则比Colossal-AI快6-19倍，比HuggingFace DDP快1.4-10.5倍。

就模型可扩展性而言，Colossal-AI可在单个GPU上运行最大1.3B的模型，在单个A100 40G 节点上运行6.7B的模型，而在相同的硬件上，DeepSpeed-HE可分别运行6.5B和50B模型，实现高达7.5倍提升。

因此，凭借超过一个数量级的更高吞吐量，DeepSpeed-RLHF比Colossal-AI、HuggingFace，可在相同时间预算下训练更大的actor模型，或以1/10的成本训练类似大小的模型

标签：

上一篇:天天简讯:u盘联网装系统-(u盘联网装系统怎么装) 下一篇:天天简讯:u盘联网装系统-(u盘联网装系统怎么装)

阳坤公司创始人孟祥坤：做世人买得起、用着好的家用医疗器械

盈盛控股乔迎宾：不显山露水潜心打造“智能办公”

郑州聚诚医院院长楚天元：大医精诚演绎“骨科风云”

中沃防火门马忠良：前半生守国门后半生护家门

“环保管家”韩娜：东北“女汉子”的超强“她力量”

行业动态更多>>

兰州名师话“美育”：“尚乐立人”分层培优以“美”润教

x 广告

人手一个专属ChatGPT？微软开源“傻瓜式”工具 训练速度提升15倍-环球信息

开源地址：https://github.com/microsoft/DeepSpeed

图|DeepSpeed-Chat的RLHF 训练流程图示，包含了一些可选择功能（来源：微软）

人手一个专属ChatGPT？微软开源“傻瓜式”工具 训练速度提升15倍-环球信息

《科创板日报》4月13日讯（编辑郑远方）当地时间4月12日，微软宣布开源DeepSpeed-Chat，帮助用户轻松训...

天天简讯:u盘联网装系统-(u盘联网装系统怎么装)

u盘联网装系统(u盘联网装系统怎么装)把电脑系统装入U盘里，其实完全可以实现，只是很多人还不知道。放在...

风光股份：4月12日融资买入293.34万元，融资融券余额5202.22万元|环球今热点

4月12日，风光股份（301100）融资买入293 34万元，融资偿还174 19万元，融资净买入119 15万元，融资余额5202 22万元。

闵行这2条交通主干道即将投入维修，就在浦江镇_最新快讯

据闵行区浦江镇消息，闵浦地区两条交通主干道江玮路（姚家浜-三鲁公路）和江文路（三鲁公路-召楼路）将...

行业资讯|世界观天下

千禾味业去年净利润增长超五成千禾味业近日发布2022年年度报告称，实现营业收入24 36亿元，同比增长26...

中老铁路首趟国际旅客列车发车

北京时间4月13日8点08分，中老铁路首趟国际客运列车D887次旅客列车从昆明南发车，开往老挝万象。从今天...

河南省财政下达9530万元支持残疾儿童康复救助|世界时快讯

河南日报记者胡舒彤4月11日，记者从省财政厅获悉，近日，省财政下达省级彩票公益金9530万元，支持各地实...

今日晚间原油价格交易提醒（2023年4月12日）

周三(4月12日)，YX原油在创出1月27日以来新高至81 85美元 桶后回落转跌。市场等待日内晚些时候即将公...

冰箱上能放重物吗 冰箱上可以放重物嘛

1、冰箱上不能放重物。2、如果在冰箱上面放重物,时间久了会出现变形的现象,而且在冰箱顶部有保温层,重物...

10000人！ 天天观天下

17天时间，我的AI星球打破了知识星球的一项纪录：破1万付费会员的最快速度。这个星球的创立源自于一个月...

vlookup跨表两个表格匹配相同数据_表格匹配相同数据-全球短讯

1、Excel中可以用Vlookup函数把两个表相同的数据匹配出来且附上另外一个表的值。2、软件版本：Office201

防山火保供电 文山州筑牢电力线路“防火线”

截至目前，共处置35千伏及以上输电线路附近山火390起，共计出动车辆256台次、出动人员4692人次，涉及170...

聚焦数字化赋能 大龙网携两大创新亮相消博会_焦点快看

大龙网集团董事长冯剑峰作为主讲嘉宾参与全球电子商务大会。大龙网供图人民网海口4月11日电（孟凡盛）4...

蜀汉外国语实验小学：幼小衔接促发展，双向奔赴共成长 天天快播报

4月10日，成都市蜀汉外国语实验小学举行了以“围绕专注力培养，聚焦小学语文课堂教师评价语的作用”为主...

“小目标 大激励” 南通如皋出入境边防检查站巧用“添光彩荣誉卡”激发队伍活力 今日看点

“我给自己定的目标是通过公共英语三级考试，取得中级检查员等级考试。”昨天（4月11日），南通如皋出入...

秦三世简历_秦三世 当前短讯

1、秦三世子婴(公元前？～前206年)，秦始皇孙，胡亥侄。2、胡亥自刎后继位。3、在位46日。4、刘邦兵到灞上(今陕

腾讯云推出业内首个“全真互联博物馆”-世界观天下

“全真互联”的概念由腾讯首提，指通过多种终端和形式，实现对真实世界全面感知、连接、交互的一系列技...

个人征信报告是什么样子的

个人征信报告记录个人身份信息、证件号码、银行卡记录及相关金融业务数据报告。同时，信用报告还具有个...

全球热消息：特斯拉Model2，真能帮马斯克一统天下？

特斯拉最便宜的车型Model2的声音是越来越多了。最近，Model2的谍照也已经被抓拍，眼看着离量产也不远了...

每日聚焦：AMD：更大的显存对显卡的游戏表现提升明显

​AMD日前发表了一篇名为《BuildinganEnthusiastPC》的博客文章，提醒玩家显卡的显存容量和性能同样重要。

中航证券：给予万兴科技买入评级

中航证券有限公司裴伊凡,卢正羽近期对万兴科技进行研究并发布了研究报告《对标Adobe，AIGC公生态初长成...

走进博物馆 感受传统文化 视点

阳光讯(白焕霞记者张磊)4月6日-7日，成泰清华园幼儿园组织幼儿走进神木市博物馆参观，共同欣赏民族文化...

快讯：大小指数走势分化创指跌0.5% 消费电子板块活跃 观天下

4月12日消息，大小指数开盘后走势分化，沪指向上震荡反弹，创业板指则跌超0 5%。板块方面，消费电子、...

【基层党建】金融下乡 兴村惠农 全球短讯

□本报记者祖兆林近年来，张家港农商银行凝心聚力打造以引领、融合、凝聚、共享为核心理念的“大家党建...

【播资讯】意天空记者：国米今夏面临严重的财政限制，还有很大的还款压力

直播吧4月11日讯意大利天空体育记者马尔凯蒂在接受TMW采访时表示，国米现在财务状况有点糟糕，而且面临...

天天短讯！钛白粉成本支撑延续，龙佰集团年内三次涨价

（经济）IMF预计今年中国经济增长5.2% 每日聚焦

高鸿业西方经济学微观部分考研历年真题题库视频网课笔记及课后题答案资料！-热资讯

环球关注：投资还是博傻？ 登康口腔上市首日涨幅高达215%

当前焦点!原油市场要闻：油价收复隔夜部分失地 全球最大原油进口国旅行需求回升

中古包买了会不会不好-天天热点

世界观天下！3d是什么意思啊(3d是什么意思啊C语言)

水晶光电(002273)：第六届第十二次董事会会议决议，审议《2022年度董事会工作报告》等多项议案|环球微头条

全球关注：接到民警电话，这位妈妈激动得大哭......

北京沙尘天气预计傍晚结束-全球今日讯

浙江安吉余村：“美丽乡村”焕发新活力

热点！武昌区华锦社区：“定制”暖心便民活动，升级“家门口”的幸福感

天津2023年高考英语第一次考试成绩可查

iPhone 15 Pro相机凸起3.78毫米：约2枚1元硬币厚度-环球今日报

做饭糊弄学，怎么突然就火了|每日热门

全球热推荐：realme真我有两款款新机通过了认证

人才服务中心职能（人才服务中心）|环球最新

世界热点！曾经被寄予厚望的潮流事物——电子书未来何去何从

世界要闻：丰添洗发水有副作用_丰添洗发水

天天简讯:传统的无机非金属材料有哪些?各有什么特点及作用_传统的无机非金属材料有哪些

全球热文：NS掌机最好玩的小众RPG游戏 知名度小 但是耐玩度高

深圳二手房：“小阳春”行情进入尾声？

渔帆暗涌结局攻略 痛苦的结局任务全流程一览[多图]

59家机构在互联网协会发布《加强未成年人保护游戏行业自律倡议》|全球即时看

【环球新视野】《“十四五”工业绿色发展规划》实施情况座谈会召开；

新集能源(601918)：新集能源2023年第一次临时股东大会决议公告，审议通过关于制定公司第十届董事、监事薪酬方案的议案等多项议案_天天讯息

陕西省长武县发布大风蓝色预警

人手一个专属ChatGPT？微软开源“傻瓜式”工具训练速度提升15倍-环球信息

人手一个专属ChatGPT？微软开源“傻瓜式”工具训练速度提升15倍-环球信息

周三(4月12日)，YX原油在创出1月27日以来新高至81 85美元桶后回落转跌。市场等待日内晚些时候即将公...

冰箱上能放重物吗冰箱上可以放重物嘛

10000人！天天观天下

防山火保供电文山州筑牢电力线路“防火线”

聚焦数字化赋能大龙网携两大创新亮相消博会_焦点快看

蜀汉外国语实验小学：幼小衔接促发展，双向奔赴共成长天天快播报

“小目标大激励” 南通如皋出入境边防检查站巧用“添光彩荣誉卡”激发队伍活力今日看点

秦三世简历_秦三世当前短讯

AMD日前发表了一篇名为《BuildinganEnthusiastPC》的博客文章，提醒玩家显卡的显存容量和性能同样重要。

走进博物馆感受传统文化视点

快讯：大小指数走势分化创指跌0.5% 消费电子板块活跃观天下

【基层党建】金融下乡兴村惠农全球短讯

环球关注：投资还是博傻？登康口腔上市首日涨幅高达215%

当前焦点!原油市场要闻：油价收复隔夜部分失地全球最大原油进口国旅行需求回升

全球热文：NS掌机最好玩的小众RPG游戏知名度小但是耐玩度高

渔帆暗涌结局攻略痛苦的结局任务全流程一览[多图]

网络电影内容品质升级单片付费模式成市场新增量

特斯拉计划下调美国市场汽车售价特斯拉在中国首次建立储能工厂

盈盛控股乔迎宾：不显山露水潜心打造“智能办公”

中沃防火门马忠良：前半生守国门后半生护家门

兰州名师话“美育”：“尚乐立人”分层培优以“美”润教

天津：划定封控区全市开展全员核酸检测

重庆姐弟被生父扔下坠亡案上诉期结束一审法院暂未收到两被告人上诉状