当前位置:首页 > 游戏 >

迷你世界模型怎么添加在创造模式(迷你世界资源库怎么添加模型)

来源:原点资讯(www.yd166.com)时间:2023-04-19 10:17:47作者:YD166手机阅读>>

机器之心专栏

微软DeepSpeed组

昨日,微软开源的 DeepSpeed Chat 引起了AI社区的广泛关注。

它让我们能够以更低的成本、更快的速度训练类似于ChatGPT的高质量大模型。

迷你世界模型怎么添加在创造模式,迷你世界资源库怎么添加模型(1)

链接:https://github.com/microsoft/DeepSpeed/tree/master/blogs/deepspeed-chat

本文对开源的 DeepSpeed Chat 进行了详细的介绍。该博客由微软DeepSpeed组官方撰写并译制,并授权「开源社」首发于中文社区,机器之心转载。

概述

近日来,ChatGPT 及类似模型引发了人工智能(AI)领域的一场风潮。这场风潮对数字世界产生了革命性影响。ChatGPT 类模型具有惊人的泛用性,能够执行归纳、编程、翻译等任务,其结果与人类专家相当甚至更优。为了使 ChatGPT 等模型的训练和部署更轻松,AI 开源社区进行了各种尝试(例如 ChatLLaMa、Alpaca、Vicuna、Databricks-Dolly 等)。

然而,尽管开源社区付出了巨大的努力,目前仍缺乏一个支持端到端的基于人工反馈机制的强化学习(RLHF)的规模化系统,这使得训练强大的类 ChatGPT 模型十分困难。例如,使用现有的开源系统训练一个具有 67 亿参数的类 ChatGPT 模型通常需要昂贵的多卡至多节点的 GPU 集群,但这些资源对大多数数据科学家或研究者而言难以获取。同时,即使有了这样的计算资源,现有的开源系统的训练效率通常还不到这些机器所能达到的最大效率的 5%。简而言之,即使有了昂贵的多 GPU 集群,现有解决方案也无法轻松、快速、经济的训练具有数千亿参数的最先进的类 ChatGPT 模型。

ChatGPT 模型的训练是基于 InstructGPT 论文中的 RLHF 方式。这与常见的大语言模型的预训练和微调截然不同。这使得现有深度学习系统在训练类 ChatGPT 模型时存在种种局限。因此,为了让 ChatGPT 类型的模型更容易被普通数据科学家和研究者使用,并使 RLHF 训练真正普及到 AI 社区,我们发布了 DeepSpeed-Chat。DeepSpeed-Chat 具有以下三大核心功能:

(i)简化 ChatGPT 类型模型的训练和强化推理体验:只需一个脚本即可实现多个训练步骤,包括使用 Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤、甚至生成你自己的类 ChatGPT 模型。此外,我们还提供了一个易于使用的推理 API,用于用户在模型训练后测试对话式交互。

(ii)DeepSpeed-RLHF 模块:DeepSpeed-RLHF 复刻了 InstructGPT 论文中的训练模式,并确保包括 a) 监督微调(SFT),b) 奖励模型微调和 c) 基于人类反馈的强化学习(RLHF)在内的三个步骤与其一一对应。此外,我们还提供了数据抽象和混合功能,以支持用户使用多个不同来源的数据源进行训练。

(iii)DeepSpeed-RLHF 系统:我们将 DeepSpeed 的训练(training engine)和推理能力(inference engine) 整合到一个统一的混合引擎(DeepSpeed Hybrid Engine or DeepSpeed-HE)中用于 RLHF 训练。DeepSpeed-HE 能够在 RLHF 中无缝地在推理和训练模式之间切换,使其能够利用来自 DeepSpeed-Inference 的各种优化,如张量并行计算和高性能 CUDA 算子进行语言生成,同时对训练部分还能从 ZeRO- 和 LoRA-based 内存优化策略中受益。DeepSpeed-HE 还能够自动在 RLHF 的不同阶段进行智能的内存管理和数据缓存。

DeepSpeed-RLHF 系统在大规模训练中具有无与伦比的效率,使复杂的 RLHF 训练变得快速、经济并且易于大规模推广:

高效性和经济性:DeepSpeed-HE 比现有系统快 15 倍以上,使 RLHF 训练快速且经济实惠。例如,DeepSpeed-HE 在 Azure 云上只需 9 小时即可训练一个 OPT-13B 模型,只需 18 小时即可训练一个 OPT-30B 模型。这两种训练分别花费不到 300 美元和 600 美元。

迷你世界模型怎么添加在创造模式,迷你世界资源库怎么添加模型(2)

表 1. 单节点 8x A100:训练时长及预估的 Azure 费用。

卓越的扩展性:DeepSpeed-HE 能够支持训练拥有数千亿参数的模型,并在多节点多 GPU 系统上展现出卓越的扩展性。因此,即使是一个拥有 130 亿参数的模型,也只需 1.25 小时就能完成训练。而对于庞大的 拥有 1750 亿参数的模型,使用 DeepSpeed-HE 进行训练也只需不到一天的时间。

迷你世界模型怎么添加在创造模式,迷你世界资源库怎么添加模型(3)

表 2. 多节点 64x A100-80GB:训练时长及预估的 Azure 费用。

非常重要的细节:上述两个表格(即表一和表二)中的数据均针对 RLHF 训练的第 3 步,基于实际数据集和 DeepSpeed-RLHF 训练吞吐量的测试。该训练在总共 1.35 亿(135M)个字符(token)上进行一个时期(epoch)的训练。我们总共有 6750 万个查询(query)字符(131.9k 个 query,每个序列长度为 256)和 6750 万个生成 / 回答字符(131.9k 个答案,每个序列长度为 256),每步的最大全局字符批量大小约为 500 万个字符(1024 个查询 - 答案对)。在与 DeepSpeed-RLHF 进行任何成本和端到端时间比较之前,我们建议读者注意这些设定。想要了解更多详细信息,请参阅我们的页面 benchmark setting。

实现 RLHF 训练的普及化:仅凭单个 GPU,DeepSpeed-HE 就能支持训练超过 130 亿参数的模型。这使得那些无法使用多 GPU 系统的数据科学家和研究者不仅能够轻松创建轻量级的 RLHF 模型,还能创建大型且功能强大的模型,以应对不同的使用场景。

迷你世界模型怎么添加在创造模式,迷你世界资源库怎么添加模型(4)

首页 1234下一页

栏目热文

狂欢是什么意思呢(一个人的狂欢是什么意思)

狂欢是什么意思呢(一个人的狂欢是什么意思)

近年来流行的部分网络用语 资料图片规范语言使用应从娃娃抓起,图为语文老师正在教小学生书写字词。新华社发【热点观察】11月...

2023-04-19 09:58:24查看全文 >>

热闹纷飞什么意思啊(梨花纷飞的意思)

热闹纷飞什么意思啊(梨花纷飞的意思)

描写四季的成语春天:阳春三月、春光明媚、春回大地、春暖花开、春意盎然、春意正浓、风和日丽、春花烂漫、鸟语花香、百鸟鸣春、...

2023-04-19 10:20:45查看全文 >>

相聚欢欣什么意思(洋溢有高兴的意思吗)

相聚欢欣什么意思(洋溢有高兴的意思吗)

来源:北京青年报大型寻亲节目《等着我》第四季5月20日起在央视一套每周日晚间八点档播出,首期表现可谓惊艳:实时直播关注度...

2023-04-19 09:57:21查看全文 >>

相逢时节的意思(相逢时节解释)

相逢时节的意思(相逢时节解释)

一段婚姻中,最忌讳的就是有第三者插足,但凡夫妻感情好一点,都不会让第三者有机可乘,然而在《相逢时节》中,看似一家子幸福美...

2023-04-19 09:55:06查看全文 >>

狂欢夜意思(狂欢日什么意思)

狂欢夜意思(狂欢日什么意思)

狂欢夜,我们应该过吗 作为一个九零后的我,今天朋友打电话问我狂欢夜怎么过,和谁过啊什么的,我说狂欢节是什么节日,跟我也没...

2023-04-19 10:02:23查看全文 >>

迷你世界怎么上传自己的微型模型(迷你世界怎么上传存档)

迷你世界怎么上传自己的微型模型(迷你世界怎么上传存档)

哎嘿,最近迷你世界更新,大家伙可以制作自己感兴趣的插件包了,让游戏增添了更多趣味性。打开资源工坊,看到有很多小伙伴已经制...

2023-04-19 09:32:48查看全文 >>

迷你世界怎么打开做好的微缩模型(迷你世界怎么找到添加的微缩模型)

迷你世界怎么打开做好的微缩模型(迷你世界怎么找到添加的微缩模型)

微缩这个功能也出了一段时间了,可以说这个功能给创作带来了无限的创意和灵感,解决了很多常规方块无法办到的事情,下面介绍一下...

2023-04-19 09:43:35查看全文 >>

迷你世界如何把模型分享出去(迷你世界如何转载别人的模型)

迷你世界如何把模型分享出去(迷你世界如何转载别人的模型)

各位小伙伴们大家好啊,今天同样是为大家带来迷你世界的资讯了,迷你世界作为当下最为火爆的沙盒类型开放世界游戏,拥有着极为大...

2023-04-19 09:51:47查看全文 >>

迷你世界怎么点微缩模型能打开(迷你世界微缩模型能打开的教程)

迷你世界怎么点微缩模型能打开(迷你世界微缩模型能打开的教程)

[闽南网]模型工作台是迷你世界新增加的一个道具,可以把一定范围内的建筑缩小到一个方块大小,那么迷你世界模型工作台怎么用?...

2023-04-19 10:06:22查看全文 >>

迷你世界怎么找出微型模型(迷你世界如何找到小模型)

迷你世界怎么找出微型模型(迷你世界如何找到小模型)

1998 年 7 月的 Macworld 大会上,乔布斯要向人们介绍一款尚未发布的 Mac 新品。台下的观众都很期待,这...

2023-04-19 10:05:47查看全文 >>

文档排行