ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

掘力计划第23期 - MetaGPT:让每个人拥有专属智能体

时间:2023-09-15 11:58:40来源:互联网编辑:茹茹

9月9日,掘力计划第23期线上分享活动以“AIGC的应用和创新”为主题召开。本次活动的分享主题为《metaGPT:让每个人拥有专属智能体》,由深度赋智 NLP & AIGC 方向算法负责人洪思睿主讲。

图片1.png

洪思睿曾任智能控制上市企业 NLP 团队负责人,负责千万级行业知识图谱及多项自然语言处理技术的应用落地。在深度赋智,她负责法律、物流、美妆、电商等多个领域的知识问答、搜索系统及多模态应用等行业落地工作。他还开源了多智能体框架metaGPT,并在 NeurIPS AutoDL 顶级竞赛中获得世界冠军,相关工作及论文发表于顶级学术期刊《IEEE TPAMI》。

直播回放地址:https://juejin.cn/live/jpowermeetup23

大语言模型发展历程

图片2.png

洪思睿首先回顾了大语言模型技术的发展历程,从早期的 CBOW 自监督学习方法,到 BERT 的双向编码器以及 GPT-3 的巨大规模预训练,再到最近的 GPT-4,大语言模型取得了巨大的技术突破。

早期技术:SSL、Transformer 和 BERT

自2013年起,自然语言理解领域出现了一些新的技术趋势。早在2013年,CBOW 模型就使用了自监督学习的方法,将词嵌入到稠密的向量空间中,奠定了后来语言模型技术的基础。2017年,Transformer 模型则通过引入注意力机制,改善了 CNN 在长序列建模方面的困难。随后在2018年,BERT 的出现则证明了规模化预训练对自然语言理解的巨大提升,只需要在特定下游任务进行微调就可以取得非常强的效果。具体来说,BERT使用了多层 Transformer 编码器进行预训练,通过 masked language model 和 next sentence prediction 等任务获得了语义理解能力,然后在下游任务中进行微调从而适应特定领域。

GPT-3的预训练范式

图片3.png

相比 BERT 采用预训练与微调相结合的方法,OpenAI 的 GPT 系列模型更加强调巨大规模的单向预训练。以 GPT-3 为例,它拥有高达 1750 亿参数,但没有进行微调就直接进行预训练并应用。GPT-3 证明了更大规模的模型即使不经微调也可以取得较强的泛化性能。随着模型规模的扩大,GPT-3 展现出了更强的 Few-Shot 学习能力。

Instruction Tuning

在 GPT-3 之后,研究者提出了指令微调(Instruction Tuning)的训练方法,使用自然语言指令引导模型学习,可以进一步提升大规模预训练语言的数据利用能力,增强泛化能力。例如,基于该方法调优后的模型,即使在未见过的数据集上也可以取得更高的准确率。这为模型带来了更好的迁移学习能力。

InstructGPT

Instruction Tuning 的idea也被 OpenAI 借鉴到了 InstructGPT 模型中。该模型不仅使用了指令微调,还利用了基于人类反馈的强化学习进行来降低模型输出的毒性。实验证明,使用人类反馈进行调优后,模型的输出质量可以大幅提升,信息量更大,偏向性和有毒性内容更少,更符合人类期待。

GPT-4时代的到来

图片4.png

今年3月,OpenAI 发布了 GPT-4 模型,其规模达到了 GPT-3 的 10 倍以上,参数量高达 18000 亿。为实现这样大规模模型的高效推理,OpenAI 采用了混合专家(Mixture of Experts)技术。具体来说,GPT-4 包含了 16 个规模约为 1110 亿参数的专家模型,每次推理会调用 2 个专家,并在专家之间共享部分权重。在训练数据方面,GPT-4 使用了约 130 万亿个词元进行预训练,是目前最大规模的语言模型。为实现高效训练,OpenAI 采用了多达 8k 的上下文序列长度,以及可变序列批处理和流水线等技术。

GPT-4 的到来预示着语言模型技术已经进入一个新的阶段,各大企业和机构也纷纷推出了自己的预训练语言模型。在模型评测领域,MMLU 基准测试已经成为衡量不同语言模型能力的标准测试集。各模型在 MMLU 基准测试中的排名也成为大家关注的焦点。

metaGPT:构建多智能体框架

图片5.png

在模型技术日益成熟的背景下,模型的落地应用也成为一个重要方向。洪思睿介绍了他们多智能体框架 metaGPT。该框架可以通过简单的自然语言描述完成完整的软件开发过程中的文档输出和代码生成工作。

metaGPT 通过定义不同的角色,如产品经理、架构师、工程师等,让每个角色负责软件开发过程中的不同阶段,实现流水线式的协同工作。具体来说,产品经理会根据需求输出产品文档,架构师负责设计架构图,最后工程师根据上游输出进行代码实现。

实验证明,metaGPT 生成的代码质量明显优于其他基于智能体框架的代码生成效果。因为上游角色的输出为下游工程师提供了完整的上下文信息,将原始的需求/任务进行了更细化和结构化的拆解,减少了歧义,提升了最终代码的可靠性。在多个数据集上的评测也证明了 metaGPT 生成代码的优异性能。

智能体技术的应用前景

图片6.png

洪思睿认为,基于大语言模型训练的智能体将会成为未来社会的重要组成部分。未来的人机交互范式也会从嵌入式模式,发展到辅助模式,再到代理模式,最终达到人机深度协作的社会化模式。在这个模式下,人类和智能体既可以自主提出需求,也可以相互提供资源来完成任务。

此外,未来互联网的门户也将从 App 变成智能体。用户只需要向单个或多个智能体提出需求,由智能体负责完成整个工作流程,包括调用不同的软件程序、设定参数等。这将极大提升人机协同的效率,更进一步带来生活和工作方式的变革。

总结

本次分享活动洪思睿详细介绍了大语言模型技术的发展历程,以及最新的GPT-4等前沿技术。她从他们开源的工作metaGPT展开,展示了如何构建多智能体协作框架,并展望了智能体技术在简化人机交互等方面的应用前景。这次活动内容丰富,对于理解当前AI技术发展具有重要参考价值。

掘力计划

掘力计划由稀土掘金技术社区发起,致力于打造一个高品质的技术分享和交流的系列品牌。聚集国内外顶尖的技术专家、开发者和实践者,通过线下沙龙、闭门会、公开课等多种形式分享最前沿的技术动态。(作者:孔恒伟)

更多热门内容
贝壳董事会主席拟捐赠股票投入居住领域并长期运营
4月17日,贝壳最新公告显示,贝壳董事会主席、首席执行官及控股股东彭永东拟捐赠9,000,000股A类贝壳普通股。在承担相应的纳税义务后,此次捐赠股票将50%税后资金用于居住行业服务者及其家庭成员的医疗健康福利、50%税后资金用于应届毕业生等租客群体的租房帮扶。据悉,

2025-04-17

心所想AI所向,2025凯度品牌日暨春季新品发布会盛大举行
面对厨电行业智能化、品质化升级趋势。4月16日,凯度成功举办了以“心所想·AI所向”为主题的2025凯度品牌日暨春季新品发布会。凯度CEO柯漫、董事长傅平及明星生活家王真儿依次登场,通过理念分享、技术解读、场景演绎,全面诠释“高端新厨电”;重磅推出首个AI数字生命体“

2025-04-17

FF为股民而战:五大举措启动“非法做空阻击战”,打赢梦想实现战
4月17日,Faraday Future(简称“FF”)今日宣布,为捍卫股东价值与信心,公司正式启动五大核心举措,标志着“梦想实现战之潜在非法做空反击战”的正式打响。在公司昨日提交Form D文件后,市场上迅速传播出一系列谣言——包括错误声称Form D表明高管正在出售股份;股价跌破

2025-04-17

Mureka火爆海外,今日正式开放国内登陆入口和API
2024年4月,昆仑万维发布了第一代音乐生成模型Mureka V1(SkyMusic)。2024年8月14日,昆仑万维推出AI音乐商用创作平台Mureka。2025年3月26日,正式发布Mureka O1模型与Mureka V6模型。自Mureka上线以来,在海内外获得了非常好的市场反响,成为全球AI音乐界现象级产品。

2025-04-16

问界M8正式发布:车载小艺一路聊,随时随地问问小艺
4月16日,家庭智慧旗舰SUV鸿蒙智行问界M8正式发布上市,据悉其搭载的鸿蒙座舱重塑家庭出行交互新范式,车载智慧助手小艺能力再升级,展现出卓越的语音交互能力,有问题随时随地都可以问问小艺。全新的小艺搜歌功能,仅需告诉小艺歌词与背景信息,即可“搜”听到想听的歌

2025-04-16

掘金AI千亿赛道 金山云获战略股东持续增持
2025年4月16日,金山云(NASDAQ:KC,HKEX:3896)宣布,将公开发行18,500,000股美国存托股(ADS),每ADS代表该公司15股普通股。同时,金山云还授予ADS承销商购买额外美国存托股的30天选择权。并且,为了方便港美股两地投资者认购,投资者可以选择在此次发行中以普通股代替AD

2025-04-16

昂瑞微客户到底是谁,招股说明书闪烁其词
2025年3月28日,北京昂瑞微电子技术股份有限公司(下称“昂瑞微”)科创板IPO申请获受理,成为今年首家未盈利企业申报案例。作为射频前端芯片领域的“国产替代先锋”之一,昂瑞微凭借20.67亿元募资计划、50.88%的营收复合增长率引发市场关注。然而,对于其招股书中客户信

2025-04-16

昂瑞微靠低端产品增收,5G增长乏力,上市之路能走多远?
3月28日,北京昂瑞微电子技术股份有限公司(以下简称“昂瑞微”)向上交所递交IPO申请。作为主营射频前端芯片、射频SoC芯片的集成电路设计企业,其招股书披露的财务数据看似亮眼:2022-2024年累计营收47.19亿元,复合增长率达50.88%。但穿透数据表象可见,公司增长动能过

2025-04-16

小刀电动车怎么样?以科技、美学重构时尚标杆,三登“Ray时尚”TOP榜
凭借卓越的综合实力与对市场需求的精准洞察,近日,小刀电动车产品再次登上“Ray时尚”电动自行车TOP榜,以及“Ray时尚”可持续时尚企业。这是小刀电动车连续三年(2023-2025年)斩获殊荣。这一成就不仅体现了其产品在设计、性能、品质上的持续突破,更印证了品牌“科技

2025-04-15

京东新品成长“百千亿”计划:2025年将打造600款销售亿级新品
4月15日,2025京东新品年度盛典在北京举行,正式推出京东新品成长“百千亿”计划,即在2025年加码百亿流量和百亿资金,并围绕营销能力与数字能力全面升级,实现60000款新品年销售破百万、6000款新品年销售破千万、600款新品年销售破亿。在此次盛典活动上,京东宣布“京

2025-04-15