ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

掘力计划第23期 - MetaGPT:让每个人拥有专属智能体

时间:2023-09-15 11:58:40来源:互联网编辑:茹茹

9月9日,掘力计划第23期线上分享活动以“AIGC的应用和创新”为主题召开。本次活动的分享主题为《metaGPT:让每个人拥有专属智能体》,由深度赋智 NLP & AIGC 方向算法负责人洪思睿主讲。

洪思睿曾任智能控制上市企业 NLP 团队负责人,负责千万级行业知识图谱及多项自然语言处理技术的应用落地。在深度赋智,她负责法律、物流、美妆、电商等多个领域的知识问答、搜索系统及多模态应用等行业落地工作。他还开源了多智能体框架metaGPT,并在 NeurIPS AutoDL 顶级竞赛中获得世界冠军,相关工作及论文发表于顶级学术期刊《IEEE TPAMI》。

直播回放地址:https://juejin.cn/live/jpowermeetup23

大语言模型发展历程

洪思睿首先回顾了大语言模型技术的发展历程,从早期的 CBOW 自监督学习方法,到 BERT 的双向编码器以及 GPT-3 的巨大规模预训练,再到最近的 GPT-4,大语言模型取得了巨大的技术突破。

早期技术:SSL、Transformer 和 BERT

自2013年起,自然语言理解领域出现了一些新的技术趋势。早在2013年,CBOW 模型就使用了自监督学习的方法,将词嵌入到稠密的向量空间中,奠定了后来语言模型技术的基础。2017年,Transformer 模型则通过引入注意力机制,改善了 CNN 在长序列建模方面的困难。随后在2018年,BERT 的出现则证明了规模化预训练对自然语言理解的巨大提升,只需要在特定下游任务进行微调就可以取得非常强的效果。具体来说,BERT使用了多层 Transformer 编码器进行预训练,通过 masked language model 和 next sentence prediction 等任务获得了语义理解能力,然后在下游任务中进行微调从而适应特定领域。

GPT-3的预训练范式

相比 BERT 采用预训练与微调相结合的方法,OpenAI 的 GPT 系列模型更加强调巨大规模的单向预训练。以 GPT-3 为例,它拥有高达 1750 亿参数,但没有进行微调就直接进行预训练并应用。GPT-3 证明了更大规模的模型即使不经微调也可以取得较强的泛化性能。随着模型规模的扩大,GPT-3 展现出了更强的 Few-Shot 学习能力。

Instruction Tuning

在 GPT-3 之后,研究者提出了指令微调(Instruction Tuning)的训练方法,使用自然语言指令引导模型学习,可以进一步提升大规模预训练语言的数据利用能力,增强泛化能力。例如,基于该方法调优后的模型,即使在未见过的数据集上也可以取得更高的准确率。这为模型带来了更好的迁移学习能力。

InstructGPT

Instruction Tuning 的idea也被 OpenAI 借鉴到了 InstructGPT 模型中。该模型不仅使用了指令微调,还利用了基于人类反馈的强化学习进行来降低模型输出的毒性。实验证明,使用人类反馈进行调优后,模型的输出质量可以大幅提升,信息量更大,偏向性和有毒性内容更少,更符合人类期待。

GPT-4时代的到来

今年3月,OpenAI 发布了 GPT-4 模型,其规模达到了 GPT-3 的 10 倍以上,参数量高达 18000 亿。为实现这样大规模模型的高效推理,OpenAI 采用了混合专家(Mixture of Experts)技术。具体来说,GPT-4 包含了 16 个规模约为 1110 亿参数的专家模型,每次推理会调用 2 个专家,并在专家之间共享部分权重。在训练数据方面,GPT-4 使用了约 130 万亿个词元进行预训练,是目前最大规模的语言模型。为实现高效训练,OpenAI 采用了多达 8k 的上下文序列长度,以及可变序列批处理和流水线等技术。

GPT-4 的到来预示着语言模型技术已经进入一个新的阶段,各大企业和机构也纷纷推出了自己的预训练语言模型。在模型评测领域,MMLU 基准测试已经成为衡量不同语言模型能力的标准测试集。各模型在 MMLU 基准测试中的排名也成为大家关注的焦点。

metaGPT:构建多智能体框架

在模型技术日益成熟的背景下,模型的落地应用也成为一个重要方向。洪思睿介绍了他们多智能体框架 metaGPT。该框架可以通过简单的自然语言描述完成完整的软件开发过程中的文档输出和代码生成工作。

metaGPT 通过定义不同的角色,如产品经理、架构师、工程师等,让每个角色负责软件开发过程中的不同阶段,实现流水线式的协同工作。具体来说,产品经理会根据需求输出产品文档,架构师负责设计架构图,最后工程师根据上游输出进行代码实现。

实验证明,metaGPT 生成的代码质量明显优于其他基于智能体框架的代码生成效果。因为上游角色的输出为下游工程师提供了完整的上下文信息,将原始的需求/任务进行了更细化和结构化的拆解,减少了歧义,提升了最终代码的可靠性。在多个数据集上的评测也证明了 metaGPT 生成代码的优异性能。

智能体技术的应用前景

洪思睿认为,基于大语言模型训练的智能体将会成为未来社会的重要组成部分。未来的人机交互范式也会从嵌入式模式,发展到辅助模式,再到代理模式,最终达到人机深度协作的社会化模式。在这个模式下,人类和智能体既可以自主提出需求,也可以相互提供资源来完成任务。

此外,未来互联网的门户也将从 App 变成智能体。用户只需要向单个或多个智能体提出需求,由智能体负责完成整个工作流程,包括调用不同的软件程序、设定参数等。这将极大提升人机协同的效率,更进一步带来生活和工作方式的变革。

总结

本次分享活动洪思睿详细介绍了大语言模型技术的发展历程,以及最新的GPT-4等前沿技术。她从他们开源的工作metaGPT展开,展示了如何构建多智能体协作框架,并展望了智能体技术在简化人机交互等方面的应用前景。这次活动内容丰富,对于理解当前AI技术发展具有重要参考价值。

掘力计划

掘力计划由稀土掘金技术社区发起,致力于打造一个高品质的技术分享和交流的系列品牌。聚集国内外顶尖的技术专家、开发者和实践者,通过线下沙龙、闭门会、公开课等多种形式分享最前沿的技术动态。(作者:孔恒伟)

更多热门内容
旭化成与CAC位于Bondalti工厂的离子交换膜法食盐电解工艺开启商业运行
旭化成株式会社(以下简称“旭化成”)作为被全球30个国家的160多家工厂采用的离子交换膜法食盐电解工艺※1(以下简称“本工艺”)供应商,与引领本工艺工程的CACEngineeringGmbH(以下简称“CAC”)合作,在葡萄牙化工巨头Bondalti Chemicals, S.A.(以下简称“Bondalti”)的

2025-10-25

马思纯×李超京东直播对谈:独家爆料《花少7》幕后趣事,分享健康心得
2025京东11.11热度持续攀升,继电玩惊喜日、爱家惊喜日等惊喜日相继开启后,10月25日,京东联合热播综艺《花儿与少年・同心季》(下称《花少7》)打造的“花少惊喜日”正式官宣上线。本次活动将节目旅行场景与健康消费深度融合,不仅带来直播间独家内容爆料,还带来买花少

2025-10-25

京东11.11直播技术全面升级,立影3D技术、JoyAI大模型重构沉浸式购物体验
随着京东 11.11 大促的火热进行,京东直播再度升级技术布局,以 “立影 3D 技术”“JoyAI大模型”等创新技术,打破传统直播边界,为用户带来更具沉浸感、趣味性的购物体验,引领直播电商技术创新新方向。立影 3D 技术:在直播间360° 还原实体货架体验作为京东全球首发

2025-10-25

【双11开门红】最高直降两千 总经理直播送货 泰坦军团抄底价不容错过!
金秋十月即将步入尾声,一年一度的“双11”购物狂欢节战鼓已然擂响。泰坦军团作为国内知名的电竞显示器品牌,即将在10月31日京东双11开门红首日的下午1点,亮相京东3C数码采销直播间,为广大用户开启京东双十一开门红直播。泰坦军团深知,用户的信任与选择是品牌不断前

2025-10-25

认知革命、70%分成、5000台现车:ZCAR竹子买车破局重构汽车新零售
在汽车零售业的数字变革浪潮中,ZCAR竹子买车以技术为引擎,用“70%利润分成”和“5000台现车供应链”双重破局,重构了汽车新零售的“人、货、场”逻辑,打造出高效转化的数字获客闭环与轻资产创业生态。同时通过透明、模式、供应链的三重优势构建,展现出强大的品牌综

2025-10-25

美光在华业务持续收缩,国产存储龙头长鑫迎来自主化机遇
10月17日,路透社援引两名知情人士消息报道称,美国存储芯片巨头美光科技计划退出其在中国的数据中心服务器芯片业务。根据美光的财报显示,近年来其来自中国大陆的销售额在总营收当中的占比已经从2023财年的14.03%,降至了2024财年的12.1%,远远落后于美国的52.4%和中国

2025-10-25

青年科学家站C位,“破壁”对话顶尖大师
10月24日下午,2025世界顶尖科学家论坛青年科学家大会在上海自贸区临港中心举行。本次大会由复旦大学主办,复旦大学学敏高等研究院承办,以“未来科学先锋——创新与卓越”为主题,汇聚海内外顶尖科学家与全球近30位优秀青年科学家,共探科学前沿,共谋青年成长。作为世

2025-10-25

2025年双十一什么时候开始?京东淘宝天猫双11活动从10月15日开始持续到11月14日结束,三波晚八点最便宜划算,附双十一红包口令和满减活动优惠一览
双十一购物节,已然成为中国消费者年度“血拼”盛宴。2025年,从京东的10月9日零点启幕,到淘宝天猫的10月15日全面跟进,直至11月14日收官。不同于以往的“单日爆买”,这份1000字攻略将手把手教你锁定时间节点、破解红包口令、掌握满减叠加秘籍。记住:早准备、晚下单

2025-10-25

一图读懂FusionXpark™随身智能体开发平台
一图读懂FusionXpark™随身智能体开发平台

2025-10-25

1024致敬鸿蒙开发者:鸿蒙生态全速进击背后的真正主角
每一行代码,都是照亮数字世界的一颗星;每一个梦想,都值得被温柔以待。这不是一场简单的庆祝,而是一次真挚的致敬。在1024程序员节这个属于所有开发者的日子里,华为鸿蒙团队携星光与敬意,奔赴全国各地,发起“星光不负 码向未来”致敬活动,就是想亲口告诉您:鸿蒙生

2025-10-25