ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

唐杰谈AI新趋势:在线学习与自评估成新范式,领域大模型难成主流

时间:2025-12-26 22:05:02来源:互联网编辑:快讯

清华大学教授、智谱AI首席科学家唐杰近日通过社交媒体分享了他对2025年大模型技术发展的深度思考。他指出,当前大模型正从“理解世界”向“融入世界”转型,核心挑战已从提升智能水平转向如何将智能转化为实际生产力。这一观点引发了学术界和产业界的广泛关注。

在技术路径层面,唐杰认为预训练阶段虽未终结,但未来重点将转向中后训练环节。经过大规模预训练,大模型已掌握基础常识和推理能力,但标准化测试中的优异表现与真实场景应用仍存在差距。他特别强调激活对齐与推理增强的必要性:当前模型在数学奥赛等高难度任务中表现突出,却在简单任务中频繁出错,这反映出基准测试的局限性。现实场景中的长尾问题分布不均、边界模糊,要求模型具备更强的场景适应能力。

关于Agent技术的发展,唐杰提出关键性论断:Agent是大模型从认知系统向生产系统转变的里程碑。他比喻称,单纯预训练的大模型如同完成博士学业却缺乏实践能力的人,而Agent的介入使其真正进入现实世界。当前实现路径正从应用层编排向模型训练过程融合转变,但跨环境泛化仍是主要瓶颈。现有解决方案仍依赖海量环境数据和针对性强化学习,技术突破尚未出现根本性转变。

记忆机制被唐杰视为模型落地的重要支撑。他构建了人类记忆与模型能力的对应框架:短期记忆对应上下文窗口,中期记忆对应检索增强生成(RAG),长期记忆融入模型参数,人类历史知识则存储于公共知识库。当前技术方案试图通过扩展上下文长度和记忆压缩同时覆盖短期与中期记忆,但知识迭代与参数修改引发的灾难性遗忘问题仍未解决,这成为制约模型进化的核心难题。

在线学习与自我评估机制被预测为下一代技术范式。唐杰指出,现有离线训练模式存在资源浪费、交互数据丢失等缺陷,具备自学习能力的模型将成为必然趋势。这种进化依赖模型对自身判断的自我评估能力,即使仅能进行概率性判断,也可形成优化目标。该观点与OpenAI前联合创始人John Schulman、谷歌DeepMind首席执行官Demis Hassabis的论述形成呼应,后者曾强调持续在线学习是通往通用人工智能的关键缺失环节。

在应用层面,唐杰提出颠覆性观点:AI应用的核心不是创造新形态,而是替代或重构人类工作。他以聊天应用取代搜索引擎并融合情感交互为例,预测2026年将成为AI替代工种的爆发期。这种判断基于端到端发展趋势——随着模型能力增强,研发与应用将深度融合,无法创造实际价值的AI产品将失去生存空间。对于企业热衷的领域大模型,他直言这是AGI实现前的过渡方案,长期来看所有领域数据都将被通用主模型吸收。

针对多模态与具身智能,唐杰保持审慎态度。他认为多模态虽前景广阔,但当前对提升AGI上限作用有限,更现实的路径是文本、理解、生成分阶段推进并保持交叉探索。具身智能面临更严峻挑战:数据采集成本高昂、机器人本体稳定性不足,导致通用能力激活困难。不过他预测,随着数据规模扩大,2026年该领域将取得实质性突破。

更多热门内容
马斯克携xAI豪掷200亿美元建数据中心,AI“军备赛”再掀高潮
当地时间1月8日,美国密西西比州州长泰特·里夫斯(Tate Reeves)发文称,马斯克旗下AI初创企业xAI正斥资超200亿美元,在密西西比州绍斯黑文市(Southaven)打造一座数据中心。xAI此次布…

2026-01-10

抖音企业号运营总踩坑?从“327播放量”到“创意生产系统”的破局之路
有人轻描淡写提了句:“内容生产可以部分自动化啊,比如用优采云这类工具,设置好关键词和模板,让AI去全网抓素材、重组信息,甚至直接生成短视频文案草稿。”看到竞品用户说“某某功能不好用”,我可能想到:我们的产品正…

2026-01-10

马斯克再谈模拟理论:人类或是代码?科学争议与商业算计交织
这不是他头一次提这事儿,早几年他就说过类似的话,但这次又刷屏了,让人忍不住多想两下。》,里面列出三种可能:一,人类文明在发展出超级模拟技术前就灭绝了;二,先进文明对模拟祖先没兴趣;三,我们很可能已经在模拟里…

2026-01-10

乐聚机器人牵手阿里云 共探具身智能新路径 推动多元场景规模化落地
1月8日,,双方将基于阿里云算力、AI平台、千问模型,共同开展人形机器人训练场合作,以及探索基于千问模型的具身智能联合解决方案和人形机器人产品的开发。 当日,乐聚智能(深圳)股份有限公司常务副总裁柯真东与阿里…

2026-01-10