ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

对话Kimi付强:追逐AGI,让模型与人类携手共进,探索智能新边界

时间:2025-10-04 11:26:46来源:互联网编辑:快讯

在近期举办的AI创造者嘉年华上,硅星人创始人兼CEO骆轶航与月之暗面(Kimi)技术副总裁付强展开了一场深度对话,围绕K2模型研发过程中的“反常识”决策以及Kimi探索通用人工智能(AGI)的技术路径展开探讨。

针对K2模型采用DeepSeekV3架构引发的讨论,付强回应称技术选择基于现实考量。他指出,采用成熟架构可复用现有推理资源,降低开发成本。尽管整体架构相似,但K2在超参数配置、专家模型数量等细节上存在显著差异。通过优化密集层模型紧凑度,最终实现的模型性能与原始架构形成本质区别。

当被问及为何在行业转向后训练时重启预训练路线,付强坦言这是战略选择。他以学生学习为例,强调模型需要像人类一样具备举一反三的能力。通过提升Token使用效率,而非单纯扩大参数规模或增加训练次数,Kimi团队在有限的高质量语料中挖掘更深层次的信息关联。这种技术路线导致产品迭代周期延长,但为模型智能化突破创造了可能。

关于开源战略的决策逻辑,付强表示这源于技术生态建设的需要。通过开源基础模型,开发者社区的反馈成为技术演进的重要驱动力。他特别强调要保持“半步领先”的节奏,既要吸收社区创新,又要确保核心技术自主性。这种开放策略与某些企业通过工程化手段包装模型性能的做法形成鲜明对比。

面对Agent技术发展的争议,付强用赛车运动作类比。第三方Agent开发者如同职业车手,能通过API调用充分发挥模型性能,但模型供应商必须深度参与应用场景构建。他指出当前多Agent调度方案本质上是工程化MoE架构,真正的智能突破需要模型原生具备工具调用和环境交互能力。

在AGI实现路径的讨论中,付强强调代码生成能力的特殊价值。相较于情感交互等主观评价领域,编程任务的客观可验证性使其成为衡量模型智能的理想标尺。K2模型在IDE集成和调用量上的优异表现,印证了通过解决高复杂度问题提升智能水平的技术路线有效性。

对于模型价值观的探讨,付强回归人工智能发展的本质命题。他引用《苦涩的教训》理论,主张赋予模型自主探索和试错能力。就像人类通过实验认知世界,模型也需要具备物理操作、化学实验等环境交互能力,这种与人类共同进化的模式才是通往AGI的正途。

更多热门内容
贝佐斯:人工智能处“行业泡沫”期,却真实且将为社会带来巨大收益
亚马逊创始人杰夫・贝佐斯(Jeff Bezos)表示,尽管有迹象表明人工智能正处于 “行业泡沫” 阶段,但该技术“真实存在,且将改变所有行业”。 他向听众表示,在泡沫时期,无论想法好坏,几乎所有构想都会…

2025-10-04

AI助力秋季出游规划,解锁个性活动,畅享秋日惬意时光
像ChatGPT这样的AI工具已经不再只是简单的聊天机器人,它可以成为你专属的旅行规划师,为你量身定制秋季活动,让你的出游计划变得轻松又高效。 人工智能的强大之处在于它可以根据你的具体需求和条件提供个性化建议…

2025-10-04

大语言模型≠人工智能!它是AI自然语言处理分支,多模态下功能更广
中新网10月3日电 大语言模型只是人工智能技术中的一种,二者并不等同。人工智能是一个非常广泛的研究领域,各种机器学习算法、图像识别、语音识别、机器人的行动策略优化以及自然语言处理等,都属于人工智能的研究范畴。…

2025-10-04

数学研究新突破:陶哲轩携手ChatGPT,1小时攻克复杂难题且无需手动编码
在Mathstodon上,陶哲轩称,自己联手ChatGPT攻克了一个MathOverflow难题,节省了数小时的编码时间。 AI不仅帮助他发现了初始尝试中的多处数学错误,还将原本可能耗费数小时的编程与调试工…

2025-10-04

ML-Summit 2025:AI Agent技术突破、应用成果与未来创投趋势全览
文档主要围绕ML-Summit 2025 全球机器学习技术大会(主办方为 CSDN Boolan,有 AMDX、数势科技等合作伙伴,大会含北京、杭州等地场次,如 ML-Summit 10 月 17-18 日…

2025-10-04