ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AlphaGo核心人物戴维·席尔瓦创业:绕开大模型,探索强化学习新路径

时间:2026-02-21 00:03:28来源:互联网编辑:快讯

前谷歌DeepMind首席科学家、AlphaGo项目核心负责人戴维·席尔瓦(David Silver)近日宣布在伦敦创立人工智能公司"Ineffable Intelligence",引发科技界广泛关注。这家初创企业正推进总额达10亿美元的种子轮融资,规模已接近OpenAI前首席科学家伊利亚·苏茨克维(Ilya Sutskever)创立的Safe Superintelligence(SSI)所创下的融资纪录。

与当前主流的大语言模型技术路径不同,席尔瓦提出要突破现有框架,回归强化学习的本质。他主张构建能够自主探索未知领域的智能系统,而非依赖人类既有知识库。这种技术理念源于其长期研究实践——作为图灵奖得主查理·萨顿(Charlie Sutton)的门生,席尔瓦的学术论文累计被引用超过28万次,2019年更获得ACM计算奖。

2025年4月,席尔瓦与导师联合发表的《欢迎来到经验时代》论文系统阐述了其技术主张。他们认为新一代AI系统应通过持续与环境交互获取经验,而非单纯依赖静态数据训练。这种思路直接体现在新公司的技术方向上:开发能够自我迭代、通过试错积累知识的超级智能系统。

资本市场对这位技术领袖的押注颇具战略眼光。接近交易的投资人透露,10亿美元融资的达成主要基于两点考量:席尔瓦在强化学习领域的权威地位,以及其提出的"后大模型时代"技术路线可能带来的颠覆性突破。当前主流AI模型均采用"预训练+微调"模式,通过海量文本数据学习语言规律,但席尔瓦指出这种路径存在根本性局限——AI的能力上限被人类数据规模所束缚。

在席尔瓦看来,现有技术路线过度依赖人类反馈强化学习(RLHF),导致模型认知水平难以突破评估员的认知边界。"要实现超越人类的智能,必须让AI具备自主探索能力。"他在近期播客节目中强调,"真正的突破需要发现人类尚未掌握的规律。"

科技界正经历显著的技术路线分化。除席尔瓦外,参与AlphaGo项目的多名科学家近期创立Reflection AI,meta则在杨立昆(Yann LeCun)带领下重组"超级智能实验室",探索非Transformer架构的新路径。行业观察家指出,当前局面类似于深度学习爆发前的技术探索期,各大实验室都在寻找突破大语言模型局限的新方案。

不过,强化学习路线也面临现实挑战。批评者认为,该技术在围棋等规则明确的环境中表现优异,但在现实世界这种开放环境中,稀疏的反馈信号和模糊的规则体系可能限制其有效性。完全摒弃语言学习路径意味着需要构建极其复杂的数字孪生系统,其算力需求可能呈指数级增长。

目前,Ineffable Intelligence已在伦敦组建核心团队,并启动全球顶尖强化学习专家的招募工作。虽然尚未公布具体产品时间表,但这家初创企业的技术方向和资源投入,已被视为影响AI技术演进的关键变量。其能否突破现有技术瓶颈,或将重新定义人工智能的发展轨迹。

更多热门内容
亚马逊790亿收购Globalstar,携手苹果在卫星市场向星链发起挑战
“我们期待在这一合作基础上,与亚马逊的Leo系统进一步深化协作,”苹果营销主管格雷格·乔斯维亚克(GregJoswiak)在声明中表示,“这将确保我们的用户能够继续使用他们依赖的重要卫星功能。” 现在,亚…

2026-04-15

从863计划到工业AI浪潮:国产算力以硬核实力筑牢制造升级数字根基
【环球网科技报道 记者 李文瑶】4月8日,由国家先进计算产业创新中心主办,国家工业信息安全发展研究中心与海光产业生态合作组织承办的“人工智能赋能新型工业化深度行(走进国家超算互联网核心节点)”活动在郑州举行…

2026-04-15

2nm工艺引领新潮流!高通骁龙8E6系列将至 小米18系列率先搭载
这一系列由两款核心芯片组成,分别是骁龙8E6标准版和性能更强的骁龙8E6 Pro,预示着移动处理器市场将进入全新的性能周期。 相比于Pro版本,骁龙8E6标准版在制程工艺和核心架构上与之保持了全面对齐,这确保…

2026-04-15

雷军近期外交互动忙:与西班牙首相自拍,又会晤阿联酋阿布扎比王储
IT之家 4 月 15 日消息,小米创办人、董事长兼 CEO 雷军今日晒图,会见了阿联酋阿布扎比王储哈立德殿下。他指出,阿联酋是中国在中东和北非地区的重要战略伙伴,两国在多个关键领域的合作成果丰硕,未来将继续…

2026-04-15