ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

00后陈源培:以游戏思维闯入机器人领域,用人类数据构建世界模型获超20亿融资

时间:2026-06-15 16:43:28来源:快讯编辑:快讯

陈源培并非传统意义上的“学霸”。在进入大学之前,他最大的爱好是打游戏,无论是FPS还是MOBA类游戏,他都玩得不亦乐乎,有些游戏的时长甚至达到了几千小时。即便在高考前一天,他仍在宿舍与同学打牌。如今回想起来,陈源培并不认为这是一段需要被否定的经历。相反,他认为游戏教会了他一个重要道理:只要持续投入、不断试错、升级和复盘,就能在某件事上变得越来越出色。

这一理念贯穿了他的整个成长过程。大学期间,陈源培主修土木专业,但他却对机器人领域产生了浓厚兴趣。利用课余时间,他自学相关知识,参加各类机器人竞赛,逐渐积累了经验。后来,他进入北京大学杨耀东教授的团队,在毫无基础的情况下,仅用三个月便独立完成了一项强化学习研究,成果还发表在人工智能顶级会议上。凭借出色的表现,他获得了斯坦福大学李飞飞实验室的访问学习机会,参与了利用人类数据训练机器人双臂灵巧操作的前沿研究。

2024年9月,年仅23岁的陈源培与京东系创始人王启斌博士、柴晓杰博士共同创立了灵初智能(Psi Bot)。短短两年内,公司累计融资超过20亿元。灵初智能专注于机器人世界模型与具身大脑的研发,目标是让机器人能够理解物理世界、规划动作,并在不同场景中完成复杂的操作任务。为了实现这一目标,公司选择从人类操作数据出发训练模型。

陈源培的研究路径经历了从物体轨迹到人类数据的转变。在北大期间,他参与了双手灵巧操作方向的研究,证明了借助GPU并行仿真,高自由度双手操作任务是可以被训练出来的。当时,仿真效率是机器人强化学习发展的核心瓶颈之一,而陈源培较早接触到了英伟达尚未正式发布的GPU机器人仿真平台,尽管早期版本存在诸多问题,但他意识到这一技术的潜力。后来,行业的发展证明了他的判断,GPU并行仿真逐渐成为机器人强化学习的重要基础设施。

陈源培认为,许多复杂的操作本质上都可以被描述为物体状态的变化。例如,拿起手机是手机沿轨迹移动,打开笔记本电脑是屏幕绕铰链旋转。这种视角提供了一种更统一的任务描述方式,使得不同任务可以拥有共同的语言。这一思路后来成为灵初智能技术路线的重要基础。

与许多依赖机器人遥操作数据的方案不同,灵初智能希望直接从人类操作中提取通用知识,再结合模仿学习和强化学习迁移到机器人身上。陈源培解释道,人类操作数据中既包含目标物体的位置、接近方式和操作意图等通用信息,也包含手指发力、关节运动等与人体结构强相关的细节。前者可以直接被模型学习,后者则由机器人在自身硬件上通过强化学习完成适配。这也是灵初坚持布局灵巧手的原因,五指手在结构上更接近人手,能够更充分地承接人类双手操作数据,降低迁移成本。

围绕这一思路,灵初自研了Psi-SynEngine数据采集引擎,其核心是一套动捕手套方案。相比传统真机遥操作方式,数据采集成本可降低至十分之一左右。值得注意的是,这套数据体系并非服务于某一种固定硬件,灵初同时设计了高自由度和低自由度两种手部构型,前者面向复杂灵巧操作,后者在成本和稳定性上更接近夹爪,可覆盖对灵巧性要求较低的工业场景。

创业后,陈源培面临一个新问题:仅仅拥有数据,并不等于机器人获得了能力。人和机器人并不生活在同一个身体里,从人到机器人的差异被称为“具身鸿沟”。在陈源培看来,人类数据真正有价值的部分,是隐藏在操作过程中的目标、策略和世界规律。机器人需要从海量人类操作数据中提取这些知识。

灵初的解决方案是世界模型。2026年,公司发布了新一代具身模型Psi-R2,它被定义为World Action Model。与传统VLA主要学习“看到什么就执行什么动作”不同,Psi-R2不仅要学会行动,还要学会预测行动的后果。例如,在拆开纸盒包装任务中,机器人需要连续完成识别纸盒结构、调整抓取姿态、展开纸盒、抓取物品等多个步骤,这是一项具有明确目标的长程操作任务。Psi-R2不仅要决定下一步如何移动机械手,还需要持续理解任务进度,并根据当前状态规划后续动作。

另一套模型Psi-W0则承担着对未来世界进行推演的任务。它接收当前状态和候选动作,并预测未来可能出现的结果。Psi-W0最重要的价值并非生成未来视频,而是完成策略评估与数据转化。对于强化学习而言,需要大量成功与失败的反馈才能不断优化策略,而Psi-R2的训练数据几乎全部来自成功样本。因此,Psi-W0被赋予了内部评测系统的角色,提前推演可能出现的未来状态,对不同动作方案进行评估与比较,帮助机器人选择更优策略执行。

更重要的是,Psi-W0还承担着跨越具身鸿沟的任务。在人类和机器人之间,存在天然的本体差异。Psi-W0学习的并不是人类具体如何运动手指,而是任务过程中物体状态如何发生变化。当模型理解了这种状态变化规律之后,再结合强化学习寻找符合机器人自身动力学特性的实现方式,从而完成从人类经验到机器人经验的迁移。

在灵初的设想中,人类操作数据只是整个系统的起点。人类操作数据首先用于训练Psi-R2;Psi-W0对策略进行评估与推演,并将人类经验转换为机器人数据;强化学习进一步优化策略;新的机器人数据再反哺下一轮模型训练,最终形成一个持续扩张的数据飞轮。

陈源培认为,当前许多讨论世界模型的公司仍停留在概念层面。世界模型本身并不直接创造价值,真正重要的是它能否帮助机器人在真实场景中完成任务。他提到了灵初另一位首席科学家温颖提出的“三重世界模型”框架。人对世界的认知大致可以分为三层:最底层是客观世界本身,也就是物理规律;最上层是主体的决策与行动,可以理解为对未来行为及结果的预期;而两者之间,还存在一层更关键的机制,负责判断哪些信息与当前任务相关,哪些只是背景噪声。

以抓取手机为例,机器人并不需要理解桌面上的一切,它真正需要关注的是手机的位置、形状、可抓取区域,以及当前动作会如何改变手机的状态。未来具身模型的核心能力之一,恰恰是这种主动筛选信息的能力。真正有效的模型,不是无差别地接收所有输入,而是能够识别哪些信息值得关注,哪些信息应该被忽略。

陈源培用“迷雾森林”来形容当下的具身智能行业状态:大致知道方向在哪里,但具体哪条路能够最终走通,没有人能够提前给出答案。他认为,未来不会由某一个算法概念决定胜负,无论是世界模型、VLA,还是其他不断出现的新框架,它们都可能推动行业进步,但很难单独构成长期壁垒。真正难以复制的,是把算法落到真实机器人系统中的能力,包括数据采集质量、数据处理流程、模型训练经验、仿真环境搭建、硬件设计、控制器调试、真机评测,以及这些环节之间的协同优化。

灵初因此把硬件、数据和模型放在同一个系统里。硬件不是孤立产品,而是为了更好采集和承载人类操作数据;数据不是一次性资产,而是持续训练模型的燃料;模型也不是静态交付物,而要在真实任务中不断被评测、修正和迭代。人类操作数据能否成为具身智能规模化学习的起点,世界模型与强化学习能否持续将其转化为机器人自身的数据与经验,最终形成类似大模型时代的数据飞轮,这些问题都还需要时间验证。

陈源培并不回避这种不确定性。在他看来,如果未来某条路线被证明更有效,灵初需要有能力快速吸收和切换。他并不相信任何一个当下流行的概念可以直接通向终局。具身智能最终会走向哪里,还要靠实验、数据和真实系统一点点验证。某种程度上,这也是他自己的人生态度。从打游戏到回国创业,他很少为自己设定一个遥远而明确的终点。相比宏大的规划,他更在意眼前的问题是否值得投入,以及自己是否真正享受解决问题的过程。

更多热门内容
小米YU7硬核测试直播大获成功:极速挑战与极限刹停均圆满通关
快科技6月15日消息,近日,小米汽车在盐城进行YU7硬核测试直播,全程7小时,涉及8大环节、26个项目,YU7标准版和YU7GT全部通关,全程无翻车。 经测试,YU7标准版实测极速达到225km/h;YU7…

2026-06-15

古尔曼爆料:苹果iOS 27三新功能筹备中,9月新品发布或迎新亮点
月 15 日消息,苹果在 2026 年全球开发者大会(WWDC)主题演讲中公布了未来一年旗下各类软件的重磅新功能,人工智能版 Siri与系统稳定性优化成为本次发布会的焦点。 苹果原本计划在 iOS 27 中…

2026-06-15

工业自动化新引擎:厦门四信智能工业网关,多协议兼容与低延迟数据处理的优选方案
导语:根据2026年工业物联网行业白皮书及市场调研数据,智能工业网关作为工业自动化与物联网融合的核心设备,其选型需重点关注协议兼容性、边缘计算能力、数据安全及行业适配经验。 基于前文调研信息,厦门四信通信科…

2026-06-15

影石大疆双雄对决:口袋影像新赛道,谁将引领创作新潮流?
这波操作堪称精准对位,同一时间窗口、同一价格区间、同是双摄口袋云台形态,大疆和影石终于从暗地较劲摆到明面上正面对决,彻底打破了此前大疆在这一领域一家独大的格局。说到底,Luna Ultra 和 Pocke…

2026-06-15

2026年人像拍摄手机怎么选?OPPO Find X9s Pro等旗舰机型深度对比推荐
OPPO Find X9s Pro最大的亮点是首次在Pro级机型上搭载了双2亿像素镜头。它从硬件到软件,从色彩到风格,都围绕“自然”与“专业”进行了深度优化,其“哈苏双2亿”系统带来的细节优势与“丹霞色彩”…

2026-06-15

小米汽车严苛测试:800人团队,3500万公里实测,多场景验证品质可靠
这种系统化的验证体系,不仅提升了车辆的整体性能,还确保了其在各种复杂环境下的稳定表现。针对特殊环境适应性测试,小米汽车组建了约500人的专项团队,分设夏季与冬季测试小组。这种将传统汽车制造经验与智能科技测试方…

2026-06-15