00后陈源培：以游戏思维闯入机器人领域，用人类数据构建世界模型获超20亿融资-业界动态-ITBear科技资讯

陈源培并非传统意义上的“学霸”。在进入大学之前，他最大的爱好是打游戏，无论是FPS还是MOBA类游戏，他都玩得不亦乐乎，有些游戏的时长甚至达到了几千小时。即便在高考前一天，他仍在宿舍与同学打牌。如今回想起来，陈源培并不认为这是一段需要被否定的经历。相反，他认为游戏教会了他一个重要道理：只要持续投入、不断试错、升级和复盘，就能在某件事上变得越来越出色。

这一理念贯穿了他的整个成长过程。大学期间，陈源培主修土木专业，但他却对机器人领域产生了浓厚兴趣。利用课余时间，他自学相关知识，参加各类机器人竞赛，逐渐积累了经验。后来，他进入北京大学杨耀东教授的团队，在毫无基础的情况下，仅用三个月便独立完成了一项强化学习研究，成果还发表在人工智能顶级会议上。凭借出色的表现，他获得了斯坦福大学李飞飞实验室的访问学习机会，参与了利用人类数据训练机器人双臂灵巧操作的前沿研究。

2024年9月，年仅23岁的陈源培与京东系创始人王启斌博士、柴晓杰博士共同创立了灵初智能（Psi Bot）。短短两年内，公司累计融资超过20亿元。灵初智能专注于机器人世界模型与具身大脑的研发，目标是让机器人能够理解物理世界、规划动作，并在不同场景中完成复杂的操作任务。为了实现这一目标，公司选择从人类操作数据出发训练模型。

陈源培的研究路径经历了从物体轨迹到人类数据的转变。在北大期间，他参与了双手灵巧操作方向的研究，证明了借助GPU并行仿真，高自由度双手操作任务是可以被训练出来的。当时，仿真效率是机器人强化学习发展的核心瓶颈之一，而陈源培较早接触到了英伟达尚未正式发布的GPU机器人仿真平台，尽管早期版本存在诸多问题，但他意识到这一技术的潜力。后来，行业的发展证明了他的判断，GPU并行仿真逐渐成为机器人强化学习的重要基础设施。

陈源培认为，许多复杂的操作本质上都可以被描述为物体状态的变化。例如，拿起手机是手机沿轨迹移动，打开笔记本电脑是屏幕绕铰链旋转。这种视角提供了一种更统一的任务描述方式，使得不同任务可以拥有共同的语言。这一思路后来成为灵初智能技术路线的重要基础。

与许多依赖机器人遥操作数据的方案不同，灵初智能希望直接从人类操作中提取通用知识，再结合模仿学习和强化学习迁移到机器人身上。陈源培解释道，人类操作数据中既包含目标物体的位置、接近方式和操作意图等通用信息，也包含手指发力、关节运动等与人体结构强相关的细节。前者可以直接被模型学习，后者则由机器人在自身硬件上通过强化学习完成适配。这也是灵初坚持布局灵巧手的原因，五指手在结构上更接近人手，能够更充分地承接人类双手操作数据，降低迁移成本。

围绕这一思路，灵初自研了Psi-SynEngine数据采集引擎，其核心是一套动捕手套方案。相比传统真机遥操作方式，数据采集成本可降低至十分之一左右。值得注意的是，这套数据体系并非服务于某一种固定硬件，灵初同时设计了高自由度和低自由度两种手部构型，前者面向复杂灵巧操作，后者在成本和稳定性上更接近夹爪，可覆盖对灵巧性要求较低的工业场景。

创业后，陈源培面临一个新问题：仅仅拥有数据，并不等于机器人获得了能力。人和机器人并不生活在同一个身体里，从人到机器人的差异被称为“具身鸿沟”。在陈源培看来，人类数据真正有价值的部分，是隐藏在操作过程中的目标、策略和世界规律。机器人需要从海量人类操作数据中提取这些知识。

灵初的解决方案是世界模型。2026年，公司发布了新一代具身模型Psi-R2，它被定义为World Action Model。与传统VLA主要学习“看到什么就执行什么动作”不同，Psi-R2不仅要学会行动，还要学会预测行动的后果。例如，在拆开纸盒包装任务中，机器人需要连续完成识别纸盒结构、调整抓取姿态、展开纸盒、抓取物品等多个步骤，这是一项具有明确目标的长程操作任务。Psi-R2不仅要决定下一步如何移动机械手，还需要持续理解任务进度，并根据当前状态规划后续动作。

另一套模型Psi-W0则承担着对未来世界进行推演的任务。它接收当前状态和候选动作，并预测未来可能出现的结果。Psi-W0最重要的价值并非生成未来视频，而是完成策略评估与数据转化。对于强化学习而言，需要大量成功与失败的反馈才能不断优化策略，而Psi-R2的训练数据几乎全部来自成功样本。因此，Psi-W0被赋予了内部评测系统的角色，提前推演可能出现的未来状态，对不同动作方案进行评估与比较，帮助机器人选择更优策略执行。

更重要的是，Psi-W0还承担着跨越具身鸿沟的任务。在人类和机器人之间，存在天然的本体差异。Psi-W0学习的并不是人类具体如何运动手指，而是任务过程中物体状态如何发生变化。当模型理解了这种状态变化规律之后，再结合强化学习寻找符合机器人自身动力学特性的实现方式，从而完成从人类经验到机器人经验的迁移。

在灵初的设想中，人类操作数据只是整个系统的起点。人类操作数据首先用于训练Psi-R2；Psi-W0对策略进行评估与推演，并将人类经验转换为机器人数据；强化学习进一步优化策略；新的机器人数据再反哺下一轮模型训练，最终形成一个持续扩张的数据飞轮。

陈源培认为，当前许多讨论世界模型的公司仍停留在概念层面。世界模型本身并不直接创造价值，真正重要的是它能否帮助机器人在真实场景中完成任务。他提到了灵初另一位首席科学家温颖提出的“三重世界模型”框架。人对世界的认知大致可以分为三层：最底层是客观世界本身，也就是物理规律；最上层是主体的决策与行动，可以理解为对未来行为及结果的预期；而两者之间，还存在一层更关键的机制，负责判断哪些信息与当前任务相关，哪些只是背景噪声。

以抓取手机为例，机器人并不需要理解桌面上的一切，它真正需要关注的是手机的位置、形状、可抓取区域，以及当前动作会如何改变手机的状态。未来具身模型的核心能力之一，恰恰是这种主动筛选信息的能力。真正有效的模型，不是无差别地接收所有输入，而是能够识别哪些信息值得关注，哪些信息应该被忽略。

陈源培用“迷雾森林”来形容当下的具身智能行业状态：大致知道方向在哪里，但具体哪条路能够最终走通，没有人能够提前给出答案。他认为，未来不会由某一个算法概念决定胜负，无论是世界模型、VLA，还是其他不断出现的新框架，它们都可能推动行业进步，但很难单独构成长期壁垒。真正难以复制的，是把算法落到真实机器人系统中的能力，包括数据采集质量、数据处理流程、模型训练经验、仿真环境搭建、硬件设计、控制器调试、真机评测，以及这些环节之间的协同优化。

灵初因此把硬件、数据和模型放在同一个系统里。硬件不是孤立产品，而是为了更好采集和承载人类操作数据；数据不是一次性资产，而是持续训练模型的燃料；模型也不是静态交付物，而要在真实任务中不断被评测、修正和迭代。人类操作数据能否成为具身智能规模化学习的起点，世界模型与强化学习能否持续将其转化为机器人自身的数据与经验，最终形成类似大模型时代的数据飞轮，这些问题都还需要时间验证。

陈源培并不回避这种不确定性。在他看来，如果未来某条路线被证明更有效，灵初需要有能力快速吸收和切换。他并不相信任何一个当下流行的概念可以直接通向终局。具身智能最终会走向哪里，还要靠实验、数据和真实系统一点点验证。某种程度上，这也是他自己的人生态度。从打游戏到回国创业，他很少为自己设定一个遥远而明确的终点。相比宏大的规划，他更在意眼前的问题是否值得投入，以及自己是否真正享受解决问题的过程。

SpaceX首份财报将至，投资者聚焦Starship及AI支出等多方面问题

2026-08-02

Seedance2.5升级实测：时长与稳定性提升，细节待完善能否破局？

2026-08-02

Kimi K3登顶编程榜引关注中国开源模型崛起重塑全球AI竞争格局

2026-08-02

马斯克关注DeepSeek X账号，中国AI发展再引科技巨头瞩目

2026-08-02

首届全国青少年人工智能大赛沪上启幕五大赛道助力青少年AI素养跃升

2026-08-02

马斯克深度访谈：AI五年内或超人类，工作金钱将变样，未来何去何从？

在马斯克的认知里，AI（数字超级智能）就像是物理学中的黑洞，是一个不可逆且会吞噬一切原有社会法则的“奇点”。这场90分钟访谈，表面上讨论的是AI、机器人和商业竞争，但更深层讨论的是：人类未来会变成什么样…