ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI真能接手人类工作?B站携6位UP主用OpenClaw直播开启真实检验

时间:2026-03-14 19:11:21来源:互联网编辑:快讯

当人工智能的讨论陷入"取代危机"与"技术乌托邦"的两极漩涡时,B站用一场持续数日的直播实验给出了新的观察视角。这场名为《龙虾代替人类》的挑战活动,将OpenClaw智能体推入真实工作场景,通过连续的压力测试展现AI在复杂任务中的实际表现。

在首场程序员岗位测试中,AI进化论-花生为智能体布置了三项任务。前两次尝试遭遇现实阻碍:分析B站账号时首次流程崩溃,第二次才勉强完成;桌面整理任务则因执行效率低下被迫中止。转折出现在第三项挑战——当被要求开发iOS版小猫补光灯升级应用时,智能体展现出令人惊讶的编程能力,尽管过程中出现指令执行偏差和代码修改拖延等插曲,最终仍交付了可运行版本。创作者评价其产品思维接近资深从业者,但完成度仍需打磨。

即将展开的系列测试将拓展至更多领域。导演小策与Jack-cui将带领智能体完整参与视频创作流程,从选题策划到脚本编写,探索AI介入内容生产的新可能;程泓宁_宇宙ebike则设定了更具挑战性的目标——借助AI实现单日百万销售额,这场商业实验将检验智能体在市场运营中的实际价值。

游戏与管理的极端场景测试同样引人注目。3月16日,籽岷等三位UP主将让AI接管游戏操作,通过实时对战检验其策略执行能力;更受关注的当属秋芝2046策划的公司管理实验,这场名为《用龙虾管公司,会倒闭吗?》的测试,将把智能体置于行政决策的核心位置。值得关注的是,活动方透露360集团创始人周鸿祎将以神秘角色参与后续环节,具体形式尚未公布。

这场持续十天的公开实验,本质上是对AI落地能力的现实检验。当技术论文中的参数突破转化为具体工作场景中的操作表现,当实验室环境里的完美演示遭遇真实世界的复杂变量,智能体的实际表现或许比任何理论探讨都更具说服力。对于那些困在"AI焦虑"中的人们,这些持续更新的测试数据,正在提供更立体的认知维度。

从程序员岗位到商业运营,从内容创作到公司管理,实验设计覆盖了现代职场的核心领域。每个测试场景都保留了意外发生的可能性——指令误解、执行偏差、系统崩溃等真实问题,恰恰构成了评估AI实用价值的关键维度。当观众透过直播镜头目睹这些不完美却真实的交互过程,关于技术替代的抽象争论,或许能获得更具象的解答。

更多热门内容
英伟达发布开源框架Polar,助力代码智能体训练表现显著提升
IT之家 5 月 28 日消息,英伟达研究团队本周发布开源框架 Polar,在不破坏原有工具调用、上下文组织和补丁提交方式的前提下,让Codex、Claude Code、Qwen Code 等现有智能体框架…

2026-05-28

Meta加速AI布局:推出付费服务、调整架构裁员,战略转型迈关键步
对于普通消费者,Meta旗下三大社交平台也将推出了梯度化社交平台Plus订阅套餐,其中Instagram、Facebook月度订阅费用为3.99美元,WhatsApp订阅定价更低,定价2.99美元/月,并支…

2026-05-28

Meta加速AI布局:推出付费服务并调整架构,战略转型迈出关键步伐
对于普通消费者,Meta旗下三大社交平台也将推出了梯度化社交平台Plus订阅套餐,其中Instagram、Facebook月度订阅费用为3.99美元,WhatsApp订阅定价更低,定价2.99美元/月,并支…

2026-05-28

英伟达发布开源框架Polar,助力代码智能体训练效率与表现双提升
IT之家 5 月 28 日消息,英伟达研究团队本周发布开源框架 Polar,在不破坏原有工具调用、上下文组织和补丁提交方式的前提下,让Codex、Claude Code、Qwen Code 等现有智能体框架…

2026-05-28