在一夜之间,一个名为Manus的AI产品迅速走红,伴随着一场看似随意却影响深远的发布会,其邀请码甚至在二手交易平台上被炒到了5万元的高价。这股热潮背后,焦虑情绪在投资界和科技大厂之间悄然蔓延。
那么,Manus究竟有何神奇之处?是泡沫炒作,还是真金不怕火炼?让我们一探究竟。
Manus的能力令人叹为观止。它能够独立完成特斯拉的财报分析报告,生成可交互的网站,甚至制作出一款即玩即乐的RPG游戏。更令人惊讶的是,它还能自行搭建开发环境,编写代码,进行调试和编译。如果你需要一份地区人口调研报告,Manus会自动访问数据库,筛选合适的数据来完成任务。在GAIA benchmark基准下,Manus的表现甚至超越了OpenAI的DeepSearch。
从推特和国内社交媒体上的用户反馈来看,Manus的执行过程流畅且高效,每个步骤的代码和产出文件都清晰可见,整理得井井有条。在特斯拉和英伟达财报分析及估值方面,其表现丝毫不逊色于雪球上的知名大V。最令人称奇的是,Manus通过虚拟电脑执行数据获取、计算和开发环境搭建等繁琐工作,极大地解放了用户,让新手也能轻松上手。
Manus的爆红,除了其卓越的性能外,还因为其背后的团队——一个土生土长的中国创业团队。在AI领域,国内团队的表现并不逊色于美国那些集结了全球顶尖人才的梦之队。事实上,Manus是Monica AI团队的另一款力作。Monica AI是一款AI聊天机器人产品,不同于国外的原生聊天机器人,Monica AI提供了大量垂直领域的API接口,用户无需担心prompt调优,即可上手使用。
Monica AI的创始人肖宏很早就意识到了大模型与用户交互方式的局限性。尽管模型强大,但用户仍需通过多轮对话分步骤完成任务,且无法确保输入的token是否为最优方案。而Manus则打破了这一局限,让用户能够在对话框中一步到位地完成更复杂、更高智能的任务。从这个角度看,Manus更像是一个经过精心规划的AI任务集合。
Manus的亮点在于其混合模型架构和虚拟云端执行环境。基于Claude 3.7和国内的Qwen模型,Manus增加了自己的训练过程,实现了任务自主规划、思考和完成。多个大模型的混合使用,加上Manus的虚拟云端执行环境,让用户只需一次性输入,就能完成以往需要多轮对话才能解决的复杂需求。
据自媒体《赛博禅心》透露,Manus的单条任务成本仅为2美元左右,是DeepSearch的十分之一。在任务执行过程中,Manus可能运用了大量工程手段结合模型能力。首先,大模型会对输入进行分析,确定任务类型;然后,将输入拆解成多个带有层级关系、优先级和执行顺序的子任务;接着,按序执行子任务,并将上级任务的输出作为下级任务的输入;最后,合并多个任务产出,形成一个最终分析结果。
然而,Manus也并非完美无缺。从用户反馈来看,其产出稳定性有待提高,甚至出现了一些事实错误,导致最终产出不可信。单任务执行时间过长也是一个被诟病的问题。尽管Manus已经展示了其任务执行逻辑和过程,但用户仍需等待漫长的时间。这背后反映了团队对使用量预估不足以及Manus本身架构产生的算力需求庞大。
尽管存在这些问题,但Manus无疑已经迈出了通用型AI Agent走进现实的第一步。市面上的Agent产品主要分为通用型和垂直应用型两类。通用型Agent的代表产品有OpenAI的"Operator"和Anthropic的“Computer Use”。而Manus则定位为一款通用型AI Agent,通过工程手段实现Agent架构创新,融合多个大模型,自动完成复杂任务。