在AI领域的一次重大突破中,字节跳动的智能体平台“扣子”凭借其新发布的Agent功能,成功吸引了业界的广泛关注。自4月18日扣子Agent上线以来,各大AI交流群内邀请码的争抢异常激烈,用户们争相获取这五个一组的宝贵邀请码,往往在放出后的几秒内就被一抢而空。
即便对于拥有强大算力的字节跳动而言,用户的热情也远远超出了预期。在扣子Agent上线的短短几天内,服务器因访问量过大而多次出现满载情况,算力消耗远超字节的初步预估。
此次字节新推出的扣子Agent,凭借其优化的产品思路和价格优势,成功填补了Manus留下的高端市场空白。Manus虽然在业界引起了轰动,但其高昂的价格让不少用户望而却步。而扣子Agent的推出,正好满足了这部分用户的需求。
在扣子Agent的多款新功能和产品中,“扣子空间”无疑是最受用户欢迎的。这款Agent已经具备了规划、使用工具和记忆等关键自主能力。用户可以用它来撰写游戏攻略、市场调研报告,甚至还能结合字节提供的多种MCP实现更复杂的需求,如利用高德地图MCP+Agent编写旅游指南,或利用飞书多维表格进行数据统计分析。
在实际体验中,扣子的Agent更像是OpenAI发布的DeepResearch和Manus的结合体。以“字节一年To B的AI战略”为例,让扣子Agent帮忙收集信息并生成分析报告。Agent将任务拆解成多个步骤,并在用户的指导下逐步完成,最终输出了一份长达10个小节的报告。虽然内容较为简略,但已经基本覆盖了各个维度的信息。
在产品设计上,字节整体的设计思路与DeepResearch相近。两者都将Agent的思考过程和收集内容放置在界面右侧,使用户能够清晰地看到AI的每一步操作。扣子的Agent还延续了字节一贯的产品设计思路,进一步提升了用户的交互体验。
为了满足用户对生成效率和质量的不同需求,扣子的智能体在界面中创新地设置了“探索模式”和“规划模式”两种模式。前者思考速度快,适合处理简单任务;后者则能根据用户需求将任务拆分成详细步骤,并在生成规划后允许用户根据需求进行修改。
然而,以智能体的三个关键能力指标——规划、工具调用和记忆来衡量,字节的Agent表现尚无法与DeepResearch和Manus相提并论。在工具调用方面,目前字节平台可直接调用的MCP种类有限,仍需进一步扩充。而在记忆问题上,也有用户反映,在进行了十几轮上下文对话后,Agent会出现“失忆”情况,无法记住之前的交流内容。
这主要是由于扣子Agent的底层模型决定。目前,扣子Agent使用的是豆包最新发布的深度思考模型Doubao-1.5-thinking-pro。与采用自研模型的OpenAI和调用Claude 3.7等模型的Manus相比,扣子Agent在文本理解思考能力、代码输出等方面稍逊一筹。
为了提升Agent的使用体验,字节在多模态能力上下了不少功夫。上周,字节发布了专门为Agent设计的GUI(图形交互界面)模型,这使得扣子Agent在视觉理解和图片生成能力上表现更加突出。在实际体验中,扣子Agent生成的报告不仅详细分好了对应的节点,而且在UI设计上体验极佳,提供了图文并茂的调研报告。
虽然扣子Agent目前的表现还无法与Manus相媲美,但在自主Agent市场几乎空白的当下,扣子Agent的表现已经足够惊艳。它做到了火山引擎一直强调的“成本低、易落地”,先将具备自主执行能力的Agent推向市场,让人们能够体验并给出反馈。
扣子的诞生,不仅是大厂在智能体路线上的一次重要尝试,更是对之前智能体发展思路的一次“纠偏”。从OpenAI发布GPT商店开始,大厂们纷纷跟进智能体的发展。然而,大厂们最初对智能体的定位仍然是做开发者生态的平台,即智能体商店。他们希望通过吸纳开发者来打造应用生态,再借助各种功能的智能体吸引用户,从而成为流量生态的入口。
然而,随着AutoGLM等能够实现自主操作的Agent的出现,大厂们开始意识到之前的思路需要调整。字节此次抢着将还不够完善的扣子Agent推出,正是为了抢占时间窗口。虽然扣子Agent目前只是一个“60分及格”的产品,但它的出现已经足够让人眼前一亮。