文小言大升级：多模型融合，AI创作新体验一键即享！-人工智能-ITBear科技资讯

在近期举办的百度AI DAY活动中，文小言品牌迎来了全面焕新与功能上的重大升级。此次升级不仅引入了百度自研的文心大模型X1和4.5，还整合了满血版DeepSeek-R1、可灵等第三方模型，实现了多模型的融合调度。

现在，用户可以通过新推出的“自动模式”，一键调用最优的模型组合，无需再为不同任务频繁切换模型。当然，对于偏好单一模型的用户，他们仍可以选择使用DeepSeek或文心大模型来完成特定任务。

百度AI产品创新业务负责人薛苏表示，AI的未来不仅仅是技术参数的竞争，更重要的是如何通过多模型的协同工作，为用户创造真正的价值。文小言通过开放生态，整合了顶尖的模型能力，旨在打造更强大、更简洁的AI产品。

在实际应用中，文小言展现出了强大的功能。例如，使用文心大模型X1来设计吉卜力风格的帆布包时，它能够准确解析风格特点，并连续调用AI绘图工具，快速生成帆布包的正反面效果图。文心4.5的多模态分析能力也非常出色，能够识别出照片中的地理位置、背景建筑等详细信息。

文小言还具备语音交互功能，用户可以在拍摄过程中直接用语音提问，文小言会自动拍摄并识别语音进行回答。同时，它还支持多种方言对话和音色切换，为用户提供了更加丰富的交互体验。

除了传统的图片问答功能外，文小言还能够基于原图进行一键二次创作。用户只需上传一张图片，它就能调用图片理解和AI绘图工具，设计出同款的衍生品。然而，在实际测试中，当原图元素过于复杂时，可能会出现文字拼写错误或主体不一致的问题。

文小言还整合了拍照搜题功能。用户只需在拍照界面选择“解题老师”，文小言就会自动调用百度教育积累的资源，为用户提供详细的解题步骤。很多题目还有视频版数字人讲解，为用户提供了更加直观的学习方式。

在对话延迟度方面，文小言也有了显著提升。这得益于百度全新的语音大模型，该模型基于互相关注意力机制，实现了端到端的语音语言处理。相比行业平均水平，该模型的调用成本降低了50%-90%，推理响应速度极快，用户等待时长从常见的3-5秒缩短至1秒左右。

虽然目前文小言暂不支持图生图功能，但它已经融合了文生图、AI修图、AI视频生成等新玩法，为用户提供了更加丰富的创作体验。同时，薛苏也表示，目前文小言将全面拥抱免费策略，专注于提升用户体验，为未来的商业化探索打下坚实基础。