ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

文小言大升级:多模型融合,AI创作新体验一键即享!

时间:2025-03-31 20:46:53来源:ITBEAR编辑:快讯团队

在近期举办的百度AI DAY活动中,文小言品牌迎来了全面焕新与功能上的重大升级。此次升级不仅引入了百度自研的文心大模型X1和4.5,还整合了满血版DeepSeek-R1、可灵等第三方模型,实现了多模型的融合调度。

现在,用户可以通过新推出的“自动模式”,一键调用最优的模型组合,无需再为不同任务频繁切换模型。当然,对于偏好单一模型的用户,他们仍可以选择使用DeepSeek或文心大模型来完成特定任务。

百度AI产品创新业务负责人薛苏表示,AI的未来不仅仅是技术参数的竞争,更重要的是如何通过多模型的协同工作,为用户创造真正的价值。文小言通过开放生态,整合了顶尖的模型能力,旨在打造更强大、更简洁的AI产品。

在实际应用中,文小言展现出了强大的功能。例如,使用文心大模型X1来设计吉卜力风格的帆布包时,它能够准确解析风格特点,并连续调用AI绘图工具,快速生成帆布包的正反面效果图。文心4.5的多模态分析能力也非常出色,能够识别出照片中的地理位置、背景建筑等详细信息。

文小言还具备语音交互功能,用户可以在拍摄过程中直接用语音提问,文小言会自动拍摄并识别语音进行回答。同时,它还支持多种方言对话和音色切换,为用户提供了更加丰富的交互体验。

除了传统的图片问答功能外,文小言还能够基于原图进行一键二次创作。用户只需上传一张图片,它就能调用图片理解和AI绘图工具,设计出同款的衍生品。然而,在实际测试中,当原图元素过于复杂时,可能会出现文字拼写错误或主体不一致的问题。

文小言还整合了拍照搜题功能。用户只需在拍照界面选择“解题老师”,文小言就会自动调用百度教育积累的资源,为用户提供详细的解题步骤。很多题目还有视频版数字人讲解,为用户提供了更加直观的学习方式。

在对话延迟度方面,文小言也有了显著提升。这得益于百度全新的语音大模型,该模型基于互相关注意力机制,实现了端到端的语音语言处理。相比行业平均水平,该模型的调用成本降低了50%-90%,推理响应速度极快,用户等待时长从常见的3-5秒缩短至1秒左右。

虽然目前文小言暂不支持图生图功能,但它已经融合了文生图、AI修图、AI视频生成等新玩法,为用户提供了更加丰富的创作体验。同时,薛苏也表示,目前文小言将全面拥抱免费策略,专注于提升用户体验,为未来的商业化探索打下坚实基础。

更多热门内容