ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谷歌Gemini Embedding 2发布:全模态融合,开启AI嵌入技术新篇章

时间:2026-03-11 22:46:54来源:快讯编辑:快讯

谷歌DeepMind近日宣布推出革命性的Gemini Embedding 2模型,这是全球首个原生多模态嵌入解决方案,实现了文本、图像、视频、音频和文档五种媒体类型的统一语义表征。该模型突破传统AI处理框架,将不同模态数据映射至共享嵌入空间,为跨模态信息检索与理解开辟了新路径。

技术架构层面,该模型基于Gemini架构深度优化,支持单次请求中混合输入多种媒体类型。文本处理能力提升至8192个token,图像支持6张PNG/JPEG格式同时处理,视频可解析120秒内的MP4/MOV内容,音频数据无需转录即可直接生成嵌入向量,文档则支持6页PDF的直接嵌入。这种交错输入机制使模型能够捕捉图像与文本、视频与音频等跨模态间的语义关联,显著提升复杂场景下的理解精度。

在性能表现上,谷歌公布的基准测试数据显示,Gemini Embedding 2在文本、图像和视频任务中均超越现有主流模型。其独创的Matryoshka表示学习(MRL)技术通过动态维度压缩,将默认3072维向量可降至768维,在保持98%性能的同时降低60%存储成本。开发者可根据应用场景选择3072、1536或768三档维度,平衡精度与计算资源消耗。

原生语音处理能力成为该模型的核心突破。不同于传统需要语音转文本的间接处理方式,Gemini Embedding 2可直接生成音频数据的嵌入向量,在会议记录、语音搜索等场景中实现端到端处理。谷歌工程师透露,该能力使语音检索响应速度提升3倍,错误率降低42%。

企业应用层面,该模型显著降低多模态系统开发门槛。开发者通过Gemini API或Vertex AI平台即可调用服务,快速构建语义搜索、数据分类和RAG(检索增强生成)系统。某金融科技公司利用该模型重构客户服务平台后,跨模态知识库检索效率提升5倍,多语言支持范围扩展至103种语言。

目前已有超过200家企业参与早期测试,涵盖媒体、医疗、电商等多个领域。医疗影像公司通过混合输入X光片与临床报告,将诊断准确率提升至92%;电商平台利用图文视频联合嵌入,实现商品搜索点击率增长28%。谷歌表示将持续优化模型在低资源语言和长视频处理方面的表现,并计划年内推出边缘设备部署方案。

更多热门内容
扎克伯格开发“CEO智能体” 助力Meta管理效率再升级
来源:环球网【环球网科技综合报道】3月23日消息,据《华尔街日报》报道,Meta公司CEO扎克伯格正在开发“CEO智能体”,以协助他履行首席执行官的职责。 报道称,“CEO智能体”可以帮助扎克伯格更快地获…

2026-03-24

雷军蔡崇信齐聚论坛发声:于不确定中锚定未来产业新方向
小米集团创始人、董事长兼首席执行官雷军,阿里巴巴集团主席蔡崇信,参加了“技术创新与未来产业发展”专题研讨会,并作先后发言。 雷军说,创新培养未来产业需要拥抱不确定性,而中国是“最适合发展高度不确定性产业”的…

2026-03-24

浦东人形机器人产业双轮驱动:技术领航标准制定 租赁融资加速市场落地
近日,浦东企业智元机器人作为英伟达全球核心生态合作伙伴,深度赋能新一代基座模型,共同定义物理AI行业标准;另一家浦东新秀企业擎天租则收获了全球机器人租赁赛道首笔亿元级融资,将重点用于铺设全国标准化履约服务网络…

2026-03-24

扎克伯格打造“CEO智能体” 助力Meta管理效率再升级
来源:环球网【环球网科技综合报道】3月23日消息,据《华尔街日报》报道,Meta公司CEO扎克伯格正在开发“CEO智能体”,以协助他履行首席执行官的职责。 报道称,“CEO智能体”可以帮助扎克伯格更快地获…

2026-03-24

AI获客未来三年大揭秘:五大趋势引领精准营销新方向!
依据是随着社交媒体、电商平台等的不断发展,用户在不同平台上的行为具有关联性,通过跨平台整合可以更全面地了解用户需求,实现精准营销。 解释:物联网设备的普及将产生大量的实时数据,AI与物联网的融合能够对这些数据…

2026-03-24

马斯克再掀科技浪潮!SpaceX与特斯拉携手Terafab,开启太空算力新纪元
月 23 日,全球科技巨头 SpaceX 和特斯拉正式宣布联手,启动 Terafab超级算力项目,目标打造全球最大的分布式算力网络,年支持算力达到 1 太瓦,结合 SpaceX 的星链卫星技术和特斯拉的车载…

2026-03-24

雷军直播揭晓SU7佳绩:锁单破3万,备现车提速交付回应车主期待
3月23日消息,在今天举行的新一代小米SU7首批交付仪式上,雷军亲自向外界揭晓了这款新车的亮眼成绩。他在直播中正式宣布,新一代SU7的锁单量已经成功突破3万辆大关。 雷军还在直播中表示,过去两年,车主朋友们对…

2026-03-24

2025中国蓝牙耳机市场:小米登顶,华为漫步者紧随,行业未来向AI升级
小米依托Redmi系列覆盖入门级真无线市场,产品迭代稳定,搭配手机生态与渠道优势,实现高速增长。 产品结构方面,真无线耳机仍是主力,全年出货7721万台;开放式耳机增长20.2%,耳夹款式增速领先;头戴耳机受…

2026-03-24

雷军透露小米新一代SU7锁单超3万台,今日上午深圳开启首批交付
【环球网科技综合报道】3月23日,小米创办人、董事长兼CEO雷军在微博发文称:“过去两年,车主朋友们对我们的交付速度有很大抱怨。 雷军随后表示,“今天上午在深圳,我们将新一代SU7正式交付到了首批用户手中。…

2026-03-24