ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谷歌Gemma 3n端侧AI新突破:2GB内存设备也能高效运行多模态模型!

时间:2025-05-21 15:22:19来源:ITBEAR编辑:快讯团队

在近日举办的2025年I/O开发者大会上,谷歌推出了一项重大技术革新——Gemma 3n端侧多模态AI模型。这一创新技术能够在智能手机、平板电脑以及笔记本电脑等设备上实现本地运行,轻松处理包括音频、文本、图片和视频在内的多种数据类型。

据Gemma产品经理Gus Martins介绍,Gemma 3n模型不仅功能强大,而且极具兼容性,能在内存小于2GB的设备上流畅运行。其采用了与Gemini Nano相同的架构,但在性能上实现了显著提升。Gus表示:“Gemma 3n的推出,标志着设备端AI应用进入了一个全新的发展阶段,其表现力令人惊叹。”

Gemma 3n的亮点之一在于其应用了谷歌DeepMind团队研发的Per-Layer Embeddings(PLE)技术。这一技术显著降低了模型的内存需求,使得Gemma 3n在保持5B和8B参数量的同时,内存占用却分别仅相当于2B和4B模型。谷歌宣称,Gemma 3n的内存占用分别低至2GB和3GB,为移动设备上的AI应用提供了更多可能性。

除了内存优化外,Gemma 3n还通过PLE、KVC共享和高级激活量化等技术,在移动设备上的响应速度提升了1.5倍,同时质量也优于Gemma 3的4B版本。这一提升使得Gemma 3n在处理复杂任务时更加迅速和准确。

Gemma 3n在非英语语言处理方面也取得了显著进展。尤其在日语、德语、韩语、西班牙语和法语等语言中,其表现尤为突出。在多语言基准测试WMT24++中,Gemma 3n获得了高达50.1%的分数,展现了其强大的跨语言处理能力。

对于用户而言,使用Gemma 3n无需进行任何复杂设置。目前,用户已经可以通过Google AI Studio直接在浏览器中体验Gemma 3n的强大功能。而对于开发者来说,他们可以通过Google AI Edge集成本地功能,实现文本和图像的理解与生成。未来,谷歌还将继续扩展Gemma 3n的能力,为开发者提供更多便捷和高效的工具。

更多热门内容