在科技界的瞩目之下,谷歌于2025年I/O开发者大会上震撼发布了其最新研发成果——Gemma 3n,一款专为内存有限设备量身打造的端侧多模态AI模型。这款模型不仅能够处理包括音频、文本、图片和视频在内的多种数据类型,而且其运行需求之低,仅需2GB内存便能在智能手机和平板电脑上流畅运行。
Gemma 3n的核心优势源自其基于Gemini Nano架构的设计,并融入了谷歌DeepMind团队研发的Per-Layer Embeddings(PLE)技术。这项技术的一大突破在于,尽管Gemma 3n的参数量分别达到了50亿和80亿,但其内存占用却能够媲美20亿和40亿参数的模型,极大地拓宽了其在低内存设备上的应用前景。据Gemma 3n的产品经理Gus Martins介绍,这一创新为设备端AI应用带来了前所未有的表现力。
除了PLE技术,Gemma 3n还集成了KVC共享和高级激活量化等先进技术,这些技术的融合使得模型在移动设备上的运行效率得到了显著提升,响应速度提高了1.5倍,同时保持了比Gemma 3 40亿参数版本更高的质量水平。这一性能优化无疑为移动设备的AI应用注入了新的活力。
值得注意的是,Gemma 3n在非英语语言的处理能力上也取得了显著进步,特别是在日语、德语、韩语、西班牙语和法语等语言上展现出了卓越的性能。在WMT24多语言基准测试中,该模型以50.1%的高分,充分证明了其强大的多语言处理能力,为全球范围内的用户带来了更加便捷和精准的AI体验。
对于普通用户而言,无需进行任何复杂设置,即可通过Google AI Studio在浏览器中轻松使用Gemma 3n。而对于开发者来说,他们则可以利用Google AI Edge将Gemma 3n的本地功能无缝集成到自己的应用中,从而为用户提供更加丰富的文本和图像理解与生成功能。这一举措无疑为开发者提供了更加强大的工具,也为AI技术的广泛应用开辟了新的道路。