ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

iPhone本地跑Gemma 4火了,0 token时代还有多远?

时间:2026-04-06 17:41:04来源:机器之心编辑:快讯

谷歌前几天开源的新模型 Gemma 4,给了业内一个大大的惊喜。

它采用了与 Gemini 3 同源的技术架构,支持原生全模态,在 Arena AI 排行榜上拿到了全球第三,而且有多个型号可以选。几个较小的型号 —— E2B(有效参数 2.3B)和 E4B(有效参数 4.5B)—— 可以直接部署在手机端本地运行,上下文窗口达到 128K,可以说是「可以放进口袋的 Gemini平替」。

不出所料,模型发布后很快就成了手机用户的新玩具。

其中,一个 X 用户的帖子被围观数十万次。他在帖子里放了一个视频,讲述自己如何在 iPhone 上本地运行 Gemma 4,包括处理图片、音频、控制手电筒开关。他表示,Gemma 4 速度快得惊人,感觉像魔法一样。

自动播放

有人在 iPhone 17 Pro 上量化了这一速度,指出如果手机用的是苹果芯片,那么在针对这套芯片优化的 MLX(苹果的机器学习框架)的帮助下,模型的推理速度可以超过 40 token / 秒。

自动播放

还有人在三星 Galaxy 上也跑出了类似的速度,而且还是在开启了思考模式的情况下。这让人直呼「快得不真实」。

这样的速度让手机端运行 AI 模型成为了未来可以被接受的选项,而且在医疗等敏感场景中非常有用。

128k 的上下文窗口也让这些小模型变得更有吸引力。

那具体怎么运行呢?其实很简单,不是极客专属,因为谷歌发布了官方 App——Google AI Edge Gallery。想在手机上体验的人可以直接下载这个 App,然后下载想要运行的模型版本,之后打开就能跑了。

而且,由于是谷歌官方发布,安全问题自然也不用太担心。

除了这些在手机端运行的小模型,还有人在更强的硬件上尝试了更大的 Gemma 4 版本,比如在 M5 Pro 版本的 MacBook Pro 上运行 Gemma 4 Mixture-of-Experts 26B。

如果是直接对话,这个模型的速度还是很快的,文本生成、代码解释都很顺畅。

但当他真的将 Gemma 4 当成 coding agent 去用时,问题就来了。因为跑 agent 时需要大上下文(Gemma 4 26B 上下文窗口为 256k)、复杂 prompt 和稳定的工具调用,Gemma 4 在这些地方明显扛不住,经常卡住、报错,或者输出结构不对。

转折点发生在他将模型换成 qwen3-coder 的时刻 ,同样环境下,文件创建、命令执行、多步任务都能正常跑。他认为,问题不在 agent 框架,而在模型本身有没有为「工具调用 + 结构化输出」做过优化。在这方面,Gemma 4 可能做得还不够,也有可能这位开发者还没找到正确的用法。

还有人说,Gemma 4 在智力水平上还有点鸡肋。

虽然如此,Gemma 4 这种「性能小钢炮」的出现依然不容小觑。如果以后大量的日常查询、聊天、简单推理、代码生成、图像理解任务都可以本地跑了,不再需要买 token,那卖 token 的厂商岂不是处境很尴尬?

当然,当前情况还没有那么悲观,毕竟现在被开源出来的模型和前沿的旗舰闭源模型之间还有差距,而且大部分能打的开源模型依然受制于硬件能力,暂时还没办法在端侧达到可用级别。

但未来的趋势是清晰的。短期看,云端闭源模型在最前沿的复杂推理和超大规模多代理协作上依然领先;但长期看,当硬件继续进步、量化技术继续优化,端侧模型会逐步蚕食云端的高频简单任务。

那些只靠卖 token、卖 API 订阅的厂商,将不得不更狠地卷「真正难啃」的部分 —— 超强 Agent、超长可靠上下文、以及需要海量实时数据的专有能力。

Gemma 4 只是一个开始。下一个惊喜,可能就是某款端侧模型在日常使用中彻底让用户感觉不到「本地」和「云端」的区别。那一天到来时,整个 AI 产业的商业模式,都会迎来一次真正的洗牌。

更多热门内容
小米YU7 GT来袭:德系调校底盘搭配澎湃OS,50万内或搅动高端轿跑风云
底盘操控小米YU7GT底盘由欧洲研发中心调校,强调德系风格。麋鹿测试超82km/h,100-0km/h制动34.5米。前双叉臂+后多连杆悬架,配CDC电磁减震。动力性能双电机四驱版功率超500kW,800V架…

2026-05-18

小米YU7火山灰配色登场:融合自然美学,引领汽车设计新潮流
随着市场对个性化设计的需求不断增长,火山灰配色的推出无疑为消费者提供了新的选择。在全球汽车市场上,颜色和设计越来越成为品牌识别的重要组成部分。消费者对于这一新配色的期待,将进一步推动小米汽车在未来市场中的发展…

2026-05-18

小米YU7新推“火山灰”配色:矿物颗粒融入车漆 低调中彰显金属魅力
全新配色方案小米汽车重磅推出YU7全新“火山灰”配色,灵感汲取自火山地貌,高纯度灰调与纳米级矿物颗粒结合,光线折射下呈现丰富金属质感。工艺亮点特殊工艺:车漆融入矿物颗粒,不同角度光照下产生色彩变化。视觉效果:…

2026-05-18

小米YU7火山灰配色实车到店:灵感取自火山地貌,金属质感随光而变
小米YU7新配色:火山灰设计灵感:源自晨雾笼罩下的火山地貌。配色特点:高纯度灰调,融入纳米级矿物颗粒,光线变化下呈现金属质感。工艺亮点:特殊工艺使车身在不同角度光照下产生色彩变化。实车已到店小米YU7火山灰配…

2026-05-18

小米YU7 GT深度试驾:德系调校底盘搭配超强动力,智能座舱开启电动轿跑新体验
凭借卓越的性能与智能科技,这款车型在多场景实测中展现出了超强的操控精准度、动力响应及智能化体验,成为行业内的新标杆。YU7GT的底盘调校是其最大的亮点之一。在智能座舱方面,小米的澎湃OS系统实现了跨设备的生态…

2026-05-18

小米YU7火山灰配色登场:自然灵感邂逅科技,光影变幻尽显个性魅力
在2025年的汽车市场上,小米汽车再次引发关注,推出了全新的小米YU7火山灰配色。这一配色灵感源自晨雾缭绕的火山地貌,展现了独特的自然美感与现代工艺的完美结合。火山灰的颜色采用高纯度的灰调,融合了纳米级矿物颗…

2026-05-18

小米YU7火山灰配色登场,独特工艺打造金属质感引市场关注
这一配色灵感源自火山地貌,展现出晨雾笼罩下的自然美感。通过高纯度的灰色调与纳米级矿物颗粒的巧妙结合,火山灰在不同光线条件下呈现出细腻而富有层次的金属质感,既沉稳又不失高级感。小米汽车的这一创新不仅体现在配色上…

2026-05-18