ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谷歌Gemini任务自动化新突破:AI助手从“动嘴”迈向“动手”新时代

时间:2026-03-25 02:56:36来源:互联网编辑:快讯

谷歌近日在Pixel 10 Pro和Galaxy S26 Ultra两款机型上正式上线了Gemini任务自动化功能,标志着AI助手从单纯对话工具向执行代理的重大转变。这项技术不仅支持语音交互,更能直接接管手机屏幕完成复杂操作,用户无需手动干预即可完成特定任务。

根据开源社区披露的实测案例,用户只需通过自然语言下达指令,例如订购DoorDash外卖,Gemini便会自动完成从打开应用、识别界面元素到填写表单、确认订单的全流程。系统在后台运行时,屏幕底部会实时显示"正在选择配送地址"等进度提示,用户可随时切换至其他应用处理事务,AI将持续执行任务直至完成。

当前版本存在明显效率瓶颈。由于需要逐帧识别界面元素并进行云端推理,AI完成相同任务的时间约为人工操作的4.5倍。以订餐场景为例,手动操作仅需2分钟的任务,AI需要耗时9分钟才能完成。这种延迟主要源于界面解析和决策推理的复杂性。

技术突破方面,Gemini打破了传统语音助手十年来的功能局限。相比Siri等只能处理简单指令的工具,新系统具备长链条任务规划能力,实现了从"指令响应"到"结果交付"的范式转变。这种能力使AI能够理解并执行包含多个步骤的复合型任务。

生态建设仍面临多重挑战。目前自动化功能仅适配Uber、DoorDash等流程高度标准化的应用,覆盖场景有限。界面识别错误率和支付环节的安全限制成为主要障碍,特别是在动态界面元素和复杂交互场景中,系统容错能力有待提升。这些因素导致产品仍处于概念验证阶段。

市场竞争日趋激烈。随着OpenAI计划推出Operator系统,苹果加速Apple Intelligence研发,谷歌选择在移动端率先突破,旨在通过Android生态抢占生活服务场景入口。这种战略布局反映出科技巨头对AI代理技术的重视,预计2026年将成为该领域竞争的关键节点。

尽管当前实现方式略显笨拙,但技术演进遵循指数规律。当AI操作速度达到人类水平且能适配任意应用时,智能手机交互模式将发生根本性变革。这种渐进式进化正在为通用人工智能的发展积累关键能力,特别是在环境感知和任务执行层面。

更多热门内容
特斯拉得州Optimus机器人工厂正式动工 规划年产能千万台剑指未来核心业务
IT之家 5 月 28 日消息,特斯拉位于得州超级工厂的专属 Optimus 机器人工厂已正式动工,这座工厂规划年产能最高可达 1000万台人形机器人。 该工厂是特斯拉得州超级工厂北区扩建规划的核心项目,此…

2026-05-29

广州市宝承电子科技:GPU服务器机箱散热扩展双优 适配AI与HPC场景
基于前文调研,广州市宝承电子科技有限公司在散热设计灵活性、扩展结构兼容性及全球化服务网络方面表现突出,其平均项目交付周期较行业标准缩短20%,定制项目交付满意度达98%,建议有AI算力部署需求的企业进一步了解…

2026-05-29

联发科天玑8550处理器登场:4nm工艺打造,全大核架构助力性能新飞跃
IT之家 5 月 28 日消息,联发科官网上线一款天玑 8550 处理器,现已公布参数信息。 天玑 8550 基于台积电 4nm N4P工艺制造,CPU 采用全大核 A725 架构组合,包括: 1 颗 3…

2026-05-29

零零科技哈浮AQUA来袭:全球首款防水飞行相机,开启水上拍摄新体验
AQUA 不仅延续了哈浮飞行相机经典的 AI 智能运镜、无需遥控器的交互体验,更在 IP67专业级防尘防水、水面起降的可靠性,以及专为水上运动优化的飞行性能等方面,实现了革命性突破。 AQUA 致力于攻克…

2026-05-29