ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谷歌推出Gemini 2.5 Computer Use模型:聚焦浏览器操作与界面交互新突破

时间:2025-10-08 09:13:05来源:互联网编辑:快讯

谷歌近期推出了一款名为“Gemini 2.5 计算机使用”的新型人工智能模型,该模型专注于通过浏览器与网络交互,使AI智能体能够在专为人类设计的用户界面中执行任务。这一创新旨在填补当前AI在非API依赖型系统操作中的空白,例如自动填写并提交网页表单等场景。

据介绍,该模型的核心能力源于其“视觉理解与推理”技术,能够解析用户请求并转化为具体的浏览器操作。谷歌透露,这一特性使其不仅适用于用户界面测试,还可操作那些仅面向人类用户、未开放API接口的系统。此前,谷歌已在AI Mode智能体功能和研究项目“Mariner”中验证了类似技术,例如通过AI根据食材清单自动将商品添加至购物车。

在竞争层面,谷歌此次发布恰逢OpenAI于年度开发者日推出ChatGPT新应用次日。OpenAI正持续强化其“ChatGPT智能体”功能,该功能可代理用户完成复杂任务。与此同时,Anthropic公司已于去年推出Claude AI模型的“计算机使用”版本,形成三足鼎立之势。

谷歌通过演示视频展示了新模型的实际运行效果,并特别说明视频播放速度已加速至3倍。测试数据显示,该模型在网页和移动端基准测试中表现优于现有主流方案。与竞品不同的是,谷歌明确限制模型仅在浏览器环境中运行,无法操控整个计算机系统。官方强调,当前版本“未针对桌面操作系统层级控制进行优化”,目前支持包括打开浏览器、文本输入、页面元素拖放等13种基础操作。

开发者可通过Google AI Studio和Vertex AI平台获取该模型,Browserbase平台则提供在线演示服务。用户可实时观察模型完成“玩2048游戏”或“浏览Hacker News热门话题”等任务,直观体验其与浏览器环境的交互能力。

更多热门内容
AMD牵手OpenAI:6吉瓦GPU部署协议达成,共筑AI算力新蓝图
OpenAI 的联合创始人兼首席执行官山姆·奥特曼(SamAltman)在合作声明中表示:“这一合作是构建实现人工智能全部潜力所需计算能力的重要一步。 整体来看,与英伟达的交易占据了 OpenAI 更广泛…

2025-10-08

24岁广州女学霸洪乐潼:从奥数奖牌到AI创业,首轮融资4.6亿的数学突围者
毕业前后,洪乐潼先是拿下Schafer数学卓越奖,该奖每年仅颁发给一名本科女生;后获得北美数学本科生的最高荣誉——摩根奖,她是第五位获此殊荣的女生。 还有此前完成天使轮融资的灵初智能,由高瓴创投和蓝驰创投领投…

2025-10-08

2025年诺奖聚焦量子力学:宏观突破引领未来科技新变革
在2025年,约翰·克拉克、米歇尔·德沃雷和约翰·马丁尼斯三位科学家因其在超导材料与量子计算领域的突破性研究,荣获这一殊荣。他们的研究揭示了量子隧穿现象在电路中的宏观表现,这不仅是物理学的里程碑,更为我们未来…

2025-10-08

邢台12个大模型落地应用 人工智能助力特色产业集群加速升级
近年来,我市聚焦特色产业集群和重点产业,积极开展“人工智能+”行动,以人工智能赋能产业集群转型升级,着力推动人工智能大模型建设训练和应用。同时,接入国家一体化算力网络,有望建成长江以北最大的市场化AI算力集聚…

2025-10-07

宜人智科魔方AI平台升级显成效 商业化推进拓展金融科技新增长
宜人智科50%的服务员工已配备协同智能体,客户响应时间明显加快,满意度与留存率同步提升;资金管理智能体实现了100%资金部署,最大限度降低了资金错配风险;系统监控智能体每日减少3小时人工值班时长,同时能自动检…

2025-10-07