ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阶跃星辰推「Step-GUI」系列模型 端云协同拓展GUI Agent能力边界

时间:2025-12-18 07:49:33来源:互联网编辑:快讯

近日,人工智能领域迎来一项重要进展,阶跃星辰正式推出全新AI Agent系列模型「Step-GUI」,涵盖云端模型、首个面向GUI Agent的MCP协议,以及业内首个支持手机部署的开源端侧模型Step-GUI Edge。这一技术方案通过端云协同架构,在保障用户隐私安全的同时,显著提升了GUI Agent的功能覆盖范围,目前已支持在淘宝、微博、抖音、小红书、闲鱼等200余个主流应用场景中执行复杂任务。

该方案的核心优势在于其隐私保护机制与能力扩展的平衡性。通过端侧模型处理敏感数据,云端模型提供算力支持,用户可自主控制数据流转范围,实现"隐私边界可知可控"。与此同时,端云协同架构突破了传统单一模型的能力限制,使Agent能够理解并操作复杂界面元素,完成跨应用的任务链执行。例如,用户可通过自然语言指令让Agent同时完成电商比价、社交分享、内容创作等跨平台操作。

技术开源策略进一步降低了开发门槛。个人开发者与硬件厂商可基于Step-GUI Edge模型快速构建定制化Agent助手,该模型在移动端的轻量化设计使其能在主流智能手机上流畅运行。据测试,开发者仅需10分钟即可完成从模型部署到功能上线的全流程,这为智能硬件、物联网设备等终端产品的智能化升级提供了高效解决方案。

这场技术竞赛已引发行业连锁反应。就在Step-GUI Edge开源后不久,字节跳动迅速推出豆包手机助手技术预览版,智谱AI也跟进开源了AutoGLM模型。三款产品均聚焦GUI交互场景,标志着GUI底层模型技术进入爆发期。业内分析指出,随着这类技术的普及,终端设备将加速向"Agent化"演进——设备不再仅仅是执行指令的工具,而是能主动理解用户需求、自主完成复杂任务的智能伙伴。

这种转变正在重塑终端市场的竞争逻辑。传统以硬件参数为核心的比拼模式,正逐步让位于"场景适应力"与"生态整合度"的较量。据预测,2026年将成为关键转折点,届时具备强GUI交互能力的终端设备将占据市场主导地位,用户入口体验与行业格局或将因此发生根本性改变。当前,各大厂商正围绕模型效率、多模态交互、跨平台兼容性等维度展开激烈角逐,这场竞赛的结果将决定未来三年智能终端市场的权力版图。

更多热门内容
马斯克将开源X平台推荐算法,首期一周内释出且后续每四周更新
来源:福布斯中文网 【#马斯克宣布将开源X推荐算法#,承诺每四周更新一次】马斯克今日宣布,将在一周内正式开源

2026-01-11

阿里千问大模型2025年12月下载量领先,累计下载量突破7亿成开源首选
【1月9日阿里千问大模型下载量爆发增长】1月9日消息,HuggingFace最新数据披露,阿里千问大模型迎来爆发式增长。2025年12月,千问模型下载量超过2到8名总和。自2025年下半年下载量超越Meta后…

2026-01-11

马斯克再放大招:X平台算法将开源,xAI砸200亿建数据中心抢跑AI赛道
马斯克称,本次开源将覆盖“所有用于决定向用户推荐自然内容和广告内容的代码”,并强调这只是第一步。针对这一问题,马斯克在去年10月确认,公司在“For You”(推荐)算法中发现了一个“重大漏洞”,并承诺进行…

2026-01-11

2026 AI编码革命来袭:程序员转型正当时,与AI共舞创未来
2026 年刚开年,马斯克在社交媒体上喊出 “2026 是奇点元年” 的推文还没降温,Anthropic 公司就甩出了 Claude Opus4.5。谷歌和 Anthropic 的工程师也坦言,现在他们内部…

2026-01-11

听脑AI深度测评:性价比、功能、安全三重优势,多场景适用之选
听脑AI:免费版基础功能够用,专业版99元/月。 长录音处理,我拖了个2小时的专家访谈进来。 中等收入的专业人士,比如医生或法务专员,如果每周要做几次访谈或汇报,听脑AI是标配。其实核心功能—转写+区分说话…

2026-01-11