ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Allen人工智能研究所推出MolmoWeb:开源视觉网络智能体新选择

时间:2026-04-03 06:46:09来源:快讯编辑:快讯

人工智能领域迎来重要进展——Allen人工智能研究所(Ai2)正式推出开源视觉网络智能体MolmoWeb。作为Molmo 2模型家族的新成员,该系统以独特的技术路径和开源特性引发关注,其40亿参数与80亿参数两个版本均支持本地部署,为研究人员提供了轻量化的研究工具。

与传统依赖专有模型蒸馏训练的网络智能体不同,MolmoWeb采用创新的数据构建方式。研发团队通过可访问性树技术生成合成轨迹数据,结合3万个人类任务轨迹组成的训练集,其中包含1100多个网站的近60万个子任务。这种混合训练策略使模型既能理解网页结构,又能模拟人类操作逻辑。训练数据还包含220万组问答对,通过让模型回答关于400个网站截图的问题,强化其信息检索能力。

在功能实现层面,该系统具备完整的浏览器操作能力。通过分析网页截图预测行动步骤,可完成导航跳转、表单填写、商品搜索等复杂任务。其操作方式与人类用户高度相似,通过模拟点击、文本输入和页面滚动等交互行为推进任务流程。这种设计使其能够适应不同网站的结构变化,无需针对特定平台进行定制开发。

基准测试数据显示,MolmoWeb在浏览器操作任务中表现优异。其性能超越OpenAI旧版GPT-4o模型,在开放权重模型领域更是一骑绝尘,40亿与80亿参数版本均领先于Fara-7B和GLM-4.1V-9B等同类产品。不过研究人员坦言,当前专有模型在综合性能上仍保持优势,但MolmoWeb的开源特性为学术界提供了重要的研究基线。

该项目团队强调,开源生态的完整性比单一模型性能更重要。此次发布不仅包含模型权重和训练代码(即将上线),还同步开放了评估工具和人类演示数据集。其中人类任务轨迹数据集的规模创下公开数据集新纪录,为后续研究提供了丰富的训练素材。这种全链条开源策略旨在破解当前网络智能体研究中的可复现性难题,推动技术透明化发展。

目前,MolmoWeb已通过Hugging Face和GitHub平台向全球研究者开放下载。其轻量化设计使个人开发者也能在消费级硬件上运行模型,这为中小研究团队参与网络智能体开发提供了可能。随着训练数据的持续扩充和社区贡献的加入,这个开源系统有望催生更多创新应用。

更多热门内容
AI发展新动态:OpenAI跨可靠性阈值,AI自我加速与垂直应用潜力并存
尤其是在网络安全、AI智能体写代码这块,给人的感觉真是日新月异,AI的进展让人感觉像突然「跳了一大格」。 Dubois提到,尤其在编程场景里,研究人员自己天天写代码,模型一变强,等于全员多了个不睡觉的搭档—…

2026-06-06

云深处DR02人形机器人升级:适应复杂工况,助力变电站精细化运维作业
【太平洋科技】近日,云深处科技宣布对DR02人形机器人完成产品升级,机型突破以往性能演示阶段,落地变电站实操场景,形成从环境移动到现场作业的商用落地能力。 整机拥有IP66防尘防水规格,可在粉尘、淋雨、高…

2026-06-06

AI递归自我改进引热议,Anthropic预测未来走向,我们该何去何从?
Anthropic给出的判断是,如果按现在的趋势继续下去,AI自己设计、构建下一代AI,是完全可能发生的。 Anthropic抛出的数据很亮眼,但是AI未来到底会发展到什么程度,Anthropic也不敢把话…

2026-06-06

英特尔携手鸿海科技:共探AI机柜新路径 加速边缘与物理AI应用落地
双方将共同探索从芯片、机柜(机架)、系统到应用的全方位 AI 解决方案,并加速由 AI 驱动的技术推动边缘和 Physical(物理 /实体)AI 应用。 双方在边缘和物理 / 实体 AI 领域将共同定义…

2026-06-06

AI时代网络安全挑战升级,齐向东:构建纵深防御体系跑赢攻防竞速
在齐向东看来,具身智能是一个连接大模型的智能体装在一个有控制单元的物体中,最典型的具身智能是智能驾驶汽车。齐向东表示,解决具身智能的安全问题,如果还是以往安全公司和产业公司互相独立地去做外挂,是解决不了的。 …

2026-06-06

从5G到6G:新一代通信网赋能全域智联 激活内需新引擎
地面层面,我国5G网络规模化商用水平全球领先,基站数量持续稳居全球首位,实现城市、乡镇、重点行政村全覆盖;5G-A网络加速迭代升级,商用试点范围持续扩大,核心性能持续优化,成为衔接5G与6G的关键过渡技术。从…

2026-06-06