ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

百度开源Unlimited OCR新模型:创新机制助力长文档解析,作者身份引猜测

时间:2026-06-26 16:11:44来源:快讯编辑:快讯

国产开源OCR领域迎来重大突破,百度最新发布的Unlimited OCR模型在长文档处理能力上实现质的飞跃。该模型采用革命性的参考滑动窗口注意力机制(R-SWA),在OmniDocBench基准测试中以93.92%的成绩刷新行业纪录,较前代DeepSeek OCR提升6.22个百分点。

传统OCR系统处理长文档时普遍采用"分页处理+结果拼接"的折中方案,这种模式如同机械抄写员般逐页重置上下文,导致显存占用随文档长度指数级增长。Unlimited OCR突破性地将人类抄写行为数字化:模型不再强制记忆全部历史内容,而是像专业抄写员那样仅保留当前工作所需的局部信息,配合完整的视觉参考实现连续解析。

技术团队创新性设计的R-SWA机制包含双重注意力路径:在视觉维度,模型始终保持对完整图像的全局感知;在文本维度,仅保留最近128个生成Token参与注意力计算。这种"全局视觉+局部文本"的混合架构,使模型在处理40页以上文档时仍能保持稳定性能,Distinct-35指标高达96.90%,编辑距离控制在0.1069以下。

实验数据显示,该模型在生成6000个Token时,推理速度较传统方案提升35%,且延迟波动幅度显著降低。其核心突破在于将KV Cache设计为固定长度队列,通过动态更新机制确保显存占用恒定,从根本上解决了长序列处理中的内存爆炸问题。这种设计使得模型在处理超长文档时,推理效率几乎不受输入长度影响。

该成果的技术辐射效应远超OCR领域。研究团队指出,R-SWA机制本质上是对注意力机制的重新定义,其"选择性遗忘"设计为长上下文处理提供了全新范式。相比传统扩容方案,这种生物仿生设计更符合人类认知规律,有望在语音识别、机器翻译等序列处理任务中引发连锁创新。

项目GitHub页面披露的技术路线图显示,团队正开发128K上下文版本,并探索构建"预填池"机制实现历史状态的按需调用。这种技术演进方向与DeepSeek OCR2形成战略呼应,前者聚焦视觉信息的高效理解,后者深耕长序列的记忆管理,共同构建起从感知到认知的完整技术链条。

值得关注的是,技术报告中出现的一位匿名作者"YY"引发行业热议。通过分析技术脉络和代码贡献,多位研究者推测该神秘人物可能是OCR领域资深专家魏浩然。这位曾主导GOT-OCR2.0开发的科学家,其研究轨迹与Unlimited OCR展现的技术特征存在显著关联,但截至目前尚未获得官方确认。

更多热门内容
孙正义股东大会火力全开:力挺AI无泡沫,硬刚马斯克太空数据中心计划
在软银年度股东大会上,68岁的孙正义火力全开,驳斥AI泡沫论,宣布软银已启动机器人量产,公开叫板马斯克的“太空数据中心”计划。在日本国内,孙正义确认软银仍是东京电力公司引入外部资本、建设AI数据中心的重要候…

2026-06-26

OpenAI内部大变革:Codex成“主力军”,AI编程工具应用趋势凸显
Codex是OpenAI面向开发者推出的端到端AI编程智能体,不同于简短且自成一体的聊天机器人,Agentic AI可在短时间内独立运行,同时协调工具调用、与环境交互,不断迭代以达成解决方案。OpenAI的…

2026-06-26

从2026到2077:京东“涅槃计划”引领物流变革,见证人机共生的温暖未来
效率突破之后,物流行业的核心命题彻底重构:单纯追求“更快送达”的高速增长时代落幕,如何依托“矩”的全域基准,搭建一套可信、可追溯、可仲裁的全域智能调度体系,成为2077年智能物流的新内核。 最初几年,行业普遍…

2026-06-26

港大阿里联合打造FineVLA框架:让机器人精准执行人类细粒度语言指令
数据层 :从异构数据到细粒度标注的完整构建流程 模型层 :用于可扩展机器人视频细粒度标注的RoboFine-VLM 评测层 :用VQA和Caption衡量VLM对机器人视频理解与标注的RoboFine-B…

2026-06-26

中国移动携手产业伙伴发布OpenAN项目,推动自智网络迈向L4级新征程
在实际网络运营工作中,多个智能体需要协同完成复杂任务,现有开源多智能体框架在适配网络运营场景时存在不足,如互联网暴露风险高、交互效率低,以及无法完全私有化部署等问题,限制了其大规模工程化应用。未来,中国移动将…

2026-06-26

长春新区具身智能机器人产业:从布局到跃升,科创动能澎湃
作为吉林省具身智能产业发展的先导区、核心区,长春新区锚定产业新高地建设目标,精准布局、精准施策,持续夯实产业发展根基。目前,新区重点培育吉林省吉翼具身智能机器人有限公司、吉林省仿生机器人创新中心有限公司、一…

2026-06-26

从爆仓到智能飞跃:东莞攀爬机器人引领中国物流开启全球提效新征程
我们习以为常的送货速度背后,是中国物流系统一场不动声色的升级与蜕变,在菜鸟东莞跨境仓里,超过100台攀爬机器人正在上演现实版“蜘蛛侠送货”,10秒就能爬上五层楼,拣选效率暴涨了100%。 从当初靠人力硬扛…

2026-06-26

2026胡润全球独角兽榜单出炉 字节跳动中国第一 蚂蚁集团第二
6月26日,胡润研究院正式发布《2026全球独角兽榜》,列出了全球成立于2000年之后、价值10亿美元以上的非上市公司。榜单显示,全球共有来自52个国家、299座城市的1603家独角兽企业上榜,较去年增加80家;全球独角兽总价值达到54万亿元,同比增长43%,创下新高。从国家分布

2026-06-26

小米YU7 C-NCAP测评成绩揭晓:综合得分率93.5% 各项指标表现优异
其综合得分率(93.5%)高于平均水平的88.4%;乘员保护得分率(96.16%)也显著高于92.49%的平均值;在VRU保护方面,83.06%的得分同样高于79.86%的平均线;而主动安全得分率(99.26…

2026-06-26