ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek新模型引AI圈热议:视觉路线或成大模型新方向,Karpathy等大佬怎么看?

时间:2025-10-21 20:12:12来源:互联网编辑:快讯

近日,一款名为DeepSeek-OCR的开源模型在AI领域掀起热议。该模型通过将文本转换为视觉token的方式,实现了对长文本的高效压缩与处理,引发了学界与产业界的广泛关注。GitHub平台显示,项目上线首日便收获超过4000个Star,社区活跃度持续攀升。

据技术文档披露,DeepSeek-OCR可将千字级文本压缩为百个视觉token,压缩率达十倍的同时保持97%的精度。实验数据显示,单块英伟达A100显卡每日可处理20万页文档,这种处理效率为解决大模型长上下文难题提供了新思路。研究团队指出,视觉token的压缩效率较传统文本token提升显著,理论上万字文本仅需约1500个视觉token即可完整表征。

学术界对技术路径的溯源显示,2022年哥本哈根大学等机构在《Language Modelling with Pixels》论文中已提出类似构想。该研究构建的PIXEL架构通过像素重建训练语言模型,后续CVPR 2023、NeurIPS 2024等顶会论文持续完善这一方向。不过,DeepSeek团队通过技术创新将视觉token的压缩效率提升至新高度,这种工程突破仍被视为重要进展。

技术社区的实践验证迅速展开。Django框架联合创始人Simon Willison仅用4个提示词、耗时40分钟便在英伟达Spark硬件上完成部署,科技视频博主NiceKate AI则成功将其移植至Mac平台。这些实践表明,该模型在多种硬件环境下的适配性良好。

争议声音同样存在。meta研究员Lucas Beyer直言技术路径缺乏渐进性,与人类认知模式存在差异。部分研究者指出,视觉token的引入可能影响模型的语言表达能力,迫使系统更多依赖视觉思维。这种范式转换对模型下游认知能力的影响,尚需更多实验验证。

技术融合的想象空间被进一步拓展。有研究者设想,若将该技术与稀疏注意力机制结合,可能使模型上下文窗口扩展至千万级token。届时,企业可将完整知识库预加载至模型,实现类似人类专家级的知识调用能力。这种设想引发对"工作记忆"容量提升的热烈讨论。

在跨文化交流层面,该模型的中英文示例引发海外研究者兴趣。论文中引用的"先天下之忧而忧,后天下之乐而乐"等中文名句,成为技术社区理解东方智慧的特殊窗口。这种文化碰撞现象,折射出AI技术发展中的多元文化互动趋势。

更多热门内容
科大讯飞2025年Q3业绩向好,大模型中标金额领先,产业生态持续拓展
根据财报,“讯飞星火”在国产算力上夯实自主可控优势的同时,保持了人工智能业界第一梯队水平:7月25日,基于全国产算力训练的“讯飞星火 X1”升级版正式上线,在数学、翻译、推理、文本生成等方面持续进步并保持业…

2025-10-21

远景张雷:中国有望凭物理人工智能,三年内领跑能源大模型赛道
但在物理人工智能、能源大模型方面,美国没有足够多的工业化场景和复杂能源系统来提供海量数据,在风机、储能等新能源制造方面也缺少实践,怎么搞得好?”他以远景赤峰零碳氢能产业园为例解释称,这个项目以全球最大绿色氢氨…

2025-10-21

第四届陕西省科协年会咸阳学术周:“大模型时代”智能计算论坛共探前沿
10月18日,由陕西省计算机学会学术工作委员会、人工智能专委会联合主办,咸阳师范学院承办的第四届陕西省科协年会咸阳学术周“大模型时代的智能计算论坛”在咸阳师范学院渭城校区弘道楼五层报告厅举行。他表示,本次论坛…

2025-10-21

百度世界2025大会启幕,多场分论坛共探AI应用新边界与新可能
随着AI进入大规模应用临界点,百度世界2025将聚焦智能体、数字人、AI计算、智能硬件等前沿议题,设置多场分论坛,与用户、开发者和企业伙伴共同探索技术赋能应用的下一站。论坛将展示AI对内容创作流程的重构,及…

2025-10-21

谷歌AI Studio明日发布新工具,降低开发难度或引AI应用创新热潮
10月21日消息,谷歌AI Studio团队核心成员LoganKilpatrick在社交平台连续发文,预告团队即将于明日推出全新AI开发工具,引发科技圈关注。 Logan Kilpatrick 在推文中透露…

2025-10-21

亚马逊云科技峰会聚焦:一站式赋能软件企业出海与AI业务创新
“AI Agents与工具” 已正式上线亚马逊云科技Marketplace,目前覆盖超过1900种来自领先提供商的AIagents与相关工具,客户可通过这一渠道便捷地发现、采购、部署并管理AI agent…

2025-10-21

百度世界2025大会将启,李彦宏主论坛演讲或带来AI领域多项关键发布
据了解,随着AI进入大规模应用临界点,百度世界2025将聚焦智能体、数字人、AI计算、智能硬件等前沿议题,设置多场分论坛,与用户、开发者和企业伙伴共同探索技术赋能应用的下一站。论坛将探讨智能体如何高效破解业…

2025-10-21

谷歌CEO坦言:OpenAI先推ChatGPT带来启示,谷歌需更快且更敢推产品
令人意外的是,Pichai并未将ChatGPT的上线简单看作危机,而是视为“窗口已被打开”的转折点。 回顾谷歌自家的AI之路,Pichai提到:谷歌长期以来从基础设施、定制芯片、研究机构等多个维度布局AI,…

2025-10-21

前OpenAI核心成员Karpathy:AGI需十年突破瓶颈,大模型与人类学习均有局限
Andrej Karpathy:这实际上是对之前一句名言的回应,我不确定这句话是谁说的,他们暗示就大语言模型及其未来发展而言,现在是智能体的十年。我期望未来能让模型在预训练中融入对材料的深度反思与消化环节,…

2025-10-21

DeepSeek新模型引热议:视觉路线成AI圈焦点,Karpathy等大佬怎么看?
这种方式或许可以解决大模型领域目前头疼的长上下文效率问题,更重要的是,如果「看」文本而不是「读」文本最终被确定为正确的方向,也意味着大模型的范式会发生重要的转变。 不过,值得注意的是,有不少研究者指出,De…

2025-10-21