ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

欧洲Mistral AI发布OCR新品,能否激发中国AI开源新动力?

时间:2025-03-14 17:26:17来源:ITBEAR编辑:快讯团队

近期,欧洲科技界再度迎来了一股新鲜力量。法国初创企业Mistral AI,这家曾因开源首个MoE模型而声名鹊起的公司,在沉寂一段时间后,携其最新力作——Mistral OCR重返舞台。

Mistral OCR自问世以来,便以“全球顶尖OCR产品”自居,旨在攻克AI在识别粗糙复杂文件时的难关,让AI操作识别更加顺畅。消息一出,社交媒体上瞬间好评如潮,但其中也不乏一些理性声音。

有用户表示,尽管对Mistral OCR的能力颇为认可,但其定价策略却让人望而却步,并呼吁中国AI企业能够尽快推出类似开源版本,以打破价格壁垒。

更有用户亲自上阵测试,上传了手写板内容的扫描件,但识别结果却不尽如人意,文字正确率偏低。

还有被Mistral OCR所宣传的“多语言识别能力”所吸引的用户,在实际使用后却发现该产品无法识别自己所使用的语言。

尽管Mistral OCR目前还存在一些局限性,但其问世无疑标志着从字符识别向场景智能的一次跨越。与传统OCR API不同,Mistral OCR是一款多模态API,不仅能够识别文本中的插图或照片,还能为这些图形元素创建边界框,并将其包含在输出中。

从Mistral AI团队发布的Demo视频中可以看到,Mistral OCR能够将图文混排的PDF文件轻松转换为结构清晰的Markdown格式文件,无论是表格与数字的组合、数学公式的转换,还是宣传图片中的印地语识别,甚至是拍得并不方正的论文照片,甚至是带有水印的文字,都能得到准确识别。

除了直观的Demo展示外,Mistral AI团队还列举了Mistral OCR的六大优势:卓越的复杂文档解析能力、原生支持多语言与多模态、行业领先的基准测试表现、同类产品中处理速度最快、创新性的“文档即提示”结构化输出,以及可选的自托管部署方案。

团队还将Mistral OCR与Google document AI、Azure OCR、Gemini系列模型以及GPT-4o等产品进行了性能对比,结果显示,Mistral OCR在总体准确率、数学公式识别等方面表现尤为突出,特别是在2503版本中,各项指标均实现了大幅提升。

在多语言处理方面,Mistral OCR的数据更是远超Google document AI和Azure OCR。

作为法国科技界的佼佼者,Mistral AI凭借其AI助手Le Chat和多个基础模型,已被官方视为最具潜力的科技公司之一,甚至被认为是有望与OpenAI一较高下的欧洲企业。Mistral AI的三位创始人拥有丰富的AI研究经验,曾在谷歌DeepMind和meta等全球顶级科技公司任职。自成立以来,Mistral AI在资金筹集方面取得了显著成绩,致力于将前沿AI技术普及给每个人。

更多热门内容