延迟低于 0.2 秒！Mistral AI 发布 Voxtral Transcribe 2 语音模型，支持中文实时转录-人工智能-ITBear科技资讯

法国人工智能初创公司Mistral AI近日宣布推出全新的语音转文字模型系列——Voxtral Transcribe2。这一系列包含两款针对不同应用场景优化的模型，旨在解决语音交互中的高延迟和成本痛点。

其中，最受关注的是名为 Voxtral Realtime 的实时转录模型。该模型拥有4B（40亿）参数规模，采用创新的流式架构。其核心亮点在于极致的响应速度:模型可以在音频输入的瞬间同步进行转录，官方数据显示其转录延迟已被压缩至200ms(0.2秒)以下。这意味着在实时对话或同声传译场景中，用户几乎感受不到处理停顿。为了促进开发者社区的生态建设，Mistral AI已以 Apache2.0协议正式开放了该模型的权重。

另一款模型 Voxtral Mini Transcribe V2 则主打大批量处理与极高性价比。该模型专门为处理长音频设计，单次请求即可支持长达3小时的录音文件。在准确率表现上，Mistral 官方表示该模型已超越了 GPT-4o mini Transcribe 和 Gemini2.5Flash。

在语言支持与成本方面，两款新模型均具备出色的普适性，支持包括中文在内的13种主流语言。定价策略也十分具有竞争力:离线批处理版 API 价格为每分钟0.003美元，而追求极致性能的实时版 API 价格则为每分钟0.006美元。

划重点:

⚡ 极低延迟: Voxtral Realtime 模型将转录延迟降至200ms 以内，支持音频即时转录，且已开源模型权重。

高德空间智能新探索：AI从信息载体进化为行动系统，引领范式变革

2026-05-22

星元晶算与清华天津装备院携手共探人形机器人芯片原子级制造新路径

美通社消息：2026年5月19日，星元晶算科技（深圳）有限公司与清华大学天津高端装备研究院完成签约仪式，双方将围绕“面向人形机器人关节模组的氮化镓器件原子级制造工艺发展态势、前瞻与应用前景研判”开展深度合作，…

2026-05-22

曾剑平谈AI入金融：风险叠加需早治理，人才要懂数据模型边界

在金融场景中，信用评估、欺诈检测、客户画像和风险识别等任务都高度依赖数据，如果训练数据被污染或包含偏见，模型输出就可能带来错误判断，甚至对不同客户和企业形成不公平结果。因为我是做人工智能安全相关研究的，所以看…

2026-05-22

5G-A赋能智慧景区：导游机器人与外卖机器狗上岗开启高效网络新体验

如果说5G网络带来了更快的下载速率，那么5G-A网络，则可以根据需要，大幅提升数据“上传”到基站网络中的传输能力。中国移动浙江公司规划技术部5G技术专家徐林忠：景区大概部署了46个5G-A基站，实现了…

2026-05-22

浙江台玖：携双轴光热减速机及高精密传动部件亮相成都光热盛会

2026-05-22

AI助手们，骗了人不能只说「对不起」

2026-05-22

消息称OpenAI一季度营收57亿美元高于Anthropic但二季度有压力

2026-05-22

伯特利冲刺港交所上市：智能底盘领航，拓展具身机器人新赛道

2026-05-22

解码Token（词元）：从概念到产业变革，数据时代新引擎如何运转？

2026-05-22

​延迟低于 0.2 秒！Mistral AI 发布 Voxtral Transcribe 2 语音模型，支持中文实时转录

延迟低于 0.2 秒！Mistral AI 发布 Voxtral Transcribe 2 语音模型，支持中文实时转录