ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

OpenAI重磅升级:Whisper语音转录模型提速8倍,质量不减!

时间:2024-10-03 12:12:11来源:ITBEAR编辑:快讯团队

【ITBEAR】在近日举办的DevDay活动日中,科技巨头OpenAI宣布推出全新的语音转录模型——Whisper large-v3-turbo。该模型拥有8.09亿参数,以其卓越的性能和速度引起了业界的广泛关注。

作为large-v3的优化版,Whisper large-v3-turbo在保持高质量转录的同时,实现了速度的大幅提升,比原版large-v3快8倍。新模型仅包含4层解码器层,相较于large-v3的32层,结构更为精简。

Whisper large-v3-turbo在参数规模上也有所调整,略大于7.69亿参数的medium模型,但远小于15.5亿参数的large模型,实现了性能与效率的平衡。同时,新模型所需的VRAM降低至6GB,相较于large模型的10GB,进一步减轻了硬件负担。

OpenAI表示,新模型的大小仅为1.6GB,便于用户下载和使用。同时,公司将继续遵循MIT许可证,提供包括代码和模型权重在内的Whisper资源,以支持开发者社区的创新和发展。

据Awni Hannun的测试结果显示,在M2 Ultra平台上,使用Whisper large-v3-turbo将12分钟的内容转录仅需14秒,展现了其强大的实时转录能力。

感兴趣的用户可以通过GitHub、Hugging Face等平台获取模型并在线体验其卓越性能。

更多热门内容
小红书“红猫计划”启航,电商赚钱逻辑仍在深度探索中
在这个过程里,蘑菇街MCN与小红书一步步共同完善了“小红书Playbook”——这是一本给到博主与品牌在小红书直播的指导手册,帮助他们更好的在小红书场域内做好直播。 “我们会以开拓者的姿态,帮助小红书探索直播…

2025-05-08