据海外科技媒体《The Information》披露,OpenAI正在秘密研发一款突破性音乐生成工具,该系统能够基于文本描述和音频片段自动创作音乐作品。这项创新技术或将颠覆传统音乐制作流程,为视频创作者和音乐人提供全新的创作方式。
内部人士透露,该工具具备两大核心功能:其一可为现有视频自动生成适配的背景音乐,其二能为人声录音添加定制化的乐器伴奏。例如用户上传一段人声清唱,系统即可生成吉他、钢琴等乐器的实时伴奏,这种交互方式在现有音乐生成技术中尚属罕见。
研发团队目前正与茱莉亚音乐学院展开深度合作,通过专业音乐生对海量乐谱进行结构化标注,构建高质量的训练数据集。这种跨学科合作模式确保了系统对音乐理论的深度理解,使其生成的旋律更符合专业音乐标准。
关于产品形态,OpenAI尚未确定最终方案。消息称该技术可能以独立应用形式推出,也可能整合到ChatGPT或视频生成工具Sora中。值得注意的是,尽管OpenAI此前发布过音乐生成模型,但这些技术均早于ChatGPT时代,此次研发标志着其在音频生成领域的重大升级。
当前科技巨头在AI音乐领域竞争激烈,谷歌和初创公司Suno均已推出类似产品。OpenAI的新工具能否在专业性和实用性上实现突破,将成为其抢占市场的关键。公司发言人对此保持沉默,仅表示将持续探索AI在创意领域的应用边界。








