Stability AI推出Stable Audio3：突破硬件限制长音频实现即时高效生成-人工智能-ITBear科技资讯

知名人工智能企业Stability AI近日推出新一代音频生成系统Stable Audio3，该系统通过开源部分模型权重的方式向全球开发者开放核心技术。作为基于潜扩散架构的音频创作工具，这款模型在双声道立体声输出质量和实时处理能力方面取得突破性进展，能够满足从音乐制作到影视音效的全场景需求。

技术团队创新性地将语义声学自编码器（SAME）与扩散变换器结合，构建出独特的双模块架构。其中SAME自编码器实现4096倍音频压缩率，将原始音频数据压缩为极简的潜在空间表示，使得模型在消费级硬件上即可完成长篇幅音频的实时生成。这种设计彻底改变了传统音频生成对专业工作站的依赖，个人创作者使用普通笔记本电脑就能完成专业级音乐制作。

该系统的核心优势体现在动态算力分配机制上。通过variable-length技术，模型可根据用户指定的音频时长自动调整计算资源消耗，避免传统固定长度模型造成的算力浪费。测试数据显示，在配备高性能GPU的环境下，生成20秒音频仅需0.62秒，处理380秒完整乐曲也仅耗时1.31秒，渲染效率较前代产品提升超过300%。

训练流程的革新同样值得关注。研发团队采用三阶段渐进式训练策略，使模型在推理阶段摆脱对传统无分类器指导技术的依赖，实现真正的单步前向传播。这种设计不仅加快了生成速度，还显著提升了音频质量的稳定性。目前开放下载的轻量级和中量级模型已登陆Hugging Face平台，面向商业用户的高性能版本则通过授权方式提供。

在功能扩展方面，新模型引入基于内补成像技术的智能编辑模块，支持对生成音频进行精准切片、拼接和效果处理。创作者可以像操作图像编辑软件那样，对音频波形进行可视化修改，这种非破坏性编辑方式为音乐创作带来全新可能。从电子音乐制作到影视后期配音，该系统正在重新定义数字音频创作的工作流程。

文物安全新守护者！国内首颗文物遥感卫星升空开启智能监测新篇

卫星核心工作并非直接探测地下文物，而是持续监控文物保护区周边环境变化，监测内容覆盖四大板块：一是盗掘、违规施工等人为破坏活动；二是滑坡、沉降、风沙水蚀等自然地质灾害；三是能够反映人为扰动的植被异常区域；四是…

2026-07-05

银行业AI转型加速：大行稳进、股份行竞速、民营行深耕小微普惠

2026-07-05

两协会联合倡议：以科技向善引领情感陪伴人形机器人健康发展

据央视新闻7月4日消息，中国人形机器人百人会和中国机械工业联合会今天联合发布关于规范和引导情感陪伴人形机器人发展的倡议，提倡共同践行科技向善、推动机器人产业健康发展。记者了解到，当前，我国人形机器人产业加速…

2026-07-05

vivo X300e完成备案：6.6英寸屏配骁龙8 Gen5 蔡司三摄7000mAh电池亮点足

7月4日消息，vivo X300e已经备案，3C认证显示其支持90W快充，该机将在暑期档发布。博主智慧皮卡丘爆料称，该机将采用6.6英寸的中尺寸屏幕，背部配备矩形Deco，预计是类似S60系列的造型。影像…

2026-07-05

北京大学领衔！全球首款忆阻器神经动力学芯片问世运算速度大幅提升

IT之家 7 月 4 日消息，北京大学集成电路学院官方公众号昨日（7 月 3 日）发布博文，宣布联合发布全球首款基于可控存内计算的忆阻器神经动力学芯片，首次将神经动力学系统的单步运算时延压缩至 2.12 毫…

2026-07-05

Jabra再推三款Evolve3专业耳机：精准适配多场景，AI赋能办公新体验

通话中主动降噪 (ANC) 是另一项显著优势：与主要针对聆听时的专注力的传统 ANC 不同，Evolve3 耳机在通话期间专门应用 ANC 功能，降低佩戴者的背景噪音，并结合侧音监测，保持语音音量自然，减少…

2026-07-05

3500余青少年齐聚成都西南赛区航天创新大赛圆满收官展青春风采

2026-07-04

2026全国青少年航天创新大赛西南赛区落幕青少年逐梦航天展风采

2026-07-04

Stability AI推出Stable Audio3：突破硬件限制 长音频实现即时高效生成

Stability AI推出Stable Audio3：突破硬件限制长音频实现即时高效生成