ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

沉浸音频产业化新进展 抖音技术团队牵头制定AVS音频团体标准

时间:2024-01-03 21:52:16来源:互联网编辑:汪淼


近日,AVS(Audio Video Standard) 音频团体标准《信息技术 虚拟现实内容表达 音频》(标准号T/AI 125-2023)发布,标志着国内沉浸音频技术在产业上应用趋于成熟,为多媒体内容多样化与个性化提供了有力的技术支撑。

图片1.jpg

沉浸音频,也称VR音频,3D音频、空间音频,是新一代音频呈现方式,相比立体声拥有更好的空间呈现效果,能精准地再现每个音源的位置和所处环境的空间信息。当前,沉浸音频带来的沉浸式体验已经在影视、广电、音乐、游戏等场景有广泛的应用。

据了解,AVS 《信息技术 虚拟现实内容表达 音频》标准由抖音视频架构沉浸音频团队牵头制定。在此过程中,该团队先后提交了20余份技术提案,贡献了多项核心技术,参加了两次复合性验证与技术评选,形成十几项前沿技术专利,开源了一套完整的空间音频渲染解决方案,经过三年时间不断完善,建立起了这项国内第三代音频内容表达标准,提供了更加丰富的多媒体呈现能力。

图片3.jpg

沉浸式音频解决方案示意图

沉浸音频是一种声场重建与还原技术,当声音进入耳朵时,在耳廓、头部附近时传播路线发生变化,到达左右耳的时间上也有微小的差别,所以真正听到的声音与原始音源并不一样,通过沉浸音频渲染,可以使佩戴耳机时与不戴耳机获得一样的听觉感受,具有三维空间感和沉浸感,具备真实环境的房间声学效果。双耳渲染演示如下图:

图片2.jpg

双耳渲染演示示意图

早在《信息技术 虚拟现实内容表达 音频》标准发布前,沉浸音频技术就得到了新媒体行业的青睐,在众多的场景中崭露头角。2022年9月中央广播电视总台“云听”客户端使用AVS VR音频标准中的耳机渲染技术完成CCTV中秋晚会现场直播;2022年11月世界杯央视转播演示系统使用了AVS VR音频标准中的扬声器渲染技术进行监听;2023年总台春节联欢晚会使用AVS VR音频标准中的耳机渲染技术完成“菁彩声”频道现场直播;2024年杭州亚运会央视体育从制作端生成元数据,按制作者意图生成实时、动态元数据下发,实现了制作、监听与下发数据的完整“菁彩声”流程。

03.jpg

2023年总台春晚使用AVS VR音频技术实现三维菁彩声直播

沉浸音频与VR/MR场景紧密结合。在VR/MR平台上三维视觉、触觉与三维音频现象同步,赋予了用户身临其境的真实感。《信息技术 虚拟现实内容表达 音频》空间音频渲染技术已集成在VR平台PICO上,用户可以使用其制作出具有声源的方位感、环境对声波的反射、透射等声学现象的内容作品,从而为消费者营造符合物理现实的沉浸式音频体验。目前,该项空间音频渲染技术也通过字节跳动旗下的云服务平台火山引擎面向企业客户开放。

随着《信息技术 虚拟现实内容表达 音频》标准的发布,多媒体内容表达有望朝着更沉浸的方向发展,带给用户身临其境的真实体验 。

更多热门内容
Windows Arm64 托管运行器正式支持 GitHub Actions,加速开发流程
过去一年,Arm 与 GitHub 持续紧密合作,致力于为基于 Arm 平台的开发者打造更便捷、更高效的开发体验。GitHub推出的Arm托管运行器 正在革新应用程序的开发与部署流程,而近期推出的面向GitHub Copilot的Arm扩展程序 ,更是进一步简化并加速了向 Arm 架构服务器的迁移过

2025-04-25

锚定AI技术,艾力斯特深度布局人工智能康复医疗领域
2025年3月21日,iRest艾力斯特于浙江温州盛大召开“AI+康复与产学研融合创新高峰论坛暨‘逐光25,艾启未来’经销商大会”。此次大会汇聚全球顶尖学者、行业专家及千余名经销商代表欢聚一堂,围绕智能康复、人工智能与医疗健康的全面融合,深度布局智能康复医疗器械,推

2025-04-24

开启内测!360纳米AI推出“MCP万能工具箱”
分析特斯拉股票能不能买?现阶段还能否投资黄金?撰写一份新能源汽车的市场调研,上传检查结果给出诊疗建议,周边有哪些春游好去处……无论工作还是生活场景,但凡你有需求,打开纳米AI客户端,调用万能工具箱里的对应工具,说一句话或敲一行字,接入工具能力的大模型就能

2025-04-23

孙宇晨的破局之举:TRX ETF冲击SEC,“三驾马车”重塑Web3新格局
华人公链的门面担当诞生了,孙宇晨又一次赚足了市场的眼光。近日,美国资管巨头 Canary Capital 正式向美国证券交易委员会(SEC)提交了 TRX ETF的S-1注册声明——TRX ETF正式递表S-1。这是TRON第一次以「正规军」身份尝试进入美国资本市场——一场合规豪赌,也是一场形象重

2025-04-23

2025年十大AI导航网站盘点:发现AI领跑,AI工具一网打尽
随着人工智能技术的飞速发展,AI工具的数量和种类呈现爆发式增长。面对琳琅满目的AI产品,如何高效筛选适合自己的工具成为用户的一大痛点。为此,AI导航类网站应运而生,它们通过聚合、评测和推荐优质AI工具,帮助用户快速触达所需资源。在众多导航平台中,发现AI凭借其全面的

2025-04-23

时空AI专家路新江:用创新时间序列编织智慧未来
在晨曦初绽的智慧城市中,时空AI技术正以看不见的“数字神经网络”编织着城市的动态脉搏。在通勤高峰期,系统通过分析过去几年同期车流时间序列数据,提前15分钟预测出多个主干道的拥堵节点,与智能信号灯协同调整路面通行节奏;在城市的地质监测站,安装在断层带的传感

2025-04-23

聚焦智能排线四大核心技术,解锁应用落地三步法(下)
在上篇内容(「全局最优」背后:智能排线如何用算法破解“效率天花板”(上))中,我们拆解了智能排线的业务价值与不同行业场景的适配案例,本篇内容我们将聚焦技术底层,拆解G7易流实现传统人工排线向智能排线的平滑过渡三步法,带您看透技术驱动物流效率跃迁的底层逻辑。

2025-04-23

Rich Smart:塑造全球金融交易新趋势
在当今快速发展的金融交易领域,选择一个可靠的交易平台对于投资者来说至关重要。Rich Smart(富慧证券),自2015年成立以来,已经成为全球知名的外汇经纪商之一,致力于提供专业、透明的交易环境,让每位投资者都能以简单透明的方式进行交易和投资。Rich Smart(富慧证券)

2025-04-23

一汽丰田携手Momenta树立安全辅助驾驶新标杆,庞博跨界体验bZ5
4月22日,一汽丰田在上海举办了主题为“GIVE ME 5 击掌未来”的bZ5技术发布会。bZ5搭载Momenta飞轮大模型5.0,支持全场景城区辅助驾驶,将安全的驾驶辅助推向新境界。一汽丰田汽车销售有限公司党委书记、总经理董修惠表示:“秉持开放的精神,我们与行业领先的软件公司M

2025-04-22

竞赛内容升级!2025第九届金砖大赛之元宇宙3D数字内容设计创作赛项报名已启动
2025第九届一带一路暨金砖国家技能发展与技术创新大赛之元宇宙3D数字内容设计创作赛项(简称“金砖大赛之元宇宙3D数字内容设计创作赛项”)报名即日正式启动。赛项由金砖国家工商理事会中方理事会、一带一路暨金砖国家技能发展国际联盟、中国科协“一带一路”暨金砖国家技

2025-04-22