ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

中国电信突破图像编码技术,以扩散模型引领通信体验革新

时间:2025-07-16 21:49:21来源:ITBEAR编辑:快讯团队

在多媒体与人工智能的交汇点,中国电信正书写着技术创新的新篇章。近日,中国电信云计算研究院的常建慧博士凭借论文《基于扩散先验的生成式图像编码》,在IEEE国际多媒体与博览会议(ICME 2025)上荣获“最佳论文奖”,这一成就标志着中国电信在生成式图像编码领域取得了国际瞩目的技术突破。

常建慧博士的论文创新性地将扩散模型引入生成式图像编码,成功打破了传统方法在压缩效率与图像重建质量之间的权衡难题。这一技术突破,不仅提升了图像的压缩率,更重要的是,它能够在极低的传输负载下,还原出高质量的视觉内容,为通信系统带来了从“传输数据”到“重建体验”的变革。

想象一下,未来的通信场景:你佩戴着轻便的AR眼镜,与远在他乡的亲人进行仿佛面对面的交流,他们的表情、动作乃至背后的环境都栩栩如生。这一切高清画面的背后,正是生成式编码技术在发挥作用。它收集关键信息,通过本地生成模型快速还原画面,为用户带来沉浸式的通信体验。

生成式编码技术的这一突破,源于对图像“压缩”与“生成”关系的全新理解。随着生成技术的进步,视觉内容已经从自然图像为主,演变为自然图像与AI生成图像的复杂混合。传统的基于GAN和VAE的生成式编码技术,在控制力、稳定性及重建质量方面存在局限。而扩散模型以其强大的可控生成高质量图像的能力,为图像压缩任务提供了新的解决方案。

然而,将扩散模型应用于生成式编码并非易事。如何在极低比特率下提取出对生成过程有引导力的关键信息,如何让扩散模型“听懂”来自编码器的控制信号,都是亟待解决的技术难题。经过反复实验与模型优化,常建慧博士及其团队终于取得了突破。他们提出的基于扩散模型先验的生成式编码框架,成功将“生成能力”转化为“可控的压缩系统”,在低码率下显著提升了感知保真度。

这一技术突破的背后,是无数次的失败与尝试。常建慧博士在求学期间就开始探索生成模型在图像压缩中的应用,但一直面临着细节保真和泛化能力的瓶颈。直到扩散模型的发展为这一难题提供了新的解法,她才看到了希望。在加入中国电信云计算研究院后,研究院提供的强大算力与实验条件支持,让她的研究得以加速推进。

如今,这一技术已经展现出广阔的应用前景。在带宽敏感或存储成本高的场景中,如医疗影像的长期备份,生成式编码可以在极低码率下保留结构与感知细节,有望大幅降低存储开销。它还可以应用于AI原生通信、AIGC存储优化、边端协同等新兴领域,为通信系统的智能化、高效化提供有力支撑。

中国电信云计算研究院计划将这一技术进一步拓展到视频编码中,并探索多模态任务和多模态模型的应用。同时,他们正与天翼云、天翼视联等公司进行沟通合作,探讨可能的落地应用场景。未来,这一技术有望在更多领域发挥重要作用,推动通信系统的持续演进和产业升级。

更多热门内容
教育动态速递:网信办整治暑期未成年人网络环境,中公教育首推AI就业学习机
7月15日,中央网信办印发通知,在全国范围内部署开展为期2个月的“清朗·2025年暑期未成年人网络环境整治”专项行动。 7月15日,昂立教育发布公告称,公司计划通过集中竞价交易方式减持不超过573.1万股回…

2025-07-16

中科大与科大讯飞联合获语音处理专利授权
金融界2025年7月16日消息,国家知识产权局信息显示,中国科学技术大学、科大讯飞股份有限公司取得一项名为“语音处理方法、装置、计算机可读存储介质及计算机设备”的专利,授权公告号CN114267322B,申请…

2025-07-16

石头科技机械手专利获授权,智能清洁领域安全便捷新突破
这一数据不仅展示了石头科技在研发领域的持续深耕,也反映了其在智能设备行业中的领先地位。这些成就不仅提升了石头科技在行业内的知名度,也为其在智能家居和清洁设备领域的市场拓展打下了坚实的基础。 总结来看,石头科技…

2025-07-16