当你在手机上流畅观看3D电影时,是否想过画面清晰度与内存占用之间的矛盾可能被彻底打破?香港科技大学计算机科学与工程系的研究团队近日宣布,他们开发的"混合辐射场"(HyRF)技术成功实现了画质与存储效率的双重突破。这项发表于神经信息处理系统会议(NeurIPS 2025)的研究成果,通过创新性的技术架构将3D模型存储需求压缩至传统方法的二十分之一,同时保持了实时渲染能力。
传统3D渲染领域长期面临两难选择:基于神经网络的方法虽能以少量参数生成精美画面,但计算速度较慢;基于3D高斯溅射的技术虽然渲染效率高,却需要为每个3D点存储多达59个参数。研究团队提出的混合方案创造性地融合了两种技术优势,就像将精密仪器与高效流水线相结合,既保证了产品质量又提升了生产效率。
技术核心在于构建的双重神经网络架构。几何网络专门处理物体的空间属性,如同建筑师精确计算结构尺寸;外观网络则负责颜色与光照效果,宛若画家调配光影色彩。这种分工模式使系统能根据观察视角智能生成细节,例如当视线转向红色球体时,网络会自动计算不同角度下的阴影变化,而无需存储所有可能的视觉状态。
在参数设计上,研究团队将每个3D点的存储参数从59个精简至8个基础值,包括三维坐标、基础颜色、尺寸和透明度。这相当于用基础骨架支撑复杂形体,再通过神经网络"画笔"添加细节装饰。实验数据显示,这种设计使存储效率提升超过20倍,240MB的3D场景模型可压缩至12MB,同时保持PSNR、SSIM等图像质量指标的领先水平。
渲染流程的创新体现在三阶段处理机制。首先通过可见性预筛选排除不可见对象,如同摄影师提前确定取景范围;接着神经网络对保留对象进行智能升级,补充完整几何与外观属性;最后采用球形背景渲染技术,通过计算视线与虚拟球面的交点生成远景内容,解决了传统方法远景模糊的缺陷。整个过程如同精密的工业生产线,每个环节都经过优化设计。
测试数据充分验证了技术优势。在涵盖室内、户外、特写及城市场景的25个测试集中,新技术在图像质量、存储效率和渲染速度三个维度均表现优异。特别是在处理大规模城市场景时,传统方法需要数千MB存储且速度下降,而HyRF技术仅需几百MB就能保持流畅渲染,为自动驾驶、数字孪生等应用开辟了新可能。
消融实验进一步揭示了技术设计的科学性。当移除双重神经网络架构时,物体边缘会出现明显空洞;取消背景渲染模块会导致远景模糊;关闭预筛选功能则使渲染速度下降75%。这些对比验证了每个组件的必要性,也证明了系统设计的合理性。
对于普通用户而言,这项技术将带来直观的体验升级。未来在移动设备上观看3D内容时,无需担心存储空间不足或设备性能不够,高质量3D体验将变得触手可及。内容创作者也能以更低的成本制作更精细的作品,推动虚拟现实、游戏开发、影视制作等领域的创新发展。该研究的完整技术细节已通过论文编号arXiv:2509.17083v2公开,供全球科研人员参考验证。