无需昂贵传感器！EMMA用视频、声音和图像破解物理世界“密码”-数码极客-ITBear科技资讯

无需昂贵传感器，仅凭日常设备就能还原复杂物理系统的真实参数——亚利桑那州立大学研究团队提出的EMMA系统，正在为数字孪生技术开辟一条低成本新路径。该系统通过整合视频画面、环境声音和图表图像三类数据，结合自主研发的液态时间常数网络，成功实现了对钟摆、无人机、遥控小车等系统的参数自动估算，相关成果已预印于arXiv平台。

传统方法依赖单一视频模态时，常因"隐藏驱动力"和"隐式动力学"两大难题陷入困境。以遥控小车为例，摄像机能记录运动轨迹，却无法捕捉电机转速这一关键参数；地面摩擦力等物理效应虽影响运动，却不会在画面中留下直接痕迹。研究团队类比侦探破案过程，指出音频中的频率变化可反推电机转速，图表中的时间序列能补充缺失数据，三类数据协同才能拼凑出完整物理图景。

系统核心的液态时间常数网络突破了传统神经网络固定时间步长的限制。该网络通过动态调整"记忆衰退速度"，既能精准建模电机指令等外部驱动力，又能自然捕捉摩擦力等隐式物理效应。实验数据显示，在包含外部驱动的场景中，其参数估算误差较神经常微分方程降低25%，较连续时间门控循环单元降低5%。配合专门设计的物理方程驱动损失函数，系统无需真实参数标签即可完成自监督学习。

在标准基准测试中，EMMA展现出惊人精度：对150厘米摆长的估算误差仅0.07%，托里切利排水系数误差控制在2%以内。面对真实世界的复杂系统，该系统在遥控小车9个参数估算中取得8.8%的平均误差，无人机12个参数估算误差为15.9%，其中包含质心高度、推力系数等难以直接测量的隐式参数。更令人瞩目的是，系统能从论文图表中直接提取生态模型、混沌系统参数，在HIV治疗动力学等仅有一个可观测状态的极端案例中，仍保持8.7%的轨迹重建误差。

研究团队通过多维度测试验证系统鲁棒性：在参数初始化范围扩大至真实值200%时，6个测试配置中5个误差低于10%；向音频注入5dB高斯噪声时，关键参数变化幅度不超过1.1%；5组随机种子实验的平均误差波动控制在9%以内。尽管计算效率稍逊于简单模型，但其53.2K的参数量仅为同类方法的百分之一，为边缘设备部署提供了可能。

这项技术正在重塑物理参数获取的范式。工程师无需实际接触火星探测车，通过视频和音频即可构建数字副本进行安全测试；医疗设备维修人员可借助环境声音诊断无人机故障；控制算法开发者能基于精确物理模型设计策略。研究团队已公开代码与数据集，为工业自动化、太空探索等领域提供开源解决方案。当普通摄像机也能成为"物理实验室"，高保真数字孪生的构建门槛正从专业机构向普通研究者大幅降低。