上海脉元智能科技有限公司(NeuraDock)近期在脑电图(EEG)技术领域取得重要进展,其研究以预印本形式发表于arXiv平台,论文编号为2606.26519。该团队开发了一款仅含七个传感器的轻量级干电极脑电图设备,旨在降低技术门槛,让更多研究者和开发者能够便捷地使用这项技术。然而,在尝试利用大语言模型辅助用户理解和操作设备时,他们发现AI常因缺乏对设备具体限制的了解而给出错误建议,这一现象促使团队深入探索如何让AI在科学仪器辅助领域既实用又可靠。
这款脑电图设备的七个传感器被精心布置在头部后方区域,包括CP5、CP6、PO3、PO4、O1、Oz和O2,这些位置主要对应大脑的视觉处理区域。由于传感器未覆盖前额叶和颞叶等关键区域,设备无法分析情绪倾向或语言处理等大脑活动。设备以每秒250个采样点的频率记录信号,并内置了严格的信号质量检测规则,以确保数据的准确性。这些物理和工程上的限制构成了AI辅助分析时的首要边界。
NeuraDock团队将AI在科学仪器领域可能犯的错误归纳为四类:物理边界错误、实现边界错误、结果边界错误和科学边界错误。物理边界错误涉及传感器无法感知的内容,如要求分析额叶活动;实现边界错误则关乎软件未实现的功能,如独立成分分析;结果边界错误涉及对计算结果字段的误解,如将视觉认知负荷分类跨人比较;科学边界错误则是最难把握的,即过度推断科学结论,如将后枕区阿尔法波不对称与情绪相关联。
为了解决这些问题,NeuraDock团队设计了一套名为“NeuraDock Agent”的系统架构。该系统的核心思想是将数学计算与语言表达彻底分离,确保AI只能接触到经过严格筛选的摘要信息,而非原始数据。系统分为本地确定性科学核心和语言层两部分,前者负责所有计算,后者则基于白名单筛选的精简摘要与AI交互。这种设计有效防止了AI超越设备实际能力范围提供建议。
在验证系统边界的有效性方面,团队进行了一系列实验。他们分析了一段包含大量脑电采样值的录制文件,并检查了系统实际发送给AI的请求内容。结果显示,原始数据被成功排除在外,从而证明了边界在应用层面上的实际作用。团队还通过故障注入实验验证了语言层的故障不会影响本地计算结果的完整性,确保了科学计算的正确性与语言服务的可用性相互独立。
当前版本的NeuraDock Agent包含六种经过审查的分析流程,每种流程都有明确的输入要求和输出限制。例如,信号质量分析负责检查录制文件的完整性,而功率谱密度和频段功率分析则提供传感器层面的频率描述。视觉认知负荷分析是最复杂的流程之一,它将录制分成多个窗口,并计算每个窗口的特征以合成一个分数,最终将窗口分为低、中、高三类。然而,团队强调,这个分类仅在同一录制内部相对有效,不能用于跨人或跨录制比较。
在探索系统的局限性方面,团队通过控制实验发现,当前的质量检测系统无法检测到所有类型的伪迹,特别是平线这种故障模式。团队还设计了一套边界意识基准测试,以评估AI在不同上下文条件下对请求的支持程度。测试结果显示,随着上下文信息的增加,AI的决策精确率逐渐提高,但严格安全回应率在“硬件加实现”条件下略高于完整上下文条件,表明过多的信息有时反而会让AI表现变差。
针对这些发现,团队提出了动态选择上下文模块的架构方向,即根据用户的问题类型提供最相关的上下文信息。这种设计有助于避免AI因接收过多不相关信息而做出错误判断。同时,团队也强调了边界意识的重要性,即AI需要准确知道何时该说可以、何时该说可以但有限制、何时该说目前做不到。
除了系统测试和AI基准测试外,团队还进行了一些真实脑电数据实验,以展示系统在实际使用场景下的表现。虽然这些实验的结果受到样本量小等因素的限制,但它们为团队提供了宝贵的质量意识可行性示例。团队表示,真正的生理效度验证需要一个独立的研究,包括足够样本量的参与者、平衡设计的视觉任务和外部行为指标等。
对于想要进一步了解技术细节的读者,可以通过arXiv编号2606.26519找到完整论文,或在GitHub上搜索“Neuradock/eeg-workstation-agent”找到开源代码和示例。NeuraDock团队希望他们的研究能够为科学仪器辅助领域的AI应用提供有益的参考和启示。