ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

OpenAI开源超稀疏模型Circuit-Sparsity:0.4B参数量解锁AI可解释性新路径

时间:2025-12-16 06:07:14来源:快讯编辑:快讯

OpenAI近日开源了一款名为Circuit-Sparsity的新型人工智能模型,该模型以极低的参数量和高度稀疏的权重矩阵,为解决大语言模型(LLM)的"黑箱"问题提供了全新思路。这款参数量仅0.4B的模型,其权重矩阵中99.9%的元素为零,仅保留0.1%的关键连接,这种设计使其内部计算路径变得清晰可追踪。

传统大模型普遍存在"概念纠缠"现象,单个神经元往往需要同时处理多个完全不同的任务,导致模型决策过程难以解释。OpenAI团队通过强制权重稀疏化,使每个神经元仅与特定神经元建立连接,从而在模型内部构建出类似电路的清晰计算路径。研究显示,在处理字符串闭合检测任务时,模型仅用12个神经元就构建出完整电路,每个神经元分别承担检测单引号、双引号或计数嵌套深度等特定功能。

技术实现层面,研究团队采用动态剪枝技术,在训练过程中持续保留绝对值最大的权重连接;通过AbsTopK激活函数强制保留前25%的激活值;同时用RMSNorm替代传统归一化层,避免破坏稀疏结构。这些创新使模型在保持性能的同时,电路规模较密集模型缩减16倍,显著降低了AI系统的理解难度。实验证明,移除电路关键节点会导致模型性能崩溃,而移除非关键节点则影响微弱,验证了电路设计的有效性。

尽管稀疏模型在可解释性方面表现突出,但其计算效率存在明显短板。由于稀疏矩阵运算无法利用GPU的Tensor Cores加速,实际运算速度比密集模型慢100-1000倍。针对这一瓶颈,研究团队提出"桥梁网络"方案,通过编码器-解码器结构在稀疏模型与预训练密集模型间建立映射关系。这种设计允许研究人员在稀疏模型上修改特定特征,再将扰动映射回密集模型,从而实现对现有大模型的解释性干预。

该研究在学术界引发广泛讨论。部分专家认为这项技术可能颠覆现有混合专家模型(MoE)的设计范式,将权重隔离到特定"专家"的传统做法或将被直接构建稀疏模型取代。也有观点指出,稀疏模型的训练成本较密集模型高出两个数量级,当前技术更适用于研究场景而非实际应用。OpenAI团队承认现有局限,但表示正在探索从密集模型中提取稀疏电路的技术路径,以及开发更高效的训练方法。

开源项目已同步发布在GitHub和Hugging Face平台,包含完整模型代码和训练日志。技术论文详细披露了动态剪枝、激活稀疏化等核心算法的实现细节,以及电路验证实验的完整数据。研究团队强调,这项工作尚处于早期探索阶段,未来计划将技术扩展至更大规模模型,并开发配套分析工具,使AI系统的评估与调试更加透明化。

更多热门内容
广发基金刘玉:AI浪潮下海外算力与机器人赛道潜力无限
展望2026年,刘玉表示,将继续聚焦海外算力和机器人等高景气赛道,希望以长远眼光布局新兴成长产业,力求在“业绩确定性”与“远期空间”之间实现动态平衡。她表示,算力作为AI技术体系的核心底座,将伴随模型能力提升…

2026-01-12

工业4.0新选择!WOMMER沃姆电动夹爪,以智能力控开启柔性制造新篇章
面对传统气动夹爪响应慢、控制粗放、依赖空压系统等痛点,WOMMER沃姆电动夹爪以高性价比、高性能、高兼容性强势登场,成为未来柔性自动化产线中不可或缺的“智能手”。 本文关键字:WOMMER沃姆、电动夹爪、机器…

2026-01-12

微观世界新突破:二维金属诞生,开启未来科技无限可能新篇章
或许在不久的将来,二维金属就会从实验室走向我们的生活:我们可能用上轻薄如纸却性能强大的电子设备,开着以氢能为动力的汽车,用着能快速充电的手机,甚至穿着嵌入二维金属传感器的智能衣物……这些曾经遥远的科幻场景,…

2026-01-12

CES 2026速腾聚创机器人“全自主”演示:开启机器人产业化新篇章
这一切的背后,是速腾聚创的具身智能解决方案在支撑:其核心是全球首个VTLA-3D操作大模型,它首次实现了力触觉模态与3D点云信息的融合,让机器人真正拥有了类似人类的“手感”与“视觉”协同能力。 此次演示验证…

2026-01-12

美光千亿美元投建巨型晶圆厂,打造先进存储基地助力AI需求增长
1月12日消息,存储巨头美光科技宣布,将于1月16日下午在美国纽约州正式破土动工,兴建其规划中的巨型晶圆厂。预计首座工厂将于2030年投产,第二座工厂将在三年后启用。至2045年第四座工厂建成时,该项目将创造…

2026-01-12

贾跃亭2月4日拉斯维加斯发布首批具身智能机器人 开启FF新增长曲线
IT之家 1 月 12 日消息,贾跃亭今日发布视频预告:2 月 4 日在拉斯维加斯的 NADA北美汽车经销商大会上,将举行首批具身智能机器人产品的终极发布,并同步启动销售。 贾跃亭解释了“为什么选择现在正式…

2026-01-12