ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI学习总“卡壳”?浙大等团队新招:让AI像学生一样精准纠错进步

时间:2026-05-06 20:25:43来源:互联网编辑:快讯

当人工智能模型在专业领域考试中答错题目时,开发者往往陷入数据堆砌的循环——不断投入更多训练样本,却始终无法精准定位问题根源。浙江大学、中国科学院大学与上海人工智能实验室联合提出的"用数据编程"框架(ProDa),为破解这一行业难题提供了创新方案。该研究通过构建可追溯的知识结构体系,首次实现了AI训练过程的闭环调试,相关成果已在预印本平台arXiv公开。

传统AI训练存在显著缺陷:模型在医学、法律等专业领域学习时,若出现错误回答,开发者既无法追溯具体知识漏洞,也无法针对性修复。这种"开环训练"模式导致资源浪费严重,例如在心脏疾病诊断训练中,模型可能因混淆"钠离子通道失活"与"心肌细胞去极化"导致答题错误,但现有方法无法定位具体混淆点。研究团队将软件工程领域的"测试驱动开发"理念引入AI训练,通过建立训练数据与测试题目的共同知识基础,使模型调试从经验主义转向工程化。

核心突破在于构建三层知识结构体系:最底层的原子概念层(L1)包含22.7万个专业术语定义,如"电压门控钠离子通道"的精确释义;中间的知识关系层(L2)记录18.6万条概念间逻辑,如"高钾血症导致膜持续去极化"的因果关系;顶层的推理链层(L3)则串联4.3万条多步骤推理路径,完整呈现从病因到临床表现的医学逻辑。这种自上而下的提取方式确保每个概念都参与至少一条推理链,消除知识孤岛。

训练数据与测试题目采用差异化生成策略:前者从L1和L2层生成选择题、判断题等基础题型,后者从L3层生成需要多步骤推理的综合题。例如在经济学训练中,系统会生成考查"三重检验标准"的推理题,干扰选项则通过颠倒L2关系方向(如将"A促进B"改为"B促进A")或截断推理链制造。这种设计使模型必须真正理解知识结构才能正确答题,而非简单记忆答案。

调试环节展现工程化优势:当模型答错时,系统自动分析错误类型——若因概念混淆(如分不清"相对论"与"量子力学"适用范围),则生成对比性强化样本;若属推理缺陷(如知道公式却不会解题步骤),则补充带中间步骤的思维链样本。修复样本与原始训练数据的子集混合训练时,系统会刻意避开已覆盖的L2关系,防止"灾难性遗忘"。实验显示,这种精准修复使30亿参数的Qwen-3-4B模型在16学科测试中得分提升11.17个百分点,超过经过人类反馈强化训练的官方版本。

实证研究覆盖物理、医学、经济学等16个学科,基于11.7万份教材文档提取出46万个知识节点。生成的1.6万道测试题与11个国际基准的相关性达0.847,证明其有效性。在光学训练中,模型通过修复"未抵消半波带面积比例"的概念缺口,正确解答了菲涅耳半波带法相关题目;在医学训练中,通过强化"钠离子通道失活"的双重否定逻辑,准确描述了高钾血症的电生理机制。

控制实验揭示数据效率革命:ProDa使用每学科1000条修复样本的效果,超越其他方法使用10000条数据的效果。在法律领域训练中,精准修复使模型对WTO裁定流程的理解准确率提升32.7个百分点,而盲目增加数据仅提升9.3个百分点。这种差异源于ProDa能直接针对模型的知识缺陷生成训练样本,而非依赖数据量的概率覆盖。

研究团队开发的ProDa Studio开源工具包,将知识提取、基准生成、模型训练等环节整合为可视化流程。开发者可在统一界面中完成从原始文档到调试评估的全流程,系统自动记录从语料到评分结果的完整溯源链。该工具已支持Qwen、Llama等主流模型家族,在GitHub和HuggingFace平台公开代码与数据集。

这项突破为专业领域AI训练开辟新路径。通过建立可解释的知识结构,开发者首次获得"手术刀"般的调试能力——既能精准修复模型的知识漏洞,又能避免通用能力衰退。实验显示,经过两轮调试的模型在MMLU通用知识测试中得分提升0.27个百分点,证明该方法在提升专业能力的同时,反而强化了基础认知。这种训练范式的转变,或将推动医疗诊断、法律咨询等高风险AI应用进入精准迭代时代。

更多热门内容
解散六年后卷土重来!OpenAI重建机器人团队 奥特曼:未来人人拥有机器人
这是奥特曼勾画的长期愿景,短期目标他也讲了:先造一批机器人,去给建设基础设施的技术工人打下手。 2025年2月4日,Figure的CEOBrett Adcock公开宣布退出和OpenAI的合作协议,他认为…

2026-06-01

OpenAI招聘启航机器人赛道,短期聚焦协助基建,长远愿景“一人一机”
OpenAI CEO萨姆·奥尔特曼(Sam Altman)今日在X平台发布OpenAI Robotics招聘信息,称公司正在招聘优秀的全栈硬件、运营、系统及机器学习工程师,研发和制造出对人类社会有用的机器人。…

2026-06-01

OpenAI Robotics开启招聘大幕,短期助基建长期盼人人享专属机器人
上证报中国证券网讯 OpenAI CEO山姆·奥特曼6月1日在X平台发布OpenAI Robotics招聘信息,称公司正在寻找杰出的全栈硬件、运维、系统及机器学习工程师,共同编程并制造对社会真正有用的机器人。…

2026-06-01

OpenAI Robotics团队扩招,Altman领航机器人业务新征程
值得关注的是,此前OpenAI已经对相关研发方向进行调整,将更多资源投入到能够与现实环境互动的人工智能系统和机器人项目中。随着世界模型、感知能力以及机器人控制技术不断进步,机器人业务正逐渐成为OpenAI未…

2026-06-01

OpenAI重金布局机器人领域!Sora之父领衔,打造软硬件闭环新生态
奥特曼继续写道,得益于机器人硬件与机器学习研究的协同设计,由 Aditya Ramesh 领导的世界模拟研究项目已经在过去一年中逐步演化为OpenAI Robotics。但从机器人视角看,它更像是 Ope…

2026-06-01

英伟达Cosmos 3问世:全开源全模态,为物理人工智能发展注入新动力
IT之家 6 月 1 日消息,英伟达今日正式推出英伟达 Cosmos 3,这是一款面向物理人工智能的开放世界基础大模型,依托混合Transformer 架构打造,在单一系统中融合视觉推理、世界生成与动作预测…

2026-06-01

OpenAI官宣进军机器人赛道,AI赋能实体硬件,具身智能时代加速开启
OpenAI CEO山姆・奥特曼也明确表示,人工智能的最终价值,是走进现实世界为人类服务,制造出真正对社会有用的机器人,是公司现阶段的核心战略之一。这一目标也契合当下具身智能的发展趋势,当AI 大模型拥有…

2026-06-01

光智融合新范式:华为全光园区引领AI时代网络变革与生态共赢
AI技术的融入,让全光园区突破了传统网络的边界,具备了全光统一联接、鸿蒙开放物联、融合多维感知、网络自动驾驶四大创新特性。 此次升级的AIF5G-A全光园区方案,不仅是华为在光网络根技术的集大成者,也创新融入…

2026-06-01

OpenAI时隔六年再入机器人赛道:以AI大模型赋能,绘就具身智能新蓝图
Figure认为通用大模型无法适配机器人的硬件需求,必须打造垂直整合的端到端模型;这也这促使OpenAI在时隔六年后,选择“复活”了机器人团队,亲自下场,将机器人从“投资”升级为“内部战略业务”。其技术路径可…

2026-06-01

OpenAI CEO发布招聘启事:加速进军机器人领域,助力人类未来生活
OpenAI CEO萨姆·奥尔特曼(Sam Altman)今日在X平台发布OpenAI Robotics招聘信息,称公司正在招聘优秀的全栈硬件、运营、系统及机器学习工程师,研发和制造出对人类社会有用的机器人。…

2026-06-01