ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Mind Lab LoRA研究新突破:大模型持续学习路径与生成式UI新探索

时间:2026-06-03 07:53:43来源:快讯编辑:快讯

前沿实验室 Mind Lab 近期在人工智能领域掀起了一股新的研究热潮,其密集发布的一系列关于 LoRA(低秩适应)与 PEFT(高效微调)的研究成果,为大型模型的“持续学习”开辟了新的路径。在 Mind Lab 的构想中,PEFT 不再仅仅是对大型模型全参数后训练的一种经济替代方案,而是成为推动“基础模型”向“可持续学习智能体”转变的核心架构。

Mind Lab 构建了一个完整的技术体系,包括记忆架构(δ-mem)、底层基础设施(MinT)、扩展定律(Scaling of PEFT)以及生成式用户界面应用(Macaron-A2UI),旨在通过少数几个强大的万亿参数基础模型,支撑起数以百万计的、具备独立记忆和技能的可持续学习智能体。其中,δ-mem 作为一种创新的平行混合线性注意力架构,针对 LoRA 的特性进行了优化,使智能体能够拥有可更新的持续记忆。

传统 Transformer 的 KV cache 仅记录当前上下文的中间状态,无法随着交互持续学习。而 δ-mem 通过增量规则(delta-rule learning)持续更新一个固定大小的矩阵,使模型在记忆基准测试中获得了显著的性能提升。即使在没有显式历史上下文的情况下,δ-mem 也能恢复出大量相关信息,展现了其强大的记忆能力。

为了支撑模型在真实场景中的持续学习,Mind Lab 还推出了专为 LoRA 训练和在线服务打造的托管基础设施系统 MinT。MinT 将基础模型长期保留在训练和推理服务中,通过导出小型的 LoRA Adapter 而不是完整模型,实现了快速上线和回滚。这一设计不仅大幅缩短了交接时间,还降低了存储和计算成本,为管理海量 LoRA 模型提供了可能。

Mind Lab 还发布了关于 LoRA 的研究论文《On the Scaling of PEFT》,提出了三大基于 LoRA 的扩展轴:Scale up、Scale down 和 Scale out。在 Scale up 方面,Mind Lab 修正了现有路由重放机制在前沿 MoE 模型上的失效问题,消除了训练和推理的差异;在 Scale down 方面,通过原生于 RL 的初始化方法 OLoRA-tail,将 LoRA 的 rank 压到了极致,同时保持了性能的稳定;在 Scale out 方面,MinT 让上百个 LoRA adapter 同时在线,实现了模型数量的可控扩展。

基于这些研究成果,Mind Lab 试验性地发布了基于 MinT 训练的模型 Macaron-A2UI。该模型不仅能够输出文本,还能在实时交互中生成结构化的可执行动作,如多选框、滑块等,极大地提升了用户交互的便捷性和效率。在 A2UI-Bench 基准测试中,Macaron-A2UI 取得了优异的成绩,证明了其强大的 UI 生成能力。

更多热门内容
双良绿电制氢智能系统:以AI算法赋能 开启绿氢产业新篇章
平台具备强大的数据监控与分析功能,能实时采集绿电供给、产氢量、气体纯度、能耗等关键参数,精准评估系统运行状态;在多电解槽组成的制氢阵列中,可快速隔离故障单元并重新分配任务,尽可能降低不良影响。 当绿电制氢迈向…

2026-06-03

远翔新材董事长率队考察安瓦科技 聚焦固态电池协同创新谋发展
作为中国固态电池产业化技术路线的提出者与实践者,安瓦科技专注于高安全、高比能全固态电池核心技术的研发,并已构建起覆盖动力电池、消费电池、储能电池、低空经济、机器人、智能具身及智算中心(AIDC)等多元应用场景…

2026-06-03

英伟达携手宇树科技推新一代人形机器人“H2 Plus”,下半年上市引期待
IT之家 6 月 2 日消息,日前,英伟达 CEO 黄仁勋宣布,英伟达将与宇树科技联手推出新一代人形机器人参考设计“H2 Plus”。据中新社报道,宇树科技市场部总监黄嘉玮 2 日(今天)透露,该产品将于今…

2026-06-03

四川发布20个前沿领域重点场景项目 18个项目现场签约共绘发展新蓝图
活动现场发布了20个重点场景项目,涵盖清洁能源、战略性矿产、低空经济、人工智能、智慧医疗等前沿领域,18个场景项目现场签署合作协议。 据了解,本次发布的20个重点场景项目分为3个综合性场景项目和17个高价值应…

2026-06-03

青岛港自主研发智能体获全国大赛特别推荐奖 引领港口安全管控新升级
依托全国首批交通运输领域首个港口国家级人工智能应用中试基地的综合优势,青岛港凭借全场景、全要素、全闭环的创新安全管控方案,获得行业专家与评委认可。 港口作业具有点多、线长、面广、场景复杂、人机交叉作业频繁、风…

2026-06-03

微星EdgeMesa N AI+迷你电脑亮相:NVIDIA RTX Spark驱动 适配多行业场景
EdgeMesa N AI+具有几个主要特点:针对AI模型开发和实时推理优化的先进架构;为生成式 AI 和 LLM 工作负载量身定制的高AI计算性能;用于大型数据集和AI模型的统一内存架构;可扩展平台,支持…

2026-06-03

高通COMPUTEX 2026发布“飞龙”品牌,AI计算版图从端到云全面布局
高通公司总裁兼CEO安蒙在前一日的开幕主题演讲中强调,智能体正成为AI词元(token)需求的核心来源,推动AI规模化落地,并将定义AI架构与经济模式。安蒙的这句话,可以视为高通对未来汽车计算平台的新定位——…

2026-06-03

智博会展现新图景 中国电信以AI为翼 赋能千行百业高质量发展
基于星辰大模型的核心能力,中国电信已打造行业大模型110余个、智能体350余个,服务3.7万家行业客户,星辰工业互联网平台、星辰智慧教育平台与星辰智慧城市平台等在多个城市落地应用,让词元(Token)价值真正…

2026-06-03

智启工业新篇:中国电信数字方案赋能传统产业,驱动转型升级新引擎
工业网络是智能制造的核心基石,中国电信持续深耕工业数字基建,全力推动行业网络从“双千兆”向“双万兆”高阶迭代,针对各类工业场景打造定制化专网解决方案,持续夯实制造业转型底层底座,在全国范围内落地一批标杆性…

2026-06-03

融云斩获三项大奖:品牌、技术、科创影响力齐绽放 战略跃迁获认可
在扬帆出海主办的PAGC 2026大会上,融云一举拿下“出海热度品牌”与“优秀出海产品技术服务”两项金帆奖;同期,全球人工智能大会GAIC 2026将“开箱即用AI服务领军企业奖”授予融云的对话式AI分身;而…

2026-06-03