ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

中科大与FrameX.AI强强联合:Stream-T1框架让AI长视频生成更靠谱

时间:2026-05-13 02:14:49来源:互联网编辑:快讯

在人工智能视频生成领域,长视频的质量与连贯性始终是难以突破的瓶颈。传统方法往往陷入两难困境:要么依赖堆砌算力训练巨型模型,成本高昂且边际效益递减;要么接受生成结果中人物变形、背景错位、动作断裂等缺陷。中国科学技术大学与frameX.AI联合团队提出的Stream-T1框架,通过创新性的推理时优化策略,为这一难题提供了低成本、高效率的解决方案。

该研究的核心突破在于将"流式生成"与"推理时扩展"深度融合。不同于传统方法将视频视为不可分割的整体,Stream-T1采用分段处理模式,将长视频拆解为多个短片段逐个生成。每个片段仅需4步去噪处理,较传统方法减少90%计算量。这种"边生成边优化"的机制,使系统能在生成过程中实时评估画面质量与叙事连贯性,及时纠正偏差。

为确保片段间的自然过渡,研究团队设计了"流式缩放噪声传播"机制。该机制通过球面插值算法,使新片段的初始噪声包含前序片段的优质特征。数学公式显示,新噪声由前序噪声与全新随机噪声按特定比例混合生成,既保持统计分布的规范性,又实现风格特征的渐进传承。实验表明,该设计使相邻片段间的跳跃感降低62%,人物面部特征保持率提升至89%。

双轨评分系统是保障生成质量的另一关键创新。系统同时运行图像奖励模型与视频奖励模型:前者以帧为单位评估画面美观度,后者通过滑动窗口分析跨片段连贯性。动态加权策略根据生成进度调整评分权重——初期侧重连贯性确保叙事方向正确,后期强化画质要求提升单帧品质。这种平衡机制使生成视频在保持动作流畅的同时,关键帧的视觉质量评分提升47%。

针对长视频生成中的记忆管理难题,研究团队提出"流式缩放记忆沉降"方案。系统通过质量门控与场景切换检测双重筛选机制,智能处理被挤出记忆窗口的旧片段:低质量片段直接丢弃,平稳场景片段采用指数移动平均融合更新,场景切换片段则作为独立锚点保存。这种差异化处理策略使内存占用减少58%,同时将主体一致性评分维持在92%以上。

在5秒与30秒视频生成测试中,Stream-T1展现出显著优势。对比当前先进模型,其30秒视频的动作质量提升达114倍,文字对齐度提高9.39%,视觉质量改善49.47%。特别在长视频场景中,传统模型因动作连贯性崩溃导致评分接近零值,而Stream-T1通过持续优化维持稳定表现,形成百分比增幅的特殊现象。消融实验证实,噪声传播、奖励剪枝、记忆沉降三大组件缺一不可,共同构成系统效能的基础。

该研究为AI视频生成领域开辟了新路径。不同于依赖模型规模扩张的传统思路,Stream-T1通过优化生成策略实现质量跃升,在保持1.3B参数规模的基础上,达到甚至超越更大模型的效果。其分段处理机制与动态记忆管理方案,为处理分钟级超长视频提供了技术储备。目前研究团队已开放项目页面与论文下载,相关代码即将在GitHub平台开源。

更多热门内容
华为HarmonyOS 7发布:从“App亲和”到“Agent亲和”,开启智能管家新纪元
6600万台终端是过去,1.8亿次小艺日活是现在,华为正在逐渐让操作系统从工具进化为有感知能判断的助理,从“响应用户指令”变成“预判需求并执行”,因为操作系统竞争的新赛道,已经不是功能比拼,而是智能体架构的…

2026-06-12

华为开发者大会发布HarmonyOS 7:空间计算与智能Agent架构引领全场景革新
PChome 6月12日消息,2026华为开发者大会上,华为正式推出HarmonyOS 7全新全场景智能操作系统,围绕更沉浸、更智能、更流畅、更安全、更便捷五大核心体验维度完成全面升级,空间计算与智能Agen…

2026-06-12

华为开发者大会发布HarmonyOS 7:Agent架构重构,启动鸿图计划加速生态扩张
华为在年度开发者大会上推出HarmonyOS 7,将鸿蒙系统定位为面向AIAgent时代的全场景智能操作系统,并同步启动"鸿图计划"以加速开源鸿蒙生态扩张。 余承东在大会上宣布启动"鸿图计划",目标是加快开…

2026-06-12

华为开发者大会重磅发布HarmonyOS 7 Beta版 开启鸿蒙Agent智能化新篇章
IT时代网6月12日消息,在东莞松山湖举行的2026年华为开发者大会上,华为终端正式推出HarmonyOS7开发者Beta版本,标志着鸿蒙系统全面迈入Agent智能化时代。 此次发布的HarmonyOS 7…

2026-06-12

华为MatePad Edge平板鸿蒙系统再升级,新增“终端”应用提升开发体验
IT之家 6 月 12 日消息,华为 MatePad Edge 平板现已获得鸿蒙 HarmonyOS 6.1.0.125 SP52更新,主要新增“终端”应用,并支持运行 DevEco Studio IDE。…

2026-06-12

智源大会成果丰硕:发布大脑模型与智能体,图灵奖得主展望AI未来
智东西6月12日报道,今天,在智源大会2026上,智源研究院分享并发布了近一年以来的多项研究成果,包括基座大模型、智能体和基础软硬件生态三部分。 该智能体可以帮助参会者实现智源大会一站式参会体验,同时也能够…

2026-06-12

华为鸿蒙7发布:从“App亲和”到“Agent亲和”,开启智能交互新篇章
6600万台终端是过去,1.8亿次小艺日活是现在,华为正在逐渐让操作系统从工具进化为有感知能判断的助理,从“响应用户指令”变成“预判需求并执行”,因为操作系统竞争的新赛道,已经不是功能比拼,而是智能体架构的…

2026-06-12

学而思与华为平板深度融合:教育内容系统级植入,开启学习新范式
华为与学而思的这次独家战略合作,意味着,华为向学而思打开了硬件与系统的深层接口,而学而思则把自己的内容能力、教研逻辑、甚至用户学习行为的数据模型,揉进了华为平板的系统生态里。但华为把系统级权限独家开放给学而…

2026-06-12