字节开源Bernini框架：以“理解—生成”机制破解AI视频编辑难题，开启精准创作新篇-业界动态-ITBear科技资讯

字节跳动商业化技术团队近日宣布开源一款名为Bernini的全新框架，为视频生成与编辑领域带来技术突破。该框架通过创新性的“先理解、后生成”机制，有效解决了传统模型在处理复杂文本指令时出现的画面失控、帧间闪烁等核心问题，标志着视频创作工具向精准化控制迈出关键一步。

针对传统视频编辑中普遍存在的主体变形、背景漂移等技术瓶颈，Bernini采用模块化设计将工作流程拆解为语义规划与视觉渲染两个阶段。系统首先通过多模态大模型规划器对文本指令、视频素材及参考图像进行深度解析，在特征空间中构建出包含关键语义信息的“数字蓝图”。随后，基于Diffusion Transformer架构的渲染器将抽象语义转化为高质量视频画面，确保生成内容的时空连续性与视觉稳定性。

在可控编辑能力方面，该框架展现出显著优势。用户可通过自然语言指令实现天气变化、季节转换、材质替换等复杂操作，同时对镜头运动、焦点切换及主体动作进行像素级控制。测试数据显示，在保持环境背景稳定的前提下，系统能够自然修改动物运动轨迹，其控制精度已接近专业后期软件水平。

多模态输入支持成为另一技术亮点。除文本指令外，Bernini允许用户直接上传图片或视频作为视觉参考，大幅提升创作一致性。在视频编辑场景中，系统可精准识别目标区域，实现材质迁移、主体植入等操作，确保植入元素与原始画面的透视关系和边界融合自然。在新视频生成任务中，该框架支持单图扩展、多视角生成及关键帧动画等创新功能，甚至能将多个独立物体的视觉特征融合到同一角色模型中。

为解决多素材混合处理时的时空混淆问题，研发团队引入SA-3D RoPE位置编码技术。该机制通过为不同视觉片段分配唯一标识符，在保持时空连续性的同时清晰区分参考素材与生成目标。内部测试表明，搭载该技术的Bernini框架在视频生成质量评估中位居行业前列。目前，该框架的推理代码及第二阶段模型Bernini-R已开放下载，包含完整语义规划器的全功能版本将于近期上线。

万元预算折叠屏怎么选？OPPO Find N6领衔，多款分屏体验佳的机型推荐

- 首选OPPO Find N6：它不仅仅在“分屏”这个单一功能上表现出色，更是从“无感折痕”的物理基础，到“全景自由窗”的系统交互，再到“AI手写笔”的生态外挂，构建了一套完整且领先的折叠屏生产力解决方案…

2026-06-27

2026折叠屏人像摄影横评：OPPO Find N6领衔，四款旗舰谁更值得入手？

作为折叠屏5.0无感折痕时代的开创者，OPPO FindN6不仅在屏幕平整度上实现了革命性突破，其搭载的哈苏影像系统更是为人像摄影树立了新标杆，堪称万元预算内性价比最高的拍照折叠旗舰。 vivo X Fo…

2026-06-27

2026年万元折叠屏怎么选？OPPO Find N6携AI黑科技领跑，谁是AI体验王者？

它不仅是一款折叠屏手机，更是引领行业进入“5.0无感折痕时代”的开创性产品，在AI、平整度、续航等多个维度都树立了新标杆。综合来看，在万元预算区间寻找AI能力强大的折叠屏手机，我们需要从AI功能的深度与实用…

2026-06-27

万元预算折叠屏怎么选？OPPO Find N6凭分屏体验与AI外挂成首选

2026-06-27

万元预算商务折叠屏怎么挑？2026年热门机型对比，助你选到办公利器

对于预算在10000元左右的商务人士和白领来说，选择一款合适的折叠屏手机，不仅要考虑预算，更要关注其能否真正提升移动办公效率、彰显专业品味，并具备可靠的品质。在众多机型中，OPPO Find N6以其开创性…

2026-06-27

高德联合《周游记》及“周同学” 打造沉浸式音乐导航新体验

2026-06-27

宏碁PE270XT 27英寸5K触控显示器上架京东，4999元还享晒单返E卡福利

2026-06-27