ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

火山引擎新方案!大模型训练视频预处理,豆包已率先应用

时间:2024-10-15 14:20:17来源:ITBEAR编辑:瑞雪

【ITBEAR】火山引擎在近期举办的视频云技术大会上,推出了一项针对大模型训练视频预处理的创新方案。该方案已被应用于豆包视频生成模型,显示出其在实际应用中的潜力。

火山引擎总裁谭待在会上表示,随着AIGC和多模态技术的发展,用户体验正在发生深刻变化。火山引擎视频云正积极探索AI大模型与视频技术的结合,旨在为企业解决技术、处理链路和业务增长层面的问题。

抖音集团视频架构负责人王悦指出,大模型厂商在视频预处理过程中面临多重挑战,包括庞大的数据集带来的计算和处理成本问题,视频样本质量的不一致,处理链路的复杂性,以及多种异构算力资源的调度和部署难题。

为了应对这些挑战,火山引擎依托自研的多媒体处理框架BMF,发布了这项大模型训练视频预处理方案。该方案能够充分利用Intel的CPU、GPU等不同资源,有效降低模型训练的算力成本。同时,通过算法和工程的优化,实现了对海量视频数据的高质量预处理,提升了模型训练效率。

火山引擎还发布了BMF lite版本,这是一个移动端后处理解决方案,支持端侧大模型接入和算子加速,更加轻量且通用。

豆包视频生成模型PixelDance于9月24日面世,采用DiT架构,并通过创新的扩散模型训练方法,解决了多主体运动复杂交互和多镜头切换的内容一致性难题。目前,该模型已通过火山引擎向企业开放邀测。

更多热门内容
YouTube新推相机拍摄标签,视频真实性和编辑完整性有保障?
【太平洋科技快讯】YouTube(全球性的在线视频分享和社交媒体平台)近期推出了一项创新功能——“用相机拍摄”标签,旨在明确指出视频是否由真实相机拍摄,且未对画面和声音进行任何修改。 为了使视频获得“用相机拍…

2024-10-16

阿里云新专利出炉,图像生成技术再突破!
金融界2024年10月16日消息,国家知识产权局信息显示,阿里巴巴云计算(北京)有限公司取得一项名为“图像生成系统及方法”的专利,授权公告号CN 113989420 B,申请日期为2021年9月。 来源:金…

2024-10-16

科大讯飞收盘微跌,滚动市盈率高达542.97倍!
10月16日,科大讯飞今日收盘43.0元,下跌0.12%,滚动市盈率PE(当前股价与前四季度每股收益总和的比值)达到542.97倍。 科大讯飞股份有限公司是一家专业从事语音及语言、自然语言理解、机器学习推理及…

2024-10-16

科大讯飞新突破!文本补全方法及相关专利在手?
金融界2024年10月16日消息,国家知识产权局信息显示,科大讯飞(北京)有限公司、河北省讯飞人工智能研究院、科大讯飞股份有限公司取得一项名为“文本补全方法以及电子设备、存储装置”的专利,授权公告号CN 1…

2024-10-16

20万内智驾新选择?广汽丰田铂智3X申报图曝光!
日前,我们从工信部官网获悉,广汽丰田旗下全新紧凑型SUV——铂智3X(bZ3X)正式向工信部申报,新车申报图随即曝光。新车将搭载广汽丰田和Momenta合作研发的L2++同级的端到端智驾,售价预计将低于20万…

2024-10-16