ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里巴巴申请视频生成新专利:融合视听特征提升视频呈现效果

时间:2026-03-06 22:38:12来源:天脉网编辑:快讯

阿里巴巴(中国)有限公司近期在专利领域有了新动作。企查查APP的信息显示,该公司申请公布了一项名为“视频生成方法、视频生成模型的训练方法及任务平台”的专利。

根据专利摘要内容,这项专利涉及一套完整的视频生成技术体系,涵盖视频生成方法、视频生成模型的训练方法以及任务平台。具体而言,在视频生成方法中,首先要获取参考图像和参考音频,其中参考图像需包含参考对象的视觉信息。接着,系统会分别针对参考图像中的视觉信息提取参考对象的视觉特征,同时对参考音频提取音频特征。随后,基于视觉特征与音频特征之间的交互特性,预测在音频特征影响下目标对象的参考动作信息,这里的目标对象是基于参考对象生成的。最后,依据参考动作信息和参考音频,生成目标对象对应的视频。

该专利技术的一大亮点在于,能够有效提升视频中目标对象的视觉信息与对应音频的匹配程度,进而显著改善视频的呈现效果。这一创新成果有望为视频生成领域带来新的技术突破和应用可能。

更多热门内容
阿里人事变动:盒马CEO严筱磊向蒋凡汇报
6月2日消息,阿里巴巴迎来关键人事与业务架构调整,核心涉及盒马管理层汇报线变更,这一变动被业内视作阿里即时零售业务收拢整合、并入中国电商事业群的重要信号。据悉,盒马CEO严筱磊(花名:百何)的工作汇报线已正式调整,由原先向集团CTO吴泽明汇报,变更为直接向阿

2026-06-03

OpenAI Codex再升级!智能体插件上线,非程序员也能轻松驾驭AI编程
此外,OpenAI宣布其所有前沿模型和Codex现已支持在AWS平台一键部署,其为企业提供了两种使用方式:一是在AmazonBedrock上直接调用OpenAI模型,二是通过Codex on Amazon…

2026-06-03

阿里前副总裁张凯夫离职创业,携电商AI经验掘金“市场模拟器”赛道
张凯夫将自己多年在淘宝操盘万亿级市场的经验,转化为模型的市场直觉——这一差异化优势,是纯技术团队难以复制的。尽管赛道竞争激烈,但依托其深厚的电商与AI积淀,这一方向有望精准服务实体经济、电商平台及企业商业决策…

2026-06-03

谷歌新研究:大模型破除“幻觉”困境,元认知成开启可靠AI新钥匙
原因在于,忠实不确定性只需要AI的语言输出和自己的内部状态对应——这是一个闭环问题,信号就在模型内部,不依赖外部真相。 归根结底,这篇论文想传递的核心信息是:AI可以不全知全能,但它必须对自己知道什么、不知道…

2026-06-03

ChatGPT月活用户破10亿创纪录,人工智能领域竞争白热化且用户习惯生变
Sensor Tower 表示,ChatGPT 在推出约三年后,于 5 月达到 10 亿每月活跃用户人数,超过 GoogleMaps、TikTok、Instagram 及 YouTube 此前的增速纪录。…

2026-06-03

字节AI大牛顾全全告别Seed团队,或携AI4S成果开启创业新征程
今天是我在 ByteDance Seed 的最后一天。为了攻克现代 AI 中最棘手的难题之一 —— 可靠地训练和规模化扩展前沿级大语言模型—— 我加入了 LLM 预训练团队,并创立了 LLM 优化与规模化…

2026-06-03

阿里前副总裁张凯夫离职创业 聚焦构建面向市场世界模型 曾掌舵淘宝行业
6月3日,科创板日报获悉,阿里副总裁张凯夫已经离职创业,方向是构建面向市场的世界模型。他相信目前正是启程之时,并招募相关人才加入。2022年1月,任阿里巴巴M6(副总裁)。编辑:吴祈 【来源:科创板日报、公…

2026-06-03