吉利汽车集团与阶跃星辰携手,向全球开发者开放两大创新多模态大模型。这一里程碑式的合作标志着双方在算力算法、场景训练等领域的深度合作取得了显著成果,共同推动了人工智能技术的边界。
在此次开源行动中,阶跃星辰的Step系列多模态大模型成为焦点。其中,阶跃Step-Video-T2V作为全球参数量最大、性能最优的开源视频生成模型,其参数量高达300亿,能够直接生成高质量的视频,分辨率达到540P,每秒帧数高达204帧。这一突破性技术确保了生成视频的高信息密度和一致性,为用户提供了前所未有的视频创作体验。用户现在即可通过跃问APP体验这一先进技术。
阶跃Step-Video-T2V在复杂场景、人物美感、视觉创意等方面展现出强大的生成能力,其语义理解和指令遵循能力尤为突出。为了全面评测这一模型的性能,阶跃星辰还发布了针对文生视频质量的新基准数据集Step-Video-T2V-eval,该测试集涵盖了11个内容类别,旨在全面评估生成视频的质量。评测结果显示,阶跃Step-Video-T2V在多个关键指标上均显著超越现有开源视频模型。
与此同时,阶跃星辰还推出了行业内首款产品级开源语音交互模型——阶跃Step-Audio。这款模型能够根据不同的场景需求生成情绪、方言、语种等多样化的语音表达,实现高质量对话。其生成的语音具有超自然、高情商等特征,能够满足影视娱乐、社交、游戏等多个行业的应用需求。在主流公开测试集中,阶跃Step-Audio的性能均位列第一,特别是在汉语水平考试六级评测中表现尤为突出。
吉利汽车集团CEO淦家阅表示,吉利一直致力于成为智能汽车AI科技的引领者和普及者。通过构建端到端的自研体系和生态联盟,吉利已经形成了完善的智能吉利科技生态网。此次与阶跃星辰的合作,将进一步推动吉利在智能驾驶、智能座舱等方面的技术创新,为用户提供更智能、更高阶的出行体验。
阶跃星辰创始人、CEO姜大昕博士也强调了开源的重要性。他表示,阶跃星辰一直以实现通用人工智能(AGI)为目标,而开源是实现这一目标的关键途径。通过开源,阶跃星辰希望能够与全球开发者共同分享技术成果,推动多模态模型技术的发展,并期待与社区开发者共同拓展模型技术的边界。