近日,中国六大顶尖人工智能初创企业之一——Step AI携手吉利汽车集团,在科技界投下了一颗震撼弹。周二,他们正式向全球开发者推出了两款开源的多模态Step系列模型。
首先亮相的是Step-Video-T2V,这款视频生成模型不仅规模宏大,更是目前全球最强大的开源同类模型,拥有惊人的300亿参数。它能够创造出204帧、分辨率为540P的高质量视频,为用户带来前所未有的视觉盛宴。
紧随其后的是Step-Audio,作为业界首款产品级的开源语音交互模型,它搭载了1300亿参数,能够生成富有情感、辩证且个性化的语音风格。无论是娱乐、社交媒体还是游戏行业,Step-Audio都能提供自然流畅的对话体验和高保真语音再现。
为了全面评估视频生成的质量,Step AI还推出了Stepeval-Audio-360基准测试系统,以及专门针对Step-Video-T2V的视频质量评估数据集Step-Video-T2V-eval。该数据集涵盖了包括动作、美学和真实性在内的11个评估维度,而Step-Video-T2V模型在指令遵循和动作流畅性等方面表现出色。
同日,中国领先的互联网公司昆仑万维也不甘落后,推出了两款开源视频生成模型——SkyReels-V1和SkyReels-A1。SkyReels-V1专为AI短片生成和图像转视频设计,是目前规模最大的模型,有效提升了效率并降低了延迟。
根据IDC与浪潮集团周日联合发布的行业报告,2024年中国智能计算力的规模和市场规模分别实现了74.1%和86.9%的同比大幅增长。报告预测,到2025年,中国智能计算力的规模将比2024年增长43%,而AI计算力市场规模将达到259亿美元,较2024年增长36.2%。
企查查数据显示,截至目前,中国已有647家与AI计算力相关的企业。过去十年来,该领域的注册公司数量稳步增长。2024年,新增注册公司207家,同比增长52.21%;而进入2025年,仅年初就已注册了15家新的AI计算力相关企业。