ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

李飞飞团队50美元训AI模型?阿里云:基于我们Qwen2.5微调而成

时间:2025-02-07 13:47:49来源:ITBEAR编辑:快讯团队

近期,科技界传来了一则引人注目的消息。据三言科技报道,斯坦福大学与华盛顿大学的研究团队携手,仅凭不到50美元的云计算成本,便成功培育出一款名为s1的人工智能推理模型。

这一创新成果迅速引起了业界的广泛关注。阿里云随后证实,该团队实际上是以其开源的阿里通义千问Qwen2.5-32B-Instruct模型为基础,进行了进一步的探索。研究人员在16块H100GPU的强大算力支持下,仅通过26分钟的监督微调,便成功训练出了全新的s1-32B模型。

据悉,这款新模型在数学和编码能力方面展现出了与业界顶尖推理模型相匹敌的实力。具体而言,s1-32B在数学竞赛问题上的表现尤为亮眼,其准确率甚至超过了OpenAI的o1-preview模型高达27个百分点。这一成就无疑为人工智能推理领域注入了新的活力。

s1-32B模型的诞生不仅彰显了研究团队在算法和算力方面的深厚积累,也进一步验证了开源模型在推动人工智能技术创新中的重要作用。通过充分利用开源资源,并结合高效的训练策略,研究人员得以在极低的成本下实现如此显著的成果。

随着人工智能技术的不断发展,越来越多的创新模型将不断涌现。s1-32B模型的诞生无疑为这一领域树立了新的标杆,也为未来的研究提供了宝贵的参考和启示。

更多热门内容
2025年:中国芯片企业借AI浪潮,破局重生
2025年是AI应用的爆发年,也是关乎国产算力企业兴衰存亡的关键之年。现在真正做到了芯片、模型助力场景应用,场景反馈回来的数据,又增加了模型跟芯片进一步地迭代,形成了一个非常良性的正向循环。”我们从芯片厂商的…

2025-08-04