阿里通义QwQ-32B-Preview亮相，能否成AI推理新标杆？-业界动态-ITBear科技资讯

阿里巴巴旗下的通义千问团队近日正式揭晓了其最新的研究成果——QwQ-32B-Preview实验性模型。这款模型在解决数学与编程领域的复杂推理问题上，展现出了卓越的AI推理能力，特别是在需要深度思考的场景中。

QwQ-32B-Preview模型与OpenAI的o1模型相媲美，并且它是以宽松的Apache 2.0许可证发布的，这意味着用户可以在商业环境中自由使用它。这一举措打破了以往大型AI模型在版权和使用上的限制。

通义千问团队在介绍QwQ模型时，表达了其愿景：“思考、质疑、理解，是人类永恒的探索精神。”QwQ模型就像一位充满好奇心的学徒，通过思考和疑问，为人类探索未知之路提供光亮。

然而，团队也坦诚地指出了QwQ模型的局限性。他们表示，QwQ仍在不断学习和成长中，有时会出现答案不够完善、思绪飘散的情况。同时，模型在处理复杂逻辑问题时，可能会陷入递归推理的循环，导致回答冗长且不够聚焦。

在安全性方面，尽管QwQ模型已经具备了一定的安全管控能力，但仍需要进一步增强。团队提醒用户，模型可能会产生不恰当或存在偏见的回答，并可能受到对抗攻击的影响。因此，他们建议用户在使用时采取适当的安全防护措施。

尽管如此，QwQ-32B-Preview模型在数学和编程领域的表现依然令人瞩目。它包含了325亿个参数，能够处理最长32000个tokens的提示词。在AIME和MATH基准测试中，QwQ-32B-Preview的表现优于OpenAI的o1-preview和o1-mini模型。在GPQA基准测试中，QwQ-32B-Preview展示了研究生水平的科学推理能力，评分为65.2%。

在数学解题能力方面，QwQ-32B-Preview在AIME基准测试中取得了50.0%的评分，证明了其强大的数学问题解决技能。而在MATH-500基准测试中，QwQ-32B-Preview更是以90.6%的成绩，全面展示了其在各类数学主题上的深入理解。在LiveCodeBench基准测试中，QwQ-32B-Preview以50.0%的成绩验证了其在真实编程场景中的出色表现。

这些令人瞩目的成绩不仅展示了QwQ-32B-Preview模型的强大实力，也体现了阿里巴巴在AI技术领域的深厚积累和创新精神。随着技术的不断进步和优化，相信QwQ模型将在未来为人类带来更多惊喜和突破。

五大浏览器联盟对抗微软Edge，浏览器市场竞争白热化

2024-11-28

上海爷叔“爱在深秋”直播十分钟吸粉数万，为何账号再遭封禁？

三言科技11月28日消息，11月27日，上海爷叔“爱在深秋-郑老师”的抖音账号在直播十分钟后再次被封禁。此次直播吸引了4.1万人观看，粉丝数增至38.7万人。此前，因点评和预测股市而爆火的“爱在深秋”抖音账…

2024-11-28

新国标护航，小刀电动车以旧换新共筑安全出行保障

近日，电动自行车领域的三项强制性国家标准正式实施，为电动自行车的安全保障设立了更为严格的标准。与此同时，各大电动车品牌正在全国范围内广泛开展的以旧换新活动，尤其是积极响应政府号召的小刀电动车，更为消费者提供了安全、便捷、实惠的换车方案，引领了电动自行

2024-11-28

保时捷与货拉拉司机运费纠纷终和解，司机称不再回应
2024-11-28

支撑构建三大供应链 TCL亮相2024链博会

11月26日，2024年第二届中国国际供应链促进博览会在北京开幕。TCL通过TCL实业与TCL科技两大主体参展，围绕智能终端、半导体显示、新能源光伏三大核心产业，联合产业链上下游支撑构建三大泛半导体供应链，呈现行业领先产品和尖端技术。具体来说，TCL支撑构建三大泛半导体

2024-11-28

OpenAI最新推理模型o1商标申请进展：正待美国专利商标局审查

2024-11-28

八成“电子仓鼠”爱囤照片记录，存下就是心安？
2024-11-28

TikTok新举措：未成年用户美颜滤镜使用受限

2024-11-28