ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

OpenAI与Anthropic齐推新型大语言模型,强化推理能力引领AI新趋势

时间:2025-08-07 12:14:49来源:新浪财经编辑:快讯团队

人工智能领域近日迎来重大进展,两大巨头OpenAI与Anthropic PBC相继推出了针对推理任务优化的新型大语言模型,标志着AI技术在编程与数据分析方面迈出了重要一步。

OpenAI此番推出了两个基于开源许可证的新算法:gpt-oss-120b与gpt-oss-20b。前者拥有惊人的1170亿个参数,后者也达到了210亿个参数。这两个模型不仅能够运行代码、与外部系统如数据库进行交互,还能根据任务的复杂度自动优化处理时间,展现了强大的实用性与灵活性。尤为gpt-oss-20b对硬件要求较低,仅需一张16GB内存的显卡即可运行,这意味着它能够在某些消费级设备上流畅工作,大大降低了AI技术的使用门槛。

OpenAI的新模型采用了专家混合架构,即多个神经网络协同工作,每个网络都针对特定任务进行了优化。这种设计使得模型在处理复杂任务时能够更高效地调用资源,提高响应速度与准确性。gpt-oss-120b与gpt-oss-20b还引入了分组多查询注意力和旋转位置嵌入两项新技术,前者减少了算法注意力机制的内存使用,后者则增强了模型处理长输入的能力,两者共同作用下,模型能够支持高达128,000个Token的上下文窗口,极大地提升了信息处理能力。

对于OpenAI的这一举措,业内专家Dave Vellante表示,开源推理模型的推出正在缩小专有API的护城河,企业现在可以在内部运行和优化模型,这无疑将推动AI技术的普及与应用。他进一步指出,未来的差异化竞争将主要体现在工具、强化学习循环、防护措施以及数据上,拥有数字孪生能力的企业将在这一领域占据先机。

与此同时,Anthropic也不甘落后,推出了Claude Opus 4.1这一新专有大语言模型,作为其旗舰产品Claude 4 Opus的升级版。在SWE-bench Verified基准测试中,Claude Opus 4.1的编程能力得分从72.5%提升至74.5%,展现了显著的进步。该模型在研究和数据分析能力方面也得到了显著提升。Claude Opus 4.1现已在Anthropic的Claude AI助手付费版本中可用,同时也可通过其API、Amazon Bedrock和Google Cloud的Vertex AI服务获取。Anthropic表示,这只是其大语言模型产品线计划增强系列中的第一个更新,未来几周还将发布更多升级,预计规模将大幅扩展。

随着OpenAI与Anthropic的新模型相继问世,企业对于AI技术的选择与应用将面临更多可能性。开源模型的推出不仅降低了技术门槛,还促进了技术的交流与共享,有望推动整个行业向更加开放、多元的方向发展。而对于企业来说,如何在众多选项中找到最适合自己的AI解决方案,将成为未来发展的重要课题。

更多热门内容