OpenAI与Anthropic齐推新型大语言模型，强化推理能力引领AI新趋势-信息流-ITBear科技资讯

人工智能领域近日迎来重大进展，两大巨头OpenAI与Anthropic PBC相继推出了针对推理任务优化的新型大语言模型，标志着AI技术在编程与数据分析方面迈出了重要一步。

OpenAI此番推出了两个基于开源许可证的新算法：gpt-oss-120b与gpt-oss-20b。前者拥有惊人的1170亿个参数，后者也达到了210亿个参数。这两个模型不仅能够运行代码、与外部系统如数据库进行交互，还能根据任务的复杂度自动优化处理时间，展现了强大的实用性与灵活性。尤为gpt-oss-20b对硬件要求较低，仅需一张16GB内存的显卡即可运行，这意味着它能够在某些消费级设备上流畅工作，大大降低了AI技术的使用门槛。

OpenAI的新模型采用了专家混合架构，即多个神经网络协同工作，每个网络都针对特定任务进行了优化。这种设计使得模型在处理复杂任务时能够更高效地调用资源，提高响应速度与准确性。gpt-oss-120b与gpt-oss-20b还引入了分组多查询注意力和旋转位置嵌入两项新技术，前者减少了算法注意力机制的内存使用，后者则增强了模型处理长输入的能力，两者共同作用下，模型能够支持高达128,000个Token的上下文窗口，极大地提升了信息处理能力。

对于OpenAI的这一举措，业内专家Dave Vellante表示，开源推理模型的推出正在缩小专有API的护城河，企业现在可以在内部运行和优化模型，这无疑将推动AI技术的普及与应用。他进一步指出，未来的差异化竞争将主要体现在工具、强化学习循环、防护措施以及数据上，拥有数字孪生能力的企业将在这一领域占据先机。

与此同时，Anthropic也不甘落后，推出了Claude Opus 4.1这一新专有大语言模型，作为其旗舰产品Claude 4 Opus的升级版。在SWE-bench Verified基准测试中，Claude Opus 4.1的编程能力得分从72.5%提升至74.5%，展现了显著的进步。该模型在研究和数据分析能力方面也得到了显著提升。Claude Opus 4.1现已在Anthropic的Claude AI助手付费版本中可用，同时也可通过其API、Amazon Bedrock和Google Cloud的Vertex AI服务获取。Anthropic表示，这只是其大语言模型产品线计划增强系列中的第一个更新，未来几周还将发布更多升级，预计规模将大幅扩展。

随着OpenAI与Anthropic的新模型相继问世，企业对于AI技术的选择与应用将面临更多可能性。开源模型的推出不仅降低了技术门槛，还促进了技术的交流与共享，有望推动整个行业向更加开放、多元的方向发展。而对于企业来说，如何在众多选项中找到最适合自己的AI解决方案，将成为未来发展的重要课题。