谷歌发布Gemini 2.5 Deep Think，月费1803元，助力解决复杂科学数学问题-信息流-ITBear科技资讯

谷歌近日震撼发布其最新推理模型——Gemini 2.5 Deep Think，这款模型被誉为迄今为止最强大的存在。

Deep Think源自一个在国际数学奥林匹克（IMO）竞赛中斩获金牌的模型变体。在最近的一次测试中，其高级版本Gemini Deep Think成功解答了IMO六道题中的五道，总分高达35分（满分42分），实力堪比金牌选手。尽管该模型在解决复杂数学问题时需要数小时，但新发布的版本在速度和易用性上都有了显著提升，据内部评估，在2025年IMO基准测试中，它仍能达到铜牌水平。

早在今年5月的I/O开发者大会上，谷歌便对Gemini 2.5 Deep Think进行了首次预览。新版本带来了“重大改进”。在涉及编程、科学、知识和推理的基准测试中，与其他不使用工具的模型相比，如OpenAI o3和Grok 4，Gemini 2.5 Deep Think在LiveCodeBench V6和Humanity’s Last Exam两项测试中均展现出了最佳性能。

Gemini app中的Deep Think模型通过运用独特的思考技巧，能够提供更详尽、更具创意和体贴的回答。它不仅能帮助数学家测试数学猜想，还能提升Web开发任务的美学效果。Deep Think支持多种输入方式，包括文本、图像、音频和视频，同时拥有1M tokens的上下文窗口，输出长度可达192K tokens。

Deep Think的工作原理基于谷歌的并行思维技术，能够同时生成并思考多个想法，随着时间的推移不断修改或整合这些想法，最终得出最优解。谷歌还通过延长推理时间或“思考时间”，为Gemini提供了更多探索不同假设的机会，从而解决复杂问题。谷歌开发了一种新颖的强化学习技术，鼓励模型利用这些扩展的推理路径，使Deep Think逐渐成为一个更出色、更直观的问题解决者。

Deep Think的应用场景广泛，尤其擅长解决需要创造力、战略规划和逐步改进的问题。例如，在迭代开发和设计领域，它在构建复杂事物的任务上表现出色，能够提升网络开发任务的美学和功能。在科学和数学发现方面，它能够推理出高度复杂的问题，通过复杂的科学文献帮助制定和探索数学猜想，可能加速科学发现的进程。在算法开发和代码领域，它在解决棘手的编码问题上尤为出色，能够仔细权衡时间复杂性，制定最佳解决方案。

目前，仅有最高级别的Google AI Ultra订阅者才能使用“Deep Think”，每月订阅费高达249.99美元（约合人民币1803元）。Deep Think能够自动与代码执行和谷歌搜索等工具配合使用，产生更长的响应。达到IMO金牌水平的Deep Think模型还将进行进一步测试，并向一小部分数学家和学者分享，以辅助研究。谷歌计划利用这些反馈来完善该模型的未来版本。