ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谷歌发布Gemini 2.5 Deep Think,月费1803元,助力解决复杂科学数学问题

时间:2025-08-02 21:00:01来源:智东西编辑:快讯团队

谷歌近日震撼发布其最新推理模型——Gemini 2.5 Deep Think,这款模型被誉为迄今为止最强大的存在。

Deep Think源自一个在国际数学奥林匹克(IMO)竞赛中斩获金牌的模型变体。在最近的一次测试中,其高级版本Gemini Deep Think成功解答了IMO六道题中的五道,总分高达35分(满分42分),实力堪比金牌选手。尽管该模型在解决复杂数学问题时需要数小时,但新发布的版本在速度和易用性上都有了显著提升,据内部评估,在2025年IMO基准测试中,它仍能达到铜牌水平。

早在今年5月的I/O开发者大会上,谷歌便对Gemini 2.5 Deep Think进行了首次预览。新版本带来了“重大改进”。在涉及编程、科学、知识和推理的基准测试中,与其他不使用工具的模型相比,如OpenAI o3和Grok 4,Gemini 2.5 Deep Think在LiveCodeBench V6和Humanity’s Last Exam两项测试中均展现出了最佳性能。

Gemini app中的Deep Think模型通过运用独特的思考技巧,能够提供更详尽、更具创意和体贴的回答。它不仅能帮助数学家测试数学猜想,还能提升Web开发任务的美学效果。Deep Think支持多种输入方式,包括文本、图像、音频和视频,同时拥有1M tokens的上下文窗口,输出长度可达192K tokens。

Deep Think的工作原理基于谷歌的并行思维技术,能够同时生成并思考多个想法,随着时间的推移不断修改或整合这些想法,最终得出最优解。谷歌还通过延长推理时间或“思考时间”,为Gemini提供了更多探索不同假设的机会,从而解决复杂问题。谷歌开发了一种新颖的强化学习技术,鼓励模型利用这些扩展的推理路径,使Deep Think逐渐成为一个更出色、更直观的问题解决者。

Deep Think的应用场景广泛,尤其擅长解决需要创造力、战略规划和逐步改进的问题。例如,在迭代开发和设计领域,它在构建复杂事物的任务上表现出色,能够提升网络开发任务的美学和功能。在科学和数学发现方面,它能够推理出高度复杂的问题,通过复杂的科学文献帮助制定和探索数学猜想,可能加速科学发现的进程。在算法开发和代码领域,它在解决棘手的编码问题上尤为出色,能够仔细权衡时间复杂性,制定最佳解决方案。

目前,仅有最高级别的Google AI Ultra订阅者才能使用“Deep Think”,每月订阅费高达249.99美元(约合人民币1803元)。Deep Think能够自动与代码执行和谷歌搜索等工具配合使用,产生更长的响应。达到IMO金牌水平的Deep Think模型还将进行进一步测试,并向一小部分数学家和学者分享,以辅助研究。谷歌计划利用这些反馈来完善该模型的未来版本。

更多热门内容