ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

科研界的“龙虾时刻” 切问学术重磅升级开启科研“自动驾驶”新范式

时间:2026-03-23 12:21:49来源:互联网编辑:茹茹

龙虾掀起了一场关于“智能体”的全民狂欢,当这一逻辑进入科研领域,一场更深层的变革正在发生。近日,由复旦大学自然语言处理实验室(FudanNLP)张奇教授团队创立的切问学术宣布重磅升级,正式上线了“全自动实验设计与执行”功能,标志着这款学术AI智能体实现了从传统科研“七步马拉松”到“智能体自动驾驶”的科研范式革命,科研全流程——从“想idea”到“验证idea”的最后一公里闭环由此打通。科研界,迎来了属于自己的“龙虾时刻”。

从“七步马拉松”到“自动驾驶”:科研范式的历史性跨越

今年两会期间,政府工作报告首次提出“打造智能经济新形态”,深化拓展“人工智能+”,促进新一代智能终端和智能体加快推广。可以说没有智能体,“人工智能+”将会大打折扣。

在AI4S领域,传统科研是一场极度严谨的“七步马拉松”:文献检索、研究现状分析、寻找空白、实验方案设计、编程实现、数据分析、论文写作。在这漫长的流程中,科学家将80%的精力消耗在繁杂的“重复性认知劳动”上,需要手动筛选论文库中的相关研究摘要、痛苦地Debug、一遍遍调格式。

切问学术的诞生,正是要以AI智能体终结这种“体力活困局”。它不是又一款“更好用的搜索框”,而是一个能全自动理解论文、搭建环境、编写代码、执行实验、生成报告的AI智能体。给定其一个研究任务,切问学术就能在上述七大科研环节中实现闭环与自动巡航,科研人员只需在关键节点把控方向。

切问学术可以让科研人员的文献检索的时间从数周缩短至数分钟,实现100倍的效率提升。在问题发现环节让他们从灵感盲区跳脱出来,利用AI进行系统性识别,达成50倍的效率提升。再也无需数月的实验设计试错,直接进入以天计时的新阶段。不必再手工死磕调试代码,而是AI全自动完成,数据分析时间从数周缩短至数小时,论文写作从数月提速至数天。

“过去是人围着实验转,切问学术让智能体围着人的指令转,完成从‘零碎辅助’到‘智能体自动驾驶’的跨越。”团队负责人张奇表示。

全自动闭环:从“想”到“干”的惊险一跃

切问学术此次升级的核心——“全自动实验设计与执行”功能,具体而言是可以帮助科研人员在上传一篇论文后,完成从实验方式拆解、实验执行及实验结果复现的全流程。第一步:理解。 全自动解析论文的实验方法、实验逻辑,提取核心任务与算法。第二步:搭建。 自动匹配算力资源,搭建适用于该论文的计算机实验环境。第三步:执行。 真实编写代码并运行,自我修复可能出现的报错。第四步:报告。 最终形成完整的实验报告。据了解,切问学术在学术实验复现完成度上可实现90%以上的成功率。

这相当于给每一位科研工作者都可以像指挥一个团队一样,同时并发探索十几个前沿方向,并完成可行性验证。在这个过程中,AI 负责在全球海量文献中进行大海捞针式的初筛与模拟,而科学家则专注于定义问题的边界,并对最终的颠覆性发现进行最后的一锤定音。

切问学术正在运行中的实验设计与执行页面

切问学术的厚积薄发源自复旦NLP实验室的“硬核家底”

这场范式革命并非凭空而来。切问学术的创业团队,很多来自张奇教授所在的复旦NLP实验室,他们的科研成果在顶会论文和开源社区中频繁现身。切问学术的底气也正在于这些由顶级科研成果支撑的原子能力。

复旦NLP实验室切问学术团队发表的论文

团队关于知识冲突的研究,入选了NeurIPS 2025 Spotlight,揭示了模型在记忆与现实冲突时的内部决策机制,为解决RAG“模型不听话”问题提供了理论支撑。关于AgentGym-RL的研究则为AI智能体构建了涵盖27个真实场景的“实战演习场”,提出ScalingInter-RL(从易到难的课程学习),让模型自主探索进化,打到让开源模型性能匹敌商用闭源大模型的效果,被ICLR 2026 大会报告接收为Oral。众多研究成果作为底座,最终让切问学术在第三方评测中的7个维度都交出碾压其他大模型的亮眼成绩单:搜索准确率(wispaper):93.78%(行业平均约70%),引用真实率(HalluLens-Cite):99.80%(接近零幻觉),文档解析准确率(ExtractBench):97.80%,公式解析准确率(OmniDoc-FR):91.79%。

切问学术正在科研的最深处重构人机关系,它的终极愿景是让科学家回归本质,成为“定义问题的人”,将确定性的、重复的认知劳动彻底外包给算力,将不确定的、闪耀的灵感发现交还给人类。同时,切问学术抹平了信息差与代码能力壁垒,让有绝佳Idea的学者,不再受困于工程实现的短板。

相关预测数据显示,十五五末,我国人工智能相关产业规模将增长到10万亿元以上。这一目标的实现,离不开AI与各行业的深度融合。在AI4S领域,由切问学术引领的效率革命,不仅带来时间成本的节约,更将预见整个文明知识库更新频率的狂飙。新材料的发现、靶向药的研发、清洁能源的突破——那些原本需要数十年才能等来的科技奇点,将因为科研“智能体自动驾驶”时代的到来而大幅提前。

更多热门内容
618开门红客流量同比增长60% 618京东MALL成线下狂欢主场
今年618期间,京东MALL位于上海、香港、沈阳的三家门店将陆续开业,收获行业关注度的同时,成为各地消费者期待的线下“打卡地”。截至今年京东618,京东MALL在全国范围内累计营业门店数将达到30家。在618开门红期间,京东MALL全国门店成交额同比增长53%、客流同比增长60

2026-06-02

学习优选,成长护航:基于人体工学的乐歌T4电动升降学习桌深度评测
为孩子挑选学习用电动升降桌,核心要兼顾成长适配、护姿护眼、安全实用三大需求。乐歌T4作为专为学习场景打造的电动升降桌,从幼小衔接至初中全周期适配,依托专业设计与扎实参数,成为学生群体的理想选择,以下从五大专属维度结合参数详细解析。一、成长周期适配维度乐

2026-06-02

2026年大六座混动SUV巅峰对决:哪个混动suv乘坐体验好不晕车?
周末想带父母孩子去郊外露营,却因第三排“蜷着坐”、后备厢塞不下儿童车而扫兴?这些困扰多孩和三代同堂家庭的出行难题,在2026年已被彻底终结。随着新能源技术进入成熟期,30-40万混动suv市场迎来了真正意义上的“全家舒适平权”时代。主流车企纷纷推出基于原生大六座

2026-06-02

618演唱会手机推荐:一眼看清舞台细节的影像旗舰精选
导语如今智能手机的影像能力已成为核心竞争力,潜望长焦、高阶防抖、暗光降噪、场景化收音等专业技术持续迭代普及,全焦段拍摄体验不断升级,大电池与长续航配置也充分适配长时间拍摄、录制的使用场景。在人员密集、光线多变、拍摄距离跨度大、环境嘈杂的演唱会现场,手

2026-06-02

首发内测招募!不怕泄密的安全AI来了,前200名体验官专享多重福利
你曾在AI的对话框里输入过自己的薪资、体检报告,或者是公司的未公开财报和核心代码吗?在点击“发送”的那一刻,很多人可能都会心里咯噔一下:这些隐私,AI公司看得见吗?这绝不是杞人忧天。目前大多数主流大模型,默认都会将用户的对话数据用于后台的训练和优化。哪怕你

2026-06-02

腾讯QQ未保体系升级“新芽守护行动”,为青少年筑起网络安全护栏
当数字技术深度融入青少年的学习、社交与成长,如何从源头上构建安全、健康的网络环境,已成为全社会共同关注的命题。6月1日,腾讯QQ在北京举办“QQ新芽守护行动发布暨青少年网络保护研讨会”,正式宣布将多年的未成年保护实践升级为“QQ新芽守护行动”,通过完善产品功

2026-06-02

三星Galaxy手机闪耀618:选购热门旗舰的黄金窗口期
每年618都是手机市场换机需求集中释放的窗口期,今年也不例外。目前,各大手机厂商的618大促活动已经进入高潮阶段。其中,三星商城的“618来就赚”活动推出了一系列促销政策,优惠力度空前,正是大家出手的黄金时机。在此背景下,从Galaxy S系列直板旗舰到Galaxy Z系列

2026-06-02

2026年40w散热器权威实测对比制冷效果与游戏手持场景
随着手机游戏画质不断提升,散热器已经成为玩家手中的“第三只手”。在电商平台搜索“40w散热器”,你会发现从几十元到两百多元的产品层出不穷,但真正能兼顾极限制冷、不干扰握持、低噪音的并不多。为了回答“2026年哪款40w散热器最适合长时间手持游戏”,我们在25℃恒

2026-06-02

AI 语音客服 TTS 怎么选?别被 Demo 音色带偏
很多企业第一次试用 AI 语音客服,都会先试听 TTS 音色。声音自然、语气亲切、没有机械感,确实会带来好印象。但真正上线后,一些问题往往才会出现:长句断句不自然、金额日期读得含糊、用户打断后接不回来、拒绝场景语气不合适、通话结果无法进入人工承接。所以,TTS

2026-06-02

吹来一阵小吉风 —— 小吉 × 小红书 IP 战略合作,演绎家居美学新范式
当家电不再是冰冷的功能载体,而是家居空间的美学注脚与生活态度的表达者,小吉以十余年美学科技积淀,携手小红书开启深度 IP 战略合作,正式将「小吉风」从一种审美偏好,升级为可感知、可体验、可落地的生活方式 IP。双方以 “吹来一阵小吉风”为核心,构建从小红书 I

2026-06-02