当大语言模型从简单的对话工具进化为具备任务执行能力的智能体时,传统搜索引擎的生存空间正被逐步压缩。谷歌与百度等老牌搜索引擎的界面已发生根本性转变——AI生成的摘要内容占据首屏,传统链接列表退居次席。这种表面变化背后,是搜索服务对象的彻底迁移:过去为人类设计的关键词匹配模式,正在被智能体对结构化数据的需求所取代。
Perplexity公司提出的"搜索即代码"(Search as Code)架构,正在重新定义信息检索的技术边界。该公司最新测试数据显示,其研发的SaC系统在处理复杂调研任务时,性能达到主流模型的2.5倍,同时将计算成本压缩85%。这项突破性成果背后,是对传统搜索架构的深度解构与重构。
传统搜索系统的三大缺陷在智能体时代愈发凸显。首先,为保证召回率而返回的海量冗余信息,导致大模型上下文窗口频繁溢出,推理成本呈指数级增长。其次,固定API调用模式限制了模型利用领域知识的主动性,使其被迫接受非最优信息源。更严重的是,多轮检索产生的中间数据污染模型上下文,真正有价值的信息常被淹没在噪声中。
SaC架构的核心创新在于将搜索过程转化为可编程的代码流。该系统由三个层次构成:顶层模型层生成执行搜索任务的Python代码;中间计算沙箱提供确定性的执行环境,确保相同输入产生相同输出;底层原子化SDK则提供检索、过滤、去重等基础操作接口。这种设计使模型能够直接操控搜索系统的内部状态,而非被动接收预处理结果。
工程实现层面的两个关键决策彰显技术深度。在编程语言选择上,Perplexity放弃执行效率更高的Rust,转而采用Python作为沙箱运行语言。这一选择源于Python在数据处理生态上的绝对优势,以及大模型对Python代码的天然理解能力。数据持久化方案则采用文件系统序列化模式,强制模型显式管理中间状态,虽然增加代码复杂度,但有效避免了内存污染导致的逻辑混乱。