在软件开发领域,一项新的创新正悄然改变着程序员的工作方式。OpenAI近期推出了Codex,这是一款基于云的软件工程智能体,专为处理编程任务而设计。
Codex能够并行执行多项任务,包括编写代码、解答代码库相关疑问、修复错误,并提交拉取请求以供审核。它运行在云端,并预先加载用户的代码库,使得操作更加高效。
这款智能体的背后是codex-1模型的支持,这是OpenAI o3针对软件工程领域进行优化的结果。目前,Codex已经对ChatGPT Pro、Team和Enterprise用户开放,并即将面向Plus用户推出。为了满足更多用户的需求,OpenAI还推出了codex-1的精简版本,这是专为轻量级开源编码Agent“Codex CLI”打造的。通过API,用户可以以1.5美元/100万tokens输入和6美元/100万tokens输出的价格使用它,即时缓存还能享受七五折优惠。
使用Codex,用户可以通过ChatGPT的侧边栏轻松访问它。他们只需输入指令并点击“代码”按钮,即可分配编程任务。同时,用户还可以通过“提问”功能向Codex咨询代码库的问题。每个任务都在一个独立且隔离的环境中处理,确保了安全性。
Codex不仅能读取和编辑文件,还能运行包括测试工具和类型检查器在内的各种命令。任务的完成时间通常在1到30分钟之间,具体取决于任务的复杂性。用户可以随时监控Codex的进度,并在任务完成后查看结果。
为了让Codex更好地融入开发环境,用户可以通过AGENTS.md文件对其进行配置。这个文件类似于README.md,用户可以在其中指导Codex如何导航代码库、运行哪些测试命令以及遵循项目的最佳实践。配置得当后,Codex的性能将达到最佳。
在编码评估和内部基准测试中,codex-1展现出了强大的性能。尽管在测试中排除了23个无法在OpenAI内部基础架构上运行的样本,但codex-1仍然表现出色。它的测试设置最大上下文长度为192k tokens,推理难度为中等,这也是目前产品中可用的设置。
在安全和透明度方面,Codex也做得相当出色。用户可以通过引用、终端日志和测试结果来检查Codex的工作。当遇到不确定或测试失败的情况时,Codex会明确告知用户,以便他们做出正确的决策。
为了平衡安全性和实用性,Codex经过训练能够识别并拒绝旨在开发恶意软件的请求,同时支持合法任务。它还增强了政策框架,并纳入了严格的安全评估。Codex完全在云端安全隔离的容器中运行,任务执行期间禁止访问互联网。
对于Codex CLI用户来说,OpenAI还发布了codex-1的精简版本,这是专为Codex CLI设计的o4-mini版本。这个新模型支持更快的工作流程,并针对低延迟代码问答和编辑进行了优化。Plus和Pro用户可以兑换价值5美元和50美元的免费API积分,用于体验Codex CLI。
OpenAI的技术团队已经开始将Codex纳入他们的日常工具包中。工程师们用它来处理那些重复且范围明确的任务,如重构、重命名和编写测试。同时,Codex也适用于构建新功能、连接组件、修复错误以及起草文档。
在发布之前,OpenAI还与外部测试人员进行了合作。例如,思科正在探索Codex如何帮助其工程团队更快地实现想法,并向OpenAI提供反馈。Temporal则使用Codex来加速功能开发、调试问题、编写和执行测试,以及重构大型代码库。
尽管Codex仍处于早期阶段,但它已经展现出了巨大的潜力。作为研究预览版,它目前还缺少一些功能,如图像输入和在Agent工作时进行方向修正。然而,随着技术的不断进步,我们可以期待Codex在未来成为工程师编写高质量代码的主流方式。