如果你是@OpenAI Codex或编程代理的新手,这个指南将帮助你更快获得更好的结果。它涵盖了使Codex在CLI、IDE扩展和Codex应用中更有效的核心习惯,从提示和规划到验证、MCP、技能和自动化。

Codex在你把它当作一个持续配置和改进的队友,而不仅仅是一次性助手时效果最佳。

一个有用的思维模型是:从正确的任务上下文开始,使用AGENTS.md作为持久的指导,根据你的工作流程配置Codex,使用MCP连接外部系统,将重复工作转化为技能,并自动化稳定的工作流程。

1. 通过清晰的上下文和提示,做好Codex的首次强力使用准备

即使你的提示不是完美的,Codex已经足够强大,可以有用。你通常可以在最少设置的情况下交给它一个难题,仍然获得强有力的结果。清晰的提示不是获取价值的必需,但它确实让结果更可靠,特别是在大型代码库或重要任务中。

如果你在大型或复杂的代码库中工作,最大的解锁通常是为Codex提供正确的任务上下文和清晰的结构,说明你想完成什么。

一个好的默认做法是在提示中包括四个内容:

目标:你试图改变或构建什么?

上下文:哪些文件、文件夹、文档、示例或错误对这个任务重要?你可以 @ 提及某些文件作为上下文。

约束:Codex应遵循哪些标准、架构、安全要求或惯例?

完成条件:任务完成前应满足什么条件,比如测试通过、行为改变或错误被修复?

这能帮助Codex保持范围,减少假设,产出更易于审查和验证的工作成果。

根据任务的难度选择推理级别,并测试哪种设置最适合你的工作流程。不同的用户和任务适合不同的设置。

低级别适用于更快速、范围明确的任务

中级或高级适用于更复杂的变更或调试

超高级适用于冗长、有代理性、重推理的任务

新手提示:大多数人通过从一些基础的成功开始最快上手,比如向Codex提问代码库相关问题或使用它进行小范围修复。强烈推荐在Codex应用中使用语音输入以加快迭代速度。

2. 通过让Codex先制定计划减少困难任务中的错误

如果任务复杂、含糊或难以清晰描述,先让Codex制定计划再开始编码。

这里有几种有效的方法:

使用计划模式:对大多数用户来说,这是最简单且最有效的选项。计划模式让Codex收集上下文信息、提出澄清问题,并在实施前制定更强的计划。通过输入 /plan 或 Shift+Tab 切换。

让Codex采访你:如果你对想要的内容有大致想法,但不确定如何准确描述,可以让Codex先提问你。告诉它质疑你的假设,并把模糊的想法转化为具体内容再写代码。

使用PLANS.md模板:对于更高级的工作流程,你可以配置Codex遵循PLANS.md或执行计划模板,用于需长时间运行或多步骤的工作。更多细节,请查看我们的执行计划指南。

3. 使用AGENTS.md使成功的指导可复用

一旦提示模式有效,下一步就是停止手动重复它。这就是AGENTS.md的作用。

把AGENTS.md看作代理的README。它是一个简单的开放格式,会自动加载到上下文中,是你和团队在代码仓库中编码如何使用Codex的最佳位置。

一个好的AGENTS.md通常包括:

仓库布局和重要目录

如何运行项目

构建、测试和代码检查命令

工程规范和PR期望

限制和禁止规则

完成的定义以及如何验证工作

CLI中的/init斜杠命令是快速启动命令,用于在当前目录搭建一个初始的AGENTS.md。这是一个很好的起点,但你应该编辑结果,使其符合你团队实际的构建、测试、代码审核和发布流程。

你可以在多个层级创建AGENTS.md文件:位于~/.codex的全局AGENTS.md用于个人默认设置,仓库级文件用于共享标准,以及子目录中更具体的规则文件。如果在当前目录附近有更具体的文件,该文件的指导优先。

保持实用。简短且准确的AGENTS.md比长篇模糊规则文件更有用。从基础开始,然后只在发现反复错误后添加新规则。

如果 AGENTS.md 文件变得过大,请保持主文件简洁,并针对规划、代码审查或架构等任务引用专门的 Markdown 文件。

提示:当 Codex 连续犯同样的错误时,询问它进行回顾并更新 AGENTS.md。指导保持实用,并基于实际摩擦。

4. 通过配置 Codex 使其更符合你的工作流程,从而获得更一致的行为

配置是令 Codex 在不同会话和环境中表现更一致的主要方式之一。例如,你可以设置模型选择、推理力度、沙盒模式、审批策略、配置文件和 MCP 设置的默认值。

一个好的起点模式是:

将个人默认设置保存在 ~/.codex/config.toml(在 Codex 应用中的 设置 → 配置 → 打开 config.toml)

将仓库特定行为保存在 .codex/config.toml 中

仅在单次情况使用命令行覆盖(如果你使用 CLI)

config.toml 是定义持久偏好设置的地方,比如 MCP 服务器、配置文件、多代理设置和实验功能。你可以直接编辑它,也可以让 Codex 帮你更新。

Codex 自带操作级别的沙箱功能,有两个关键设置可控。审批模式决定何时 Codex 在执行命令前请求你的许可,沙箱模式决定 Codex 是否能在目录中读写以及代理可以访问哪些文件。

如果你是完全的新手,建议默认权限保守开始。默认保持审批和沙箱严格,只在信任的仓库或特定流程中,根据需求再放宽权限。

注意 CLI、IDE 及 Codex 应用共用相同的配置层。详情请查看我们的示例配置文档页面。

提示:尽早为你的真实环境配置 Codex。许多质量问题实际上是配置问题,比如错误的工作目录、缺少写权限、错误的模型默认设置,或者缺少工具和连接器。

5. 通过让 Codex 进行测试、验证和审查工作来提升可靠性

不要仅仅停留在让 Codex 做出更改。需要时让它创建测试,运行相关检查,验证结果,并在你接受之前审查工作。

Codex 可以为你完成这个循环,但前提是它知道“正确”的标准是什么。这个指导可以来自提示或 AGENTS.md。

这可能包括:

编写或更新针对更改的测试

运行正确的测试套件

检查代码风格、格式或类型检查

确认最终行为符合请求

审查差异以发现错误、回归或风险模式

提示:在 Codex 应用中切换差异面板,可以直接在本地审查更改。点击具体行即可提供反馈,反馈将作为上下文传递给下一次 Codex 交互。

这里一个有用的选项是使用斜杠命令 /review,它为你提供了几种不同的代码审查方式:

针对基础分支进行PR风格的审查

审查未提交的更改

审查一次提交

使用自定义审查指令

如果你和你的团队有一个code_review.md文件,并且该文件在AGENTS.md中有引用,Codex在审查时也可以遵循这些指导。这是希望团队在多个代码库和贡献者之间保持审查行为一致性的强有力模式。

Codex不仅仅是生成代码。通过合适的指令,它还能帮助测试、验证和审查代码。

如果你使用GitHub云端服务,可以轻松地设置Codex为你的PR运行代码审查。我们在OpenAI使Codex审查100%的PR。你可以选择启用自动审查,或者在@Codex时让它被动审查。

6. 通过MCP将外部工具和实时上下文引入Codex

当Codex所需的上下文存在于代码库之外时,使用MCP。它让Codex连接你已经使用的工具和系统,这样你就不必不断地复制粘贴实时信息到提示中。

模型上下文协议(Model Context Protocol,简称MCP)是一种用于将Codex连接到外部工具和系统的开放标准。

以下情况使用MCP:

所需的上下文存在于代码库之外

数据经常变化

您希望Codex使用工具而不是依赖粘贴的指令

您需要跨用户或项目实现可重复的集成

Codex支持带有OAuth的STDIO和可流式HTTP服务器。

在Codex应用程序中,前往设置 → MCP服务器以查看自定义和推荐服务器。通常,Codex可以帮助您安装所需的服务器。您只需提出请求。您还可以在命令行界面使用codex mcp add命令添加带有名称、URL和任何附加信息的自定义服务器。

提示:只有当工具能解锁真实工作流程时才添加工具。不要一开始就接入你使用的所有工具。先从一两个明显能消除你经常做的手动环节的工具开始,然后再逐步扩展。

7. 将重复的工作流程转化为可复用的技能

一旦工作流程变得可重复,就不要再依赖冗长的提示或反复往返。使用技能(Skill)将指令打包成SKILL.md文件、上下文和支持逻辑,Codex将持续应用。技能能在CLI、IDE扩展和Codex应用中使用。

保持每个技能的范围紧密聚焦于一项工作。先从2到3个具体用例开始,定义清晰的输入和输出,并撰写描述,明确说明技能做什么及何时使用。包括用户实际可能说出的触发短语类型。

不要试图一开始就覆盖所有边缘情况。先从一个代表性任务开始,使其运行良好,然后将该工作流程转化为技能并逐步改进。只在能显著提升可靠性时才包含脚本或额外资源。

一个好的经验法则是:如果你不断重复使用相同的提示或反复纠正同一工作流程,它可能就应该成为一个技能。

技能对于以下重复性工作尤其有用:

日志分类

发布说明草拟

根据清单审查PR

迁移规划

遥测或事件总结

标准调试流程

$skill-creator 技能是搭建技能第一个版本的最佳起点,而使用 $skill-installer 技能可以将其安装到本地。技能中最重要的部分之一是描述。它应清晰说明技能的功能及使用时机。

提示:个人技能存储在 $HOME/.agents/skills,团队共享技能可以提交到仓库内的 .agents/skills 文件夹。这对新队友入职特别有帮助。

8. 通过自动化节省重复工作时间

一旦工作流程稳定,你可以安排 Codex 在后台为你运行它。在 Codex 应用中,自动化允许你选择项目、提示词、频率和执行环境来处理重复任务。

当任务变得重复时,你可以轻松在 Codex 应用的自动化标签页创建自动化。你可以选择运行的项目、运行的提示词(可以调用技能),以及执行频率。你还可以选择自动化是在专用的 git 工作树中运行,还是在本地环境中运行。了解更多关于 git 工作树的信息。

合适的候选包括:

总结最近的提交

扫描可能的漏洞

起草发布说明

检查持续集成失败

制作站立会议总结

定期运行可重复的分析工作流程

一个有用的规则是技能定义方法,自动化定义时间表。如果一个工作流程仍然需要大量指导,先将其转变为技能。一旦它变得可预测,自动化就成为倍增器。

提示:使用自动化进行反思和维护,而不仅仅是执行。回顾最近的会话,总结重复出现的摩擦,并随着时间推移改进提示、指令或工作流程设置。

9. 通过会话控制在较长时间的工作中保持有序

Codex 会话不仅仅是聊天记录。它们是积累了上下文、决策和行动的工作线程,因此良好的管理对质量有重要影响。

在 Codex 应用界面中管理多个线程最简单,可以固定线程和创建工作树。但如果你使用命令行界面,这些斜杠命令尤其有用:

/experimental 用于切换实验性功能并添加到你的 config.toml

/resume 恢复保存的对话

/fork 创建一个新线程,同时保留原始记录

/compact 当线程变长时,您想要早期上下文的总结版本时使用。注意,Codex 会自动为您压缩对话

/agent 当您运行多个代理并希望在活动代理线程之间切换时使用

/theme 选择语法高亮主题

/apps 直接在 Codex 中使用 ChatGPT 应用

/status 检查当前会话状态

每个连贯的工作单元保持一个线程。如果工作仍然是同一问题的一部分,保持在同一个线程通常更好,因为它保留了推理轨迹。只有当工作真正分支时才分叉。

提示:使用 Codex 的多代理工作流程,将有限的工作从主线程中卸载出去。让主代理专注于核心问题,使用子代理处理探索、测试或分诊等任务。

10. 常见错误及避免方法

首次使用 Codex 时要避免的一些常见错误:

在提示中堆砌持久规则,而不是将它们移入 AGENTS.md 或技能文件

不让代理查看其工作内容,不提供如何最佳运行构建和测试命令的详细信息

跳过多步骤和复杂任务的规划

在了解工作流程之前,给予Codex对你电脑的全部权限

在不使用git工作树的情况下,对同一文件运行多个活动线程

在手动操作还不可靠时,将重复任务转变为自动化

将Codex与自己的工作并行使用,而不是逐步监视其操作

入门清单

给Codex设定正确的目标、背景、限制条件和完成标准

对于复杂任务,先让Codex进行规划

创建一个初始的AGENTS.md

告诉Codex如何构建、测试、验证和评审

设置与你工作流匹配的配置默认值

为高价值的外部工具添加MCP

将重复的工作流转化为技能

当工作流稳定后使用自动化

你越是把你的工作流、标准和上下文转化为Codex可用的内容,就越能看到智能代理的真正能力。今天就开始吧!