Skip to content

附录 C:术语表

本术语表统一全书高频概念的定义与用法。术语按英文字母排序,每条包含英文原名、中文释义和首次出现章节。

排版约定:英文术语首次出现用"中文(English)"格式,后续统一用英文原文。连字符规范:subagent(不用 sub-agent)、worktree(不用 work-tree)。


术语释义首次出现
ACP (Agent Communication Protocol)Agent 间通信协议(Agent Communication Protocol),由 DeepAgents 提出,定义 Agent 之间的消息传递与协调规范,与 MCP(Agent↔Tool)互补。第 13 章
Agent Loop执行循环(Agent Loop),Agent 的核心运行机制:接收输入 → 调用模型 → 执行工具 → 观察结果 → 循环直至模型决定停止,退出条件通常是 stop_reason != "tool_use"第 1 章
Agentic RL智能体强化学习(Agentic RL),将 RL 训练范式扩展到复杂终端环境中的 Agent 场景,涵盖环境建模、探索多样性、奖励设计、异步调度等系统性工程,区别于简单的 bandit 式 RLVR。第 1 章
apply_patchCodex 的大规模文件编辑工具,通过虚拟 CLI 模式 (--codex-run-as-apply-patch) 接受 unified diff 格式的补丁并原子性地应用到目标文件,替代逐行 Edit 操作。第 3 章
Context Engineering上下文工程(Context Engineering),Agent 系统的架构核心,涵盖系统提示组装、工具定义编排、对话历史管理、缓存优化、压缩策略等全链路上下文治理,是 Prompt Engineering 的系统化演进。第 1 章
Context Rot上下文腐化(Context Rot),随着对话历史增长,模型注意力被长历史稀释,导致对关键信息的响应质量下降的现象,是触发上下文压缩的核心动因。第 8 章
DAG (Directed Acyclic Graph)有向无环图(Directed Acyclic Graph),本书中主要用于任务系统的依赖建模:每个任务节点通过 blockedBy/blocks 字段形成 DAG,系统据此调度可执行任务。第 1 章
Deep Research深度研究(Deep Research),一种长程多 Agent 研究架构模式,典型流程为 Orchestrator → Subagents → Synthesizer → Citation Agent,支持多步推理、记忆持久化和证据综合。第 1 章
Dispatch Map分发映射(Dispatch Map),将工具名称映射到对应处理函数的数据结构(如 TOOL_HANDLERS = {name: handler}),是工具系统的核心路由机制,循环不变、工具可扩展。第 3 章
FSM (Finite State Machine)有限状态机(Finite State Machine),本书中出现于两个场景:(1) 结构化输出中将输出约束建模为 FSM 以实现 Guided Decoding;(2) Team 协议中的审批/关机状态转移。第 3 章
Guided Decoding引导解码(Guided Decoding),在 LLM token 采样层通过 FSM 或文法约束强制输出符合预定义结构(JSON Schema、BNF 等),实现方式包括 logit masking、grammar-based decoding 等。第 3 章
Harness / Harness Engineering操作环境 / 操作环境工程(Harness / Harness Engineering)。Harness = Tools + Knowledge + Observation + Action Interfaces + Permissions,是模型的运行边界而非智能本身。Harness Engineering 是第三代 Agent 工程范式,负责构建完整的约束、反馈、控制系统。第 1 章
Hook钩子(Hook),Agent 生命周期中预设的回调注入点(如 PreToolUse / PostToolUse / SessionStart),允许在执行流程的关键节点插入安全检查、日志记录、权限校验等逻辑。第 2 章
KV-cache键值缓存(KV-cache),Transformer 推理时缓存已计算的 Key/Value 矩阵以避免重复计算。在 Agent 系统中,KV-cache 命中率是 Context Engineering 的关键性能指标,直接影响延迟和成本。第 1 章
LangGraphLangChain 团队的状态机编排框架,将 Agent 工作流建模为有向图(StateGraph),支持条件分支、检查点与回滚、Human-in-the-loop 和子图组合。第 2 章
Logit MaskingLogit 屏蔽(Logit Masking),在模型输出的 logit 层将不合法 token 的概率设为负无穷,强制模型只能选择合法 token,是 Guided Decoding 和工具管理(屏蔽不可用工具)的底层机制。第 3 章
LSP (Language Server Protocol)语言服务器协议(Language Server Protocol),编辑器/IDE 与语言分析后端之间的标准通信协议,提供 Hover 信息、跳转定义、引用查找等能力,是 Agent 获取结构化代码上下文的关键外设。第 3 章
MCP (Model Context Protocol)模型上下文协议(Model Context Protocol),Anthropic 提出的标准化协议,定义 Agent(Host)与外部工具/数据源(Server)之间的发现、调用与通信方式,传输层支持 stdio / SSE / WebSocket。第 3 章
Nag Reminder提醒机制(Nag Reminder),在每轮 Agent Loop 的上下文末尾自动注入待办事项摘要,利用 Recitation 效应锚定模型注意力,防止长任务中目标漂移。第 6 章
POMDP (Partially Observable Markov Decision Process)部分可观测马尔可夫决策过程(POMDP),相比简单 bandit 问题,POMDP 建模了状态的部分可观测性和时序依赖,是 Agentic RL 中复杂终端环境的标准形式化框架。第 24 章
Provider模型提供商抽象层(Provider),统一不同 LLM 供应商的消息格式、能力差异、认证方式和成本信息,使 Agent 不绑定单一模型供应商,支持故障转移和运行时切换。第 7 章
Prompt Caching提示缓存(Prompt Caching),利用 KV-cache 机制缓存系统提示和历史消息的计算结果,通过保持前缀稳定、只追加不修改等策略最大化缓存命中率,降低推理成本和延迟。第 8 章
RAG (Retrieval-Augmented Generation)检索增强生成(Retrieval-Augmented Generation),将外部知识库的检索结果注入模型上下文以增强回答质量,是 Context Engineering 的子集,实际落地需解决分块策略、检索噪声、reranking 等工程挑战。第 1 章
Recitation复述效应(Recitation),模型倾向于对上下文末尾(最近位置)的信息给予更高注意力的现象,在 Agent 系统中被利用于注意力锚定——将关键信息(如 todo list)放在上下文末尾以提高执行准确性。第 8 章
RLVR (RL with Verifiable Rewards)可验证奖励强化学习(RL with Verifiable Rewards),使用可程序化验证的奖励信号(如代码测试通过率、数学答案正确性)替代人工标注,是 Agentic RL 的前置阶段,对应简单 bandit 场景。第 20 章
Sandbox / SandboxPolicy沙箱 / 沙箱策略(Sandbox / SandboxPolicy),限制 Agent 执行环境的安全隔离机制。SandboxPolicy 定义三级策略(read-only / workspace-write / full-access),底层实现因平台而异:macOS 使用 Seatbelt,Linux 使用 Landlock/Bubblewrap,Windows 使用 Restricted Token。第 1 章
SeatbeltmacOS 沙箱机制(Seatbelt),基于 /usr/bin/sandbox-exec 的进程级权限隔离,通过 profile 文件定义文件系统、网络等资源的访问策略,是 Codex 和 Claude Code 在 macOS 平台的核心安全边界。第 4 章
Skill Loading技能加载(Skill Loading),按需将结构化知识(SKILL.md 文件)注入 Agent 上下文的机制,通过 list_skills 发现 → read_skill 加载 → tool_result 注入的三步流程实现,避免前置加载浪费 token。第 7 章
Subagent子智能体(Subagent),由主 Agent 调度的子角色,拥有独立的 messages[] 和可选不同工具集,执行完成后将结果摘要返回主 Agent。核心价值是上下文隔离和失败隔离,不等于"能力更弱",而是"职责更收紧"。第 3 章
TeamManager / Teammate团队管理器 / 队友(TeamManager / Teammate)。TeamManager 负责创建和管理 Teammate 实例;Teammate 是具有持久化状态和身份的协作实体,通过 JSONL Mailbox 进行异步消息传递,区别于一次性无状态的 Subagent。第 13 章
TodoWrite计划写入工具(TodoWrite),Agent 维护内存中待办列表的工具,将任务拆解为 flat list 并在执行过程中标记完成状态,配合 Nag Reminder 防止目标漂移,是从自由执行到计划驱动的第一步。第 3 章
Transcript Archive对话归档(Transcript Archive),将被压缩前的完整对话历史序列化保存到 .transcripts/{timestamp}.jsonl 文件中,使上下文压缩操作可恢复——必要时可从归档中重建完整历史。第 8 章
Worktree工作树(Worktree),利用 git worktree 为每个并行任务创建独立的工作目录和分支(git worktree add -b task-{id}),解决多 Agent 共享文件系统的冲突问题,完成后合并回主分支并清理。第 3 章

补充术语

以下术语在正文中频繁出现但未列入大纲,为完整性一并收录。

术语释义首次出现
Action Space动作空间(Action Space),Agent 在给定状态下所有可执行动作的集合,本书中分三级:Level 1 原子动作 → Level 2 工具调用 → Level 3 脚本/REPL 组合。第 1 章
Compaction上下文压缩(Compaction),当对话历史超过 token 阈值时,通过工具输出截断、LLM 摘要等策略缩减上下文长度同时保留关键信息,是对抗 Context Rot 的核心手段。第 2 章
Human-in-the-loop人在回路(Human-in-the-loop),在 Agent 执行关键操作前要求人类审批确认的控制模式,平衡自主性和安全性。第 2 章
Logprobs对数概率(Logprobs),模型为每个 token 输出的对数概率值,可用于置信度评估、输出质量控制和 Guided Decoding 的验证。第 3 章
stop_reason停止原因(stop_reason),模型响应中标识本轮结束原因的字段(如 tool_use 表示需要执行工具、end_turn 表示自然结束),是 Agent Loop 的退出判据。第 1 章
Tool Calling工具调用(Tool Calling),模型以结构化 JSON 格式请求执行外部函数的机制(也称 Function Calling),是 Agent 与环境交互的核心接口。第 1 章