附录 C：术语表

本术语表统一全书高频概念的定义与用法。术语按英文字母排序，每条包含英文原名、中文释义和首次出现章节。

排版约定：英文术语首次出现用"中文（English）"格式，后续统一用英文原文。连字符规范：subagent（不用 sub-agent）、worktree（不用 work-tree）。

术语	释义	首次出现
ACP (Agent Communication Protocol)	Agent 间通信协议（Agent Communication Protocol），由 DeepAgents 提出，定义 Agent 之间的消息传递与协调规范，与 MCP（Agent↔Tool）互补。	第 13 章
Agent Loop	执行循环（Agent Loop），Agent 的核心运行机制：接收输入 → 调用模型 → 执行工具 → 观察结果 → 循环直至模型决定停止，退出条件通常是 `stop_reason != "tool_use"`。	第 1 章
Agentic RL	智能体强化学习（Agentic RL），将 RL 训练范式扩展到复杂终端环境中的 Agent 场景，涵盖环境建模、探索多样性、奖励设计、异步调度等系统性工程，区别于简单的 bandit 式 RLVR。	第 1 章
apply_patch	Codex 的大规模文件编辑工具，通过虚拟 CLI 模式 (`--codex-run-as-apply-patch`) 接受 unified diff 格式的补丁并原子性地应用到目标文件，替代逐行 Edit 操作。	第 3 章
Context Engineering	上下文工程（Context Engineering），Agent 系统的架构核心，涵盖系统提示组装、工具定义编排、对话历史管理、缓存优化、压缩策略等全链路上下文治理，是 Prompt Engineering 的系统化演进。	第 1 章
Context Rot	上下文腐化（Context Rot），随着对话历史增长，模型注意力被长历史稀释，导致对关键信息的响应质量下降的现象，是触发上下文压缩的核心动因。	第 8 章
DAG (Directed Acyclic Graph)	有向无环图（Directed Acyclic Graph），本书中主要用于任务系统的依赖建模：每个任务节点通过 `blockedBy`/`blocks` 字段形成 DAG，系统据此调度可执行任务。	第 1 章
Deep Research	深度研究（Deep Research），一种长程多 Agent 研究架构模式，典型流程为 Orchestrator → Subagents → Synthesizer → Citation Agent，支持多步推理、记忆持久化和证据综合。	第 1 章
Dispatch Map	分发映射（Dispatch Map），将工具名称映射到对应处理函数的数据结构（如 `TOOL_HANDLERS = {name: handler}`），是工具系统的核心路由机制，循环不变、工具可扩展。	第 3 章
FSM (Finite State Machine)	有限状态机（Finite State Machine），本书中出现于两个场景：(1) 结构化输出中将输出约束建模为 FSM 以实现 Guided Decoding；(2) Team 协议中的审批/关机状态转移。	第 3 章
Guided Decoding	引导解码（Guided Decoding），在 LLM token 采样层通过 FSM 或文法约束强制输出符合预定义结构（JSON Schema、BNF 等），实现方式包括 logit masking、grammar-based decoding 等。	第 3 章
Harness / Harness Engineering	操作环境 / 操作环境工程（Harness / Harness Engineering）。Harness = Tools + Knowledge + Observation + Action Interfaces + Permissions，是模型的运行边界而非智能本身。Harness Engineering 是第三代 Agent 工程范式，负责构建完整的约束、反馈、控制系统。	第 1 章
Hook	钩子（Hook），Agent 生命周期中预设的回调注入点（如 PreToolUse / PostToolUse / SessionStart），允许在执行流程的关键节点插入安全检查、日志记录、权限校验等逻辑。	第 2 章
KV-cache	键值缓存（KV-cache），Transformer 推理时缓存已计算的 Key/Value 矩阵以避免重复计算。在 Agent 系统中，KV-cache 命中率是 Context Engineering 的关键性能指标，直接影响延迟和成本。	第 1 章
LangGraph	LangChain 团队的状态机编排框架，将 Agent 工作流建模为有向图（StateGraph），支持条件分支、检查点与回滚、Human-in-the-loop 和子图组合。	第 2 章
Logit Masking	Logit 屏蔽（Logit Masking），在模型输出的 logit 层将不合法 token 的概率设为负无穷，强制模型只能选择合法 token，是 Guided Decoding 和工具管理（屏蔽不可用工具）的底层机制。	第 3 章
LSP (Language Server Protocol)	语言服务器协议（Language Server Protocol），编辑器/IDE 与语言分析后端之间的标准通信协议，提供 Hover 信息、跳转定义、引用查找等能力，是 Agent 获取结构化代码上下文的关键外设。	第 3 章
MCP (Model Context Protocol)	模型上下文协议（Model Context Protocol），Anthropic 提出的标准化协议，定义 Agent（Host）与外部工具/数据源（Server）之间的发现、调用与通信方式，传输层支持 stdio / SSE / WebSocket。	第 3 章
Nag Reminder	提醒机制（Nag Reminder），在每轮 Agent Loop 的上下文末尾自动注入待办事项摘要，利用 Recitation 效应锚定模型注意力，防止长任务中目标漂移。	第 6 章
POMDP (Partially Observable Markov Decision Process)	部分可观测马尔可夫决策过程（POMDP），相比简单 bandit 问题，POMDP 建模了状态的部分可观测性和时序依赖，是 Agentic RL 中复杂终端环境的标准形式化框架。	第 24 章
Provider	模型提供商抽象层（Provider），统一不同 LLM 供应商的消息格式、能力差异、认证方式和成本信息，使 Agent 不绑定单一模型供应商，支持故障转移和运行时切换。	第 7 章
Prompt Caching	提示缓存（Prompt Caching），利用 KV-cache 机制缓存系统提示和历史消息的计算结果，通过保持前缀稳定、只追加不修改等策略最大化缓存命中率，降低推理成本和延迟。	第 8 章
RAG (Retrieval-Augmented Generation)	检索增强生成（Retrieval-Augmented Generation），将外部知识库的检索结果注入模型上下文以增强回答质量，是 Context Engineering 的子集，实际落地需解决分块策略、检索噪声、reranking 等工程挑战。	第 1 章
Recitation	复述效应（Recitation），模型倾向于对上下文末尾（最近位置）的信息给予更高注意力的现象，在 Agent 系统中被利用于注意力锚定——将关键信息（如 todo list）放在上下文末尾以提高执行准确性。	第 8 章
RLVR (RL with Verifiable Rewards)	可验证奖励强化学习（RL with Verifiable Rewards），使用可程序化验证的奖励信号（如代码测试通过率、数学答案正确性）替代人工标注，是 Agentic RL 的前置阶段，对应简单 bandit 场景。	第 20 章
Sandbox / SandboxPolicy	沙箱 / 沙箱策略（Sandbox / SandboxPolicy），限制 Agent 执行环境的安全隔离机制。SandboxPolicy 定义三级策略（read-only / workspace-write / full-access），底层实现因平台而异：macOS 使用 Seatbelt，Linux 使用 Landlock/Bubblewrap，Windows 使用 Restricted Token。	第 1 章
Seatbelt	macOS 沙箱机制（Seatbelt），基于 `/usr/bin/sandbox-exec` 的进程级权限隔离，通过 profile 文件定义文件系统、网络等资源的访问策略，是 Codex 和 Claude Code 在 macOS 平台的核心安全边界。	第 4 章
Skill Loading	技能加载（Skill Loading），按需将结构化知识（SKILL.md 文件）注入 Agent 上下文的机制，通过 `list_skills` 发现 → `read_skill` 加载 → tool_result 注入的三步流程实现，避免前置加载浪费 token。	第 7 章
Subagent	子智能体（Subagent），由主 Agent 调度的子角色，拥有独立的 messages[] 和可选不同工具集，执行完成后将结果摘要返回主 Agent。核心价值是上下文隔离和失败隔离，不等于"能力更弱"，而是"职责更收紧"。	第 3 章
TeamManager / Teammate	团队管理器 / 队友（TeamManager / Teammate）。TeamManager 负责创建和管理 Teammate 实例；Teammate 是具有持久化状态和身份的协作实体，通过 JSONL Mailbox 进行异步消息传递，区别于一次性无状态的 Subagent。	第 13 章
TodoWrite	计划写入工具（TodoWrite），Agent 维护内存中待办列表的工具，将任务拆解为 flat list 并在执行过程中标记完成状态，配合 Nag Reminder 防止目标漂移，是从自由执行到计划驱动的第一步。	第 3 章
Transcript Archive	对话归档（Transcript Archive），将被压缩前的完整对话历史序列化保存到 `.transcripts/{timestamp}.jsonl` 文件中，使上下文压缩操作可恢复——必要时可从归档中重建完整历史。	第 8 章
Worktree	工作树（Worktree），利用 `git worktree` 为每个并行任务创建独立的工作目录和分支（`git worktree add -b task-{id}`），解决多 Agent 共享文件系统的冲突问题，完成后合并回主分支并清理。	第 3 章

补充术语

以下术语在正文中频繁出现但未列入大纲，为完整性一并收录。

术语	释义	首次出现
Action Space	动作空间（Action Space），Agent 在给定状态下所有可执行动作的集合，本书中分三级：Level 1 原子动作 → Level 2 工具调用 → Level 3 脚本/REPL 组合。	第 1 章
Compaction	上下文压缩（Compaction），当对话历史超过 token 阈值时，通过工具输出截断、LLM 摘要等策略缩减上下文长度同时保留关键信息，是对抗 Context Rot 的核心手段。	第 2 章
Human-in-the-loop	人在回路（Human-in-the-loop），在 Agent 执行关键操作前要求人类审批确认的控制模式，平衡自主性和安全性。	第 2 章
Logprobs	对数概率（Logprobs），模型为每个 token 输出的对数概率值，可用于置信度评估、输出质量控制和 Guided Decoding 的验证。	第 3 章
stop_reason	停止原因（stop_reason），模型响应中标识本轮结束原因的字段（如 `tool_use` 表示需要执行工具、`end_turn` 表示自然结束），是 Agent Loop 的退出判据。	第 1 章
Tool Calling	工具调用（Tool Calling），模型以结构化 JSON 格式请求执行外部函数的机制（也称 Function Calling），是 Agent 与环境交互的核心接口。	第 1 章

附录 C：术语表 ​

补充术语 ​

附录 C：术语表

补充术语