附录A 术语表
本术语表综合自 Agentic Design Patterns Glossary、Hello-Agents 术语体系及各章内容,按主题分类组织。首次出现时给出英文原文与简明定义。
一、基础概念
| 术语 | 英文 | 定义 |
|---|---|---|
| 提示词 | Prompt | 用户向AI模型提供的输入(问题、指令或陈述),用于激发模型生成响应 |
| 上下文窗口 | Context Window | AI模型单次处理的最大token容量,涵盖输入与输出 |
| 上下文学习 | In-Context Learning | AI通过提示中直接嵌入的示例掌握新任务的能力,无需额外训练 |
| 零样本/少样本提示 | Zero-Shot / Few-Shot Prompting | 通过提供零个或少量任务示例引导模型响应的技术 |
| 多模态 | Multimodality | AI理解并处理跨数据类型信息(文本、图像、音频等)的能力 |
| 基础化 | Grounding | 将模型输出关联至可验证真实信息源的过程,降低幻觉风险 |
| 幻觉 | Hallucination | 模型生成看似合理但实际不正确或无依据的内容 |
| Token | Token | LLM处理文本的基本单位,通常为一个词或词的一部分 |
二、核心AI模型架构
| 术语 | 英文 | 定义 |
|---|---|---|
| Transformer | Transformer | 现代LLM的基石架构,核心创新为自注意力机制 |
| 自注意力机制 | Self-Attention | Transformer的关键组件,使模型能捕捉序列中任意位置间的依赖关系 |
| 循环神经网络 | RNN | 早于Transformer的序列处理架构,通过循环结构维持历史记忆 |
| 专家混合 | Mixture of Experts (MoE) | 通过路由网络动态选择专家子网络处理输入的高效架构 |
| 扩散模型 | Diffusion Models | 通过噪声注入与去噪过程生成高质量数据的生成式模型 |
| 状态空间模型 | State Space Model (SSM) | Mamba等新兴架构采用的序列建模方法,具备长上下文高效处理能力 |
三、LLM开发生命周期
| 术语 | 英文 | 定义 |
|---|---|---|
| 预训练 | Pre-training | 在海量通用数据集上训练基础模型,学习语言规律与世界知识 |
| 微调 | Fine-tuning | 在特定任务数据集上进一步训练通用模型,实现能力适配 |
| 对齐 | Alignment | 调整模型行为使其符合人类价值观,确保输出有用且安全 |
| 监督微调 | Supervised Fine-Tuning (SFT) | 在标注正确的输入输出配对上训练模型 |
| 指令微调 | Instruction Tuning | 专注提升模型遵循指令能力的微调方法 |
| LoRA | Low-Rank Adaptation | 参数高效微调技术,仅更新少量低秩参数矩阵 |
| RLHF | Reinforcement Learning from Human Feedback | 基于人类偏好反馈训练奖励模型,指导AI学习的对齐技术 |
| DPO | Direct Preference Optimization | 无需独立奖励模型的直接偏好优化方法 |
四、智能体核心概念
| 术语 | 英文 | 定义 |
|---|---|---|
| 智能体 | Agent | 能感知环境并采取自主行动以实现目标的AI系统 |
| Agentic AI | Agentic AI | 具备自主性、目标导向性和环境交互能力的AI系统范式 |
| 认知架构 | Cognitive Architecture | 智能体的内部信息处理与决策制定框架 |
| 感知-推理-行动循环 | Perception-Reasoning-Action Loop | 智能体的基本运行循环:感知环境→推理决策→执行行动 |
| 自主性 | Autonomy | 智能体在无人干预下独立完成任务的能力程度 |
概念层级:Agent → Agentic AI → Self-Evolving Agent(递进关系:从基础智能体到具备自主进化能力的系统)
五、推理与规划
| 术语 | 英文 | 定义 |
|---|---|---|
| 思维链 | Chain of Thought (CoT) | 引导模型逐步展示推理过程的提示技术。参见第10章 |
| 思维树 | Tree of Thoughts (ToT) | 同步探索多条推理路径的进阶推理框架 |
| ReAct | Reason and Act | 将推理与工具调用融合于循环流程的经典智能体框架。参见第4章 |
| 规划 | Planning | 将高层目标分解为可管理子任务序列的能力 |
| Plan-and-Solve | Plan-and-Solve | 先制定完整计划再逐步执行的范式。参见第5章 |
| 反思 | Reflection | 智能体评估自身输出并迭代改进的自我优化机制。参见第6章 |
| 自我纠正 | Self-Correction | 智能体识别错误并自主修复的能力 |
| 深度研究 | Deep Research | 迭代式信息检索、综合与新问题发现的自主深入探索 |
概念层级:CoT → ToT → GoD(推理复杂度递增);Planning → Plan-and-Solve → Adaptive Planning(规划灵活度递增)
六、Agentic设计模式
| 术语 | 英文 | 定义 |
|---|---|---|
| 提示词链 | Prompt Chaining | 将问题分解为线性步骤序列,前步输出为后步输入 |
| 路由 | Routing | 根据输入上下文动态选择最优处理路径的条件分发 |
| 并行化 | Parallelization | 独立子任务并发执行以优化效率的模式 |
| 工具使用 | Tool Use / Function Calling | 智能体调用外部API、数据库等工具的机制。参见第8章 |
| 目标设定与监控 | Goal Setting and Monitoring | 设定可量化目标并追踪执行进度的模式。参见第9章 |
| 异常处理与恢复 | Exception Handling and Recovery | 检测、分类和从运行时错误中恢复的策略 |
| 资源感知优化 | Resource-Aware Optimization | 在资源约束下优化执行效率的模式 |
| 优先级管理 | Prioritization | 动态评估与排序任务优先级的策略 |
| 探索与发现 | Exploration and Discovery | 在不确定环境中主动探索新信息的机制 |
概念层级:Prompt Chaining → Routing → Parallelization(流程控制复杂度递增);Tool Use → MCP → A2A(交互协议抽象层级递增)
七、记忆系统
记忆系统完整架构参见第11-13章
| 术语 | 英文 | 定义 |
|---|---|---|
| 感知记忆 | Sensory Memory | 对原始输入的极短期保留,类比人类感觉登记 |
| 短期记忆 | Short-Term Memory (STM) | 当前会话上下文中维护的临时信息 |
| 工作记忆 | Working Memory | 对当前任务相关信息的主动维护与操作 |
| 长期记忆 | Long-Term Memory (LTM) | 跨会话持久化的知识存储,包括事实性和程序性记忆 |
| 情景记忆 | Episodic Memory | 存储特定事件和经历的记忆类型 |
| 语义记忆 | Semantic Memory | 存储一般性知识和概念的记忆类型 |
| 程序记忆 | Procedural Memory | 存储技能和操作流程的记忆类型 |
| 记忆巩固 | Memory Consolidation | 将短期记忆转化为长期记忆的过程 |
| 记忆检索 | Memory Retrieval | 从记忆存储中提取相关信息的过程 |
概念层级:Sensory Memory → STM → Working Memory → LTM(持续时间递增);Episodic → Semantic → Procedural(抽象程度递增)
八、检索增强生成(RAG)
RAG 技术体系参见第14-15章
| 术语 | 英文 | 定义 |
|---|---|---|
| RAG | Retrieval-Augmented Generation | 结合信息检索与生成模型的技术,用外部知识增强模型输出 |
| 文本分块 | Text Chunking | 将长文本切分为适合检索的小片段的预处理策略 |
| 嵌入 | Embedding | 将文本映射到高维向量空间的表示方法 |
| 向量数据库 | Vector Database | 专为高维向量存储和相似度检索优化的数据库 |
| 语义检索 | Semantic Search | 基于语义相似度而非关键词匹配的信息检索方法 |
| 混合检索 | Hybrid Search | 结合稀疏检索(BM25)和稠密检索(向量)的策略 |
| 知识图谱 | Knowledge Graph | 以图结构组织实体及其关系的知识表示方法 |
| Graph RAG | Graph RAG | 结合知识图谱与RAG的进阶检索架构 |
| 重排序 | Reranking | 对初始检索结果按相关性重新排序的精化步骤 |
| JIT知识集成 | Just-In-Time Knowledge Integration | 在需要时实时检索和注入知识的动态策略 |
概念层级:Embedding → Vector DB → Semantic Search → RAG → Graph RAG(技术栈从底层到应用层)
九、上下文工程
上下文工程完整体系参见第16-18章
| 术语 | 英文 | 定义 |
|---|---|---|
| 上下文工程 | Context Engineering | 系统化设计和管理AI系统输入上下文的工程学科 |
| 提示工程 | Prompt Engineering | 优化单次提示以获得更好模型响应的技术 |
| 上下文污染 | Context Pollution | 无关或低质量信息占据上下文窗口,降低模型性能 |
| 上下文干扰 | Context Interference | 上下文中相互矛盾的信息导致模型输出不一致 |
| 上下文压缩 | Context Compression | 在保留关键信息的前提下减小上下文体积的技术 |
| 信号密度 | Signal Density | 上下文中有用信息占总信息量的比例 |
| GSSC流水线 | Gather-Select-Summarize-Compose | 长时程任务上下文管理的四阶段流水线 |
十、通信协议
| 术语 | 英文 | 定义 |
|---|---|---|
| MCP | Model Context Protocol | 标准化模型与工具/数据源交互的开放协议。参见第19章 |
| A2A | Agent-to-Agent Protocol | Google提出的智能体间发现、协商和协作的通信协议。参见第20章 |
| ANP | Agent Network Protocol | 面向开放网络环境的去中心化智能体通信协议 |
| Agent Card | Agent Card | A2A协议中描述智能体能力和接口的元数据文件 |
| MCP Server | MCP Server | 向AI模型暴露工具和资源的MCP协议服务端 |
| MCP Client | MCP Client | 连接MCP Server并代理模型发起工具调用的客户端 |
十一、多智能体系统
| 术语 | 英文 | 定义 |
|---|---|---|
| 多智能体协作 | Multi-Agent Collaboration | 多个专业化智能体协同工作以完成复杂任务的系统模式 |
| 编排者 | Orchestrator | 负责协调和管理多个智能体执行流程的中心控制角色 |
| 层级拓扑 | Hierarchical Topology | 具有明确上下级关系的多智能体组织结构 |
| 对等拓扑 | Peer-to-Peer Topology | 智能体地位平等、直接协商的去中心化组织结构 |
| 混合拓扑 | Hybrid Topology | 结合层级与对等元素的灵活组织结构 |
| 角色分工 | Role Specialization | 为不同智能体分配特定职责以提升效率的策略 |
十二、安全与评估
| 术语 | 英文 | 定义 |
|---|---|---|
| Guardrails | Guardrails | 约束智能体行为在安全边界内的防护机制。参见第22章 |
| 输入Guardrail | Input Guardrail | 在处理前检验和过滤用户输入的安全层 |
| 输出Guardrail | Output Guardrail | 在返回前检验和过滤模型输出的安全层 |
| 提示注入 | Prompt Injection | 通过恶意构造的输入操纵模型行为的攻击方式 |
| 越狱 | Jailbreaking | 绕过模型安全限制使其生成不当内容的技术 |
| 人机协同 | Human-in-the-Loop (HITL) | 在智能体工作流中保留人类审查和干预节点的模式。参见第23章 |
| 人在环上 | Human-on-the-Loop | 人类监督但不主动介入的更高自主度模式 |
| 信任校准 | Trust Calibration | 动态调整对智能体自主决策信任程度的机制 |
| 评判模型 | Critique Model | 专门评审其他模型输出质量的评估模型 |
| Benchmark | Benchmark | 标准化的智能体能力评估测试集 |
概念层级:Input Guardrail → Behavior Constraint → Output Guardrail(按数据流方向);HITL → Human-on-the-Loop → Full Autonomy(自主程度递增)
十三、框架与工具
| 术语 | 英文 | 定义 |
|---|---|---|
| LangChain | LangChain | 基于链式组合构建LLM应用的框架 |
| LangGraph | LangGraph | 基于图结构构建有状态循环Agent的LangChain扩展 |
| LlamaIndex | LlamaIndex | 专注数据索引和检索的LLM应用框架 |
| CrewAI | CrewAI | 基于角色扮演的多智能体协作框架 |
| AutoGen | AutoGen | 微软开源的多智能体对话框架 |
| Dify | Dify | 开源的LLM应用低代码开发平台 |
| Coze | Coze | 字节跳动的AI Agent构建平台 |
十四、前沿概念
| 术语 | 英文 | 定义 |
|---|---|---|
| GUI Agent | GUI Agent | 通过视觉感知和界面操作与图形用户界面交互的智能体。参见第27章 |
| 自我进化智能体 | Self-Evolving Agent | 能自主改进自身能力和行为的智能体系统。参见第28章 |
| Agentic RL | Agentic Reinforcement Learning | 将强化学习与智能体架构结合的训练范式 |
| 编码智能体 | Coding Agent | 专门用于代码生成、调试和开发辅助的智能体。参见第30章 |
| Agent-as-a-Service | Agent-as-a-Service | 将智能体能力作为云服务提供的部署模式 |
| 涌现能力 | Emergent Abilities | 模型规模达到阈值后突然出现的新能力 |
| Agent-FLAN | Agent-FLAN | 专为智能体能力设计的微调数据方法论。参见第10章 |
| ADAS | Automated Design of Agentic Systems | 自动搜索最优智能体系统架构的元学习框架。参见第28章 |
| SWE-bench | SWE-bench | 基于真实 GitHub Issue 的编码智能体评估基准。参见第24、30章 |
| 具身智能体 | Embodied Agent | 能在物理或虚拟 3D 环境中感知和操作的智能体。参见第27章 |
| Token 经济学 | Token Economics | 分析和优化智能体系统 Token 消耗与成本的工程实践。参见第10章 |
| 可观测性 | Observability | 通过 Trace/Span/Metric 监控智能体运行时行为的基础设施。参见第9章 |