提示词工程没有消失,而是成为上下文工程的基础子集:它负责单次交互中的指令、格式和示例设计;上下文工程进一步管理模型推理时看到的完整信息环境。
当 LLM 应用从实验走向生产,单纯的提示词设计已不足以构建可靠的 AI 系统。
上下文工程解决的核心问题是:
如何在正确的时间,将正确的信息,以正确的格式,提供给模型?
这本书将带你系统掌握这门 AI 时代最核心的工程能力。
💡 本书与提示词工程的关系:《大模型提示词工程指南》 聚焦于单次交互中的提示词设计技巧;而本书则关注更宏观的系统层面——如何通过检索增强生成(RAG)、记忆架构、工具调用和上下文压缩等工程手段,在生产环境中持续为模型提供高质量的上下文。建议先阅读提示词工程作为基础,再深入本书的上下文工程体系。
| 资源类型 | 主要价值 | 本书补充 |
|---|---|---|
| 厂商官方文档 | API、模型能力和参数的最新说明 | 把多家厂商的能力抽象为统一的上下文工程方法 |
| 框架文档 | 具体框架、SDK 和组件用法 | 解释何时选择 RAG、记忆、工具、智能体和多模态策略 |
| 本书 | 中文系统化教材与实践路径 | 串联生产、安全、评估、成本、案例和可运行示例 |
| 资料类型 | 关注对象 | 主要盲区 | 本书补足 |
|---|---|---|---|
| 提示词工程书 | 单次提示词、格式和示例 | 难以覆盖检索、记忆、权限、预算和多轮状态 | 将提示词纳入完整上下文生命周期 |
| RAG 资料 | 文档检索和答案生成 | 容易忽略工具、记忆、对话、观测和事故处理 | 把 RAG 放进生产上下文架构 |
| 智能体资料 | 规划、工具调用和多步任务 | 容易低估上下文污染、压缩和来源追踪 | 给智能体建立上下文边界和治理闭环 |
| 平台文档 | API、参数和 SDK 用法 | 缺少跨平台抽象和工程取舍 | 提供可迁移的方法、检查清单和实战路径 |
| 本书 | 信息来源、预算、结构、权限、评估和故障处理 | 不替代各厂商最新 API 文档 | 帮助读者设计可验证、可治理的上下文系统 |
本书最终把这些主题收束为一张 上下文架构评审卡:从任务边界、信息来源、写入/选择/压缩/隔离策略,到权限、预算、失败模式和回归评估,帮助读者判断一个系统是否只是“把组件串起来”,还是具备可验证、可治理、可回滚的上下文工程架构。
|
|
|
|
“理解上下文窗口”——跟随以下步骤快速掌握核心能力:
- 认识上下文(第1-2章):理解什么是上下文窗口、Token 概念,以及为什么上下文质量影响模型输出
- 理论框架入门(第3章):建立信息环境设计、四大核心策略和上下文评估方法的统一框架
- 窗口管理实战(第4-7章):学习存储、检索、压缩和隔离等关键策略,掌握分块与优化方法
- 进阶技巧(第8-10章):探索工具调用、智能体上下文管理和自主 RAG 的实现方式
- 实践闭环(第12-14章):把方法落到生产工作流,并运行 EnterpriseKnow 最小实验,完成查询、权限过滤、引用回答和评估回归
graph LR
A[理论基础] --> B[核心技术]
B --> C[实战方法]
C --> D[进阶探索]
A1[上下文工程定义] --> A
A2[LLM 原理] --> A
B1[RAG 技术栈] --> B
B2[记忆架构] --> B
B3[工具调用] --> B
C1[生产部署] --> C
C2[智能体开发] --> C
D1[前沿技术] --> D
D2[行业趋势] --> D
| 主题 | 你将掌握的能力 |
|---|---|
| RAG 系统 | 分块策略、嵌入模型选择、重排序优化、混合检索 |
| 记忆架构 | 工作记忆 / 短期记忆 / 长期记忆的设计与实现 |
| 工具调用 | Function Calling、Model Context Protocol(MCP,模型上下文协议)、工具设计原则 |
| 智能体 | 单/多智能体上下文管理、状态追踪、记忆学习 |
| 生产实践 | 性能优化、成本控制、可观测性、安全治理 |
本书适合以下读者:
| 角色 | 阅读重点 |
|---|---|
| 🧑💻 AI 应用开发者 | 核心技术 + 实践方法 |
| ✍️ 提示词工程师 | 理论基础 + 进阶探索 |
| 📊 AI 产品经理 | 第一部分 + 第三部分概览 |
| 🏗️ AI 架构师 | 全书精读,重点关注生产实践 |
| 🔬 研究人员 | 进阶技术 + 未来展望 |
💡 前置知识:建议具备基础编程能力和对 LLM 的基本了解。代码路线需要能阅读 Python、HTTP API 和 JSON;生产路线需要理解日志、指标、权限、缓存和发布流程;研究路线需要能读论文摘要、评估指标和基准实验。
graph LR
Start[上下文工程学习入口] --> Ch1[第1章:概述]
Ch1 --> Role1["AI 应用开发者<br/>第1-3章 → 第4-9章 → 第12-14章"]
Ch1 --> Role2["提示词工程师<br/>第1-3章 → 第4-8章 → 第11-12章"]
Ch1 --> Role3["AI 产品经理<br/>第1-3章 → 第12-13章 → 第15章"]
Ch1 --> Role4["AI 架构师<br/>全书精读,重点第8-10章 → 第12-14章"]
Ch1 --> Role5["研究人员<br/>第1-3章 → 第10章 → 第12章 → 第15章"]
Role1 --> End1["掌握核心技术与生产实践"]
Role2 --> End2["从提示词迈向上下文工程"]
Role3 --> End3["产品视角的上下文策略"]
Role4 --> End4["设计生产级上下文架构"]
Role5 --> End5["前沿技术与研究方向"]
| 读者角色 | 学习重点 | 核心成果 |
|---|---|---|
| AI 应用开发者 | 第1-3章 → 第4-9章 → 第12-14章 | 掌握 RAG、记忆架构、工具调用、智能体和生产部署 |
| 提示词工程师 | 第1-3章 → 第4-8章 → 第11-12章 | 从提示词工程升级为上下文工程,掌握记忆、检索、压缩、隔离、工具和反模式治理 |
| AI 产品经理 | 第1-3章 → 第12-13章 → 第15章 | 理解上下文工程的产品价值、行业落地和未来趋势 |
| AI 架构师 | 全书精读,重点第8-10章 → 第12-14章 | 设计高性能、可观测、可治理的上下文工程架构 |
| 研究人员 | 第1-3章 → 第10章 → 第12章 → 第15章 | 掌握长上下文、多模态、评估与前沿技术方向 |
👉 推荐:GitBook 在线版
本书提供 PDF 版本供离线阅读,可前往 GitHub Releases 页面下载最新版本。
如需获取默认分支自动更新的预览版,可直接下载 context_engineering_guide.pdf。该文件会随主线更新覆盖,不代表正式发布版本。
先安装 mdPress:
brew tap yeasy/tap
brew install --cask mdpress
mdpress serve启动后访问 本地阅读地址 即可阅读。
📕 初学者:按顺序阅读全书
📗 有经验者:重点阅读第二、三部分
📘 快速参考:阅读每章末尾的“本章小结”
第一部分:认识上下文工程
├── 第1章:上下文工程概述
├── 第2章:大语言模型基础
└── 第3章:上下文工程框架
第二部分:核心技术
├── 第4章:写入策略 — 外部存储与记忆
├── 第5章:选择策略 — 检索增强生成
├── 第6章:压缩策略 — 上下文优化
└── 第7章:隔离策略 — 结构化设计
第三部分:进阶技术与架构
├── 第8章:工具调用与能力扩展
├── 第9章:智能体上下文管理
├── 第10章:进阶技术与架构
└── 第11章:反模式与常见错误
第四部分:工程实战与未来演进
├── 第12章:生产环境最佳实践
├── 第13章:行业应用与架构案例
├── 第14章:综合实战 - 构建企业知识库问答系统
└── 第15章:未来展望与发展趋势
附录
├── 附录A:术语表
├── 附录B:工具与技术生态
├── 附录C:参考资源
├── 附录D:参考文献
└── 附录E:快变事实核验表
📖 完整目录请查看 SUMMARY.md,正文可从 第一章:认识上下文工程 开始。
| 特色 | 说明 |
|---|---|
| 📐 生命周期框架 | 用 Write / Select / Compress / Isolate 组织上下文从写入、选择、压缩到隔离的完整过程 |
| 🔬 量化评估闭环 | 提供上下文质量指标、评估集设计、回归阈值和持续改进方法 |
| 🧭 失败案例经济学 | 用 Graph RAG、检索失败、过度压缩和上下文污染解释为什么系统会在生产中失效 |
| 🛡️ 生产治理视角 | 覆盖权限、来源追踪、成本预算、可观测性、安全治理和事故处理 |
| ✅ 可运行实战 | 第 14 章配套 EnterpriseKnow 本地实验,覆盖检索、ACL、来源引用和评估集回归 |
本书是 AI 技术丛书的一部分。以下书籍与本书形成互补:
| 书名 | 与本书的关系 |
|---|---|
| 《零基础学 AI》 | AI 零基础入门,适合缺乏 AI 背景的读者 |
| 《大模型提示词工程指南》 | 提示词设计基础,本书的前置读物 |
| 《Claude 技术指南》 | Claude 的 MCP 协议与工具使用实践 |
| 《智能体 AI 权威指南》 | 智能体的上下文管理是本书技术的核心应用场景 |
| 《大模型安全权威指南》 | 上下文安全(提示注入防御、RAG 安全)的深度参考 |
| 《OpenClaw 从入门到精通》 | 开源智能体框架中上下文工程的实战应用 |
| 《大模型原理与架构》 | 深入理解大语言模型底层逻辑与架构 |
| 《智能体 Harness 工程指南》 | Harness 记忆子系统与上下文组装引擎的工程实现 |
欢迎贡献!您可以通过以下方式参与:
本书采用 CC BY-NC-SA 4.0 许可证。
您可以自由分享和演绎,但需署名、非商业使用、相同方式共享。
为了保持书稿的专业性和一致性,本项目遵循以下规则:
- 术语表规范:本书必须在附录中包含“术语表”(Glossary),用于标注书中出现的关键术语及其解释。
- 位置:
appendix/glossary.md - 格式:需按字母顺序或拼音顺序排列,包含中英文对照及简明定义。
- 位置:
感谢所有为大模型技术发展做出贡献的研究者与工程师,特别是:
- Anthropic — 上下文工程领域的开创性工作与 MCP 协议
- OpenAI、Google、Meta — LLM 技术的持续创新
- LangChain、LlamaIndex — RAG 框架的宝贵贡献
- 所有开源社区的贡献者们
