Skip to content

yeasy/context_engineering_guide

Repository files navigation

大模型上下文工程权威指南

从理论到实践,掌握 AI 时代最核心的工程能力

License: CC BY-NC-SA 4.0 GitHub stars Release Last Updated Online Reading PDF

开始阅读 · 核心内容 · 适合谁读 · 参与贡献

Context Engineering Guide Cover

为什么需要这本书?

提示词工程没有消失,而是成为上下文工程的基础子集:它负责单次交互中的指令、格式和示例设计;上下文工程进一步管理模型推理时看到的完整信息环境。

当 LLM 应用从实验走向生产,单纯的提示词设计已不足以构建可靠的 AI 系统

上下文工程解决的核心问题是:

如何在正确的时间,将正确的信息,以正确的格式,提供给模型?

这本书将带你系统掌握这门 AI 时代最核心的工程能力。

💡 本书与提示词工程的关系《大模型提示词工程指南》 聚焦于单次交互中的提示词设计技巧;而本书则关注更宏观的系统层面——如何通过检索增强生成(RAG)、记忆架构、工具调用和上下文压缩等工程手段,在生产环境中持续为模型提供高质量的上下文。建议先阅读提示词工程作为基础,再深入本书的上下文工程体系。

资源类型 主要价值 本书补充
厂商官方文档 API、模型能力和参数的最新说明 把多家厂商的能力抽象为统一的上下文工程方法
框架文档 具体框架、SDK 和组件用法 解释何时选择 RAG、记忆、工具、智能体和多模态策略
本书 中文系统化教材与实践路径 串联生产、安全、评估、成本、案例和可运行示例

本书不可替代的定位

资料类型 关注对象 主要盲区 本书补足
提示词工程书 单次提示词、格式和示例 难以覆盖检索、记忆、权限、预算和多轮状态 将提示词纳入完整上下文生命周期
RAG 资料 文档检索和答案生成 容易忽略工具、记忆、对话、观测和事故处理 把 RAG 放进生产上下文架构
智能体资料 规划、工具调用和多步任务 容易低估上下文污染、压缩和来源追踪 给智能体建立上下文边界和治理闭环
平台文档 API、参数和 SDK 用法 缺少跨平台抽象和工程取舍 提供可迁移的方法、检查清单和实战路径
本书 信息来源、预算、结构、权限、评估和故障处理 不替代各厂商最新 API 文档 帮助读者设计可验证、可治理的上下文系统

本书最终把这些主题收束为一张 上下文架构评审卡:从任务边界、信息来源、写入/选择/压缩/隔离策略,到权限、预算、失败模式和回归评估,帮助读者判断一个系统是否只是“把组件串起来”,还是具备可验证、可治理、可回滚的上下文工程架构。


核心内容

第一部分:认识上下文工程

  • 上下文工程的定义与价值
  • 从提示词工程到上下文工程的演进
  • LLM 基础:上下文窗口与 Token
  • 理论框架:四大原则与核心策略

第二部分:核心技术与策略

  • Write — 外部存储与记忆架构
  • Select — RAG 与检索增强生成
  • Compress — 摘要与上下文压缩
  • Isolate — 结构化与隔离设计

第三部分:进阶技术与架构

  • 工具调用与能力扩展
  • 智能体上下文管理
  • 自主检索增强生成 (Agentic RAG)
  • 长上下文模型应用
  • 多模态上下文管理
  • 上下文工程反模式

第四部分:工程实战与未来演进

  • 生产环境的最佳实践
  • 真实系统架构案例分析
  • 项目实战体验
  • 基础设施与未来前瞻
  • 附录 A:术语表
  • 附录 B:工具与技术生态
  • 附录 C:参考资源
  • 附录 D:参考文献
  • 附录 E:快变事实核验表

五分钟快速上手

“理解上下文窗口”——跟随以下步骤快速掌握核心能力:

  1. 认识上下文(第1-2章):理解什么是上下文窗口、Token 概念,以及为什么上下文质量影响模型输出
  2. 理论框架入门(第3章):建立信息环境设计、四大核心策略和上下文评估方法的统一框架
  3. 窗口管理实战(第4-7章):学习存储、检索、压缩和隔离等关键策略,掌握分块与优化方法
  4. 进阶技巧(第8-10章):探索工具调用、智能体上下文管理和自主 RAG 的实现方式
  5. 实践闭环(第12-14章):把方法落到生产工作流,并运行 EnterpriseKnow 最小实验,完成查询、权限过滤、引用回答和评估回归

你将学到什么

graph LR
    A[理论基础] --> B[核心技术]
    B --> C[实战方法]
    C --> D[进阶探索]

    A1[上下文工程定义] --> A
    A2[LLM 原理] --> A

    B1[RAG 技术栈] --> B
    B2[记忆架构] --> B
    B3[工具调用] --> B

    C1[生产部署] --> C
    C2[智能体开发] --> C

    D1[前沿技术] --> D
    D2[行业趋势] --> D
Loading
主题 你将掌握的能力
RAG 系统 分块策略、嵌入模型选择、重排序优化、混合检索
记忆架构 工作记忆 / 短期记忆 / 长期记忆的设计与实现
工具调用 Function Calling、Model Context Protocol(MCP,模型上下文协议)、工具设计原则
智能体 单/多智能体上下文管理、状态追踪、记忆学习
生产实践 性能优化、成本控制、可观测性、安全治理

目标读者

本书适合以下读者:

角色 阅读重点
🧑‍💻 AI 应用开发者 核心技术 + 实践方法
✍️ 提示词工程师 理论基础 + 进阶探索
📊 AI 产品经理 第一部分 + 第三部分概览
🏗️ AI 架构师 全书精读,重点关注生产实践
🔬 研究人员 进阶技术 + 未来展望

💡 前置知识:建议具备基础编程能力和对 LLM 的基本了解。代码路线需要能阅读 Python、HTTP API 和 JSON;生产路线需要理解日志、指标、权限、缓存和发布流程;研究路线需要能读论文摘要、评估指标和基准实验。

学习路线图

graph LR
    Start[上下文工程学习入口] --> Ch1[第1章:概述]

    Ch1 --> Role1["AI 应用开发者<br/>第1-3章 → 第4-9章 → 第12-14章"]
    Ch1 --> Role2["提示词工程师<br/>第1-3章 → 第4-8章 → 第11-12章"]
    Ch1 --> Role3["AI 产品经理<br/>第1-3章 → 第12-13章 → 第15章"]
    Ch1 --> Role4["AI 架构师<br/>全书精读,重点第8-10章 → 第12-14章"]
    Ch1 --> Role5["研究人员<br/>第1-3章 → 第10章 → 第12章 → 第15章"]

    Role1 --> End1["掌握核心技术与生产实践"]
    Role2 --> End2["从提示词迈向上下文工程"]
    Role3 --> End3["产品视角的上下文策略"]
    Role4 --> End4["设计生产级上下文架构"]
    Role5 --> End5["前沿技术与研究方向"]
Loading
读者角色 学习重点 核心成果
AI 应用开发者 第1-3章 → 第4-9章 → 第12-14章 掌握 RAG、记忆架构、工具调用、智能体和生产部署
提示词工程师 第1-3章 → 第4-8章 → 第11-12章 从提示词工程升级为上下文工程,掌握记忆、检索、压缩、隔离、工具和反模式治理
AI 产品经理 第1-3章 → 第12-13章 → 第15章 理解上下文工程的产品价值、行业落地和未来趋势
AI 架构师 全书精读,重点第8-10章 → 第12-14章 设计高性能、可观测、可治理的上下文工程架构
研究人员 第1-3章 → 第10章 → 第12章 → 第15章 掌握长上下文、多模态、评估与前沿技术方向

快速开始

在线阅读

👉 推荐GitBook 在线版

下载离线版本

本书提供 PDF 版本供离线阅读,可前往 GitHub Releases 页面下载最新版本。

如需获取默认分支自动更新的预览版,可直接下载 context_engineering_guide.pdf。该文件会随主线更新覆盖,不代表正式发布版本。

本地阅读

先安装 mdPress

brew tap yeasy/tap
brew install --cask mdpress
mdpress serve

启动后访问 本地阅读地址 即可阅读。

阅读建议

📕 初学者:按顺序阅读全书
📗 有经验者:重点阅读第二、三部分
📘 快速参考:阅读每章末尾的“本章小结”

目录概览

第一部分:认识上下文工程
├── 第1章:上下文工程概述
├── 第2章:大语言模型基础
└── 第3章:上下文工程框架

第二部分:核心技术
├── 第4章:写入策略 — 外部存储与记忆
├── 第5章:选择策略 — 检索增强生成
├── 第6章:压缩策略 — 上下文优化
└── 第7章:隔离策略 — 结构化设计

第三部分:进阶技术与架构
├── 第8章:工具调用与能力扩展
├── 第9章:智能体上下文管理
├── 第10章:进阶技术与架构
└── 第11章:反模式与常见错误

第四部分:工程实战与未来演进
├── 第12章:生产环境最佳实践
├── 第13章:行业应用与架构案例
├── 第14章:综合实战 - 构建企业知识库问答系统
└── 第15章:未来展望与发展趋势

附录
├── 附录A:术语表
├── 附录B:工具与技术生态
├── 附录C:参考资源
├── 附录D:参考文献
└── 附录E:快变事实核验表

📖 完整目录请查看 SUMMARY.md,正文可从 第一章:认识上下文工程 开始。


本书特色

特色 说明
📐 生命周期框架 用 Write / Select / Compress / Isolate 组织上下文从写入、选择、压缩到隔离的完整过程
🔬 量化评估闭环 提供上下文质量指标、评估集设计、回归阈值和持续改进方法
🧭 失败案例经济学 用 Graph RAG、检索失败、过度压缩和上下文污染解释为什么系统会在生产中失效
🛡️ 生产治理视角 覆盖权限、来源追踪、成本预算、可观测性、安全治理和事故处理
可运行实战 第 14 章配套 EnterpriseKnow 本地实验,覆盖检索、ACL、来源引用和评估集回归

推荐阅读

本书是 AI 技术丛书的一部分。以下书籍与本书形成互补:

书名 与本书的关系
《零基础学 AI》 AI 零基础入门,适合缺乏 AI 背景的读者
《大模型提示词工程指南》 提示词设计基础,本书的前置读物
《Claude 技术指南》 Claude 的 MCP 协议与工具使用实践
《智能体 AI 权威指南》 智能体的上下文管理是本书技术的核心应用场景
《大模型安全权威指南》 上下文安全(提示注入防御、RAG 安全)的深度参考
《OpenClaw 从入门到精通》 开源智能体框架中上下文工程的实战应用
《大模型原理与架构》 深入理解大语言模型底层逻辑与架构
《智能体 Harness 工程指南》 Harness 记忆子系统与上下文组装引擎的工程实现

参与贡献

欢迎贡献!您可以通过以下方式参与:

  • 🐛 提交 Issue — 报告错误或提出建议
  • 📝 提交 PR — 改进内容或修复 typo
  • ⭐ Star 本项目 — 帮助更多人发现这本书

许可证

本书采用 CC BY-NC-SA 4.0 许可证。

您可以自由分享和演绎,但需署名、非商业使用、相同方式共享。


项目规则

为了保持书稿的专业性和一致性,本项目遵循以下规则:

  1. 术语表规范:本书必须在附录中包含“术语表”(Glossary),用于标注书中出现的关键术语及其解释。
    • 位置:appendix/glossary.md
    • 格式:需按字母顺序或拼音顺序排列,包含中英文对照及简明定义。

致谢

感谢所有为大模型技术发展做出贡献的研究者与工程师,特别是:


📧 联系作者

如有问题或建议,欢迎通过 Issue 联系。


让我们一起探索上下文工程的世界,构建更智能、更可靠的 AI 应用。

🌟 如果这本书对你有帮助,请给个 Star 支持!

About

从理论到实践,掌握 AI 时代最核心的大模型工程能力

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors