
目前很多 AI Agent 表现不佳,在处理复杂任务时经常“掉链子”。这通常不是因为模型本身不够强大,而是由于上下文工程(Context Engineering)的失败。本文将深入探讨什么是上下文工程,它与提示词工程、RAG 等概念的区别,以及如何通过系统化的方法来解决上下文问题。
什么是上下文(Context)?
上下文不仅仅是简单的聊天记录,它是一个提供给大语言模型的、用来完成推理或生成任务的全部信息集合。它可以被分为三个核心类别:
- 指导性上下文(Guiding Context): 告诉模型“做什么”以及“如何做”,为模型的行为设定框架、目标和规则。我们熟知的提示词工程主要优化这类上下文,包括系统提示词、任务描述、少样本示例等。
- 信息性上下文(Informational Context): 提供模型所需的知识、事实和数据。这部分包括检索增强生成(RAG)以及记忆系统(Memory),例如短期记忆、长期记忆和“思考草稿本”。
- 行动性上下文(Actionable Context): 告诉模型“能做什么”以及执行后的结果。这部分包括工具定义、工具调用及其结果,使模型能够与外部世界进行交互。
什么是上下文工程(Context Engineering)?
上下文工程是一门系统性的学科,它专注于设计、构建和维护一个动态系统,以便为 Agent 在执行任务的每一步智能地组装出最优的上下文组合,从而确保任务能够可靠、高效地完成。 Andrej Karpathy 形象地将上下文工程比喻为操作系统的内存管理器。它的职责不是简单地把数据塞满内存,而是通过复杂的调度算法,决定在每个“时钟周期”加载、换出或优先处理哪些


2103

被折叠的 条评论
为什么被折叠?



