返回 基础认知

Basics

智能体系统核心术语:Prompt, Memory, Tool, Workflow 与 RAG

理清构建多智能体应用时无法绕开的五大核心工程组件,明确其在架构体系中的真实边界与作用。

PromptMemory
智能体系统核心术语:Prompt, Memory, Tool, Workflow 与 RAG 封面图

初学者在阅读 AI 智能体(Agent)相关的架构白皮书或开源代码库时,常常被满屏幕交织的英文字母弄得头晕脑胀。 实际上,无论底层代码多么庞杂,一个现代的智能体系统基本都由以下五个核心高频组件(Component)搭建而成。明确它们的真正职责边界,是读懂任何高级架构图的先决条件。

我们可以把一个全功能的智能体系统想象为一个刚刚入职公司的“新员工”,这五个术语分别对应着驱动他工作的五种不同要素。

1. Prompt(提示词边界约束)

专业定义: Prompt Engineering 是通过自然语言或极简的代码模板向大语言模型下达特定的指令集。它决定了该 Node(节点)在当前单步推理中扮演何种角色(Persona)、遵从什么任务规范以及必须采用何种特定结构来返回 JSON/文本输出。

大白话比喻: Prompt 就像是发给这个新员工的一大本《入职培训岗位职责手册》。 如果没有任何 Prompt,模型就像刚出厂的瞎子,它不知道自己是谁。只有通过 Prompt 的严厉约束:“你现在的角色是一个温柔的售后客服,任务是解答退货问题且禁止对客户发脾气”,这个模型才能立刻进入状态工作。它解决了 “模型如何思考与扮演” 的问题。

漫画:老板将一本发光的极厚说明书递给一脸懵逼的机器人新员工

2. Memory(状态与记忆上下文)

专业定义: 由于无状态的 REST API 调用是失忆的,Memory 模块负责实现会话状态追踪。它分为短程注意力上下文记录(对话历史/Scratchpad)和需要挂载到外部数据库的长程记忆(用户长线业务表单、知识画像)。

大白话比喻: 如果没有 Memory,这个新员工就跟金鱼一样只有 7 秒的记忆。 Memory 就是他的“随身笔记本”。他不仅可以把刚才和你聊过的内容记下来(Short-term Memory),还能把你长期的生活偏好写在笔记本的最后一页(Long-term Memory)。它解决的是 “系统如何记住发生过什么” 的问题。

3. Tool / Function Calling(工具调用执行引擎)

专业定义: 大语言模型本质只是文本的概率生成器,自身无法突破沙盒与现实世界发生真实的 I/O 交互。Tool Calling 是一套允许大语言模型结构化生成外部 API 调用参数,从而让宿主程序代发网络请求改变外部状态的能力。

大白话比喻: 这位新员工光会聊天没用,遇到不会算账的时候,他需要一个真正的算盘。 Tool 就是发给这个员工的一个百宝兵器库。当遇到超出文本理解的事物(比如实时天气查询),他从兵器库里掏出一个叫“气象 API”的扳手,跑到外面把今天下雨的数据带回大脑。它解决的是 “模型如何干涉物理与互联网世界” 的问题。

漫画:机器人打开一个发光的工具箱,里面全是诸如搜索和计算器的图标

4. Workflow / Orchestration(工作流调度编排)

专业定义: Workflow 定义了基于有向无环图(DAG)或状态机的一系列刚性或动态的任务流转逻辑。它用来界定什么阶段该触发检索,由于什么条件的抛出该进入重试回路,谁应当把输出丢给下游消费者。

大白话比喻: 员工手里即便拥有无数把厉害的扳手和起子,如果不被指导,他很可能上来就乱捶。 Workflow 就是这家公司红绿灯交替运作的标准流水线(SOP)。它用极其死板但极度确定的业务逻辑写下了:“你必须先去问客户意向,如果没有拿到数据就必须在这里干等着不准执行下一个环节。” 它解决的是 “单向逻辑应该按照什么宏观时间线推进” 的问题。

5. RAG(检索增强知识供给)

专业定义: Retrieval-Augmented Generation,是一种通过实时查询外部向量化数据(如 Vector DB)来作为大模型增强生成上下文依据的具体技术栈。

大白话比喻: 这个员工虽然读过全人类的书,但他根本不知道你这几个月新写的代码文档。 RAG 就是给他脚边放了一个按拼音排序极其精准的**“企业内部秘密资料柜”**。一旦他遇到不懂的疑难杂症,他不再去脑子里回忆旧知识,而是转身打开柜子准确地拿出答案念给你听。它解决的是 “企业特定私域语料的精准供给” 问题。

总结框架

看懂任何时髦架构的第一步:

  • Prompt 搞定模型脑残:定义“怎么思考”。
  • Memory 搞定模型失忆:定义“记住什么”。
  • Tool 搞定模型瘫痪瞎子:定义“拿什么做事”。
  • Workflow 搞定模型混乱暴走:定义“按什么先后次序排班”。
  • RAG 搞定模型不懂你们公司业务:定义“依照什么核心权威数据回答”。

继续阅读

继续沿着这条知识路径往下读

返回 基础认知

基础认知

RAG 还是 Agentic RAG?一文读懂它们的本质区别

传统 RAG 像一个按菜谱做菜的厨师,你给什么食材他就做什么菜,不会变通。而 Agentic RAG 像一个会思考的大厨,会品尝、调整、甚至临时去菜市场补买调料。同样是 RAG,它们解决问题的方式有天壤之别。

继续阅读

基础认知

Agentic RAG 工作流:LLM 自己做主,不再死板执行

传统 RAG 是固定流水线,Agentic RAG 则给大模型装上了「大脑」——它会自己决定查什么、怎么查、查几次。本文用生活化比喻帮你彻底理解这种新一代检索增强生成架构。

继续阅读