返回 基础认知

Basics

Agentic RAG 工作流:LLM 自己做主,不再死板执行

传统 RAG 是固定流水线,Agentic RAG 则给大模型装上了「大脑」——它会自己决定查什么、怎么查、查几次。本文用生活化比喻帮你彻底理解这种新一代检索增强生成架构。

Agentic RAGRAG

你有没有遇到过这种情况:问 AI 一个需要多步推理的问题,它给你返回一个答案,你总觉得哪里不对,但又说不清楚。

问题可能不在答案本身,而在于它是怎么得到这个答案的

传统 RAG(检索增强生成)的套路是固定的:接收问题 → 去数据库里搜 → 把结果塞给大模型 → 输出答案。这个流程是工程师提前写好的,大模型只是在最后一步”读材料写答案”,中间没有任何决策权。

Agentic RAG 彻底改变了这个关系:大模型变成了整个过程的”总指挥”,它自己决定下一步该做什么。

一句话解释 Agentic RAG

想象你委托一个特别靠谱的研究助理帮你写一份市场分析报告。你只需要说”帮我分析一下我们公司去年 Q4 的市场表现”。

传统的 RAG 像是一个执行指令的工具人:你说查销售数据,它就去查;你说加竞品对比,它就加。但它不会自己判断”这份报告还需要什么”。

而 Agentic RAG 更像一个经验丰富的顾问。它接到任务后会自己思考:“要做这个分析,我需要内部销售数据、第三方行业报告、还有竞争对手的公开信息。” 然后它自己决定用什么工具、从哪里查、查到什么程度才够用。

整个过程是迭代的、动态的、自我修正的——这就是 Agentic RAG 的精髓。

“Maker-Checker”循环:不停问自己”够了吗”

传统 RAG 是一次性操作:查一次,答一次,结束。Agentic RAG 则是反复循环,直到满意为止。

这个循环的工作方式是:

  1. 第一次调用:你把问题扔给大模型,大模型看看手里的信息,发现”不够”,于是决定调用某个工具去查资料。

  2. 工具调用:大模型可能去查向量数据库,可能调 SQL 查结构化数据,也可能调 API 查外部信息。

  3. 评估结果:拿到数据后,大模型判断”这个回答了我的问题吗?“如果觉得还不够,就继续。

  4. 迭代直到满意:不满意就换查询方式、换数据源,反复这个过程,直到大模型认为”这回差不多了”,才输出最终答案。

用一个生活场景来类比:你想找一家适合聚餐的餐厅。Agentic RAG 不是简单搜索”附近餐厅”就完事了,它会先查大家的评分,再筛掉不符合人数的,再考虑交通是否方便,最后综合出一个推荐——整个过程它自己在脑子里不断做判断。

记忆与状态:不会白查

传统 RAG 每次查询都是独立的,上下文不共享。Agentic RAG 保留了”记忆”,它记得之前查了什么、查到了什么、哪些方向已经排除掉了。

这就好比研究助理不会在同一次任务里反复查同一个数据源——它有一个全局的进度感,知道自己做到了哪一步。

这种机制让它能真正处理复杂的多步骤任务,而不是每个步骤都从零开始。

自我修正:错误路径不一条道走到黑

这是 Agentic RAG 最有价值的能力之一:知道自己错了,能自动换方向

比如你去查某个概念,查完发现方向偏了,Agentic RAG 会立刻调整,重新拟定查询策略,而不是硬着头皮把错误结论说完。

它能做什么样的自我修正?

  • 重新组织查询词:把模糊的问题改写成更精准的检索式
  • 换数据源:向量库查不到就去 SQL 库,再不行就调 API
  • 回退并请人介入:在高度敏感或反复失败的场景下,主动标注”这里需要人工确认”

这套自我修正机制让 Agentic RAG 比传统方案可靠得多,尤其在法律合规、医疗研究这类容错率极低的场景

边界在哪里?它不是万能的

虽然 Agentic RAG 听起来很强大,但它本质上仍然是一个在人类划定范围内自主决策的系统。

它的能力边界由这几件事决定:

  • 工具和数据:它只能用接入的工具能做的事,查不了没接入的数据
  • 领域边界:比如你只接入了内部知识库,它就不知道外面的最新行业动态
  • 安全护栏:违规的请求会被直接拒绝,不存在”想做什么就做什么”

所以 Agentic RAG 不是通用人工智能,它是特定领域里的超级助手——在它能触及的范围内,几乎可以替代大部分人工检索和分析工作。

什么场景适合用 Agentic RAG?

从实践来看,这几类场景受益最大:

  • 合规审查和法律研究:需要反复核实事实、出处,多轮验证才能确保结论无误
  • 复杂数据库查询:NL2SQL(自然语言转 SQL)的场景,查询经常需要来回调整
  • 多数据源综合分析:需要同时从向量库、SQL 库、API 等多个来源拿数据并整合
  • 长周期的研究任务:中途可能出现新信息,需要动态调整研究策略

总结

Agentic RAG 本质上是把**“检索”这件事从被动执行变成了主动决策**。大模型不再只是一个答案生成器,而是整个信息获取流程的指挥官——它判断该查什么、选什么工具、迭代几次、什么时候可以输出。

对于需要高精度、多步骤、动态决策的复杂任务来说,这是一个质的飞跃。但用的时候也要记住:它的自主性是有边界的,边界由接入的工具和数据决定

继续阅读

继续沿着这条知识路径往下读

返回 基础认知

基础认知

RAG 还是 Agentic RAG?一文读懂它们的本质区别

传统 RAG 像一个按菜谱做菜的厨师,你给什么食材他就做什么菜,不会变通。而 Agentic RAG 像一个会思考的大厨,会品尝、调整、甚至临时去菜市场补买调料。同样是 RAG,它们解决问题的方式有天壤之别。

继续阅读

基础认知

Agentic RAG 的三大坑:Retrieval Thrash、Tool Storm 和 Context Bloat

你以为给 RAG 装上了大脑,它就能自动变强?错了——Agentic RAG 有它自己独特的翻车方式。这篇文章用生活比喻帮你彻底搞懂三种最常见的失败模式,以及怎么提前识别和规避。

继续阅读