什么是 RAG?RAG 的主要流程是什么?

September 26, 2025 / 十六 / 8阅读 / 0评论/ 分类: AI大模型原理和应用

回答重点

RAG(Retrieval Augmented Generation,检索增强生成)是一种结合信息检索和生成式模型的技术方案。其主要流程包括两个核心环节:

  1. 检索(Retrieval):基于用户的输入,从外部知识库中检索与查询相关的文本片段,通常使用向量化表示和向量数据库进行语义匹配;

  2. 生成(Generation):将用户查询与检索到的内容作为上下文输入给生成模型(如 GPT 等),由模型输出最终答案。

就是在本地检索到相关的内容,将其增强到提示词中,再去做结果生成

简单来说,就是利用外部知识动态补充模型生成能力,既能保证回答的准确性,又能在知识库更新时即时反映最新信息(部分业务是内部文档,网上没有,因此可以本地提供知识库来增强 AI 的知识)。

扩展知识

为什么会有RAG?

随着自然语言处理技术的发展,纯生成模型虽然可以生成流畅的文本,但有时知识会滞后或不够准确。

通过引入检索模块,RAG 模型能够从外部知识库中提取实时且丰富的信息,再经过生成模型综合处理,提升回答的准确性和覆盖面,而无需重新训练模型

RAG的详细工作流程

graph TD
    A[用户输入查询] --> B[查询预处理与向量化]
    B --> C[向量数据库检索相关文档]
    C --> D[构建prompt(问题+检索内容)]
    D --> E[生成模型生成回答]
    E --> F[返回最终答案]

  1. 文本向量化

使用语义模型将文档和问题转为高维向量表示

  1. 检索阶段

在向量数据库中检索与查询最相似的 N 条内容

  1. 构建 prompt

将用户原始问题和检索到的内容拼接拼接为模型上下文输入

#RAG(2)#AI(3)

评论