什么是 RAG？RAG 的主要流程是什么？

September 26, 2025 / 十六 / 8阅读 / 0评论/ 分类: AI大模型原理和应用

RAG（Retrieval Augmented Generation，检索增强生成）是一种结合信息检索和生成式模型的技术方案。其主要流程包括两个核心环节：

就是在本地检索到相关的内容，将其增强到提示词中，再去做结果生成。

简单来说，就是利用外部知识动态补充模型生成能力，既能保证回答的准确性，又能在知识库更新时即时反映最新信息（部分业务是内部文档，网上没有，因此可以本地提供知识库来增强 AI 的知识）。

随着自然语言处理技术的发展，纯生成模型虽然可以生成流畅的文本，但有时知识会滞后或不够准确。

通过引入检索模块，RAG 模型能够从外部知识库中提取实时且丰富的信息，再经过生成模型综合处理，提升回答的准确性和覆盖面，而无需重新训练模型。

graph TD
    A[用户输入查询] --> B[查询预处理与向量化]
    B --> C[向量数据库检索相关文档]
    C --> D[构建prompt（问题+检索内容）]
    D --> E[生成模型生成回答]
    E --> F[返回最终答案]

使用语义模型将文档和问题转为高维向量表示

在向量数据库中检索与查询最相似的 N 条内容

将用户原始问题和检索到的内容拼接拼接为模型上下文输入

#RAG(2)#AI(3)

苦海回身，早悟兰因