什么是 RAG?RAG 的主要流程是什么?
回答重点
RAG(Retrieval Augmented Generation,检索增强生成)是一种结合信息检索和生成式模型的技术方案。其主要流程包括两个核心环节:
检索(Retrieval):基于用户的输入,从外部知识库中检索与查询相关的文本片段,通常使用向量化表示和向量数据库进行语义匹配;
生成(Generation):将用户查询与检索到的内容作为上下文输入给生成模型(如 GPT 等),由模型输出最终答案。
就是在本地检索到相关的内容,将其增强到提示词中,再去做结果生成。
简单来说,就是利用外部知识动态补充模型生成能力,既能保证回答的准确性,又能在知识库更新时即时反映最新信息(部分业务是内部文档,网上没有,因此可以本地提供知识库来增强 AI 的知识)。
扩展知识
为什么会有RAG?
随着自然语言处理技术的发展,纯生成模型虽然可以生成流畅的文本,但有时知识会滞后或不够准确。
通过引入检索模块,RAG 模型能够从外部知识库中提取实时且丰富的信息,再经过生成模型综合处理,提升回答的准确性和覆盖面,而无需重新训练模型。
RAG的详细工作流程
graph TD
A[用户输入查询] --> B[查询预处理与向量化]
B --> C[向量数据库检索相关文档]
C --> D[构建prompt(问题+检索内容)]
D --> E[生成模型生成回答]
E --> F[返回最终答案]
文本向量化
使用语义模型将文档和问题转为高维向量表示
检索阶段
在向量数据库中检索与查询最相似的 N 条内容
构建 prompt
将用户原始问题和检索到的内容拼接拼接为模型上下文输入
#RAG(2)#AI(3)评论