RAG(检索增强生成)工作流搭建主要包括以下步骤:
1. 文档加载:从多种不同来源加载文档,如非结构化的数据(包括 PDF)、结构化的数据(如 SQL)以及代码(如 Python、Java 等)。LangChain 提供了 100 多种不同的文档加载器。
2. 文本分割:文本分割器把 Documents 切分为指定大小的块,称为“文档块”或者“文档片”。
3. 存储:
将切分好的文档块进行嵌入(Embedding)转换成向量的形式。
将 Embedding 后的向量数据存储到向量数据库。
4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。
5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。
RAG 是一种结合了检索和生成的技术,其基本流程为:首先,给定用户输入(如问题或话题),从数据源中检索出相关文本片段作为上下文。然后,将用户输入和检索到的上下文拼接成完整输入,并添加提示传递给大模型(如 GPT)。最后,从大模型的输出中提取或格式化所需信息返回给用户。
您还可以通过以下资源进一步学习 RAG:
视频演示:
Query 改写效果对比 Bot:https://www.coze.cn/store/bot/7400553639514800182?panel=1&bid=6dkplh1r43g15
视频演示:
RAG 全流程学习 Bot:
2025-01-06