diff --git a/app/docs/CommunityShare/RAG/rag.mdx b/app/docs/CommunityShare/RAG/rag.mdx index 779f102..65b5999 100644 --- a/app/docs/CommunityShare/RAG/rag.mdx +++ b/app/docs/CommunityShare/RAG/rag.mdx @@ -6,16 +6,18 @@ tags: - tag-one --- -# RAG - -# 本rag toy demo 合适给不了解rag的人在10分钟内快速弄明白rag的流程 -### 也可以参照 “马克的技术笔记” 配合食用 # RAG Retrieval-Augmented Generation 增强索引生成 -### 解决的问题:智能问答,构建外部知识库,使大模型更具特化。 -### 需要的工具:大模型,外部知识库,特定文件数据。 -### rag 技术的本质就是(1)搜索特定文件里面的相关信息,然后(2)把这些搜索出来的信息作为补充信息或者上下文信息,然后(3)和用户的提问一起发送给大语言模型并获取答案。 -# RAG流程: -### 分片-embedding化-存储到向量数据库-用户提问-召回-重排-处理后的数据与用户提问一起打包扔给大语言模型-大语言模型返回答案 + +- 本rag笔记合适给不了解rag的人在10分钟内快速弄明白rag的流程 +- 也可以参照 “马克的技术笔记” 配合食用 +
+ +- 解决的问题:智能问答,构建外部知识库,使大模型更具特化。 +- 需要的工具:大模型,外部知识库,特定文件数据。 +- rag 技术的本质就是(1)搜索特定文件里面的相关信息,然后(2)把这些搜索出来的信息作为补充信息或者上下文信息,然后(3)和用户的提问一起发送给大语言模型并获取答案。 + +# RAG流程 +- 分片 -> embedding化 -> 存储到向量数据库 -> 用户提问 -> 召回 -> 重排 -> 处理后的数据与用户提问一起打包扔给大语言模型 -> 大语言模型返回答案 ## 一.建立自己的小rag ### 1.chunking(分片) - 把我们的文档切分成特定片段。