diff --git a/app/docs/CommunityShare/RAG/rag.mdx b/app/docs/CommunityShare/RAG/rag.mdx index 65b5999..779f102 100644 --- a/app/docs/CommunityShare/RAG/rag.mdx +++ b/app/docs/CommunityShare/RAG/rag.mdx @@ -6,18 +6,16 @@ tags: - tag-one --- -# RAG Retrieval-Augmented Generation 增强索引生成 - -- 本rag笔记合适给不了解rag的人在10分钟内快速弄明白rag的流程 -- 也可以参照 “马克的技术笔记” 配合食用 -
+# RAG -- 解决的问题:智能问答,构建外部知识库,使大模型更具特化。 -- 需要的工具:大模型,外部知识库,特定文件数据。 -- rag 技术的本质就是(1)搜索特定文件里面的相关信息,然后(2)把这些搜索出来的信息作为补充信息或者上下文信息,然后(3)和用户的提问一起发送给大语言模型并获取答案。 - -# RAG流程 -- 分片 -> embedding化 -> 存储到向量数据库 -> 用户提问 -> 召回 -> 重排 -> 处理后的数据与用户提问一起打包扔给大语言模型 -> 大语言模型返回答案 +# 本rag toy demo 合适给不了解rag的人在10分钟内快速弄明白rag的流程 +### 也可以参照 “马克的技术笔记” 配合食用 +# RAG Retrieval-Augmented Generation 增强索引生成 +### 解决的问题:智能问答,构建外部知识库,使大模型更具特化。 +### 需要的工具:大模型,外部知识库,特定文件数据。 +### rag 技术的本质就是(1)搜索特定文件里面的相关信息,然后(2)把这些搜索出来的信息作为补充信息或者上下文信息,然后(3)和用户的提问一起发送给大语言模型并获取答案。 +# RAG流程: +### 分片-embedding化-存储到向量数据库-用户提问-召回-重排-处理后的数据与用户提问一起打包扔给大语言模型-大语言模型返回答案 ## 一.建立自己的小rag ### 1.chunking(分片) - 把我们的文档切分成特定片段。