Chat with Wiki - 用deepseek打造个人知识库

Answer

以下是关于用 DeepSeek 打造个人知识库的相关信息：

可以先将文本拆分成若干小文本块（chunk），通过 embeddings API 将其转换成与语义相关的 embeddings 向量，并在向量储存库中保存这些向量和文本块作为问答的知识库。当用户提出问题时，将问题也转换成向量，与储存库中的向量比对，提取关联度高的文本块，与问题组合成新的 prompt 发送给 GPT API，从而提高回答的准确性和相关性。例如对于“此文作者是谁？”的问题，可以直观或通过比较 embeddings 向量找到关联度最高的文本块，如“本文作者：越山。xxxx。”。
在 RAGFlow 中，可配置本地部署的 DeepSeek 模型。选择 Ollama 并配置相关信息，导入嵌入模型用于文本向量化。设置系统模型后，可创建知识库，导入文件（可设置文件夹）并解析，解析速度取决于本机 GPU 性能。解析完成后进行检索测试，没问题即可进入聊天界面，还可自行设置助理。
此外，AI 编程与炼金术中也涉及 DeepSeek 的相关知识，如在不同章节中的应用，包括给老外起中文名、驱动 Life Coach 等，具体内容可通过相关链接进一步查看。

Content generated by AI large model, please carefully verify (powered by aily)

References

上面将文本转换成向量（一串数字）能大大节省空间，它不是压缩，可简单理解为索引(Index)。接下来就有意思了。比如我有一个大文本，可以先把它拆分成若干个小文本块（也叫chunk)，通过embeddings API将小文本块转换成embeddings向量,这个向量是跟文本块的语义相关。在一个地方（向量储存库）中保存这些embeddings向量和文本块，作为问答的知识库。当用户提出一个问题时，该问题先通过embeddings API转换成问题向量，然后将这问题向量与向量储存库的所有文本块向量比对，查找距离最小的几个向量，把这几个向量对应的文本块提取出来，与原有问题组合成为新的prompt(问题/提示词)，发送给GPT API。这样一来就不用一次会话中输入所有领域知识，而是输入了关联度最高的部分知识。一图胜千言，转一张原理图。再举一个极其简单的例子，比如有一篇万字长文，拆分成Chrunks包含：文本块1：本文作者：越山。xxxx。文本块2：公众号越山集的介绍：传播效率方法，分享AI应用，陪伴彼此在成长路上，共同前行。文本块3：《反脆弱》作者塔勒布xxxx。文本块4：“科技爱好者周刊”主编阮一峰会记录每周值得分享的科技内容，周五发布。...文本块n如果提问是”此文作者是谁？“。可以直观的看出上面的文本块1跟这个问题的关联度最高，文本块3次之。通过比较embeddings向量也可以得到这结论。那最后发送给GPT API的问题会类似于”此文作者是谁？从以下信息中获取答案：本文作者：越山。xxxx。《反脆弱》作者塔勒布xxxx。“这样一来，大语言大概率能回答上这个问题。

栋人佳Dougle整理：Git使用

我们返回RAGFlow中，打开右上角设置，进入模型提供商，显示如下界面接着我们就开始配置我们本地部署的DeepSeek模型选择Ollama，配置如下信息，模型是什么取决你运行的模型是什么基础URL如下配置设置完成之后，点击确定即可，然后显示如下界面那么再导入一个embedding模型，这个嵌入模型可以用于文本的向量化导入成功之后，界面如下接着我们设置系统模型设置设置好后，就可以返回知识库，进行创建知识库了进入数据集，导入文件即可，当然可以设置文件夹当作知识库，大家自行设置导入完毕之后，需要将文件进行解析之后，大模型才会懂得文件内容是什么。可以批量进行解析，文件解析速度按照你本机的GPU性能，即显卡的性能，越好的显卡，解析越快，越差则反之解析好之后，进入检索测试即可测试没有问题，那么对于文件来说，模型是可以进行检索的，下一步就可以进入聊天界面了助理设置可以自行进行设置

AI编程与炼金术：Build on Trae

蓝色文字跳转到文档对应位置）（不断更新）|章节_[三.使用DeepSeek R1给老外起中文名](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-DyEMdmCPOo98S6xbPfNcsuEOnuh)|知识点_[Node.JS安装](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-PVnndBSV5oWOukx38tKcw2CPnub)|[申请DeepSeek R1 API](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-TrXednqLAoH3VLxrUiYc1Pb9nhf)|[网页接入DeepSeek API](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-UK5xdzhiaoo9RkxHR5bcs30pnV8)||-|-|-|-||[一.Trae的介绍/安装/疑难杂症](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-R4GvdgOzeoC9mOxd1hScuql6nVY)|[Python安装](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-Kcojdhid9oWJPjxAvEOczRt0nkg)||||[二.图片字幕生成器](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-Yev6dqzNmolizDxG2PWcKj8Pn8y)|[用多模态复刻产品](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-PHwVdl7gCoZEehxUmiUcDeO8nde)||||[四.DeepSeek R1驱动的Life Coach](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-AyjYdKtFhobv6Zxrq71cYJubnug)|[使用AI Rules](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-MBCsdTfLzoRnE9xQm3PcWgdFnEf)|[使用Git进行版本管理](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-S86bdFV1XoE66LxBqVhcqdYFnze)|[Github+Vercel进行云端部署](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-GgVmdqPMqoilxFxONuCcnbNpn2g)||[五.DeepSeek驱动的网页金句卡片生成](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-ZDQHd6QnqoH7SEx3UXwchSOEndc)|[使用Chat完善产品需求（PRD）](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-Q21mdyyRIoKZfdxT7rZcwD5lnwd)|[开发浏览器插件](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-Mgsvd3OnZousC0x3m3fcqRBanhd)|[Chrome插件logo自动生成](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-J4dcdT2IAoJUXhx2UKKcElR0n6g)||[六.做一个你专属的好文推荐网站（DeepSeek R1+飞书多维表格）](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-MbTBdqIKBowgXExFCLqcQ0KTn5c)|[创建带有AI能力的飞书多维表格](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-R94pdLmyio0NCpxXUGzcJIMonTe)|[用网页呈现多维表格里的内容](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-KMaCd5GQKopqChxO2KycXXG3n5c)|||[七.做一个你专属的好文推荐网站（DeepSeek R1+飞书多维表格）（下）](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-UDIsdsmulox4LcxK2CdcwjGgny6)|[浏览器插件将信息一键插入多维表格](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-O1B2djb7voeVsUxJxLHcyyo6n3c)|[将复杂产品分拆成多个简单产品](https://waytoagi.feishu.cn/wiki/O5V5wLC5Jiilpjk9j9RcAuACnZc#share-UOx6dg3aVoeaYpx7M6hcurwUnGc)||