Home/Question List/Question Detail

利用deep seek建立知识库应用

Answer

以下是关于利用 deep seek 建立知识库应用的相关内容：

RAG 技术：利用大模型的能力搭建知识库是 RAG 技术的应用。在需要依靠不包含在大模型训练集中的数据时，主要通过检索增强生成 RAG 实现。RAG 应用可抽象为 5 个过程：

文档加载：从多种来源加载文档，LangChain 提供 100 多种文档加载器，包括非结构化、结构化数据和代码等。
文本分割：文本分割器把文档切分为指定大小的块。
存储：包括将切分好的文档块嵌入转换成向量形式，并将向量数据存储到向量数据库。
检索：通过检索算法找到与输入问题相似的嵌入片。
输出：把问题及检索出来的嵌入片提交给 LLM，生成更合理答案。

创建知识库应用的具体步骤：

地址输入浏览器：http://这里替换为你宝塔左上角的那一串:3000/
进入后，点击应用并创建，选择 qwen 模型。
创建知识库。点击知识库 - 选择 qwen - Embedding - 1 点击确认创建。
上传文件，等待处理，文本状态为“已就绪”即可。
回到创建的应用，关联创建的知识库。
点击两个发布，之前第一个叫做保存。
点击新建，创建 key。创建后保存同时将 API 根地址最后加上/v1 并保存下来。

此外，在安装并接入 cow 方面：

回到宝塔，打开【终端】。
依次粘贴并回车：cd/root 、git clone https://github.com/zhayujie/chatgpt-on-wechat （注意粘贴完整）。
出现特定样子表示成功，失败或无反应则刷新重试。
继续依次输入：cd chatgpt-on-wechat/ 、pip install -r requirements.txt 。
等待执行完成后，继续粘贴：pip install -r requirements-optional.txt 。
到“文件”菜单中执行，点击文件 - 找到 root，进入 root 文件夹，找到 chatgpt-on-wechat 文件夹并进入。

Content generated by AI large model, please carefully verify (powered by aily)

References

手把手教你本地部署大模型以及搭建个人知识库

因为利用大模型的能力搭建知识库本身就是一个RAG技术的应用。所以在进行本地知识库的搭建实操之前，我们需要先对RAG有一个大概的了解。以下内容会有些干，我会尽量用通俗易懂的描述进行讲解。我们都知道大模型的训练数据是有截止日期的，那当我们需要依靠不包含在大模型训练集中的数据时，我们该怎么做呢？实现这一点的主要方法就是通过检索增强生成RAG（Retrieval Augmented Generation）。在这个过程中，首先检索外部数据，然后在生成步骤中将这些数据传递给LLM。我们可以将一个RAG的应用抽象为下图的5个过程：文档加载（Document Loading）：从多种不同来源加载文档。LangChain提供了100多种不同的文档加载器，包括PDF在内的非结构化的数据、SQL在内的结构化的数据，以及Python、Java之类的代码等文本分割（Splitting）：文本分割器把Documents切分为指定大小的块，我把它们称为“文档块”或者“文档片”存储（Storage）：存储涉及到两个环节，分别是：将切分好的文档块进行嵌入（Embedding）转换成向量的形式将Embedding后的向量数据存储到向量数据库检索（Retrieval）：一旦数据进入向量数据库，我们仍然需要将数据检索出来，我们会通过某种检索算法找到与输入问题相似的嵌入片Output（输出）：把问题以及检索出来的嵌入片一起提交给LLM，LLM会通过问题和检索出来的提示一起来生成更加合理的答案[heading2]文本加载器（Document Loaders）[content]文本加载器就是将用户提供的文本加载到内存中，便于进行后续的处理

张梦飞：【知识库】FastGPT+OneAPI+COW带有知识库的机器人完整教程

1、地址输入浏览器：http://这里替换为你宝塔左上角的那一串:3000/2、进入后，点击应用并创建，选择qwen模型3、创建知识库。点击知识库-选择qwen-Embedding-1点击确认创建。4、上传文件，等待处理，最后文本状态是“已就绪”就是OK了。5、回到刚刚创建的应用，关联上创建的知识库。6、点击两个发布。之前第一个叫做保存7、点击新建，创建key。创建后保存同时将API根地址最后加上/v1也保存下来。[heading1]七、安装并接入cow[content]1、回到宝塔，打开【终端】继续，一行一行依次粘贴，依次回车：cd/root2、这个注意一定要粘贴完整，这里容易粘贴不全。git clone https://github.com/zhayujie/chatgpt-on-wechat3、出现下方的样子，就是成功了。如果失败，或者没反应，刷新一下，重新再试一次4、继续一行一行，依次输入：cd chatgpt-on-wechat/pip install-r requirements.txt5、等待执行完成，如上图后，继续粘贴：pip install-r requirements-optional.txt6、上边的都执行完成后。现在我们到“文件”菜单中去执行，点击文件-找到root，进入root文件夹,找到chatgpt-on-wechat文件夹，并进入。

【共学最全版本】微信机器人共学教程

1、地址输入浏览器：http://这里替换为你宝塔左上角的那一串:3000/账号root密码12342、进入后，点击应用并创建，选择qwen模型3、创建知识库。点击知识库-选择qwen-Embedding-1点击确认创建。4、上传文件，等待处理，最后文本状态是“已就绪”就是OK了。5、回到刚刚创建的应用，关联上创建的知识库。6、点击两个发布。之前第一个叫做保存7、点击新建，创建key。创建后保存同时将API根地址最后加上/v1也保存下来。10、双击这个文件，我画红框的地方是需要修改的地方。*因为这个地方对格式和符合要求比较严格，如果是小白，建议你直接复制我下方的配置。[heading2]六、接入cow[content]11、删除上图文件里的所有代码。复制下边的代码，粘贴到文件里。粘贴后，找到第4、5行，把刚才FastGPT里拿到API和key，根据要求粘贴到双引号里。这也是你唯一需要修改的地方。修改完之后，点击保存，关闭文件。[heading1]第五天教程：HOOK机制的机器人教学

Others are asking

deepseek官方教程

以下是关于 DeepSeek 的官方教程相关信息：火山方舟 DeepSeek 申请免费额度教程，包含多种 API 使用方式，如飞书多维表格调用、Coze 智能体调用、浏览器插件调用。可以使用邀请码 D3H5G9QA，通过邀请链接 https://www.volcengine.com/activity/deepseek?utm_term=202502dsinvite&ac=DSASUQY5&rc=D3H5G9QA 邀请可拿 3000 万 tokens，畅享 671B DeepSeek R1，活动截止至北京时间 20250218 23:59:59。同时，火山方舟大模型服务平台的模型服务计费文档有更新，DeepSeekR1、V3 模型分别提供了 50 万免费额度和 API 半价活动。有关于一线教师的 AI 需求与高效工具推荐，如让模型创作诗歌、生成宣传标语、提示库（https://apidocs.deepseek.com/zhcn/promptlibrary）、代码解释、内容分类、角色扮演（自定义人设）、散文写作、文案大纲生成、模型提示词生成等。 2 月 14 日的社区动态中，有《突破 DeepSeek R1 能力天花板，火山引擎扣子+飞书一站式企业解决方案》《羊毛快薅|字节火山上线了 DeepSeek 系列模型并悄悄更改了模型服务价格...》等内容，还附上了飞书多维表格、Coze 的接入使用方法等。此外，还有关于 DeepSeek 关键 9 篇论文及创新点的讲解，以及 DeepSeek 官方发布的 R1 模型推荐设置。

2025-04-15

coze搭建工作流调用deepseek如何把模型的输出存入到多维表中

以下是将模型的输出存入到多维表中的步骤： 1. 逐步搭建 AI 智能体：搭建整理入库工作流。设置大模型节点提取稍后读元数据，使用 MiniMax 6.5s 245k，设置最大回复长度至 50000，以确保能完整解析长内容网页。进行日期转时间戳，后续的飞书多维表格插件节点在入库日期字段时只支持 13 位时间戳，需要使用「日期转时间戳time_stamp_13」插件进行格式转化。把稍后读元数据转换为飞书多维表格插件可用的格式，飞书多维表格插件目前（2024 年 08 月）只支持带有转义符的 string，以 Array<Object>格式输入，所以必须将之前得到的元数据数组进行格式转换。添加「飞书多维表格add_records」插件，只需要设置{{app_token}}与{{records}}参数，将元数据写入飞书表格。 2. 搭建 Coze 工作流：打开 Coze 的主页，登录后，在【工作空间】创建一个智能体。在编排页面，给智能体编辑好人设，可先写一个简单的，然后点右上角自动优化，系统会自动补全更精细的描述。点击工作流的+，创建一个工作流。大模型节点把 input 给到 DeepSeek，让 DeepSeek 按照提前规定的输出框架生成对应文案。生图节点将输出给到图像生成组件画图。结束输出时，两个输出给到最终的 end 作为最终的输出。注意在编写系统提示词时，如果需要 input 可被 DeepSeek 调用，需要用{{input}}作为参数引入，不然大模型不知道自己需要生成和这个 input 相关的结果。编排完，点击【试运行】，调试至满意后点击发布。

2025-04-14

deepseek写论文

以下是关于 DeepSeek 在不同方面应用的相关信息：应用场景：包括脑爆活动方案、会议纪要、批量处理客户评论、分析总结复盘内容、生成专业软件使用过程、写小说框架、写论文、写文案、写小红书笔记、写周报、做设计头脑风暴、做网站、分析感情问题等。优势与不足：在写文方面全面领先，但长文可能太发散、文风用力过猛导致审美疲劳，且模型多样性不够，相同 prompt 提问多次答案雷同。应对策略：写理性文章时，可先与 DeepSeek 讨论思路，再用 Cloud 3.5 批量生成；用 O1 模型对创作的字数控制有一定效果，也可通过多轮对话让 AI 增删改查来调整字数。创作相关：模仿特定小说家的文学方式创作小说，需在提示词中描述文风特征；邀请大家在腾讯频道发布用 AI 写的小说并鉴赏。发展历程：DeepSeek 历时 647 天在大语言模型（LLM）领域取得突破，发布 13 篇论文。谷歌 CEO 坦言 Deep Seek 的突破标志着 AI 的全球化进程。

2025-04-13

如何使用deepseek写论文？

使用 DeepSeek 写论文可以参考以下几点： 1. 给予 DeepSeek 更多自由发挥的空间，避免过度限制。 2. 注意旧模型在文学创作中可能存在的过度道德说教和正面描述趋势，导致结果生硬死板的问题。 3. 了解 DeepSeek 在文风、哲学思考和触动人情感方面的优秀表现，利用其文创能力为论文增添特色。 4. 参考提示词编写的方法，例如收集信息、重新定义问题等，以更有效地向 DeepSeek 传达需求。 5. 可以借鉴他人使用 DeepSeek 写论文的经验，如 Yvonne 的成功案例。需要注意的是，虽然 DeepSeek 能提供帮助，但仍需您对生成的内容进行审核和修改，以确保论文的质量和准确性。