首页/问答列表/问答详情

利用deep seek建立知识库应用

回答

以下是关于利用 deep seek 建立知识库应用的相关内容：

RAG 技术：利用大模型的能力搭建知识库是 RAG 技术的应用。在需要依靠不包含在大模型训练集中的数据时，主要通过检索增强生成 RAG 实现。RAG 应用可抽象为 5 个过程：

文档加载：从多种来源加载文档，LangChain 提供 100 多种文档加载器，包括非结构化、结构化数据和代码等。
文本分割：文本分割器把文档切分为指定大小的块。
存储：包括将切分好的文档块嵌入转换成向量形式，并将向量数据存储到向量数据库。
检索：通过检索算法找到与输入问题相似的嵌入片。
输出：把问题及检索出来的嵌入片提交给 LLM，生成更合理答案。

创建知识库应用的具体步骤：

地址输入浏览器：http://这里替换为你宝塔左上角的那一串:3000/
进入后，点击应用并创建，选择 qwen 模型。
创建知识库。点击知识库 - 选择 qwen - Embedding - 1 点击确认创建。
上传文件，等待处理，文本状态为“已就绪”即可。
回到创建的应用，关联创建的知识库。
点击两个发布，之前第一个叫做保存。
点击新建，创建 key。创建后保存同时将 API 根地址最后加上/v1 并保存下来。

此外，在安装并接入 cow 方面：

回到宝塔，打开【终端】。
依次粘贴并回车：cd/root 、git clone https://github.com/zhayujie/chatgpt-on-wechat （注意粘贴完整）。
出现特定样子表示成功，失败或无反应则刷新重试。
继续依次输入：cd chatgpt-on-wechat/ 、pip install -r requirements.txt 。
等待执行完成后，继续粘贴：pip install -r requirements-optional.txt 。
到“文件”菜单中执行，点击文件 - 找到 root，进入 root 文件夹，找到 chatgpt-on-wechat 文件夹并进入。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

手把手教你本地部署大模型以及搭建个人知识库

因为利用大模型的能力搭建知识库本身就是一个RAG技术的应用。所以在进行本地知识库的搭建实操之前，我们需要先对RAG有一个大概的了解。以下内容会有些干，我会尽量用通俗易懂的描述进行讲解。我们都知道大模型的训练数据是有截止日期的，那当我们需要依靠不包含在大模型训练集中的数据时，我们该怎么做呢？实现这一点的主要方法就是通过检索增强生成RAG（Retrieval Augmented Generation）。在这个过程中，首先检索外部数据，然后在生成步骤中将这些数据传递给LLM。我们可以将一个RAG的应用抽象为下图的5个过程：文档加载（Document Loading）：从多种不同来源加载文档。LangChain提供了100多种不同的文档加载器，包括PDF在内的非结构化的数据、SQL在内的结构化的数据，以及Python、Java之类的代码等文本分割（Splitting）：文本分割器把Documents切分为指定大小的块，我把它们称为“文档块”或者“文档片”存储（Storage）：存储涉及到两个环节，分别是：将切分好的文档块进行嵌入（Embedding）转换成向量的形式将Embedding后的向量数据存储到向量数据库检索（Retrieval）：一旦数据进入向量数据库，我们仍然需要将数据检索出来，我们会通过某种检索算法找到与输入问题相似的嵌入片Output（输出）：把问题以及检索出来的嵌入片一起提交给LLM，LLM会通过问题和检索出来的提示一起来生成更加合理的答案[heading2]文本加载器（Document Loaders）[content]文本加载器就是将用户提供的文本加载到内存中，便于进行后续的处理

张梦飞：【知识库】FastGPT+OneAPI+COW带有知识库的机器人完整教程

1、地址输入浏览器：http://这里替换为你宝塔左上角的那一串:3000/2、进入后，点击应用并创建，选择qwen模型3、创建知识库。点击知识库-选择qwen-Embedding-1点击确认创建。4、上传文件，等待处理，最后文本状态是“已就绪”就是OK了。5、回到刚刚创建的应用，关联上创建的知识库。6、点击两个发布。之前第一个叫做保存7、点击新建，创建key。创建后保存同时将API根地址最后加上/v1也保存下来。[heading1]七、安装并接入cow[content]1、回到宝塔，打开【终端】继续，一行一行依次粘贴，依次回车：cd/root2、这个注意一定要粘贴完整，这里容易粘贴不全。git clone https://github.com/zhayujie/chatgpt-on-wechat3、出现下方的样子，就是成功了。如果失败，或者没反应，刷新一下，重新再试一次4、继续一行一行，依次输入：cd chatgpt-on-wechat/pip install-r requirements.txt5、等待执行完成，如上图后，继续粘贴：pip install-r requirements-optional.txt6、上边的都执行完成后。现在我们到“文件”菜单中去执行，点击文件-找到root，进入root文件夹,找到chatgpt-on-wechat文件夹，并进入。

【共学最全版本】微信机器人共学教程

1、地址输入浏览器：http://这里替换为你宝塔左上角的那一串:3000/账号root密码12342、进入后，点击应用并创建，选择qwen模型3、创建知识库。点击知识库-选择qwen-Embedding-1点击确认创建。4、上传文件，等待处理，最后文本状态是“已就绪”就是OK了。5、回到刚刚创建的应用，关联上创建的知识库。6、点击两个发布。之前第一个叫做保存7、点击新建，创建key。创建后保存同时将API根地址最后加上/v1也保存下来。10、双击这个文件，我画红框的地方是需要修改的地方。*因为这个地方对格式和符合要求比较严格，如果是小白，建议你直接复制我下方的配置。[heading2]六、接入cow[content]11、删除上图文件里的所有代码。复制下边的代码，粘贴到文件里。粘贴后，找到第4、5行，把刚才FastGPT里拿到API和key，根据要求粘贴到双引号里。这也是你唯一需要修改的地方。修改完之后，点击保存，关闭文件。[heading1]第五天教程：HOOK机制的机器人教学

其他人在问

deepseek官方教程

以下是关于 DeepSeek 的官方教程相关信息：火山方舟 DeepSeek 申请免费额度教程，包含多种 API 使用方式，如飞书多维表格调用、Coze 智能体调用、浏览器插件调用。可以使用邀请码 D3H5G9QA，通过邀请链接 https://www.volcengine.com/activity/deepseek?utm_term=202502dsinvite&ac=DSASUQY5&rc=D3H5G9QA 邀请可拿 3000 万 tokens，畅享 671B DeepSeek R1，活动截止至北京时间 20250218 23:59:59。同时，火山方舟大模型服务平台的模型服务计费文档有更新，DeepSeekR1、V3 模型分别提供了 50 万免费额度和 API 半价活动。有关于一线教师的 AI 需求与高效工具推荐，如让模型创作诗歌、生成宣传标语、提示库（https://apidocs.deepseek.com/zhcn/promptlibrary）、代码解释、内容分类、角色扮演（自定义人设）、散文写作、文案大纲生成、模型提示词生成等。 2 月 14 日的社区动态中，有《突破 DeepSeek R1 能力天花板，火山引擎扣子+飞书一站式企业解决方案》《羊毛快薅|字节火山上线了 DeepSeek 系列模型并悄悄更改了模型服务价格...》等内容，还附上了飞书多维表格、Coze 的接入使用方法等。此外，还有关于 DeepSeek 关键 9 篇论文及创新点的讲解，以及 DeepSeek 官方发布的 R1 模型推荐设置。

2025-04-15

我想让DEEPSEEK帮我写一篇论文，题目已经定好了，怎么给他输入指令

以下是给 DeepSeek 输入指令以帮助您写论文的一些建议： 1. 采用结构化提示词：优先保留专业领域术语和技术词汇，这些术语通常具有高信息价值。对不同类型的信息设置权重，按优先级排序：任务定义>关键约束>专业术语>定量信息>方法论>背景。以完整语义单元为基本保留单位，而非单个词语，确保压缩后的内容仍保持语义完整性。避免详细指导思考过程，让模型自主生成思维链。 2. 高阶能力调用：文风转换矩阵：例如“用鲁迅杂文风格写职场 PUA 现象”“将产品说明书改写成《史记》列传格式”“把这篇论文摘要翻译成菜市场大妈能听懂的话”。领域穿透技术：如行业黑话破解“解释 Web3 领域的'胖协议瘦应用'理论”。 3. 场景化实战策略：创意内容生成。技术方案论证。 4. 效能增强技巧：对话记忆管理：包括上下文锚定（如“记住当前讨论的芯片型号是麒麟 9010”）、信息回溯（如“请复述之前确认的三个设计原则”）、焦点重置（如“回到最初讨论的供应链问题”）。输出质量控制：针对过度抽象、信息过载、风格偏移等问题，使用相应的修正指令。 5. 特殊场景解决方案：长文本创作：可采用分段接力法，如“先完成故事大纲→逐章扩展→最后进行伏笔校验”“确保新章节与前文的三处细节呼应”。敏感内容处理：使用概念脱敏法（如“用经济学原理类比说明网络审查机制”）或场景移植法（如“假设在火星殖民地讨论该议题”）。在输入指令时，您需要清晰明确地描述论文的题目、研究目的、主要论点、关键论据、期望的结构和风格等重要信息，以便 DeepSeek 能够为您生成符合要求的内容。

2025-04-14

coze搭建工作流调用deepseek如何把模型的输出存入到多维表中

以下是将模型的输出存入到多维表中的步骤： 1. 逐步搭建 AI 智能体：搭建整理入库工作流。设置大模型节点提取稍后读元数据，使用 MiniMax 6.5s 245k，设置最大回复长度至 50000，以确保能完整解析长内容网页。进行日期转时间戳，后续的飞书多维表格插件节点在入库日期字段时只支持 13 位时间戳，需要使用「日期转时间戳time_stamp_13」插件进行格式转化。把稍后读元数据转换为飞书多维表格插件可用的格式，飞书多维表格插件目前（2024 年 08 月）只支持带有转义符的 string，以 Array<Object>格式输入，所以必须将之前得到的元数据数组进行格式转换。添加「飞书多维表格add_records」插件，只需要设置{{app_token}}与{{records}}参数，将元数据写入飞书表格。 2. 搭建 Coze 工作流：打开 Coze 的主页，登录后，在【工作空间】创建一个智能体。在编排页面，给智能体编辑好人设，可先写一个简单的，然后点右上角自动优化，系统会自动补全更精细的描述。点击工作流的+，创建一个工作流。大模型节点把 input 给到 DeepSeek，让 DeepSeek 按照提前规定的输出框架生成对应文案。生图节点将输出给到图像生成组件画图。结束输出时，两个输出给到最终的 end 作为最终的输出。注意在编写系统提示词时，如果需要 input 可被 DeepSeek 调用，需要用{{input}}作为参数引入，不然大模型不知道自己需要生成和这个 input 相关的结果。编排完，点击【试运行】，调试至满意后点击发布。

2025-04-14

Deepseek自动生成网站前端页面

以下是关于 DeepSeek 自动生成网站前端页面的相关内容： DeepSeek v3 能力更新后虽能生成炫目的前端页面，但多为静态且实用性有限。可结合飞书多维表格将生成的漂亮前端变为真实的系统，如【智能作业分发系统】。该系统整体包括用户登陆（可加飞书调查表二维码实现注册）、作业类型、作业详情（含连连看游戏、AI 智能问答、考试系统）。其实现逻辑为用户登陆系统后进入页面看到老师分配的作业分类，选择分类进入作业详情页面，详情页有学习单词发音及三个模块。对于小白，可用飞书作数据源，通过飞书 API 接口获取内容，用 DeepSeek v3 制作前端+后端（用 Trae 更方便）。获取请求参数时，测试成功后的示例代码中有完整的请求参数和请求体可直接复制使用。创建前后端时，若用 DeepSeek 官网搭建需按代码目录结构创建对应文件（用 Trae 可省略），首次运行可能遇到飞书 API 未正确配置 CORS 导致浏览器拦截请求的问题，V3 会给出修改意见。此外，Same dev 能像素级复制任意 UI 界面并生成前端代码，支持多种文件格式和技术栈代码，但免费额度消耗快，网站被谷歌标记。360 智脑复现了 DeepSeek 强化学习效果并发布开源模型 LightR114BDS。 AI 时代生存法则：会提需求比会写代码更重要，会开脑洞比会复制粘贴更值钱，真正的大佬都是让 AI 当乙方！