Chat with Wiki - 我想做一个，基于我个人知识库的chatbot，以供我随时搜索和提问，且优先搜索知识库内的内容而非联网搜索，你有什么建议吗？

Answer

以下是为您提供的关于创建基于个人知识库的 chatbot 的建议：

选择合适的平台和工具：例如可以考虑使用飞书智能伙伴创建平台（Aily）或扣子（https://www.coze.cn/home）等。
数据分段储存：由于大模型的上下文长度有限制，需要将上传的资料根据特定符号或字符长度进行分段，如将 8000 字文档按每 800 字分成一个片段储存。
增强检索：当用户输入问题，大模型会根据相似度检索出若干最相关的数据片段，再据此生成答案，这一技术称为 RAG（检索增强生成）。
配置知识库：
- 在 Bot 内使用知识库：
  - 登录相关平台。
  - 在左侧导航栏的工作区区域，选择进入指定团队。
  - 在 Bots 页面，选择指定 Bot 并进入 Bot 详情页。
  - 在 Bot 编排页面的知识库区域，单击加号图标，添加指定的知识库。
  - （可选）添加知识库后，可以在自动调用下拉界面内，调整知识库的配置项，如最大召回数量、最小匹配度、调用方式等。
- 在工作流内使用 Knowledge 节点：
  - 登录相关平台。
  - 在左侧导航栏的工作区区域，选择进入指定团队。
  - 在页面顶部进入工作流页面，并打开指定的工作流。
  - 在左侧基础节点列表内，选择添加 Knowledge 节点。
注意使用限制：单用户最多创建 1000 个知识库，文本类型知识库下最多支持添加 100 个文档，单用户每月最多新增 2GB 数据，累计上限是 10GB。

此外，知识库可以解决大模型幻觉、专业领域知识不足的问题，提升大模型回复的准确率。您可以将知识库直接与 Bot 进行关联用于响应用户回复，也可以在工作流中添加知识库节点，成为工作流中的一环。

Content generated by AI large model, please carefully verify (powered by aily)

References

我是WaytoAGI专属问答机器人，基于Aily和云雀大模型。「飞书智能伙伴创建平台」（英文名：Aily）是飞书团队旗下的企业级AI应用开发平台，提供了一个简单、安全且高效的环境，帮助企业轻松构建和发布AI应用，推动业务创新和效率提升。为企业探索大语言模型应用新篇章、迎接企业智能化未来提供理想选择。云雀是一款由字节跳动研发的语言模型，通过便捷的自然语言交互，能够高效的完成互动对话、信息获取、协助创作等任务。[heading2]我怎么使用你[content]方法1：你可以在WaytoAGI飞书知识库首页找到加入飞书群的链接（下图二维码仅作示意，请在[知识库首页](https://waytoagi.feishu.cn/wiki/QPe5w5g7UisbEkkow8XcDmOpn8e)找到最新二维码），然后点击加入，直接@机器人即可。知识库首页交流群版块，注意这里的二维码会定期更新，此处仅为示意方法2：你可以在WaytoAGI.com的网站首页，直接输入你的问题，即可得到回答。[heading2]为什么要做问答机器人[content]1.整个知识库的内容已经非常庞大，内容越来越丰富的同时，作为一个刚进入知识库的用户，并没有办法可以很快的找到知识库的内容。2.传统的搜索是基于关键词及关键词的相关性。例如搜索“吃了吗？”和“昨天晚上鸡腿好吃”，在字面意义上的差异和语义上的价值。3.作为一个AI知识库，需要用更先进的办法来解决：RAG技术。4.在群中提供一个可以快速供大家检索信息的方式，使用更加便捷。

创建并使用知识库

你可以将知识库直接与Bot进行关联用于响应用户回复；也可以在工作流中添加知识库节点，成为工作流中的一环。[heading2]在Bot内使用知识库[content]1.登录[扣子](https://www.coze.cn/home)。2.在左侧导航栏的工作区区域，选择进入指定团队。3.在Bots页面，选择指定Bot并进入Bot详情页。4.在Bot编排页面的知识库区域，单击加号图标，添加指定的知识库。5.（可选）添加知识库后，可以在自动调用下拉界面内，调整知识库的配置项。配置项说明：|配置项|说明||-|-||最大召回数量|Bot在调用知识库匹配用户输入内容时，返回的数据片段数量，数值越大返回的内容越多。||最小匹配度|Bot在调用知识库匹配用户输入内容时，会将达到匹配度要求的数据片段进行召回。如果数据片段未达到最小匹配度，则不会被召回。||调用方式|知识库的调用方式。<br>自动调用：每轮对话将自动从所有关联的知识库中匹配数据并召回。<br>按需调用：你需要在人设与回复逻辑中提示Bot调用RecallKnowledge方法，以约束Bot在指定时机从知识库内匹配数据。|1.（可选）在预览与调试区域调试Bot能力时，扩展运行完毕的内容可以查看知识库命中并召回的分片内容。[heading2]在工作流内使用Knowledge节点[content]1.登录[扣子](https://www.coze.cn/home)。2.在左侧导航栏的工作区区域，选择进入指定团队。3.在页面顶部进入工作流页面，并打开指定的工作流。4.在左侧基础节点列表内，选择添加Knowledge节点。

Coze - 打造 AI 私人提效助理实战知识库

创作者：@这显得我很呆昂@千钧一发之际Coze支持上传私有化数据（如本地文件、实时在线数据），通过向量搜索来检索最相关的内容，以便更精确地回答用户的问题。[heading2]什么是知识库？[content]我们都知道，大模型是基于公开的数据来训练的，不包含某个特定领域的私有数据，比如大模型肯定不知道你们公司的规章制度是什么、你在做项目的基本信息以及进度情况。但是通过配置私有知识库，就可以让大模型仅仅根据我们提供的内容来回答问题，比如我们把公司的制度或者项目的会议纪要、资料等信息，制作成知识库，大模型就可以根据知识库的内容，来回答我们关于公司制度或者是项目的相关问题。知识库可以解决大模型幻觉、专业领域知识不足的问题，提升大模型回复的准确率。[heading2]知识库Bot的实现原理[content]数据分段储存：由于大模型的上下文长度是有限制的，所以大模型首先会将我们上传的资料，根据特定的符号或者字符长度进行分段，比如一篇8000字的文档，他会按照每800字分成一个片段，一共分成10个片段，储存起来。增强检索：当用户输入一个问题，大模型就会根据相似度，检索出若干个最相关的数据片段，最后再根据这些内容，生成用户的答案，这个技术我们通常称为RAG（检索增强生成）。延伸阅读：[什么是RAG技术](https://icloudnative.io/posts/what-is-rag/)使用限制单用户最多创建1000个知识库。文本类型知识库下最多支持添加100个文档。单用户每月最多新增2 GB数据，累计上限是10 GB。