从 0 到 1 搭建知识库的方法如下:
【智能体】让 Coze 智能体机器人连上微信和微信群:
创建智能体:
知识库:本次创建知识库使用手动清洗数据,上节课程是自动清洗数据。自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。
在线知识库:点击创建知识库,创建一个画小二课程的 FAQ 知识库。知识库的飞书在线文档,其中每个问题和答案以分割,暂时不要问为什么。选择飞书文档、自定义的自定义,输入,然后就将飞书的文档内容以区分开来,这里可以点击编辑修改和删除。点击添加 Bot,添加好可以在调试区测试效果。
本地文档:本地 word 文件,注意如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面。画小二这个课程 80 节课程,分为了 11 个章节,不能一股脑全部放进去训练。正确的方法是首先将 11 章的大的章节名称内容放进来,章节内详细内容格式依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理,然后选择创建知识库自定义清洗数据。
发布应用:点击发布,确保在 Bot 商店中能够搜到。
使用 Dify 构建知识库:
准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式。对数据进行清洗、分段等预处理,确保数据质量。
创建数据集:在 Dify 中创建一个新的数据集,并将准备好的文档上传至该数据集。为数据集编写良好的描述,描述清楚数据集包含的内容和特点。
配置索引方式:Dify 提供了三种索引方式供选择:高质量模式、经济模式和 Q&A 分段模式。根据实际需求选择合适的索引方式,如需要更高准确度可选高质量模式。
集成至应用:将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用。在应用设置中,可以配置数据集的使用方式,如是否允许跨数据集搜索等。
持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代。定期更新知识库,增加新的内容以保持知识库的时效性。
【知识库】FastGPT + OneAPI + COW 带有知识库的机器人:
创建知识库应用:
地址输入浏览器:http://这里替换为你宝塔左上角的那一串:3000/
进入后,点击应用并创建,选择 qwen 模型。
创建知识库。点击知识库 选择 qwen Embedding 1 点击确认创建。
上传文件,等待处理,最后文本状态是“已就绪”。
回到刚刚创建的应用,关联上创建的知识库。
点击两个发布。之前第一个叫做保存。
点击新建,创建 key。创建后保存同时将 API 根地址最后加上/v1 并保存下来。
安装并接入 cow:
回到宝塔,打开【终端】。
依次粘贴并回车:cd/root 。
git clone https://github.com/zhayujie/chatgptonwechat ,注意一定要粘贴完整。
出现下方的样子,就是成功了。如果失败,或者没反应,刷新一下,重新再试一次。
继续一行一行,依次输入:cd chatgptonwechat/ ,pip install r requirements.txt 。
等待执行完成,继续粘贴:pip install r requirements optional.txt 。
上边的都执行完成后,到“文件”菜单中去执行,点击文件 找到 root,进入 root 文件夹,找到 chatgpt on wechat 文件夹,并进入。
2025-01-19