知識ベースとの対話

以下是关于如何将知识库里的文件进行分类清晰数据，使其变得更加智能化的方法： 1. 在线知识库点击创建知识库，创建一个画小二课程的 FAQ 知识库。飞书在线文档中每个问题和答案以分割，可点击编辑修改和删除。点击添加 Bot，并在调试区测试效果。 2. 本地文档注意拆分内容，提高训练数据准确度，将海报的内容训练到知识库里面。对于画小二这个课程，80 节课程分为 11 个章节，不能一股脑全部放进去训练。首先将 11 章的大的章节名称内容放进来，章节内详细内容依次按固定方式进行人工标注和处理。然后选择创建知识库自定义清洗数据。 3. 发布应用点击发布，确保在 Bot 商店中能够搜到。 4. 飞书知识库在飞书里面选择对应的文件夹，一次最多智能选择 20 个文件（若文件大于 20 个可多建几个知识库）。可以选择自动进行数据清洗，数据清洗是把数据进行类结构化整理，内容中的图片资料也会保留。测试对话，基本反馈正常，目前 coze 存在不稳定版本，需要不断调试完善。 5. Excel 知识库可以增加其他形式的知识库。上传表格的知识库不要过于复杂，不要有合并表格情况，同时系统不认不同的 Sheet。数据处理完成会显示 100%进度，加工出来的数据，点击添加 Bot，就增加到知识库中，然后测试发布和返回。 6. 网页知识库有自动采集和手动采集两种方式，手动采集需要安装插件，操作稍微有点小复杂。选择批量添加，写入画小二官网的地址，可根据需求添加自己的网站。将网站所有的页面都扫描出来，点击确认，将全站数据解析并保存到知识库里面，按照默认自动清洗数据。 7. 创建知识库并上传文本内容本地文档：在文本格式页签下，选择本地文档，然后单击下一步。将要上传的文档拖拽到上传区，或单击上传区域选择要上传的文档。目前支持上传.txt、.pdf、.docx 格式的文件内容，每个文件不得大于 20M，一次最多可上传 10 个文件。当上传完成后单击下一步。选择内容分段方式，包括自动分段与清洗（系统会对上传的文件数据进行自动分段，并会按照系统默认的预处理规则处理数据）和自定义（手动设置分段规则和预处理规则，包括分段标识符、分段最大长度、文本预处理规则，如替换掉连续的空格、换行符和制表符，删除所有 URL 和电子邮箱地址）。单击下一步完成内容上传和分片。