以下是关于知识库建立和使用的详细信息:
创建知识库:
使用知识库:扣子的知识库功能提供了简单易用的方式来存储和管理外部数据,让 Bot 可以与指定的数据进行交互。将数据上传到知识库后,扣子会自动将文档分割成一个个内容片段进行存储,并通过向量搜索来检索最相关的内容来回答用户问题。知识库由大到小可分为:知识库(一整套领域知识,是 Bot 加载的最小单位)、单元(知识库的一部分,可上传的最小内容单位可以是一个.txt、.pdf、.csv 文件或一个网页)、分段(一个单元切分成多个分段,模型查询的最小单位。分段内容的完整度和准确性度会影响模型回答问题的准确性)。
|上传方式|操作步骤||-|-||API|获取在线API的JSON数据,将JSON数据上传至知识库。<br>1.在表格格式页签下,选择API,然后单击下一步。<br>2.单击新增API。<br>3.输入网址URL并选择数据的更新频率,然后单击下一步。<br>4.输入单元名称或使用自动添加的名称,然后单击下一步。<br>5.配置数据表信息后,单击下一步。<br>5.1.确认表结构:系统已默认获取了表头的列名,你可以自定义修改列名,或删除某一列名。<br>5.2.指定语义匹配字段:选择哪个字段作为搜索匹配的语义字段。在响应用户查询时,会将用户查询内容与该字段内容的内容进行比较,根据相似度进行匹配。<br>6.查看表结构和数据,确认无误后单击下一步。<br>7.完成上传后,单击确定。||自定义|手动创建数据表结构和数据。<br>1.在表格格式页面下,选择自定义,然后单击下一步。<br>2.输入单元名称。<br>3.在表结构区域添加字段,单击增加字段添加多个字段。<br>4.设置列名,并选择指定列字段作为搜索匹配的语义字段。在响应用户查询时,会将用户查询内容与该字段内容的内容进行比较,根据相似度进行匹配。<br>5.单击确定。<br>6.单击创建分段,然后在弹出的页面输入字段值,然后单击保存。|
扣子的知识库功能提供了简单易用的方式来存储和管理外部数据,让你的Bot可以与指定的数据进行交互。将数据上传到知识库后,扣子会自动将你的文档分割成一个个内容片段进行存储,并通过向量搜索来检索最相关的内容来回答用户问题。知识库由大到小可分为:知识库:一整套领域知识,是Bot加载的最小单位。单元:知识库的一部分,可上传的最小内容单位可以是一个.txt、.pdf、.csv文件或一个网页。分段:一个单元切分成多个分段,模型查询的最小单位。分段内容的完整度和准确性度会影响模型回答问题的准确性。
|上传方式|操作步骤||-|-||Notion|1.在文本格式页签下,选择Notion,然后单击下一步。<br>2.单击授权。<br>首次导入Notion数据和页面时,需要进行授权。<br>1.在弹出的页面完成登录,并选择要导入的页面。<br>2.选择要导入的数据,然后单击下一步。<br>3.选择内容分段方式:<br>3.1.自动分段与清洗:系统会对上传的文件数据进行自动分段,并会按照系统默认的预处理规则处理数据。<br>3.2.自定义:手动设置分段规则和预处理规则。<br>分段标识符:选择符合实际所需的标识符。<br>分段最大长度:设置每个片段内的字符数上限。<br>文本预处理规则:<br>替换掉连续的空格、换行符和制表符<br>删除所有URL和电子邮箱地址<br>1.单击下一步完成内容上传和分片。||自定义|1.在文本格式页签下,选择自定义,然后单击下一步。<br>2.输入单元名称,然后单击确认。<br>3.单击创建分段,然后在弹出的页面输入要上传的内容。<br>每个分段最多可添加2000个字符。<br>1.单击保存。|