以下是关于知识库的相关内容:
大模型并非 100%准确,会产生幻觉,原因主要有两点:
因此,知识库的出现是为解决大模型数据准确性的问题。大模型可额外学习外接知识库中的知识,从而精准回复用户。典型应用如客服系统,公司将用户所有问题及答案记录在文档中,以知识库形式投喂给大模型,用户自然语言询问时,大模型能根据知识库内容给出更准确回答。
扣子的知识库功能提供简单易用方式存储和管理外部数据,让 Bot 与指定数据交互。上传数据到知识库后,扣子会自动将文档分割成内容片段存储,并通过向量搜索检索最相关内容回答用户问题。知识库由大到小可分为:
在商业化问答场景中,左侧有三处配置:AI 模型、提示词、知识库。模型、提示词、知识库三者可想象成:
大模型并不是100%准确的,它会产生幻觉,主要是因为以下两点训练大模型的数据是有日期限制的,如果你询问大模型超出日期限制的问题,则大模型无法准确回答大模型的数据来源于互联网,如果是公司内部的私有数据,则大模型无法感知因此知识库的出现就是为了解决大模型的数据准确性的问题。大模型可以额外学习外接知识库中的知识,从而来精准回复用户。知识库中最典型的一个应用就是客服系统:公司可以将用户所有问题以及答案记录在文档中,然后以知识库的形式投喂给大模型。这样当用户通过自然语言询问问题时,大模型就可以根据知识库中的内容给出更加准确的回答。
扣子的知识库功能提供了简单易用的方式来存储和管理外部数据,让你的Bot可以与指定的数据进行交互。将数据上传到知识库后,扣子会自动将你的文档分割成一个个内容片段进行存储,并通过向量搜索来检索最相关的内容来回答用户问题。知识库由大到小可分为:知识库:一整套领域知识,是Bot加载的最小单位。单元:知识库的一部分,可上传的最小内容单位可以是一个.txt、.pdf、.csv文件或一个网页。分段:一个单元切分成多个分段,模型查询的最小单位。分段内容的完整度和准确性度会影响模型回答问题的准确性。
上方页面左侧画红框的地方,是这个“问答机器人”的配置,右侧是与“机器人”的一轮对话。左侧有三处配置:AI模型提示词知识库。模型、提示词、知识库三者可以想象成:大语言模型:是一个学习过无数本书、拥有无穷智慧的人。他读过无数的书、看过无数的段子,因此对公共知识、学识技能、日常聊天十分擅长。然而,在工作场景下,只会聊天侃大山可不行,你想让他帮你干活。这个时候,就需要“提示词”出场了,提示词:是你告诉这个全知全能的人,他是一个什么样的角色、他要专注于哪些技能,让他能够按照你的想法,变成一个你需要的“员工”。知识库:相当于你给这个“聪明”员工的发放了一本工作手册。即使是看过再多的书、浏览过再多的文字,也不会准确的知道见到老板娘过来吃饭要打三折,张梦飞过去吃饭要打骨折。而知识库,就是把这些内容写在了工作手册上。让这个聪明的员工,见到有人来的时候,就翻一翻手册,然后再做出反应。我的设定:AI模型:这里使用的是阿里千问模型。