与知识库对话

以下是关于如何用大模型和数据接口对话的相关内容：大模型入门指南动手实验由于作者使用的是 macOS 系统，因此采用 GGML 量化后的模型。官方开源出来的模型大都以 Python 为主，效率一般。作者通常会采用社区内的其他实现，比较有名的项目有： ggerganov/llama.cpp:Port of Facebook's LLaMA model in C/C++ ggerganov/whisper.cpp:Port of OpenAI's Whisper model in C/C++ LLama 首先是编译，为了利用 Metal 的 GPU，可以用如下命令编译。之后需要去 Llama27BChatGGML中下载模型，3G 到 7G 不等，读者可以按需尝试。此外，llama.cpp 还提供了 WebUI 供用户使用，首先启动 server，它默认监听 8080 端口，打开浏览器就可以对话。 Whisper 和 llama 类似，采用 make 命令编译，之后去 ggerganov/whisper.cpp下载量化好的模型，然后转换音频即可，目前只接受 wav 格式，可以用 ffmpeg 转化。输出的 srt 文件如下所示： |Size|Parameters|Englishonly model|Multilingual model|Required VRAM|Relative speed| ||||||| |tiny|39 M|tiny.en|tiny|~1 GB|~32x| |base|74 M|base.en|base|~1 GB|~16x| |small|244 M|small.en|small|~2 GB|~6x| |medium|769 M|medium.en|medium|~5 GB|~2x| |large|1550 M|N/A|large|~10 GB|1x| 一般来说，英文的音频 small 模型就足够了，但是如果是中文，最好用最大的模型。数据库通过在工作流中添加数据库节点对数据表进行操作。在工作流中可通过 NL2SQL 方式和代码方式进行调用，支持完整读写模式。参考以下操作，在工作流中添加并配置工作流节点。在工作流中配置数据库节点前，确保已经搭建了一个 Bot，并在这个 Bot 中创建好了数据表。 1. 单击页面顶部的工作流页签，然后单击创建工作流。 2. 输入工作流名称和工作流的使用描述，然后单击确认。工作流名称和描述可以帮助大语言模型理解什么场景下需要调用该工作流。 1. 在基础节点页签下，将数据库节点拖入到工作流配置画布区域。 2. 根据以下信息配置数据库节点。 2.1. 输入：添加 SQL 执行中需要的参数，可以是一个变量，也可以是一个固定值。 2.2. SQL:输入要执行的 SQL 语句，可以直接使用输入参数中的变量。可单击自动生成使用大模型生成 SQL。在弹出的页面中，选择这个数据库工作流生效的 Bot 和数据表，然后使用自然语言描述要执行的操作，单击自动生成生成 SQL 语句，最后单击使用。不支持 Select语法。不支持多表 Join 操作。最多返回 100 行数据。手把手教你本地部署大模型以及搭建个人知识库通过 Open WebUI 使用大模型使用 Open WebUI 1. 首先访问如下网址。当打开这个页面的时候，会让你登陆，这个时候随便使用一个邮箱注册一个账号即可。 1. 和本地大模型进行对话。登陆成功之后，如果已经使用过 ChatGPT 等类似的大模型对话网站，对这个页面应该不陌生。Open WebUI 一般有两种使用方式：第一种是聊天对话；第二种是 RAG 能力，也就是可以让模型根据文档内容来回答问题。这种能力就是构建知识库的基础之一。如果要求不高的话，已经搭建了一个本地大模型了，并且通过 Web UI 实现了和大模型进行对话的功能。相信通过这么一通折腾，就理解了 ChatGPT 的信息流。至于为什么 ChatGPT 的访问速度比我们自己的要快，而且回答效果要好，有两个原因：快是因为 GPT 大模型部署的服务器配置高；好是因为 GPT 大模型的训练参数多，数据更优以及训练算法更好。如果想要更加灵活的掌握知识库，请接着往下看。