与知识库对话 - 你是基于什么大模型做的知识库

回答

以下是关于大模型和知识库的相关知识：

RAG（检索增强生成）技术：利用大模型搭建知识库是 RAG 技术的应用。大模型训练数据有截止日期，当需要依靠不在训练集中的数据时，可通过 RAG 实现。RAG 包括文档加载、文本分割、存储（包括嵌入和向量数据存储到向量数据库）、检索、输出（把问题及检索出的嵌入片提交给 LLM 生成答案）等 5 个过程。文档加载可从多种来源加载不同类型的文档，文本分割将文档切分为指定大小的块。
硬件配置要求：运行大模型需要较高的机器配置。生成文字大模型最低配置为 8G RAM + 4G VRAM，建议配置为 16G RAM + 8G VRAM，理想配置为 32G RAM + 24G VRAM（跑 GPT-3.5 差不多性能的大模型）；生成图片大模型最低配置为 16G RAM + 4G VRAM，建议配置为 32G RAM + 12G VRAM；生成音频大模型最低配置为 8G VRAM，建议配置为 24G VRAM。
实例：在一个设定中，使用阿里千问模型，设定角色为“美嘉”，知识库为《爱情公寓》全季剧情，实现问答。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

文本加载器就是将用户提供的文本加载到内存中，便于进行后续的处理

【AI+知识库】商业化问答场景，让AI回复更准确，一篇专为所有“小白”讲透RAG的实例教程（上篇）

[title]【AI+知识库】商业化问答场景，让AI回复更准确，一篇专为所有“小白”讲透RAG的实例教程（上篇）大语言模型：是一个学习过无数本书、拥有无穷智慧的人。他读过无数的书、看过无数的段子，因此对公共知识、学识技能、日常聊天十分擅长。然而，在工作场景下，只会聊天侃大山可不行，你想让他帮你干活。这个时候，就需要“提示词”出场了，提示词：是你告诉这个全知全能的人，他是一个什么样的角色、他要专注于哪些技能，让他能够按照你的想法，变成一个你需要的“员工”。知识库：相当于你给这个“聪明”员工的发放了一本工作手册。即使是看过再多的书、浏览过再多的文字，也不会准确的知道见到老板娘过来吃饭要打三折，张梦飞过去吃饭要打骨折。而知识库，就是把这些内容写在了工作手册上。让这个聪明的员工，见到有人来的时候，就翻一翻手册，然后再做出反应。我的设定：AI模型：这里使用的是阿里千问模型。提示词：这里设定的角色是“美嘉”，是按照美嘉的人设、背景和对话风格做的设定。知识库：这里放的是《爱情公寓》全季的剧情，让“美嘉”拥有了自己过往的“记忆”，知道自己做过什么、好朋友是谁等等。图中右侧是一个十分简单的问答，我问：“你是谁？你和子乔在台球厅吵架那次是为了什么吵架？”她的回复是：“我是陈美嘉，那次在台球厅和吕子乔吵架是因为他约会被人撞见，我讽刺他脸大影响信号，他还反击我。后来谈到过去的事情，我指责他忘恩负义，他就说我平。最后，我伤心地说要分手，因为他之前甩过我。”

手把手教你本地部署大模型以及搭建个人知识库

所有人都会手把手教你部署XX大模型，听起来很诱人，因为不需要科学上网，不需要高昂的ChatGPT会员费用。但是在开启下面的教程之前，我希望你能有个概念：运行大模型需要很高的机器配置，个人玩家的大多数都负担不起所以：虽然你的本地可能可以搭建出一个知识库，但是它不一定能跑的起来下面我通过一组数据来让大家有个感性的认知。以下文字来源于视频号博主：黄益贺，非作者实操生成文字大模型最低配置：8G RAM + 4G VRAM建议配置：16G RAM + 8G VRAM理想配置：32G RAM + 24G VRAM（如果要跑GPT-3.5差不多性能的大模型）生成图片大模型（比如跑SD）最低配置：16G RAM + 4G VRAM建议配置：32G RAM + 12G VRAM生成音频大模型最低配置：8G VRAM +建议配置：24G VRAM而最低配置我就不建议了，真的非常慢，这个我已经用我自己8G的Mac电脑替你们试过了。讲这个不是泼大家冷水，而是因为我的文章目标是要做到通俗易懂，不希望通过夸大的方式来吸引你的眼球。这是这篇文章的第二次修改，我专门加的这段。原因就是因为好多小伙伴看了文章之后兴致冲冲的去实验，结果发现电脑根本带不动。但是这并不妨碍我们去手把手实操一遍，因为实操可以加深我们对大模型构建的知识库底层原理的了解。如果你想要私滑的体验知识库，可以参考我的另一篇文章：[胎教级教程：万字长文带你使用Coze打造企业级知识库](https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb)好了，废话不多说，下面教程还是值得亲自上手搞一遍的，相信走完一遍流程后，你会对知识库有更深的理解。