与知识库对话

要做自己的大模型，以下是一些关键步骤和要点：一、理解大模型通俗来讲，大模型是输入大量语料，让计算机获得类似人类的“思考”能力，能够进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练和使用过程： 1. 找学校：训练大模型需要大量计算，GPU更合适，只有购买得起大量GPU的才有资本训练。 2. 确定教材：大模型需要大量数据，几千亿序列（Token）的输入基本是标配。 3. 找老师：选择合适的算法让大模型更好理解Token之间的关系。 4. 就业指导：为让大模型更好胜任某一行业，需要进行微调（fine tuning）指导。 5. 搬砖：完成就业指导后，进行如翻译、问答等工作，在大模型里称为推导（infer）。 Token被视为模型处理和生成的文本单位，可代表单个字符、单词、子单词等，在将输入进行分词时，会对其进行数字化，形成词汇表。二、部署和训练自己的大模型的主要步骤 1. 选择合适的部署方式本地环境部署云计算平台部署分布式部署模型压缩和量化公共云服务商部署根据自身的资源、安全和性能需求选择。 2. 准备训练所需的数据和计算资源确保有足够的训练数据覆盖目标应用场景。准备足够的计算资源，如GPU服务器或云计算资源。 3. 选择合适的预训练模型作为基础可以使用开源的预训练模型如BERT、GPT等。也可以自行训练一个基础模型。 4. 针对目标任务进行模型微调训练根据具体应用场景对预训练模型进行微调训练。优化模型结构和训练过程以提高性能。 5. 部署和调试模型将训练好的模型部署到生产环境。对部署的模型进行在线调试和性能优化。 6. 注意安全性和隐私保护大模型涉及大量数据和隐私信息，需要重视安全性和合规性。三、Lora 生图在 Lora 生图中，点击预览模型中间的生图会自动跳转到相关页面。模型上的数字代表模型强度，可在 0.6 1.0 之间调节，默认为 0.8。也可以自己添加 lora 文件，点击后会显示训练过的所有 lora 的所有轮次。VAE 不需要替换，正向提示词输入所写的提示词，可以选择基于这个提示词一次性生成几张图，选择生成图片的尺寸（横板、竖版、正方形）。采样器和调度器新手小白可以默认，迭代步数在 20 30 之间调整，CFG 在 3.5 7.5 之间调整，随机种子 1 代表随机生成图。如果有满意的生成结果，想要微调或高分辨率修复，可以复制随机种子，粘贴到相应位置，下次生成的图会近似。如果确认了合适的种子和参数，想要高清放大，可点开高清修复，选择放大倍数，新手小白可默认算法，迭代步数建议在 20 30 之间，重回幅度在 0.3 0.7 之间调整。今日作业按照比赛要求，收集六个主题中一个主题的素材并且训练出 lora 模型后提交 lora 模型与案例图像。提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd