与知识库对话

以下是一份垂直领域大模型训练指南：一、大模型入门通俗来讲，大模型就是输入大量语料，让计算机获得类似人类的“思考”能力，能够进行文本生成、推理问答、对话、文档摘要等工作。大模型的训练和使用过程可以用“上学参加工作”来类比： 1. 找学校：训练大模型需要大量计算，GPU 更合适，只有购买得起大量 GPU 的才有资本训练自己的大模型。 2. 确定教材：大模型需要的数据量特别多，几千亿序列（Token）的输入基本是标配。 3. 找老师：即用合适的算法讲述“书本”中的内容，让大模型更好理解 Token 之间的关系。 4. 就业指导：为了让大模型更好胜任某一行业，需要进行微调（fine tuning）指导。 5. 搬砖：就业指导完成后，进行如翻译、问答等工作，在大模型里称之为推导（infer）。在 LLM 中，Token 被视为模型处理和生成的文本单位，可以代表单个字符、单词、子单词等，具体取决于所使用的分词方法。在将输入进行分词时，会对其进行数字化，形成一个词汇表。二、LLM 开源中文大语言模型及数据集集合 1. 医疗领域 XrayGLM：首个会看胸部 X 光片的中文多模态医学大模型。地址：简介：该项目发布了 XrayGLM 数据集及模型，在医学影像诊断和多轮交互对话上显示出非凡潜力。 MeChat：中文心理健康支持对话大模型。地址：简介：该项目开源的中文心理健康支持通用模型由 ChatGLM6B LoRA 16bit 指令微调得到，数据集通过调用 gpt3.5turbo API 扩展真实的心理互助 QA 为多轮的心理健康支持多轮对话，提高了通用语言大模型在心理健康支持领域的表现，更加符合在长程多轮对话的应用场景。 MedicalGPT 地址：简介：训练医疗大模型，实现包括二次预训练、有监督微调、奖励建模、强化学习训练。发布中文医疗 LoRA 模型 shibing624/ziyallama13bmedicallora，基于 ZiyaLLaMA13Bv1 模型，SFT 微调了一版医疗模型，医疗问答效果有提升，发布微调后的 LoRA 权重。三、100 基础训练大模型步骤三·Lora 生图： 1. 点击预览模型中间的生图会自动跳转到相应页面。 2. 模型上的数字代表模型强度，可在 0.6 1.0 之间调节，默认为 0.8。 3. 可以自己添加 lora 文件，点击后会显示训练过的所有 lora 的所有轮次。 4. VAE 不需要替换。 5. 正向提示词输入所写的提示词，可以选择基于这个提示词一次性生成几张图。 6. 选择生成图片的尺寸，包括横板、竖版、正方形。 7. 采样器和调度器新手小白可以默认不换。 8. 迭代步数可以按照需求在 20 30 之间调整。 9. CFG 可以按照需求在 3.5 7.5 之间调整。 10. 随机种子 1 代表随机生成图。 11. 所有设置都完成后，点击开始生成，生成的图会显示在右侧。 12. 如果有某次生成结果不错，想要微调或者高分辨率修复，可以点开那张图，往下滑，划到随机种子，复制下来，粘贴到随机种子这里，下次生成的图就会和这次的结果近似。 13. 如果确认了一张很合适的种子和参数，想要高清放大，则点开高清修复，可以选择放大的倍数。新手小白可以默认算法，迭代步数建议在 20 30 之间，重回幅度根据需求在 0.3 0.7 之间调整。今日作业：按照比赛要求，收集六个主题中一个主题的素材并且训练出 lora 模型后提交 lora 模型与案例图像。提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd