Chat with Wiki - 微调大模型

Answer

大模型微调相关知识如下：

大模型的概念：大模型输入大量语料，让计算机获得类似人类的“思考”能力，能进行文本生成、推理问答、对话、文档摘要等工作。可以用上学参加工作来类比大模型的训练和使用过程，包括找学校（需要大量 GPU 进行训练）、确定教材（需要大量数据）、找老师（选择合适算法）、就业指导（微调）、搬砖（推导）。
Llama3 部署和微调教程：由大圣编写，适合小白。亮点包括教购买算力、手把手下载并部署 Llama3 模型、使用甄嬛数据集微调并实验、了解微调意义和概念。但不讲解微调技术性原理和 Python 代码，需充值 50 元购买算力。
微调的技术路线：从参数规模角度，分为全量微调 FFT（对全量模型参数进行全量训练）和 PEFT（只对部分模型参数进行训练）。PEFT 是目前业界较流行的微调方案。
微调的好处：在较小的特定领域数据集上继续 LLM 的训练过程，可通过调整模型参数大幅提高模型在特定任务中的性能。能输入更多示例，经过微调的模型可能会失去一些通用性，但在特定任务中会有更好表现。
OpenAI 官方微调教程：https://github.com/openai/openai-cookbook/blob/main/examples/How_to_finetune_chat_models.ipynb

Content generated by AI large model, please carefully verify (powered by aily)

References

通俗来讲，大模型就是输入大量语料，来让计算机获得类似人类的“思考”能力，使之能够理解自然语言，能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习，那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程：1.找学校::训练LLM需要大量的计算，因此GPU更合适，因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大，需要的数据量特别多，几千亿序列（Token）的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容，让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后，为了让大模型能够更好胜任某一行业，需要进行微调（fine tuning）指导5.搬砖::就业指导完成后，下面就要正式干活了，比如进行一次翻译、问答等，在大模型里称之为推导（infer）

大圣：全网最适合小白的 Llama3 部署和微调教程

大家好，我是大圣，一个致力于使用AI技术将自己打造为超级个体的程序员。作为一名程序员，我对大模型技术是非常向往的，但是因为是非科班出身，一直迟迟没有动手。在Llama3出来之后，我萌生了微调的想法，我的目的很简单，不是为了学习多么高深的知识，而是让自己先入门。入门最好的方式就是直接上手实操，这是也是之前的一系列教程中所强调的理念。由于市面上没有找到专门针对我们纯小白的教程，所以这篇教程就来啦！这篇教程的亮点教你如何购买算力，不再为本地电脑的配置不够而发愁手把手教你下载并部署Llama3模型，以前都是玩别人部署的，这次咱们玩自己的！)使用甄嬛数据集微调Llama3模型，并且针对微调后的模型进行实验了解微调的意义和概念但是这篇教程不会讲解微调的技术性原理以及文中会用到的Python代码。原因很简单，因为我是一位Java开发工程师，里面的代码我都是靠GPT4.0帮我读的另外这篇教程需要你充值50块钱，不过不是给我哦，是购买算力的预充值。我不想因为50块钱把你劝退，所以这里我要多说一句，免费的才是最贵的。看完我的教程，你绝对会认为这50块钱花的很值

3. 如何让 LLM 应用性能登峰造极

参数规模的角度，大模型的微调分成两条技术路线：全量微调FFT(Full Fine Tuning)：对全量的模型参数，进行全量的训练。PEFT(Parameter-Efficient Fine Tuning)：只对部分模型参数进行训练。从成本和效果的角度综合考虑，PEFT是目前业界比较流行的微调方案。OpenAI官方微调教程：[https://github.com/openai/openai-cookbook/blob/main/examples/How_to_finetune_chat_models.ipynb](https://github.com/openai/openai-cookbook/blob/main/examples/How_to_finetune_chat_models.ipynb)微调是在较小的、特定领域的数据集上继续LLM的训练过程。这可以通过调整模型本身的参数，而不是像提示工程和RAG那样仅仅更改提示，来大幅提高模型在特定任务中的性能。把微调想象成把通用工具打磨成精密仪器。微调有两大好处：提高模型在特定任务中的性能。微调意味着你可以输入更多的示例。您可以在数以百万计的代币上进行微调，而根据上下文的大小，少量学习提示仅限于数以万计的代币。经过微调的模型可能会失去一些通用性，但对于其特定任务而言，您应该期待它有更好的表现。