Chat with Wiki - Java 程序员如何从 0 到 1 开发微调模型

Answer

以下是 Java 程序员从 0 到 1 开发微调模型的步骤和相关信息：

准备工作：假设您已经按照相关说明准备了训练数据。

使用 OpenAI CLI 进行微调：

明确从哪里 BASE_MODEL 开始的基本模型的名称（如 ada、babbage、curie 或 davinci），您可以使用后缀参数自定义微调模型的名称。
运行相关命令，该命令会执行以下操作：
- 使用文件 API 上传文件（或使用已经上传的文件）。
- 创建微调作业。
- 流式传输事件直到作业完成（这通常需要几分钟，但如果队列中有很多作业或您的数据集很大，则可能需要数小时）。

关于基本模型：每个微调工作都从一个默认为 curie 的基本模型开始。模型的选择会影响模型的性能和运行微调模型的成本。您的模型可以是 ada、babbage、curie 或 davinci。请访问定价页面了解有关微调费率的详细信息。

微调作业的时间：开始微调作业后，可能需要一些时间才能完成。在系统中，您的工作可能排在其他工作之后，训练模型可能需要几分钟或几小时，具体取决于模型和数据集的大小。如果事件流因任何原因中断，您可以通过运行特定命令恢复它。工作完成后，它应该显示微调模型的名称。

微调的优势：

比即时设计更高质量的结果。
能够训练比提示中更多的例子。
由于更短的提示而节省了 Token。
更低的延迟请求。

微调的步骤：

准备和上传训练数据。
训练新的微调模型。
使用您的微调模型。

可微调的模型：微调目前仅适用于以下基础模型：davinci、curie、babbage 和 ada。这些是原始模型，在训练后没有任何说明（例如 text-davinci-003）。您还可以继续微调微调模型以添加其他数据，而无需从头开始。

安装建议：建议使用 OpenAI 命令行界面(CLI)。要安装这个，运行相关指令（以下说明适用于 0.9.4 及更高版本。此外，OpenAI CLI 需要 python 3）。通过将相关行添加到您的 shell 初始化脚本（例如.bashrc、zshrc 等）或在微调命令之前的命令行中运行它来设置您的环境变量。

此外，还有“大圣：全网最适合小白的 Llama3 部署和微调教程”，其核心代码全部参考如下开源项目：GitHub-datawhalechina/self-llm:《开源大模型食用指南》基于 Linux 环境快速部署开源大模型，更适合中国宝宝的部署教程。该教程有诸多亮点，如教您如何购买算力，手把手教您下载并部署 Llama3 模型，使用甄嬛数据集微调 Llama3 模型等，但不会讲解微调的技术性原理以及文中会用到的 Python 代码，且需要您充值 50 块钱购买算力的预充值。

Content generated by AI large model, please carefully verify (powered by aily)

References

微调（Fine-tuning）

以下假设您已经按照上述说明准备了训练数据。使用OpenAI CLI开始微调工作：您从哪里BASE_MODEL开始的基本模型的名称（ada、babbage、curie或davinci）。您可以使用后缀参数自定义微调模型的名称。运行上面的命令会做几件事：1.使用文件API上传文件（或使用已经上传的文件）2.创建微调作业3.流式传输事件直到作业完成（这通常需要几分钟，但如果队列中有很多作业或您的数据集很大，则可能需要数小时）每个微调工作都从一个默认为curie的基本模型开始。模型的选择会影响模型的性能和运行微调模型的成本。您的模型可以是以下之一：ada、babbage、curie或davinci。请访问我们的定价页面，了解有关微调费率的详细信息。开始微调作业后，可能需要一些时间才能完成。在我们的系统中，您的工作可能排在其他工作之后，训练我们的模型可能需要几分钟或几小时，具体取决于模型和数据集的大小。如果事件流因任何原因中断，您可以通过运行以下命令恢复它：工作完成后，它应该显示微调模型的名称。除了创建微调作业外，您还可以列出现有作业、检索作业状态或取消作业。

微调（Fine-tuning）

了解如何为您的应用程序定制模型。[heading2]介绍[content]通过提供以下内容，微调可让您从API提供的模型中获得更多收益：1.比即时设计更高质量的结果2.能够训练比提示中更多的例子3.由于更短的提示而节省了Token4.更低的延迟请求GPT-3已经在来自开放互联网的大量文本上进行了预训练。当给出仅包含几个示例的提示时，它通常可以凭直觉判断出您要执行的任务并生成合理的完成。这通常称为“小样本学习”。微调通过训练比提示中更多的示例来改进小样本学习，让您在大量任务中取得更好的结果。对模型进行微调后，您将不再需要在提示中提供示例。这样可以节省成本并实现更低延迟的请求。在高层次上，微调涉及以下步骤：1.准备和上传训练数据2.训练新的微调模型3.使用您的微调模型[heading2]哪些模型可以微调？[content]微调目前仅适用于以下基础模型：davinci、curie、babbage和ada。这些是原始模型，在训练后没有任何说明（例如text-davinci-003）。您还可以继续微调微调模型以添加其他数据，而无需从头开始。[heading2]安装[content]我们建议使用我们的OpenAI命令行界面(CLI)。要安装这个，运行（以下说明适用于0.9.4及更高版本。此外，OpenAI CLI需要python 3。）OPENAI_API_KEY通过将以下行添加到您的shell初始化脚本（例如.bashrc、zshrc等）或在微调命令之前的命令行中运行它来设置您的环境变量：

大圣：全网最适合小白的 Llama3 部署和微调教程

本文的核心代码全部参考如下开源项目：[GitHub-datawhalechina/self-llm:《开源大模型食用指南》基于Linux环境快速部署开源大模型，更适合中国宝宝的部署教程](https://github.com/datawhalechina/self-llm/tree/master)[heading1]一、引言[content]大家好，我是大圣，一个致力于使用AI技术将自己打造为超级个体的程序员。作为一名程序员，我对大模型技术是非常向往的，但是因为是非科班出身，一直迟迟没有动手。在Llama3出来之后，我萌生了微调的想法，我的目的很简单，不是为了学习多么高深的知识，而是让自己先入门。入门最好的方式就是直接上手实操，这是也是之前的一系列教程中所强调的理念。由于市面上没有找到专门针对我们纯小白的教程，所以这篇教程就来啦！这篇教程的亮点教你如何购买算力，不再为本地电脑的配置不够而发愁手把手教你下载并部署Llama3模型，以前都是玩别人部署的，这次咱们玩自己的！)使用甄嬛数据集微调Llama3模型，并且针对微调后的模型进行实验了解微调的意义和概念但是这篇教程不会讲解微调的技术性原理以及文中会用到的Python代码。原因很简单，因为我是一位Java开发工程师，里面的代码我都是靠GPT4.0帮我读的另外这篇教程需要你充值50块钱，不过不是给我哦，是购买算力的预充值。我不想因为50块钱把你劝退，所以这里我要多说一句，免费的才是最贵的。看完我的教程，你绝对会认为这50块钱花的很值OK，都交代清楚，大家按照决定是否要继续享用，废话不多少，我们直接开始