Chat with Wiki - 测试微调模型

Answer

以下是关于测试微调模型的相关内容：

在完成微调之后，需要对结果进行测试。微调不会直接影响原有的大模型，而是生成一些文件，包括模型权重文件、配置文件、训练元数据、优化器状态等。这些文件可以和原有大模型合并并输出新的大模型。

在测试之前，先通过不合并的方式进行微调结果的验证。例如，若数据集中有问答“问：你是谁？答：家父是大理寺少卿甄远道”，当给微调后的模型指定角色“现在你要扮演皇帝身边的女人--甄嬛”，然后问模型“你是谁？”，若回答是“家父是大理寺少卿甄远道”，则认为模型微调有效果。

测试代码结果成功。之后可以将微调结果和原有大模型进行合并，然后输出新的模型，使用 webdemo 进行测试。包括切换到对应的目录、执行合并代码、生成相应文件、创建 chatBotLora.py 文件并执行代码进行本地测试、开启自定义服务等步骤，最终验收成功。

此外，当作业成功时，fine_tuned_model 字段将填充模型名称，可将此模型指定为 Completions API 的参数，并使用 Playground 向它发出请求。首次完成后，模型可能需要几分钟准备好处理请求，若超时可能是仍在加载中，几分钟后重试。可通过将模型名称作为 model 完成请求的参数传递来开始发出请求，包括 OpenAI 命令行界面、cURL、Python、Node.js 等方式。

要删除微调模型，需在组织中被指定为“所有者”。

创建微调模型时，假设已准备好训练数据。使用 OpenAI CLI 开始微调工作，需指定基本模型的名称（ada、babbage、curie 或 davinci），还可使用后缀参数自定义微调模型的名称。运行命令会上传文件、创建微调作业、流式传输事件直到作业完成，每个微调工作都从默认为 curie 的基本模型开始，模型选择会影响性能和成本。开始微调作业后，可能需要一些时间才能完成，若事件流中断可恢复。工作完成后会显示微调模型的名称，还可列出现有作业、检索作业状态或取消作业。

Content generated by AI large model, please carefully verify (powered by aily)

References

大圣：全网最适合小白的 Llama3 部署和微调教程

在完成微调之后，我们需要对微调后的结果进行测试，在测试之前，我们需要先了解两个概念微调不会直接影响原有的大模型，而是生成一些文件，让我们可以在原有大模型的基础上结合这些文件来实现微调后的能力。这些文件通常包括（这篇文章不做过多解释）：模型权重文件配置文件训练元数据优化器状态微调后的文件是可以和原有大模型合并并输出新的大模型的我们先通过不合并的方式进行微调结果的验证。因为我们的数据集中有这么一个问答：问：你是谁？答：家父是大理寺少卿甄远道因此当我们给微调后的模型指定一个角色时：“现在你要扮演皇帝身边的女人--甄嬛”，然后我们问模型：你是谁？如果模型的回答是：“家父是大理寺少卿甄远道”，那我们就认为模型微调有效果！1.测试代码结果如下，成功啦！代码如下：[heading3]将微调结果合并到模型[content]既然我们已经测试了，那我们就将微调的结果和原有大模型进行合并，然后输出新的模型，使用webdemo进行测试。1.合并代码切换到对应的目录执行完成后会生成如下文件代码如下：[heading3]使用webdemo测试合并后的模型[content]OK，马上到最后一步啦，接下来我们就使用webdemo来测试一把新的模型1.创建chatBotLora.py文件，将下面的代码复制进去1.执行代码，本地测试1.开启自定义服务，验收成功啦！

微调（Fine-tuning）

当作业成功时，该fine_tuned_model字段将填充模型名称。您现在可以将此模型指定为我们的Completions API的参数，并使用Playground向它发出请求。在您的工作首次完成后，您的模型可能需要几分钟时间才能准备好处理请求。如果对您的模型的完成请求超时，可能是因为您的模型仍在加载中。如果发生这种情况，请在几分钟后重试。您可以通过将模型名称作为model完成请求的参数传递来开始发出请求：OpenAI命令行界面：cURL：Python：Node.js：您可以继续使用所有其他完成参数，如temperature等，对这些frequency_penalty请求presence_penalty进行微调模型。[heading2]删除微调模型[content]要删除微调模型，您必须在您的组织中被指定为“所有者”。OpenAI命令行界面：cURL：Python：[heading2]准备数据集[content]微调是一种强大的技术，可用于创建特定于您的用例的新模型。在微调您的模型之前，我们强烈建议您阅读以下针对您的用例的最佳实践和具体指南。

微调（Fine-tuning）

以下假设您已经按照上述说明准备了训练数据。使用OpenAI CLI开始微调工作：您从哪里BASE_MODEL开始的基本模型的名称（ada、babbage、curie或davinci）。您可以使用后缀参数自定义微调模型的名称。运行上面的命令会做几件事：1.使用文件API上传文件（或使用已经上传的文件）2.创建微调作业3.流式传输事件直到作业完成（这通常需要几分钟，但如果队列中有很多作业或您的数据集很大，则可能需要数小时）每个微调工作都从一个默认为curie的基本模型开始。模型的选择会影响模型的性能和运行微调模型的成本。您的模型可以是以下之一：ada、babbage、curie或davinci。请访问我们的定价页面，了解有关微调费率的详细信息。开始微调作业后，可能需要一些时间才能完成。在我们的系统中，您的工作可能排在其他工作之后，训练我们的模型可能需要几分钟或几小时，具体取决于模型和数据集的大小。如果事件流因任何原因中断，您可以通过运行以下命令恢复它：工作完成后，它应该显示微调模型的名称。除了创建微调作业外，您还可以列出现有作业、检索作业状态或取消作业。