Chat with Wiki - 你使用的是哪家基础大模型？

Answer

目前常见的基础大模型包括：

Fooocus 程序默认用到了 3 个 SDXL 的模型，分别是一个 base，一个 Refiner，和一个 LoRA。其大模型（base 和 Refiner）默认放在：Fooocus_win64_1-1-10\Fooocus\models\checkpoints；LoRA 模型默认放在：Fooocus_win64_1-1-10\Fooocus\models\loras。如果单独安装，需要下载三个模型：SDXL 基础模型：https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensors；refiner 模型：https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensors；LoRA 模型：https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_offset_example-lora_1.0.safetensors。如果部署了 SD 秋叶包，也可以共用模型（大模型和 LoRA），可在 Fooocus_win64_1-1-10\Fooocus\modules\path.py 中修改路径为秋叶包模型对应的路径。配置好后点击 run.bat 文件启动。
在大型语言模型方面，主要有以下几家：OpenAI 制作了 GPT-3.5 和 GPT-4，它们驱动了 ChatGPT 和微软的 Bing（在 Edge 浏览器上访问）；Google 在 Bard 的标签品牌下有各种模型；Anthropic 制造了 Claude 和 Claude 2。
每个微调工作都从一个默认为 curie 的基本模型开始，模型可以是 ada、babbage、curie 或 davinci。您可以使用 OpenAI CLI 开始微调工作，具体操作及相关注意事项如上述说明。

Content generated by AI large model, please carefully verify (powered by aily)

References

大模型（base和Refiner）默认放在这里：\Fooocus_win64_1-1-10\Fooocus\models\checkpointsLoRA模型默认放在这里：\Fooocus_win64_1-1-10\Fooocus\models\lorasFooocus程序默认用到了3个SDXL的模型，一个base，一个Refiner，和一个LoRA。如果单独安装，这里需要下载三个模型：SDXL基础模型：https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensorsrefiner模型：https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensorsLoRA模型：https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_offset_example-lora_1.0.safetensors如果你部署了SD秋叶包，也可以共用模型（大模型和LoRA），可以这里找到path.py文件：Fooocus_win64_1-1-10\Fooocus\modules\path.py，用text记事本打开，修改路径为秋叶包模型对应的路径：大模型路径，比如：sd-webui\models\Stable-diffusion\SDXLLoRA模型路径：比如sd-webui\models\lora都配置好之后，点击run.bat文件启动。

如何使用 AI 来做事：一份带有观点的指南

当我们现在谈论人工智能时，我们通常谈论的是大型语言模型或简称为LLMs。大多数AI应用程序都由LLM驱动，其中只有几个基础模型，由少数几个组织创建。每家公司都通过聊天机器人直接访问他们的模型：OpenAI制作了GPT-3.5和GPT-4，它们驱动了[ChatGPT](https://chat.openai.com/)和微软的[Bing](https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx&sydconv=1)（在Edge浏览器上访问）。Google在[Bard](https://bard.google.com/)的标签品牌下有各种模型。Anthropic制造了Claude和[Claude 2](https://claude.ai/)。还有其他我不会讨论的LLMs。第一个是[Pi](https://pi.ai/talk)，一个由Inflection构建的聊天机器人。Pi针对对话进行了优化，真的、真的想成为你的朋友（真的，试试看我在说什么）。它不喜欢做除了聊天之外的任何事情，尝试让它为你工作是一种令人沮丧的事情。我们也不会涵盖任何人都可以使用和修改的各种开源模型。它们通常对今天的普通用户来说不是很容易使用或有用，但是有真正的希望。未来的指南可能会包括它们。因此，这是一份快速参考图表，总结了LLM的现状：

微调（Fine-tuning）

以下假设您已经按照上述说明准备了训练数据。使用OpenAI CLI开始微调工作：您从哪里BASE_MODEL开始的基本模型的名称（ada、babbage、curie或davinci）。您可以使用后缀参数自定义微调模型的名称。运行上面的命令会做几件事：1.使用文件API上传文件（或使用已经上传的文件）2.创建微调作业3.流式传输事件直到作业完成（这通常需要几分钟，但如果队列中有很多作业或您的数据集很大，则可能需要数小时）每个微调工作都从一个默认为curie的基本模型开始。模型的选择会影响模型的性能和运行微调模型的成本。您的模型可以是以下之一：ada、babbage、curie或davinci。请访问我们的定价页面，了解有关微调费率的详细信息。开始微调作业后，可能需要一些时间才能完成。在我们的系统中，您的工作可能排在其他工作之后，训练我们的模型可能需要几分钟或几小时，具体取决于模型和数据集的大小。如果事件流因任何原因中断，您可以通过运行以下命令恢复它：工作完成后，它应该显示微调模型的名称。除了创建微调作业外，您还可以列出现有作业、检索作业状态或取消作业。