Chat with Wiki - 模型蒸馏

Answer

模型蒸馏是指教师模型将知识蒸馏给学生模型，有多种蒸馏方式。其应用场景广泛，例如在车机等算力有限的场景中，能让小模型在特定领域取得良好效果，还能实现低成本高速推理和修复模型幻觉。

在实际操作中，PaaS 平台支持多机分布式部署，满足推理性能要求，能一站式完成模型蒸馏。例如在阿里云 PAI 平台上进行模型蒸馏微调时，由于上一步中蒸馏的数据集很小，不足以改变模型权重，因此可以使用别人做好的数据集。在使用前可以打开查看里面的结构，和蒸馏出来的数据结构是否一致。然后下载并解压数据集，在 PAI 平台的数据集中找到 OSS 存储，建立数据集并上传。接着选择模型进行部署训练，如选择 7b-instruct 的原生模型，选择训练，注意超参配置。训练完成后可以测试模型效果，在 model gallery 里面找到训练好的模型进行部署和调试。

此外，ComfyUI 原生支持 FLUX.1，FLUX.1 有三个变体：FLUX.1[pro]、FLUX.1[dev]和 FLUX.1[schnell]。FLUX.1[pro]通过 API 提供，被认为是最强的模型；FLUX.1[dev]具有非商用许可，是从“FLUX.1[pro]”提炼得出；FLUX.1[schnell]是一个蒸馏的 4 步模型，拥有 Apache 2.0 商用许可，适用于在本地进行部署或者个人使用。相关模型的链接、模型与工作流地址以及说明文档均可获取。

在云端部署操作方面，登录 Pad 控制台，通过 model gallery 进行部署，如 Deepseek R1 模型，可选择 SG 浪或 Vim 推理框架，根据资源出价，部署后可在模型在线服务 EAS 查看状态。模型试用可以使用 postman，通过修改接口和复制文档中的内容进行在线调试，发送请求查看状态码，根据模型名称和相关要求输入内容进行试用。同时要注意模型 API 的调用方法，包括查找位置、获取 token 等，使用后要及时停止或删除服务以避免持续付费。

Content generated by AI large model, please carefully verify (powered by aily)

References

智能纪要：02-26 | DeepSeek部署+蒸馏 2025年2月26日

AI模型的云端部署与试用PaaS平台特性：PaaS平台支持多机分布式部署，满足推理性能要求，使用独占资源和专有网络，能一站式完成模型蒸馏。模型价格差异：简单应用开发平台交付产品价格在千元、万元或几十万元级别，为公司打造专有模型价格更高。云端部署操作：登录Pad控制台，通过model gallery进行部署，如Deepseek R1模型，可选择SG浪或Vim推理框架，根据资源出价，部署后可在模型在线服务EAS查看状态。模型试用方法：使用postman，通过修改接口和复制文档中的内容进行在线调试，发送请求查看状态码，根据模型名称和相关要求输入内容进行试用。作业布置：部署成功一个大语言模型，通过调试证明成功，在调试内容中带上钉钉昵称向模型对话，将成功结果提交问卷可获得阿里云小礼包。模型蒸馏及相关部署操作API调用与服务关停：介绍了模型API的调用方法，包括查找位置、获取token等，强调使用后要及时停止或删除服务以避免持续付费。模型蒸馏概念：教师模型将知识蒸馏给学生模型，有多种蒸馏方式，如R1通过蒸馏数据集并用于学生模型微调。蒸馏应用场景：包括车机等算力有限场景，能让小模型在特定领域有良好效果，还能实现低成本高速推理和修复模型幻觉。模型部署实操：在model gallery中选择模型，如1000问7B指令模型，进行部署，选择VIM加速和竞价模式，查看部署状态和日志。

基于阿里云PAI平台: 复现R1蒸馏+蒸馏训练模型过程

由于我们上一步中蒸馏的数据集很小,不足以改变模型权重,因此我们使用一个别人做好的数据集.在使用前可以打开看下里面的结构,和我们蒸馏出来的数据结构是一致的.[Bespoke-Stratos-17k_thought.json.zip](https://bytedance.feishu.cn/space/api/box/stream/download/all/Wk2fbCI5YohTIxxn1XIclRAZn4e?allow_redirect=1)1.建立你用于训练的数据集下载并解压这个数据集,然后在PAI平台的数据集中找到你的OSS存储,建立数据集.然后上传数据集:1.开始部署模型进行训练选择这个7b-instruct的原生模型,选择训练选择全参微调,并选择自定义数据集:注意超参需要这么配置:系统提示词的内容如下:最后体现在我们的配置上就是这样的:这个训练要求需要使用灵骏的资源,比如8卡H100,需要的显存比较大:点击训练就可以开始训练了.如果在DLC里看到下面的状态就是训练成功了.1.训练完成就可以测试模型效果了同样在model gallery里面找到训练好的模型,点击右上角的部署.使用vllm部署.部署完成后,使用如下命令调试(注意大小写):

ComfyUI FLUX

ComfyUI原生支持FLUX.1有三个变体：FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell]1.FLUX.1[pro]：通过API提供，被认为是最强的模型，在指令跟随、视觉质量、图像细节以及多样性方面表现出色。2.FLUX.1[dev]：具有非商用许可，是从“FLUX.1[pro]”提炼得出。显卡不够的,用下面这个模型:fp8版本的flux1-dev-fp8模型（12GB VRAM运行）3.FLUX.1[schnell]：Flux Schnell是一个蒸馏的4步模型,拥有Apache 2.0商用许可，属于4步模型，适用于在本地进行部署或者个人使用。模型链接FLUX.1[dev]https://huggingface.co/black-forest-labs/FLUX.1-dev/tree/mainFLUX.1[dev fp8]https://huggingface.co/Kijai/flux-fp8FLUX.1[schnell]https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main模型比较大,下载慢的可以从网盘里下.模型与工作流地址https://pan.quark.cn/s/2797ea47f691https://pan.baidu.com/s/1nV26Fhn3WYBLrg2hSA0_YQ?pwd=cycy说明文档https://xiaobot.net/post/8fd64f3f-52d1-4948-824d-5ee0c38e2594