模型蒸馏是指教师模型将知识蒸馏给学生模型,有多种蒸馏方式。其应用场景广泛,例如在车机等算力有限的场景中,能让小模型在特定领域取得良好效果,还能实现低成本高速推理和修复模型幻觉。
在实际操作中,PaaS 平台支持多机分布式部署,满足推理性能要求,能一站式完成模型蒸馏。例如在阿里云 PAI 平台上进行模型蒸馏微调时,由于上一步中蒸馏的数据集很小,不足以改变模型权重,因此可以使用别人做好的数据集。在使用前可以打开查看里面的结构,和蒸馏出来的数据结构是否一致。然后下载并解压数据集,在 PAI 平台的数据集中找到 OSS 存储,建立数据集并上传。接着选择模型进行部署训练,如选择 7b-instruct 的原生模型,选择训练,注意超参配置。训练完成后可以测试模型效果,在 model gallery 里面找到训练好的模型进行部署和调试。
此外,ComfyUI 原生支持 FLUX.1,FLUX.1 有三个变体:FLUX.1[pro]、FLUX.1[dev]和 FLUX.1[schnell]。FLUX.1[pro]通过 API 提供,被认为是最强的模型;FLUX.1[dev]具有非商用许可,是从“FLUX.1[pro]”提炼得出;FLUX.1[schnell]是一个蒸馏的 4 步模型,拥有 Apache 2.0 商用许可,适用于在本地进行部署或者个人使用。相关模型的链接、模型与工作流地址以及说明文档均可获取。
在云端部署操作方面,登录 Pad 控制台,通过 model gallery 进行部署,如 Deepseek R1 模型,可选择 SG 浪或 Vim 推理框架,根据资源出价,部署后可在模型在线服务 EAS 查看状态。模型试用可以使用 postman,通过修改接口和复制文档中的内容进行在线调试,发送请求查看状态码,根据模型名称和相关要求输入内容进行试用。同时要注意模型 API 的调用方法,包括查找位置、获取 token 等,使用后要及时停止或删除服务以避免持续付费。
AI模型的云端部署与试用PaaS平台特性:PaaS平台支持多机分布式部署,满足推理性能要求,使用独占资源和专有网络,能一站式完成模型蒸馏。模型价格差异:简单应用开发平台交付产品价格在千元、万元或几十万元级别,为公司打造专有模型价格更高。云端部署操作:登录Pad控制台,通过model gallery进行部署,如Deepseek R1模型,可选择SG浪或Vim推理框架,根据资源出价,部署后可在模型在线服务EAS查看状态。模型试用方法:使用postman,通过修改接口和复制文档中的内容进行在线调试,发送请求查看状态码,根据模型名称和相关要求输入内容进行试用。作业布置:部署成功一个大语言模型,通过调试证明成功,在调试内容中带上钉钉昵称向模型对话,将成功结果提交问卷可获得阿里云小礼包。模型蒸馏及相关部署操作API调用与服务关停:介绍了模型API的调用方法,包括查找位置、获取token等,强调使用后要及时停止或删除服务以避免持续付费。模型蒸馏概念:教师模型将知识蒸馏给学生模型,有多种蒸馏方式,如R1通过蒸馏数据集并用于学生模型微调。蒸馏应用场景:包括车机等算力有限场景,能让小模型在特定领域有良好效果,还能实现低成本高速推理和修复模型幻觉。模型部署实操:在model gallery中选择模型,如1000问7B指令模型,进行部署,选择VIM加速和竞价模式,查看部署状态和日志。
由于我们上一步中蒸馏的数据集很小,不足以改变模型权重,因此我们使用一个别人做好的数据集.在使用前可以打开看下里面的结构,和我们蒸馏出来的数据结构是一致的.[Bespoke-Stratos-17k_thought.json.zip](https://bytedance.feishu.cn/space/api/box/stream/download/all/Wk2fbCI5YohTIxxn1XIclRAZn4e?allow_redirect=1)1.建立你用于训练的数据集下载并解压这个数据集,然后在PAI平台的数据集中找到你的OSS存储,建立数据集.然后上传数据集:1.开始部署模型进行训练选择这个7b-instruct的原生模型,选择训练选择全参微调,并选择自定义数据集:注意超参需要这么配置:系统提示词的内容如下:最后体现在我们的配置上就是这样的:这个训练要求需要使用灵骏的资源,比如8卡H100,需要的显存比较大:点击训练就可以开始训练了.如果在DLC里看到下面的状态就是训练成功了.1.训练完成就可以测试模型效果了同样在model gallery里面找到训练好的模型,点击右上角的部署.使用vllm部署.部署完成后,使用如下命令调试(注意大小写):
ComfyUI原生支持FLUX.1有三个变体:FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell]1.FLUX.1[pro]:通过API提供,被认为是最强的模型,在指令跟随、视觉质量、图像细节以及多样性方面表现出色。2.FLUX.1[dev]:具有非商用许可,是从“FLUX.1[pro]”提炼得出。显卡不够的,用下面这个模型:fp8版本的flux1-dev-fp8模型(12GB VRAM运行)3.FLUX.1[schnell]:Flux Schnell是一个蒸馏的4步模型,拥有Apache 2.0商用许可,属于4步模型,适用于在本地进行部署或者个人使用。模型链接FLUX.1[dev]https://huggingface.co/black-forest-labs/FLUX.1-dev/tree/mainFLUX.1[dev fp8]https://huggingface.co/Kijai/flux-fp8FLUX.1[schnell]https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main模型比较大,下载慢的可以从网盘里下.模型与工作流地址https://pan.quark.cn/s/2797ea47f691https://pan.baidu.com/s/1nV26Fhn3WYBLrg2hSA0_YQ?pwd=cycy说明文档https://xiaobot.net/post/8fd64f3f-52d1-4948-824d-5ee0c38e2594