在 Flux 炼丹中,炼丹物品的打标步骤如下:
在打标过程中还需注意以下几点:
选一个基础大模型,我使用的是“麦橘写实”,然后填一个lora的名字。准备好之后,将照片导入到丹炉,选择适合的分辨率,可以勾选“脸部加强训练”,然后点击“预处理”。其实这里有一个自动的裁剪模式,但是我试过觉得自动的不太靠谱,所以还是手动裁吧。预处理之后,就会出现一个脸部的文件夹,和一个整体的文件夹,并且每一张照片都已经自动打好了tag标签。我们可以给整体添加统一的标签,也可以单独给每一张修改标签。这个标签的作用主要是帮助AI去理解我们的图片,告诉它画面里面有什么。这里要注意的是,如果你想让这个特征成为人物的固定的效果,你就不要填写这个关键词。比如我不描写他的发型,只描写他的头发颜色,那么后期出图的时候,他的发型就不能被改变,但是头发颜色却可以被改变。这个过程挺漫长的,每一张图片都要仔细检查,打标的好坏会影响到后面人物lora是否有比较好的泛化性。所以如果你想让你的人物能多一些变化,就尽量描述的详细一些吧。[heading1]#03[heading1]参数调整[content]前面两个环节比较重要,这个参数调节其实就可以佛系一点了。大部分参数是固定的,主要的几个按照我之前讲解过的人物参数配置一遍就可以了,后期再根据生成的结果来调整。设置好之后就可以开始训练了。[heading1]#04[heading1]炼丹[content]18张脸部图片,20张整体图片,各训练50步,循环训练10次,并行步数为1,所以训练总步数为19000,训练时长为45分钟,loss值为0.0769。从数值上来看是个不错的丹,但具体好坏还是要我们自己通过测试来判断,毕竟像不像只有我们自己知道。[heading1]#05
接下来会有注册为开发者的选项,大家可以注册个人开发者,按照流程填写即可。注册好之后,进入开发者信息,就可以看到AppID和密钥了。将信息填入,开启双语TAG,可以看到下面的tag就变成双语的了。接下来就是检查每幅图的tag,看看描述词是否和人物匹配,删除不正确的,新增一些你需要的。检查完没有问题之后,就可以点击“开始训练”,炼制我们的第一枚丹了。
[heading2]智慧章節本章节主要介绍Flux模型打标及训练相关内容。打标要用自然语言,语句精简,选好触发词和打标模型,推荐短标并检查。训练后模型在个人主页下载。测单以Forge为例,讲了参数设置、Lora改名等,还提及Lora权重、拟合判断,以及训练素材、人像素材数量和模型筛选标准。[01:45:26](https://waytoagi.feishu.cn/minutes/obcnla1pg28w36cej6ocjf3v?t=6326000)模型选择要点:避免过欠拟合,需大量测试筛选本章节从个人审美角度讲模型选择,要看图片拟合程度,过拟合画面会崩坏,欠拟合则像示例图的3号模型应直接淘汰。还提到模型泛化性问题,不同轮数模型学习程度不同,如十五号模型在人像和动植物方面表现好,但建筑方面差,因此需大量测试、筛选、测评。[01:47:23](https://waytoagi.feishu.cn/minutes/obcnla1pg28w36cej6ocjf3v?t=6443000)摩搭在线生图及Lora模型筛选、炼丹参数等使用经验分享本章节主要讲解炼丹及筛选素材集。介绍了摩搭在线生图方法,分享炼丹参数,建议先用素材原词测权重判断模型是否拟合,再用怪词测泛化性,根据人像肢体完整程度等筛选。提到20轮是摩搭训练模型的临界点,还说明了素材尺寸,解答了关于过拟合等疑问及分享素材准备流程。