Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我要用Sd做图片细化,要怎么做?给出具体方法

Answer

以下是使用 SD 做图片细化的具体方法:

  1. 对于更精确的蒙版,如人物的眼睛或配饰等,可使用 Segment Anything 中的 GroundingDINO。启用 GroundingDINO 后,AI 会自动下载模型,若没有魔法,可去云盘下载并放到指定文件目录下。在检测提示词中输入相关内容,如“eye”,AI 可自动检测并设置蒙版,还可通过预览箱体得到编号来选择调整单一部分。选择要修改的蒙版上传到重绘蒙版中,并添加提示词,如“闭眼”,点击生成即可完成修改。
  2. 给人物换背景时,加载生成的背景蒙版。大模型选择 revAnimated_v122,正向提示词可设为“简单背景、花、国画、工笔”,蒙版模式选择“重绘非蒙版内容”。若头发部分没抠好,可将其放入图生图中,使用 tile 模型做整体细化,还能给人物衣服添加国风元素。
  3. SD 扩图时,若原本图片尺寸为 1152x1152 需增高高度,可设置为(1152x1526)。ControlNet 设置方面,若无法识别处理,可采取以下措施:提高 ControlNet 的权重(增加预处理权重,降低引导介入时机直到为 0,增加引导终止时机直到为 1);降低重绘幅度(高清修复大图时使用);把原始的黑白二维码叠加在二维码上方(正片叠底,保留 4 个定位点,擦去其他地方),调节透明度;使劲抽卡。
  4. SD 放大通常重绘幅度设置在 0.3 以下,使用 tile 模型时可提高重绘幅度,如保持重绘幅度为 1 放大 1.5 倍绘图,能加强画面细节且不崩坏。对于草图,可将其导入 ControlNet 中,添加提示词进行细化,还可通过改变控制模式和增加关键词来优化效果,如实现随机提示词转换,用提示词对参考图做出调整。
Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】商业换装如此简单,Segment Anything保姆级教学

但有的时候,我们需要更精确一点的蒙版,比如人物的眼睛,或者是身上的配饰等等。单靠SAM模型就很难得到想要的蒙版了,这个时候我们就需要使用到segment anything中的GroundingDINO了。启用GroundingDINO,AI会自动下载模型,此时会需要用魔法,没有魔法的同学可以去我的云盘直接下载。放到这个文件目录下“……sd-webui-aki-v4.2\extensions\sd-webui-segment-anything\models\grounding-dino”点击启用,在检测提示词中输入“eye”,AI就可以根据语义分割帮我们自动检测出眼睛的部分,并设置好蒙版。我们还可以通过预览箱体,来得到两只眼睛的编号,通过编号可以选择调整单一的眼睛。比如,我只想调整左边那只眼睛,我就只需要勾选1就可以了。和刚才一样,选择我们想要修改的蒙版,上传到重绘蒙版当中。添加提示词“闭眼”。点击生成,可以看到图片就修改好了。我们再来给人物换个背景试试,加载刚才生成的背景蒙版。大模型选择revAnimated_v122,正向提示词:简单背景、花、国画、工笔。蒙版模式选择“重绘非蒙版内容”。得到这张图片,头发的部分没有抠太好。我们将它再次放入图生图中,使用tile模型做一次整体细化,除了融合人物之外,还能给人物的衣服也添加上国风元素。生成,人物好像变得高级了一些。来到PS,使用创成式填充修复一下头发。完成啦。

教程:详细二维码

和第二步一样的关键词和模型发送过来,按照下面的参数设置我原本的图片尺寸是1152x1152我需要增高高度这里设置为(1152x1526)ControlNet设置[heading3]4、无法识别处理[content]能扫码不能长按识别1、提高ControlNet的权重(增加预处理权重,降低引导介入时机直到为0,增加引导终止时机直到为1)2、或降低重绘幅度(高清修复大图的时候才用的上)3、把原始的黑白二维码叠加在二维码上方(正片叠底,保留4个定位点,擦去其他地方),调节下透明度。4、使劲的抽卡!!!

【SD】最强控制插件ControlNet(4)细节狂魔tile

SD放大的原理就是利用分区的方式将图片切成多块,然后每一块分开渲染,最终合并成一张图。但是这样渲染有一个缺点,就是重绘幅度不能开得太大,开得太大的后果就是每一块分区里面都有可能生成新的人物。当我将重绘幅度调到1,放大刚才那张图片,结果就变成了这样,每一个分区之中都产生了新的绘画。通常情况下,使用SD放大,重绘幅度都设置在0.3以下。这时,我们使用tile模型,还是保持重绘幅度为1,放大1.5倍,进行绘图。由于重绘幅度的提高,画面的细节得到了非常大的加强,但是可以看到,在tile模型的加持下,如此高的重绘幅度并没有导致画面崩坏。当然在一般情况下,也不需要将重绘幅度刻意调这么高,因为太多的细节也会影响图片的观感。放大之后,拿来做手机壁纸也非常漂亮了。补齐草稿当我们有一张这样的草图的时候,我们可以利用Tile模型对它进一步细化。将图片导入到ControlNet中,提示词为“一间木屋,两棵树”。这是细化之后的结果,tile的这个功能可以帮助我们对简单的色块草稿做细化,提供一些设计灵感。我们再增加一点关键词——“一间长满鲜花的木屋”,并将下面的控制模式改为“更注重提示词”。生成一下,是不是更惊艳了,这个用法就是我们最后要讲的一个tile的功能,也是它的最强功能——随机提示词转换。随机提示词转换这个用法的主要效果,就是可以用提示词对我们的参考图做出调整。比如我这里找到一张钢铁侠的图片,我想要用这个动作来绘制一个美国队长的形象。

Others are asking
Sd文生图的专业术语有哪些
以下是一些关于 SD 文生图的专业术语: 1. 内容型提示词:主要用于描述想要的画面,如“1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面”。 2. 标准化提示词:例如“,drawing,paintbrush”。 3. 权重:通过括号和特定数值来增加提示词的权重,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。 4. 反向提示词:告诉 AI 不要的内容,如“NSFw,”。 5. 采样迭代步数:指 AI 绘画去噪的次数,步数越高绘画越清晰,但绘画速度越慢,通常数值控制在 20 40 之间较好。 6. 采样方法:AI 生成图像时的特定算法,常用的有“Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM”。 7. 比例:尺寸并非越大越好,模型练图通常按 512x512 的框架绘制,高宽比尽量在这个数值附近。高清修复可放大图像倍率,高宽比主要控制画面比例。
2024-12-16
Sd中,使用CN时候,进行预处理跟不进行预处理有什么区别?
在 SD 中,使用 CN(ControlNet)时,进行预处理和不进行预处理会对生成的图像产生不同的影响。 进行预处理可以更好地控制生成的图像,例如通过使用 Canny 预处理可以保留花纹图案细节,使用tile 预处理可以固定画面等。不进行预处理则可能导致生成的图像效果不稳定,需要更多的调整和尝试。 因此,建议在使用 CN 时进行预处理,以获得更好的生成效果。
2024-05-04
我要写论文,需要用什么ai工具‘
在论文写作中,以下是一些常用的 AI 工具: 1. 文献管理和搜索: Zotero:结合 AI 技术,能自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便进行数据分析和可视化。 Knitro:用于数学建模和优化,助力复杂数据分析和模型构建。 4. 论文结构和格式: LaTeX:虽不是纯粹的 AI 工具,但结合自动化和模板,能高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化论文编写。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 利用 AI 写课题的步骤和建议如下: 1. 确定课题主题:明确研究兴趣和目标,选择有价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具搜集相关文献和资料。 3. 分析和总结信息:借助 AI 文本分析工具提取关键信息和主要观点。 4. 生成大纲:用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的大纲。 5. 撰写文献综述:利用 AI 工具确保内容准确完整。 6. 构建方法论:根据研究需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若涉及数据收集和分析,使用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:借助 AI 写作工具撰写各部分,并检查语法和风格。 9. 生成参考文献:使用 AI 文献管理工具生成正确格式。 10. 审阅和修改:用 AI 审阅工具检查逻辑性和一致性,根据反馈修改。 11. 提交前的检查:使用抄袭检测工具确保原创性,做最后的格式调整。 AI 文章排版工具方面: 1. Grammarly:不仅检查语法和拼写,还具备一定排版功能,可改进文档风格和流畅性。 2. QuillBot:AI 驱动的写作和排版工具,能改进文本清晰度和流畅性。 3. Latex:常用于学术论文排版,使用标记语言描述格式,有 AI 辅助的编辑器和插件简化过程。 4. PandaDoc:文档自动化平台,用 AI 帮助创建、格式化和自动化生成文档,适用于商业和技术文档。 5. Wordtune:AI 写作助手,重新表述和改进文本,使其更清晰专业。 6. Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作排版。 选择合适的 AI 文章排版工具需考虑文档类型、出版标准和个人偏好。学术论文常用 Latex 和 Overleaf,一般文章和商业文档则 Grammarly 和 PandaDoc 等可能更适用。
2025-04-14
我要根据PPT开发一个网页,请详细提供操作步骤和选择哪一个AI工具更合适。
以下是根据 PPT 开发网页的详细操作步骤以及适用的 AI 工具: 一、生成 PDF 1. 将您的文件转换为 PDF 格式,其他文件格式也可行,但 PDF 效果更佳。 2. 若希望在文章中加入图片,需将图片转换为 Markdown 格式。 网络图片:直接复制图片的 URL,右键图片选择复制 URL,然后用 Markdown 格式写入文档。 自己的图片:使用图床服务(如 https://sm.ms/)托管图片,生成公链。 3. 插入视频:先将本地视频上传到公网(如 B 站),在视频页面寻找“分享”按钮,点击“嵌入”或“嵌入代码”选项获取 URL,用 Markdown 格式写入。 二、适用的 AI 工具 1. 爱设计 网址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 输入大纲和要点: 导入大纲和要点 输入主题自动生成大纲和要求 选择模版并生成 PPT 导出 2. MindShow 网址:https://www.mindshow.fun//home 输入大纲和要点: 导入大纲和要点 输入主题自动生成大纲和要求 选择模版并生成 PPT 导出 3. Process ON 网址:https://www.processon.com/ 输入大纲和要点: 导入大纲和要点: 手动复制(相对耗时) 导入方式:复制最终大纲内容到本地 txt 文件,将后缀改为.md(若看不见后缀可自行搜索开启),打开 Xmind 软件导入 md 文件,在 Process ON 导入 Xmind 文件。 输入主题自动生成大纲和要求:新增思维导图,输入主题点击 AI 帮我创作。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版再点击下载。若喜欢使用且无会员,可在某宝买一天会员。
2025-04-13
推荐几个AI工具及其使用方法,我要用于病案质控
以下为您推荐几个可用于病案质控的 AI 工具及其使用方法: 1. Scite.ai:这是一个为研究人员、学者和行业专业人员打造的创新平台,旨在增强他们对科学文献的洞察。它提供了一系列工具,如引用声明搜索、自定义仪表板和参考检查,这些都能简化您的学术工作。您可以通过访问使用。 2. Scholarcy:这是一款科研神器,主要为做科研、学术、写论文的人准备。它可以从文档中提取结构化数据,并通过知识归纳引擎生成文章概要,精炼地呈现文章的总结信息,分析中包含关键概念、摘要、学术亮点、学术总结、比较分析、局限等板块的内容。您可以通过使用。 3. ChatGPT:这是一个强大的自然语言处理模型,可以提供有关病案质控的修改意见。您可以向它提供您的文章,并提出您的问题和需求,它将尽力为您提供帮助。您可以通过使用。 这些工具可以帮助您从不同的角度审视和改进您的病案质控工作,您可以根据自己的具体需求选择合适的工具进行尝试。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-04-13
如果我要分析代码功能
如果您要分析代码功能,可以参考以下步骤: 1. 准备工作: 分析要拷贝页面的技术栈,可通过打开 https://www.wappalyzer.com/ 输入要分析的网站地址获取。 截图要克隆的网页。 分析页面功能,如顶部导航栏、页面主体区域(包括分类在左边、文章列表在右边、标题位置、文章卡片展示位置、文章列表和分类区域)、底部导航栏。 2. 开始克隆出效果,并逐渐完善: 根据分析拆分后续要实现的内容,如先实现文章列表部分和底部导航栏。 对于文章列表部分,可使用提示词根据图片实现,注意不要直接点击全部接受,先看效果,不符合需求可拒绝或让 AI 解释新增代码的作用。 对于左侧菜单栏,可通过提示词实现,如要求内容是文章的分类,在页面滚动时菜单会吸顶。若出现异常,可选中所有异常添加到对话,让 AI 解决。 可让 AI 添加注释解释每段代码对应的功能,以便精准提出修改建议。 明确提示词,说清楚要实现的功能的位置、大小、效果。 3. 对于 AI Review(测试版): 这是一项可查看代码库中最近更改以捕获潜在错误的功能。 您可以单击各个审阅项以查看编辑器中的完整上下文,并与 AI 聊天获取详细信息。 为让其更有利,您可为 AI 提供自定义说明以专注于特定方面,如性能相关问题。 目前有几个选项可供选择进行审核,如查看工作状态、查看与主分支的差异、查看上次提交。
2025-04-09
我是一名日语大四学生,我要利用我的开题报告结合deepseek完成一篇论文初稿,请问怎么向deepseek提问
要向 DeepSeek 提问以结合您的开题报告完成论文初稿,您可以遵循以下正确的提问模板: 1. 赋予角色(选填):对 DeepSeek 赋予一个特定的角色,以便它能更专业地回答您的问题。 2. 背景/现状(必填):提供尽可能详细的背景信息,例如您的开题报告的主题、研究目的、已有的研究进展等,以使 DeepSeek 更好地理解您的问题。 3. 需求/目标(必填):明确告诉 DeepSeek 您的需求,比如您希望它根据开题报告提供论文大纲、分析相关数据、提供文献综述等,提出的需求越明确获得的答案越有价值。 4. 补充要求:您还可以提出关于回答的格式、风格、字数等方面的要求。 例如:您可以这样提问“我赋予您论文撰写助手的角色,我的开题报告主题是关于日本文化在现代社会中的变迁,目前我已经完成了初步的文献收集和分析,我的目标是请您根据这份开题报告为我生成一个详细的论文大纲,要求大纲结构清晰,逻辑连贯,具有一定的创新性”。
2025-03-31
我是一名日语大四学生,我要利用我的开题报告和文献综述结合deepseek完成一篇论文初稿,请问怎么向deepseek提问
向 DeepSeek 提问时,可遵循以下万能通用的提问公式:提示词=赋予角色+背景/现状+目标/需求+补充要求。 1. 赋予角色(选填):对 DeepSeek 赋予一个特定的角色,以便它能更专业地回答您的问题。 2. 背景/现状(必填):提供尽可能详细的背景信息,以使它更好地理解您的问题,并为您提供更准确的答案。例如您是日语大四学生,正在进行开题报告和文献综述相关工作。 3. 需求/目标(必填):明确告诉 DeepSeek 您的需求,比如完成一篇结合开题报告和文献综述的论文初稿。 4. 补充要求:例如指定写作风格要具有吸引力、友好性和幽默感等。 另外,在使用 DeepSeek 时还需注意: 对于像“仅通过东方集团的历年公开财务数据,分析这家公司的潜在投资机会和风险”这样的特定需求,可能需要进一步追问以获得更满意的结果。 与 DeepSeek 交流时,在其提供方法建议后,可以追问背后的方法论。 对于创作类的需求,如脱口秀段子,可以结合特定人物的特点和风格,并指定主题和字数等要求。
2025-03-31
正在搭建客户CRM系统,对于客户拜访跟进记录表格,希望平衡销售人员的录入便捷性和信息完整性,如何通过多维表格接入的AI功能来简化信息录入,比如通过语音录音,直接解析内容。推荐我具体方法,包括怎么解析语音,输出的关键字段,以及提示词
以下是一种通过多维表格接入的 AI 功能来简化客户拜访跟进记录信息录入的方法: 1. 定义任务目标:让 AI 成为您的私人 CRM,即客户管理系统。 2. 编写指令: 定义角色:希望 AI 作为一名顶级的客户服务与销售总监,负责记住客户的爱好与信息。 提供背景信息:简单描述自己的身份,例如负责什么产品的销售。 明确任务目标和输出要求:在每次拜访客户后,把重要信息发送给 AI,要求 AI 每次接到新的客户消息后,只用回复一句“收到,知道了。” 3. 信息录入方式:可以通过语音录音的方式将拜访客户的信息传达给 AI。 4. 语音解析:利用 AI 的语音识别和自然语言处理能力,对语音内容进行解析。 5. 输出的关键字段:可能包括客户姓名、联系方式、拜访时间、拜访内容要点、客户需求、客户反馈等。 6. 提示词:例如“请整理本次拜访客户的关键信息”“提取重要内容并生成表格”等。 您可以参考以上方法,根据实际需求进行调整和优化。
2025-03-07
当前DEEPSEEK发展壮大情况下,个人应具备AI方面什么能力避免被时代淘汰,如何提升这些能力,细化具体可执行的步奏
在 DEEPSEEK 发展壮大的情况下,个人为避免被时代淘汰,应具备以下 AI 方面的能力并通过以下具体可执行的步骤来提升: 1. 善用工具: 历史表明,使用工具的人通常表现更优,人类发展就是工具演化的过程。 不会用 AI 工具自动化重复性任务,可能面临被淘汰,应适应这种转变。 因自动化效率提升,可腾出时间进行高层次思考。 具体步骤:积极学习和掌握 AI 工具的使用方法,将重复性工作交给工具处理,培养利用工具提升效率的习惯。 2. 抽象与整合: “大语言模型”压缩了大量知识,可快速回放,无需直接学习所有知识细节,要在更高层次学习并抽象更多细节。 AI 能使人类更易学习技能或知识,技术进步使“整合”而非专业化成为可能,人们在更高层次工作,为 AI 提供方向并作选择。 具体步骤:锻炼高层次的思维能力,学会从复杂信息中提炼关键要点,不断提升整合能力,将精力集中于制定“策略”,把执行细节交给自动化系统。
2025-02-24
如何将传统知识库通过LLM能力转化成更智能与精细化的知识库?包括但不限于分段、QA问答和图片解析描述和总结
将传统知识库通过 LLM 能力转化为更智能和精细化的知识库是一个复杂但可行的过程,以下是一些关键步骤和方法: 1. 数据预处理:对传统知识库中的内容进行清理、格式化和标准化,确保数据的质量和一致性。 2. 内容分段:根据主题和逻辑结构,将长篇的知识内容合理分段,使信息更易于理解和处理。 3. 提取关键信息:从文本中提取重要的概念、实体和关系,为后续的问答和总结做准备。 4. 构建 QA 问答对:分析知识库中的内容,设计有针对性的问题和准确的答案,形成问答对,以方便用户快速获取所需信息。 5. 图片解析描述:对于包含图片的内容,使用图像识别技术提取关键元素,并进行详细的描述和解释。 6. 总结归纳:对分段后的内容进行总结,提炼核心要点,帮助用户快速了解主要内容。 在实施过程中,需要不断优化和调整方法,以确保转化后的知识库能够满足用户的需求,提供更高效和准确的服务。
2024-11-18
某银行计划对外采购2024年分行内训师培训项目,现需要对采购内容做详细要求,培训内容以AI工具课程开发与设计,课程制作与实践,短视频制作,直播授课技巧等,我该如何对培训老师资质,授课经验,AI工具运用等技能做细化要求
以下是为您提供的关于银行采购 2024 年分行内训师培训项目中对培训老师资质、授课经验、AI 工具运用等技能的细化要求建议: 培训老师资质: 具备相关领域的专业教育背景,如计算机科学、人工智能等。 持有相关的行业认证或资格证书。 授课经验: 拥有丰富的企业内训经验,特别是在金融行业的培训经历。 成功完成过类似 AI 工具课程开发与设计、课程制作与实践等相关课程的授课。 AI 工具运用技能: 熟练掌握多种主流的 AI 工具,如常见的机器学习框架、自然语言处理工具等。 能够运用 AI 工具进行实际项目开发,并具有相关的案例成果。 熟悉短视频制作和直播授课中涉及的 AI 辅助技术,如智能剪辑工具、虚拟主播技术等。 希望以上建议对您有所帮助。
2024-09-13