Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

SD和MJ出图的效果怎么样？

Answer

SD（Stable Diffusion）和 MJ（Midjourney）出图效果各有特点：

初步生成方面：DALL-E 3 具有强大的文本识别能力，能快速生成符合意图的画面；MJ 则通过垫图功能（--Sref 和--iw 组合）确保图像风格一致。
图像优化方面：对于 DALL-E 3 和 MJ 跑不出来的图，SD 可用于图像的细节处理，尤其是局部重绘，如调整人物手部细节。
角色原画设计方面：相较于 SD，MJ 能生成更多样、更具设计感的角色设计，不受制于特定模型风格。使用 Midjourney + Stable Diffusion 混合模式进行原画设计，有两到三次的 Prompt 调整空间，能运用 SD Controlnet 的各种功能对设计细节进行更多更细致的调节，可产出更合理的结构、更丰富的细节，效率极高，在合适条件下一个完整方案产出示例不超过十五分钟，还能极大避免 Midjourney 可能造成的版权争议和信息泄露风险。
模型表现方面：在 UI 设计的图标类型中，SDXL 的训练素材可能较久远，表现不如 MJ。Stability AI 称 SDXL 能识字，能还原文字内容，但字形和图像效果不如 MJ。您可以在Clipdrop、Dreamstudio体验最新版本的 SDXL，也可以在https://platform.stability.ai/使用 SDXL 的 API 构建内容。

Content generated by AI large model, please carefully verify (powered by aily)

Others are asking

风格化mj提示词

以下是关于 Midjourney 风格化提示词的相关内容：仿照 GPTs 里的 MJ prompt 改的提示词可用于 coze 或其他国内的 agent。MJ 对节点无要求，画插图可不切节点，不挑模型，提示词可让 agent 补全润色。例如：“一个巨大鲸鱼头部的特写，鲸鱼的眼睛显示疲惫的神情，一个小女孩站在鲸鱼的旁边抚摸鲸鱼的脸，小女孩占画面比例很小，体现鲸鱼的巨大，吉卜力工作室风格”的提示词为“A closeup of a huge whale's head with its tired eyes. A little girl in red dress stands beside the whale, gently touching its face. The girl takes up a small portion of the frame, emphasizing the whale's enormity. Created Using: soft colors, gentle lighting, wideangle lens, Ghibli Studio style ar 16:9 style raw niji 6”。 Midjourney V6 更新风格参考命令 2.0“sref”，常见问题如想要的新图像和 sref 图像差异大时，MJ 给出了三种办法：修改提示：语义细节太多时，编写提示用可取细节替换不需要的；风格不够时，修改提示使其更符合追求的风格。更改“sw”值：语义细节太多时，将“sw”从默认值 100 降低；风格不够时，将“sw”从默认值 100 提高。使用小权重强调或弱化不需要的画布元素。参数总览与举例： “No 否定提示”：在提示词末尾加上“no”可让画面中不出现某些内容，如“no plants”表示图像中不出现植物。 “Quality 生成质量”：在提示词后加上“quality”或“q”参数可更改生成图像花费时间和质量，高质量需更长处理时间和更多 GPU 分钟数。 “Seeds 种子值”：MJ 依靠噪点团起点“Seed”创建视觉噪音场生成初始图像，每个图像种子值随机生成，可指定，v4 模型中相同种子值和提示词产生相同图像结果，可用于生成连贯一致的人物形象或场景。 “Stylize 风格化”：使用 stylize 参数可让 Midjourney 生成更具艺术色彩、构图和形式的图像，低风格化值生成的图像与提示密切相关但艺术性较差，高风格化值产生的图像艺术性强但与提示关联性少，AI 自由发挥空间大。

MJ和runaway用什么软件代替比较好

以下是一些可以替代 MJ（Midjourney）和 Runway 的软件： Luma 发布的 DIT 视频生成模型 Dream Machine 图生视频表现惊艳，具有电影级效果。出图工具方面，还有 SD（Stable Diffusion）和悠船。MJ 稳定性好、协作性强且有成熟经验参考，但并非所有人都拥有；SD 有独特能力但需本地部署且上手门槛高；悠船对中文支持好、交互友好简单易上手，但管控严格，有很多敏感词不能使用。如果您想了解更多关于这些软件的详细信息或有其他特定需求，请进一步向我提问。

以下是关于如何使用 MJ（Midjourney）的详细说明： 1. 图像网格：使用 /imagine 命令可根据提示生成低分辨率图像选项网格。每个图像网格下方的按钮可用于创建图像的变体、升级图像或重新运行最后一个 Midjourney Bot 操作。 U1U2U3U4 按钮将图像与图像网格分开，方便下载或使用其他工具，如“缩小”“平移”。使用旧版 Midjourney 模型版本时，U 按钮会放大图像。重做（重新滚动）按钮可重新运行作业，重新运行原始提示生成新的图像网格。变化按钮（V1V2V3V4）可创建所选网格图像的增量变化，生成与所选图像整体风格和构图相似的新图像网格。 2. 放大图像：制作变体：创建放大图像的变体并生成包含四个选项的新网格。网页：在 Midjourney.com 上打开图库中的图像。最喜欢：标记您最好的图像，以便在 Midjourney 网站上轻松找到它们。 3. 模型个性化： MJ 发布了模型个性化 Personalization 或 'p' 的早期测试版本。每次写提示时，很多信息是“隐含的”，MJ 算法通常用社区综合偏好填补空白，而模型个性化会学习您的喜好来填补。模型个性化的要求：目前从成对排名中的投票和喜欢的探索页面上的图像中学习，需要大约 200 个成对排名/喜欢才能生效，可在排名页面查看评分数量或在 Discord 上输入 /info。使用方法：只需在提示后输入 'p'，或使用提示栏中的设置按钮为所有提示启用个性化功能。启用时会在提示后添加一个“代码”，可分享让其他人使用应用于该图像的个性化效果，还可以使用 's 100' 控制个性化效果的强度（0 为关闭，1000 为最大，100 为默认）。注意：个性化目前不是稳定功能，会随更多成对排名而变化，可能会推出算法更新，视为“不断变化的有趣功能”。 4. Midjourney V6 更新风格参考命令 2.0"sref"： 2 月 1 日初次发布了首个“一致风格”测试算法，称为“风格参考”，工作方式类似于图像提示，可提供一个或多个描述想要的一致风格的图像的 URL。使用方法：在提示后面输入 'sref' 以及一个指向图像的 URL，例如 'sref url A'。高级设置：使用多个图像 URL 并设置风格的相对权重，例如 'sref urlA::2 urlB::3 urlC::5'，通过 'sw 100' 设置风格化的总体强度（100 是默认值，0 表示关闭，1000 表示最大值），常规图像提示必须在 'sref' 之前。注意：MJ 可能会在接下来的几周内更新此功能，若提示倾向于照片逼真而想要冲突的插图风格，可能仍需在提示中添加文本说明，风格参考对图像提示没有直接影响，仅对至少包含一个文本提示的作业产生影响，计划稍后添加“一致角色”的功能，与 'cref' 参数使用方式相同。

去哪里使用mj

Midjourney 的使用方法如下：模型个性化：工作原理：模型个性化会学习您的喜好，以更符合您的口味生成图像。要求：目前从成对排名中的投票和您喜欢的探索页面上的图像中学习，需要大约 200 个成对排名/喜欢才能生效。您可以在排名页面查看评分数量，或在 Discord 上输入/info。使用方法：在提示后输入p，或使用提示栏中的设置按钮为所有提示启用个性化功能。启用时会在提示后添加一个“代码”，您可以分享此代码让他人使用应用于该图像的个性化效果。还可以使用s 100 控制个性化效果的强度（0 为关闭，1000 为最大，100 为默认）。注意事项：个性化目前不是稳定功能，会随您进行更多成对排名而变化，且可能会在接下来几周内推出算法更新。在 Discord 上的使用：与 Midjourney Bot 互动：可以在 Discord 上进行，Midjourney 服务器具有不同的界面和频道。直接消息：与直接消息中的 Midjourney 机器人进行一对一合作，获得更安静的体验。 Midjourney 官方服务器：提供协作和计费/技术支持渠道。频道列表：包括support 频道获取计费和技术支持，newbies 频道创建图像。会员名单：Midjourney Bot 使用命令生成图像，版主和指南可帮助解决计费和技术问题。 V6 更新风格参考命令 2.0"sref"：初次更新 1.0 说明：2 月 1 日，MJ 发布首个“一致风格”测试算法，称为“风格参考”，可提供一个或多个描述想要的一致风格的图像的 URL。如何使用：在提示后面输入sref 及图像的 URL，例如sref url A。系统会将图像 URL 视为“风格参考”，并尝试生成与其风格或美学相匹配的内容，适用于 V6 和 Niji V6（不适用于 V5 等）。高级设置：可使用多个图像 URL 并设置相对权重，例如sref urlA::2 urlB::3 urlC::5，通过sw 100 设置风格化的总体强度（100 是默认值，0 表示关闭，1000 表示最大值），常规图像提示必须在sref 之前。注意事项：MJ 可能会在接下来几周内更新此功能，若提示倾向于照片逼真而想要冲突的插图风格，可能仍需在提示中添加文本说明，风格参考对图像提示没有直接影响，仅对至少包含一个文本提示的作业产生影响，计划稍后添加“一致角色”功能，与cref 参数使用方式相同。

如何用mj有效地画三视图

要有效地用 Midjourney（MJ）画三视图，可以参考以下步骤： 1. 对于核心角色创建，如局长的三视图设计，先明确角色特点，使用 GPT4 生成相关描述。 2. 进行多次尝试和修改，根据团队成员的反馈不断调整。 3. 可以用 MJ 进行垫图生成，在保持原 IP 特点的基础上重新设计。 4. 如果 MJ 生成的效果不理想，可以结合其他工具，如用 Illustrator 手绘，再用 Stable Diffusion（SD）控图，后期利用 AI 工具生成拓展视频。需要注意的是，MJ 虽然在美术效果和设计能力上有进步，但仍可能存在局限，需要不断尝试和改进。

以下是关于 Midjourney（MJ）的相关信息： 1. 文字生成效果测试：MJ 在圣诞节前夕推出新版本 V6，聚焦于文字生成方面。使用英文文本输入，对英语提示词的识别效果变好，将需要生成的文本用双引号“text”包裹，输出的图片中便能出现所要求的文字。但带文字的图片生成仍受文本量、文字在画面中的占比、其他提示词数量和画面复杂程度等因素影响。为探究 V6 的文字生成能力开展了进一步实践测试。 2. 更新风格参考命令 2.0“sref”：2 月 1 日，MJ 发布首个“一致风格”测试算法，称为“风格参考”。工作方式类似于图像提示，在提示后面输入sref 及图像的 URL，可提供一个或多个 URL 并设置相对权重，还可通过sw 100 设置风格化总体强度。此功能适用于 V6 和 Niji V6，不适用于 V5 等。MJ 可能在接下来几周内更新此功能，风格参考对图像提示无直接影响，仅对至少包含一个文本提示的作业产生影响，计划稍后添加“一致角色”功能。 3. 角色一致性功能使用报告：MJ 推出角色一致性功能，以甜茶的图片为例进行测试。使用方式是在提示后输入`cref URL`附上人物图像的 URL，注意要在提示词后面，可使用`cw`修改参考强度，强度 100 是默认值，会使用面部、头发和衣服，强度 0 时只会关注面部。

以下是关于 SD 的一些教程：用 SD 做二维码：好看的二维码欣赏：第一个就是 qrbtf。最近新出了融合二维码教程。方法原文地址：https://stablediffusionart.com/qrcode/ 相关帖子展示了使用 Stable Diffusion 创建的艺术二维码，是使用定制训练的 ControlNet 模型生成的，人们也想出了在无自定义模型情况下制作 QR 码的方法。用 SD 做中文文字（持续更新中）：制作思路：将中文字做成白底黑字，存成图片样式。使用文生图的方式，使用大模型真实系，作者用的 realisticVisionV20_v20.safetensorsControlNet 预设置。输入关键词，如奶油的英文单词，Cream+Cake（加强质感），反关键词：Easynegative（负能量），反复刷机，得到满意的效果即可。同理可输出 C4D 模型，可自由贴图材质效果，3d,blender,oc rendering。如果希望有景深效果，也可以打开 depth（增加阴影和质感）。打开高清修复，分辨率联系 1024 以上，步数：2960。参考视频教程：【“牛逼”的教程来了！一次学会 AI 二维码+艺术字+光影光效+创意 Logo 生成，绝对是 B 站最详细的 Stable Diffusion 特效设计流程教学！AI 绘画进阶应用哔哩哔哩】https://b23.tv/c33gTIQ SD 的各种实践教程：线稿上色 Midjourney+Stable Diffusion：https://waytoagi.feishu.cn/wiki/AsbYwmfS6ikhr3kNsCocdPMEnUd 猫咪狗狗 lora：https://waytoagi.feishu.cn/wiki/JiQewVbOHi7tzakS23ecprxsnfg 字体设计机甲战士：https://waytoagi.feishu.cn/wiki/GUQ3w52elisr9ukIgkBc42UmnWd 做盲盒平面变 3D：https://waytoagi.feishu.cn/wiki/SCK8wV4PTiHQVKkvGRUcx0fcnTe MJ 出图 SD 放大：https://waytoagi.feishu.cn/wiki/E88nwOtk9ilRQskg3Qlc6ZHpnTf 七夕字体和图：https://waytoagi.feishu.cn/wiki/BjQ1wLRv0ivCLtk136VchSCqnpU 可爱毛粘字体：https://waytoagi.feishu.cn/wiki/NjhbwF1cTiQ5Xjkd3tNc1OWynZd

绘画工具sd怎么使用？

以下是关于绘画工具 SD 的使用方法： 1. 生成超大图像：若想用 SD 绘制超高分辨率图片（如 10000x768 的清明上河图），直接调分辨率不可行，会爆显存，正常尺寸设置最高到 2048。先在 PS 中设置所需大尺寸画布，保存为 jpg 图片。将图片放入 ControlNet 中，点击右下角箭头，将图片尺寸信息发送到生成设置。填入正反向提示词，启用 Tiled Diffusion 插件，其中方案选择 Mixture of Diffusers，可防止接缝产生。 2. 提示词标签选择：按顺序选择标签词，如女孩、白头发、蓝眼睛等。选择画质和视角，如最好的质量、杰作、从人物角度往下看等。选择艺术风格，如皮克斯动画、轮廓光。填写负面提示词，点击选框结尾的“负面”。模型选择“revAnimated”，调整尺寸后点击生图。 3. 真人转二次元及图生图：使用【X/Y/Z plot】脚本做参数对比，设置 X 轴为提示词相关性（取值范围 130，每次增加 5），Y 轴为重绘幅度（取值范围 01，每次增加 0.2）。提示词相关性在 6—11 中间为最佳，重绘幅度大小可控制生成图与原图相似度。可使用绘图功能增加或修改元素，如增加红色眼镜、去掉衣服图案、更换头部或修改帽子部分等。

comfyui 与 SD 功能上有啥区别

ComfyUI 与 SD 在功能上主要有以下区别： 1. 工作原理：ComfyUI 更接近 SD 的底层工作原理。 2. 自动化工作流：ComfyUI 具有更出色的自动化工作流，能够消灭重复性工作。 3. 后端工具：ComfyUI 作为强大的可视化后端工具，可实现 SD 之外的功能，如调用 API 等。 4. 定制开发：可根据定制需求开发节点或模块。 5. 应用场景：例如在抠图素材方面，ComfyUI 能根据需求自动生成定制的抠图素材。 6. 与其他软件的结合：如与 Blender 整合，从工作流程上天然适配。 7. 工作流搭建：ComfyUI 以连线方式搭建工作流，可通过改变节点实现不同功能，具有更高的自由和拓展性，能根据自身需求搭建和改造工作流。

我是一名电商设计师，现在想学习SD AI绘图，有一点基础，但学习课程资源有限，请你帮我制定一份详细的学习计划，并提供一些学习资源。

以下是为您制定的学习 SD AI 绘图的详细计划及相关学习资源：学习计划： 1. 首先，深入学习 Stable Diffusion 的核心基础原理，包括模型工作流程、核心基础原理、训练全过程以及其他主流生成式模型介绍。 2. 接着，掌握 Stable Diffusion 的核心网络结构，如 SD 模型整体架构、VAE 模型、UNet 模型、CLIP Text Encoder 模型等。 3. 学习从 0 到 1 搭建使用 Stable Diffusion 模型进行 AI 绘画的不同方式，如使用 ComfyUI、SD.Next、Stable Diffusion WebUI、diffusers 搭建推理流程，并查看生成示例。 4. 了解 Stable Diffusion 的经典应用场景，如文本生成图像、图片生成图片、图像 inpainting、使用 controlnet 辅助生成图片、超分辨率重建等。 5. 最后，尝试从 0 到 1 上手使用 Stable Diffusion 训练自己的 AI 绘画模型，包括配置训练环境与训练文件，以及基于 Stable Diffusion 训练 LoRA 模型。学习资源： 1. 教程：深入浅出完整解析 Stable Diffusion（SD）核心基础知识知乎。目录涵盖了 Stable Diffusion 系列的各个方面，包括核心基础知识、网络结构解析、搭建推理流程、应用场景和模型训练等。 2. SD 模型权重百度云网盘：关注 Rocky 的公众号 WeThinkIn，后台回复：SD 模型，即可获得资源链接，包含多种模型权重。 3. SD 保姆级训练资源百度云网盘：关注 Rocky 的公众号 WeThinkIn，后台回复：SDTrain，即可获得资源链接，包含数据处理、模型微调训练以及基于 SD 的 LoRA 模型训练代码全套资源。 4. Stable Diffusion 中 VAE，UNet 和 CLIP 三大模型的可视化网络结构图下载：关注 Rocky 的公众号 WeThinkIn，后台回复：SD 网络结构，即可获得网络结构图资源链接。

SD 的部署方式如下： 1. 本地部署（Win 系统）：系统要求：Win10 或 Win11。查看配置：查看电脑系统：在桌面上找到“我的电脑”，鼠标右键点击，点击“属性”，查看 Windows 规格。查看电脑配置：需要满足 3 个要求（推荐），电脑运行内存 8GB 以上，是英伟达（NVIDA）的显卡，显卡内存 4GB 以上。打开任务管理器（同时按下 ctrl+shift+esc），可查看电脑运行内存，8GB 运行内存可以勉强运行 SD，推荐 16GB 以上运行内存；查看电脑显卡内存（显存），4GB 显存可运行 SD，推荐 8GB 以上显存。配置达标跳转至对应安装教程页：。一键式安装：电脑配置能支持 SD 运行的朋友们，可使用 B 站秋叶分享的整合包。具体安装方法：打开链接 https://pan.baidu.com/s/1hY8CKbYRAj9RrFGmswdNiA?pwd=caru ，下载《1.整合包安装》，存放到电脑本地。打开保存到电脑里的文件夹。打开文件夹《1.秋叶整合包主包》，鼠标右击文件，点击“解压文件”。选择解压到 D 盘或者 E 盘，小心 C 盘被占满，点击确定。解压完成后，来到第二个文件夹，双击里面的文件，点击安装。打开刚刚解压保存的 SD 的根目录，找到启动器，鼠标右击启动器，点击“发送到”，桌面快捷方式。双击启动器，等待更新，接着点击左边第二个“高级选项”，在显存优化里，根据自己电脑的显存选择（就是上面查看的专用 GPU 内存），自己电脑是多少就选多少。回到第一个一键启动，点击右下角的一键启动。出现代码页面不用管，等一下就行了，SD 的主界面会自动在网页上弹出来。如果出现报错，可以回到最开始的界面，在左边点击“疑难解答”，再点击右边的“开始扫描”，最后点击“修复”按钮。 2. 云端部署：部署流程：安装和配置基础环境：浏览器上按照腾讯云>控制台>云服务器的路径找到你刚才购买的实例，点击启动，就会新开一个远程访问的窗口，输入你购买时设置的密码，进入，这样你就有了一个远程的 Windows 系统环境，接下来安装显卡驱动、配置环境变量即可。安装显卡驱动：用内置的 IE（也可下载 Chrome），打开英伟达的网站，找到驱动下载，选择购买机器时选定的显卡型号、Windows 版本号，下载对应的驱动，然后安装上。配置环境变量：驱动安全完成后，开始配置环境变量。首先先找到你安装后驱动所在的目录，如果没有特殊设定的话，一般是在「C:\\Program Files\\NCIDIA Corporation」这里，复制这个路径，找到环境变量配置入口（控制面板>系统和安全>系统），选择「高级系统设置」，弹窗设置环境变量，找到「系统变量」里的 Path 环境变量，点击「编辑...」，然后「新建」，帮刚才复制的 nvidia 驱动安装地址粘贴进去，保存即可。备选：SD 好难，先试试简单的无界 AI：

以下是关于 SD 换脸插件 Roop 的详细步骤： 1. 勾选包含 Python 和 C++包等相关项目，更改安装位置后点击右下角安装。安装时间较长，需耐心等待。 2. 安装好后，打开 SD 文件目录下的相关文件夹，在地址栏输入“cmd”并回车，在打开的 dos 界面粘贴“python m pip install insightface==0.7.3 user”代码，自动安装 insightface。若此阶段出错，建议下载最新的秋叶 4.2 整合包（6 月 23 号更新），在云盘后台回复【SD】可下载。 3. 安装完成后，重新打开启动器，后台会继续下载一些模型，全程要保证科学上网。 4. 选用真实系模型“realisticVisionV20”，关键词描述相关内容生成照片。 5. 启用 ROOP 插件，选择要替换的人物照片，面部修复选择“GFPGAN”，根据需求设置右边的参数数值和放大算法，点击生成。 6. 若生成的人脸像素偏低、模糊，可将图发送到“图生图”，开较小的重绘幅度，然后使用 controlnet 中的 tile 模型进行重绘。此插件主要适用于真实人脸替换，对二次元人物作用不大。在使用时要谨慎，切勿触犯法律。若想要此插件，可添加公众号【白马与少年】，回复【SD】即可。推荐使用最新的秋叶整合包，出错概率最小，且科学上网很重要。

出图是动漫/真人有什么区别和需要注意的点？

动漫出图和真人出图有以下区别和需要注意的点：版权和法律意识：对于知名动漫角色的使用，要特别注意版权和法律问题。模型和文件：LORA 在提炼图片特征方面功能强大，其文件通常有几十上百兆，承载的信息量远大于 Embedding，在还原真人物品时，LORA 的细节精度更高。下载的 LORA 需放在特定文件夹，使用时要注意作者使用的大模型，通常配套使用效果最佳，同时还需加入特定触发词保证正常使用。提示词：设置文生图提示词时，正向提示词和负向提示词的准确设定对出图效果有重要影响。参数设置：包括迭代步数、采样方法、尺寸等参数的合理设置，会影响出图的质量和效果。

总结文章内容，生成内容总结，最后输出图片、海报类的内容总结，用什么工具如何实现？

以下是对上述文章内容的总结：文章主要介绍了三种与总结文章内容、生成相关图片和推送相关内容有关的工作流： 1. Yeadon 的 coze 扣子闪光卡片制作工作流：包括输入原文链接、提取链接内容、生成原文二维码、图片搜索、利用代码节点改变 HTML 展示信息变量、HTML 代码转图片内容、抠图提取卡片主体等步骤。具有页面自动对齐、修改方便、模板复用等优势，有待提升的方面包括自由选择显示内容和添加更多动画效果等。 2. 【拔刀刘】的自动总结公众号内容并定时推送到微信的工作流：包括使用大模型节点批量总结文章内容，选择模型和配置参数，使用代码节点汇总格式化最终输出内容，通过自建插件将格式化好的内容推送到用户微信。 3. 【买买买！?产品买点提炼神器强化版?】的一站式营销内容解决方案工作流：包括卖点提炼模块，通过提问引导用户发掘卖点，或由大模型帮助生成；卖点修改模块，对大模型总结的卖点进行精细化调整；内容展示模块，将生成的内容制作成可保存的图片并输出图片链接。关于生成图片、海报类内容总结的工具和实现方式，在 Yeadon 的工作流中，通过代码节点将 HTML 代码转成图片内容，在【买买买！?产品买点提炼神器强化版?】的工作流中，利用图像流制作美观的图片模板，并传入相关信息展示在图片中。

请给出图像智能修改的智能体

以下是一些关于图像智能修改的智能体相关信息：在一键改图工作流方面：此过程未用大模型，未消耗 token。每次生成结果唯一，无种子概念，无法保存特定结果。调好后可配东北大花袄等背景，修改名字便于排查问题。用户界面可直接拿到返回变量值，返回文本需手动以 Markdown 格式拼接变量。点击立即生成按钮可添加多种事件，表单默认有点击时事件，表单提交时可调用工作流并传入对应参数。表单有 unsubmit、error 和数据改变时等事件，可设置提交时调用工作流，限制上传文件数量，表单提交时可设置禁用态。对左侧图片进行数据绑定，选择工作流和对应颜色，保存刷新查看生成结果。工作流数据绑定要先清空，避免手动输入变量，选工作流时要注意准确。调好第一张图片后复制成三张，根据背景颜色区分，通过连接节点选择对应图片输出。在用户界面不发布也可调试，有预览功能。识别图片特征有误时需在工作流里优化提示词，可考虑使用视频模型。应用界面数据无法直接带到智能体，可尝试左右布局，左边表单右边互动。在 Coze 工作流创建室内设计师方面：打开 Coze 官网 https://www.coze.cn/home 创建 Bot。图像流分为智能生成、智能编辑、基础编辑三类。Coze 的图像流很像 ComfyUI，但是比 ComfyUI 更普世化，更简单易上手。空间风格化插件有参数，如 image_url 是毛坯房的图片地址；Strength 是提示词强度，影响效果图；Style 是生成效果的风格，如新中式、日式、美式、欧式、法式等。按照构架配置工作流，调试工作流毛坯房测试用例：https://tgi1.jia.com/129/589/29589741.jpg 。开始节点对应配置三项内容，然后点击右上角发布，机器人就可以出图。在产品买点提炼神器强化版方面：智能体功能实现包括卖点提炼模块，通过提问引导用户发掘产品/服务的卖点，若用户无法准确回答则交由大模型帮助回答并生成可能的卖点。卖点修改模块对大模型总结的卖点进行精细化调整，用户可根据满意度选择跳过、修改补充、让大模型补充或重新生成全部内容。内容展示模块将生成的内容利用图像流制作成可保存的图片，制作美观的图片模板，从工作流中传入产品名称、卖点、买点等信息并在图片中展示，将生成的图片链接通过结束节点输出，并在工作流的消息节点展示。

人类接收外界信息的感官中，视觉占比高达83%，听觉占11%，其余触觉、嗅觉、味觉合计仅占6%。如何采用用AI画出图示呢

以下为您提供采用 AI 画出关于人类接收外界信息感官占比图示的相关指导：首先，您可以选择合适的 AI 绘图工具，如 Creately、Whimsical 或 Miro 等。 Creately 是一个在线绘图和协作平台，利用 AI 功能简化图表创建过程，适合绘制流程图、组织图、思维导图等。它具有智能绘图功能，能自动连接和排列图形，还有丰富的模板库和预定义形状，支持实时协作。官网：https://creately.com/ Whimsical 是一个专注于用户体验和快速绘图的工具，适合创建线框图、流程图、思维导图等。其具有直观的用户界面，易于上手，支持拖放操作，快速绘制和修改图表，提供多种协作功能。官网：https://whimsical.com/ Miro 是一个在线白板平台，结合 AI 功能，适用于团队协作和各种示意图绘制，如思维导图、用户流程图等。它支持无缝协作，支持远程团队实时编辑，有丰富的图表模板和工具，还支持与其他项目管理工具（如 Jira、Trello）集成。官网：https://miro.com/ 使用这些工具绘制图示的一般步骤如下： 1. 选择工具：根据您的具体需求选择合适的 AI 绘图工具。 2. 创建账户：注册并登录该平台。 3. 选择模板：利用平台提供的模板库，选择一个适合您需求的模板。 4. 添加内容：根据您的需求，添加并编辑图形和文字。利用 AI 自动布局功能优化图表布局。 5. 协作和分享：如果需要团队协作，可以邀请团队成员一起编辑。完成后导出并分享图表。

什么软件可以根据我的要求出图？

以下是一些可以根据您的要求出图的软件： 1. 悠船：从成本和小白理解力的角度来说值得先尝试。新注册有免费的社区福利。下载网址：www.youchuanai.com 。在悠船桌面端进行新用户注册，输入离谱村专用激活码（296976）即可完成注册。 2. Midjourney：出图质量稳定，使用门槛低。普通用户不需要企业也可下载使用。可以登录 Discord（https://discord.com/）网站，打开 Midjourney 服务器出图。通过/imagine 命令输入提示词生成图片。还可以使用 Autojourney 插件批量出图，该插件是电脑浏览器的一个插件，功能强大，可在浏览器拓展程序中下载安装。 3. SD：在细节调节方面理解力较好。为了达到心中理想的效果，可能需要反复调节和细节调节，不同的图类型、想达到的不同效果和画风，可能需要不同的平台。具体的使用方法群文档里都可以搜。

能直接输出图片的AI网站

以下是一些能直接输出图片的 AI 网站： 1. Artguru AI Art Generator：在线平台，生成逼真图像，给设计师提供灵感，丰富创作过程。 2. Retrato：AI 工具，将图片转换为非凡肖像，拥有 500 多种风格选择，适合制作个性头像。 3. Stable Diffusion Reimagine：新型 AI 工具，通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator：专为喜欢梦幻童话风格的人设计的 AI 工具，将上传的照片转换为芭比风格，效果超级好。 5. 无界 AI：一款可以在线 AI 生成图片的网站（类似 SD Online 一键出图版），网址为 https://www.wujieai.cc/ （新用户扫码注册可领取积分）。此外，还有用于鉴别图片是否为 AI 生成的网站，如 ILLUMINARTY（https://app.illuminarty.ai/）。但需注意，AI 鉴别仍存在一些局限性。

我想要通过建筑草图生成效果图，有什么工具和流程可以使用

以下是使用悠船工具将建筑草图生成效果图的流程和相关介绍： 1. 基础使用：提示词：在右侧填写提示词，右上可下载对应图片。参数调整：参数详解参考下方「参数详解」。注意任何点击都会重新生成图片，免费用户可能会提示超出套餐，所以别乱点。最右侧是所有生成图片的略缩图。 2. 图片调整：变化：分为细微和强烈，细微改变幅度小，强烈改变幅度大。高清：有“直接”和“创意”两种模式，“直接”表示啥都不变直接出高清，“创意”表示在图片基础上进行微小的优化调整。风格变化：基于生成的图片作为上传图片（垫图）再创作。拓展：可上下左右拓展图片。缩放：指的是镜头，比如 2x 就是镜头拉远 2 倍。局部重绘：选择区域要大一些，太小的无法进行修改。 3. 图像参考：在悠船中可以利用垫图和提示词配合生成符合要求的建筑、风景、文物等。只需将图片复制到悠船的提示词框里面，并填写对应的提示词描述。

将照片改成卡通效果用什么ai会比较简单易操作

以下几种 AI 工具可以将照片改成卡通效果，操作相对简单易操作： 1. ChatGPT 4o：支持上传照片后直接生成“吉卜力卡通风格”图像，提示词只需简单写“吉卜力风格化”即可，后续会话中只需上传图片，无需重复输入提示词。参考链接：

视频生成效果对比

以下是为您整理的关于视频生成的相关内容：百度“秒哒”：特点：无代码编程、多智能体协作、多工具调用，一句话生成应用、网站、小游戏。优势：更适合普通用户，直接输出结果，看不到写代码过程。智能体协作矩阵支持灵活组建虚拟开发团队，工具集成强大，完成即部署。试玩链接（临时有效）：相关链接：电商视频生成神器 Product Anyshoot：功能：商品图秒变视频展示，模特自动拿着、穿戴、摆放商品。特点：支持所有电商品类，5000+模板可自定义修改。优势：商品还原度高，视频真实流畅，对比效果优于 Pika 和阿里通义 Wanx。在线体验：相关链接： Meta 发布的 Meta Movie Gen 文生视频模型：组成：由视频生成和音频生成两个模型组成。 Movie Gen Video：30B 参数 Transformer 模型，可从单个文本提示生成 16 秒、16 帧每秒的高清视频，相当于 73K 个视频 tokens。能执行精确视频编辑，如添加、删除或替换元素，或背景替换、样式更改等全局修改。在个性化视频方面，在保持角色身份一致性和运动自然性方面取得 SOTA 性能。 Movie Gen Audio：13B 参数 Transformer 模型，可接受视频输入以及可选的文本提示，生成与视频同步的高保真音频。训练方式：通过预训练微调范式完成，在骨干网络架构上沿用了 Transformer，特别是 Llama3 的许多设计。预训练阶段在海量的视频文本和图像文本数据集上进行联合训练，学习对视觉世界的理解。微调阶段精心挑选一小部分高质量视频进行有监督微调，以进一步提升生成视频的运动流畅度和美学品质。为提高效果，引入流匹配（Flow Matching）作为训练目标，使得视频生成的效果在精度和细节表现上优于扩散模型。扩散模型通过从数据分布逐渐加入噪声，然后在推理时通过逆过程去除噪声来生成样本，用大量的迭代步数逐步逼近目标分布。流匹配则是通过直接学习样本从噪声向目标数据分布转化的速度，模型只需通过估计如何在每个时间步中演化样本，即可生成高质量的结果。

目前文字转视频，效果比较理想的工具有哪些？

目前文字转视频效果比较理想的工具包括： 1. Pika：是一款出色的文本生成视频 AI 工具，擅长动画制作，并支持视频编辑。 2. SVD：若熟悉 Stable Diffusion，可安装此最新插件，能在图片基础上直接生成视频，由 Stability AI 开源。 3. Runway：老牌 AI 视频生成工具，提供实时涂抹修改视频的功能，但需收费。 4. Kaiber：视频转视频 AI，能够将原视频转换成各种风格的视频。 5. Sora：由 OpenAI 开发，可以生成长达 1 分钟以上的视频。更多的文生视频的网站可以查看这里：此外，Sora v2 即将发布，支持 1 分钟视频生成，提供文本转视频、文本+参考图片转视频以及文本+视频转视频功能。Runway 还有 Act One 角色参考视频功能，能实现视频表演和声音的角色转移，支持通过拍摄视频驱动另一个视频，保持表情和口型同步。

当前效果比较好的对口型，换脸，配音AI应用

以下是一些效果较好的对口型、换脸、配音的 AI 应用： Runway：网址为 https://runwayml.com ，有网页和 app 方便使用。工具教程：即梦：网址为 https://dreamina.jianying.com/ ，是剪映旗下产品，生成 3 秒，动作幅度有很大升级，有最新 S 模型和 P 模型。工具教程： Minimax 海螺 AI：网址为 https://hailuoai.video/ ，非常听话，语义理解能力非常强。视频模型： Kling：网址为 kling.kuaishou.com ，支持运动笔刷，1.5 模型可以直出 1080P30 帧视频。视频模型： Vidu：网址为 https://www.vidu.studio/ haiper：网址为 https://app.haiper.ai/ Pika：网址为 https://pika.art/ ，可控性强，可以对嘴型，可配音。工具教程：智谱清影：网址为 https://chatglm.cn/video ，开源了，可以自己部署 cogvideo。工具教程： PixVerse：网址为 https://pixverse.ai/ ，人少不怎么排队，还有换脸功能。工具教程：通义万相：网址为 https://tongyi.aliyun.com/wanxiang/ ，大幅度运动很强。 luma：网址为 https://lumalabs.ai/ 即梦 AI 对口型的相关教程：功能介绍：「对口型」是即梦 AI「视频生成」中的二次编辑功能，现支持中文、英文配音。目前主要针对写实/偏真实风格化人物的口型及配音生成，为用户的创作提供更多视听信息传达的能力。可上传包含完整人物面容的图片，进行视频生成，待视频生成完成后，点击预览视频下的「对口型」按钮，输入台词并选择音色，或上传配音文件进行对口型效果生成。目前支持语言：中文（全部音色），英文（推荐「超拟真」内的音色）技巧：上传写实/近写实的人物单人图片，目前不支持多人物图片对口型；输入 prompt，选择参数，点击生成视频，尽量确保人物无形变等扭曲效果；确保人物生成的情绪与希望匹配的口型内容匹配；在生成的视频下方，点击【对口型】；输入或上传需要配音的内容，注意视频生成时长和配音试听时长尽量对齐，点击生成。先对口型，再超分补帧关于 AI 短片的相关信息： AI 图片与视频生成的新能力与应用：图片编辑功能：Midjourney 新增本地图片上传编辑入口，可进行局部重绘、扩图和风格转换等操作。视频生成模型：解梦新出 p 模型和 s 模型，p 模型支持人物多动作和变焦，易改变画风；s 模型生成速度快、积分消耗少，能保持原始画风但语义理解有限。特效玩法：皮卡和 Pixforce 有特效玩法，如人物爆炸、漂浮等，可用于优化视频效果。视频转会：Runway 的 GN3 模型支持上传视频并转换风格，可用于实现多元宇宙等风格穿梭的片子，也能将简单场景转换为难以拍摄的场景。视频生成中的角色生视频技术：角色生视频突破关键帧限制：当前视频生成多依赖关键帧，而角色生视频不再是关键帧输入，而是直接传入角色本身，可更灵活生成视频，如让小男孩从左跑到右。多角色参考生成创意视频：支持上传多张图，最多三张，可将人物、衣服、背景等元素融合生成视频，如小男孩穿裙子在宇宙飞。角色对口型技术：如吉梦的对口型技术，支持文本朗诵和本地配音，能根据输入生成人物开口讲话的视频，但有上传人物长相等限制。不同工具的角色生视频效果：对比了吉梦、Runway 等工具的角色生视频效果，如 Runway 的 x one 在身体、头部、眼神动态上表现更好。角色生视频的应用场景：可用于规避机器人念台词的尴尬瞬间，让机器人有更丰富的表情和神态。角色生视频的未来发展：未来视频生成将摆脱纯关键帧方式，采用多模态信息输入，如定义角色和场景的三视图等。

有哪些效果好的开源OCR模型值得推荐

以下是一些效果较好的开源 OCR 模型推荐： 1. Mistral OCR：当前最强的 OCR 模型，具有多语言支持，超越 Gemini 2.0 Flash，可在 Le Chat 及 API 调用。ElevenLabs 赠送 $25 Mistral API 额度，免费领取！领取地址： 2. Gemini 2.0 Flash：也是一款 OCR 模型。