Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

Midjourney怎样生成人物侧脸照?

Answer

要在 Midjourney 中生成人物侧脸照,您可以按照以下步骤进行操作:

  1. 初始图(单人画面生成结果)。
  2. 找到已生成的人物纯图,提取图片链接(url)做准备工作。
  3. 基于生成的构图清晰但人物失控的成图基础上,进行重绘 Vary Region。具体操作包括:框选需要被替换的人物,然后将准备好的链接,贴入框内界面 cref 后面,注意先把原始的 cref(即红色部分)删掉。
  4. 连续“抽卡”后找到合适的角度,选中理想的图片,U1/U2/U3/U4 点击后就可以拿出来使用。
  5. 假设需求是让配角转头营造“偷看主角”的感觉。先准备一个正脸照的链接,然后进入重绘界面圈起红色部分,更新 cref 的链接为正脸照链接。如果还是出不来,再修改原有指令词,要求将女性的侧脸照替换成正脸。坚持几轮抽卡后就可以得到需要的结果。

此外,Midjourney V6 更新了角色一致性命令“--cref”。您可以添加角色参考图像,并选择一个“--cw(cref 权重)”以达到效果。Midjourney 能够从参考图像中识别的角色属性将与提示混合,从而创建出您角色的最终表现。您可以通过使用“--cw N”参数(cref 权重)来大致控制转移,其中 N 的值可以从 1 到 100,默认值为 100。需要注意的是,“--cw”参数不会改变角色参考图像的强度/影响力,“--cw 100”的值(默认值)将捕捉整个角色,“--cw 99 到--cw 1”之间的值将开始捕捉较少的整个角色,仅集中于转移面部,“--cw 0”的值将仅捕捉面部,大致类似于面部替换。

Content generated by AI large model, please carefully verify (powered by aily)

References

Midjourney群像人物一致性保持及空间深度控制

A.初始图(单人画面生成结果)B.男同事Jeff画像C.构思中应产生的构图效果(即男生作为主角,女生作为配角,一前一后,画面具有层次感)Step 2:找到已生成的Lisa纯人物的图,提取图片链接(url)做准备工作。Step 3:基于Step 1生成的构图清晰但人物失控的成图(C)基础上,进行重绘Vary Region,步骤:a.框选需要被替换的人物,b.然后将Step 2准备好的链接,贴入框内界面cref后面,注意⚠️:先把原始的cref(即红色部分)删掉哦!Step 4:连续“抽卡”后找到合适的角度,选中理想的图片,U1/U2/U3/U4点击后就可以拿出来使用啦。Step 5:假设此时突然加大难度-即当甲方爸爸(小伙伴)提需求:要求配角将头转过来,营造一种TA在“偷看主角”的感觉。这时候,a.先准备一个正脸照的链接,然后进入重绘界面圈起红色部分,b.更新cref的链接为正脸照链接(如果还是出不来,再修改原有指令词,要求将女性的侧脸照替换成正脸);坚持几轮抽卡后就可以得到需要的结果(如成品图”所示)。

Midjourney群像人物一致性保持及空间深度控制

Step 5:将Step 4生成的图seed值复制,重新使用Prompt+sref+cref+上图的seed值再次生成,这里请注意⚠️:sref需要使用的是“成品图”,cref使用的是step3里的链接-原始侧身照,这样就可以得到右图。参考:Sci-fi movie scene.The profile of a woman is in the foreground,and in the background are the backs of three employees,who are standing and operating virtual screens.Rendered in a C4D style inspired by Unreal Engine,with high resolution and rich detail.--ar 16:9--seed 3792896587--cref url--sref url--style raw--sw 100--cw 100Step 6:用“右图”作为sref风格提示图,提示词,cref和种子值保持不变,进行再次刷新迭代,得到下图。Step 7:以Step 6为基础,进行局部重绘改变后排两个人的形象,请耐心的一个个改,不要一次改俩(会失控),最后在你的耐心下,会最终收获“第四张”完美的图。最后的最后,既然看到这里了,来个总结?:1.思路是这样的,但追求效率更高的话,可以用PS或者其他工具哟,有时候不要过于死磕纯ai处理。2.如果非要死磕MJ来实现群像控制&空间深度控制,一句咒语:“sref+cref+局部重绘”配合不断的练习和刷新,以及耐心可以得到99%的满意,这时候效率就别考虑了???。

Midjourney V6 更新角色一致性命令 "--cref "

例子:Two people standing in the forest.Ezra is a husky adult plump male wearing red glasses.He has an undercut short black buzzcut short hairstyle.He is a gamer-nerd dressed in layers,a dark undershirt,an overshirt,hipster boho stylish fashion.He wears a teal overshirt and thick plastic red eyeglasses.--cref https://s.mj.run/dCsjeI5AflU--ar 3:2翻译:在森林中站着两个人。Ezra是一个傻大个、胖胖的男性,戴着红色眼镜。他有一个短的黑色发型。他是一个穿着层层叠叠的游戏宅男,穿着一件深色背心、一件外套,时尚的嬉皮士波西米亚风格。他穿着蓝绿色的外套和厚厚的塑料红色眼镜。--cref https://s.mj.run/dCsjeI5AflU--ar 3:2根据需要重复此过程,但要小心不要过多地这样做,因为会丧失保真度。4.添加您的角色参考图像,并选择一个--cw(cref权重)以达到效果Midjourney能够从参考图像中识别的角色属性将与提示混合,从而创建出您角色的最终表现。您可以通过使用--cw N参数(cref权重)来大致控制转移,其中N的值可以从1到100。默认值为100。注意:--cw参数不会改变角色参考图像的强度/影响力,--cw参数的作用:·--cw 100的值(默认值)将捕捉整个角色。·--cw 99到--cw 1之间的值将开始捕捉较少的整个角色,仅集中于转移面部。·--cw 0的值将仅捕捉面部,大致类似于面部替换。

Others are asking
"如何使用Midjourney"
以下是关于如何使用 Midjourney 的详细介绍: 1. “人物参考”功能: 在提示词后输入`cref URL`并附上一个人物图像的 URL。需注意一定要在提示词后面,否则会报错。 可以使用`cw`来修改参考“强度”,从 0 到 100。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;在强度 0(`cw 0`)时,只会关注面部,适合改变服装、发型等。 2. 喂图: 意义:从第一张起,可反复上传优化图片,来达到自己想要的图片。 过程:上传单张或者一组(4 到 5 张)到 Midjourney 输入框里,有两种方法: 点击输入框前方的加号上传。 鼠标选择图片或一组拖到软件里,回车,点击上传后的图片,在左下角“在浏览器打开链接“打开后复制浏览器上的链接,返回主界面,在输入框里“/imagine:粘贴刚才复制的链接+所描述的关键词。 常见问题:小白新手找不到输入框频道。解决方法是找到 Midjourney 白色图标,点击进去,找带数字结尾的频道,或者在自己社区里添加 Midjourney 机器人。 3. Midjourney V6 更新角色一致性命令“cref”: 官方说明:在提示后键入`cref URL`,其中 URL 是一个角色图像的网址。可以使用`cw`来修改参考的“强度”。 用途:这个功能在使用由 Midjourney 图像制作的角色时效果最佳,不适用于真实的人物/照片。 高级功能:可以使用多个 URL 来混合信息/来自多个图像的角色。 在网页 alpha(测试最初版)上的操作:拖动或粘贴图像到想象栏,有三个图标。选择这些图标设置它是一个图像提示,一个风格参考,还是一个角色参考。按住 Shift 键选择一个选项以将图像用于多个类别。 需注意,虽然 MJ V6 还处于 alpha 测试阶段,但这个和其他功能可能会突然更改,V6 官方 beta 版本即将推出。
2025-03-24
Midjourney
以下是关于 Midjourney 的相关信息: 隐私政策: 本隐私政策适用于 Midjourney,Inc.、Midjourney.com 网站和 Midjourney 图像生成平台的服务。Midjourney 是一家通信技术孵化器,提供图像生成服务以增强人类创造力并促进社会联系。 个人数据指与个人相关、可用于直接或间接识别个人身份的任何信息。本政策适用于 Midjourney 收集、使用和披露的个人数据,包括通过服务、训练机器学习算法过程、网站以及第三方来源收集的数据,但不适用于某些特定人员的个人数据。 可能会不时更新政策,适用法律要求时会通知变更。 定义了“您”或“您的”的含义以及使用数据的概念。 收集的数据类型包括个人数据。 图像提示: 要将图像添加到提示中,可按/imagine 输入,出现提示框后,将图片文件拖入或右键单击并粘贴链接。 使用 Midjourney Bot 在私信中上传图像可防止其他服务器用户看到,除非用户具有隐身模式,否则图像提示在 Midjourney 网站上可见。 给出了多个例子,如不同的起始图像和中途模型版本的相关示例,还提到纵横比提示,即将图像裁剪为与最终图像相同的宽高比以获得最佳效果。 社区准则: Midjourney 是默认开放的社区,内容必须为 P。 要友善并尊重彼此和员工,不创建不尊重、攻击性或辱骂性的图像或使用此类文本提示,禁止任何形式的暴力或骚扰。 无成人内容或血腥内容,未经许可不公开转发他人创作,分享时要小心。 任何违反规则的行为可能导致服务被禁止,规则适用于所有内容。
2025-03-12
Midjourney多人物在不同场景下的一致性
以下是关于 Midjourney 多人物在不同场景下一致性的相关内容: 参数局限性: 最好使用 Midjourney 生成的图像,因为其对自身输出的解读已优化,使用真实世界图像可能导致扭曲或不一致。 无法精确复制每一个小细节,AI 更倾向于关注更广泛的视觉特征。 不太适用于多人组合,通常会让组内所有人看起来相同。 实际应用案例: 分镜和漫画:在不同面板和场景中保持同一角色的一致性,不丧失角色核心身份。 角色设计:为角色创建不同版本,如不同服装、姿势或环境中的版本。 奇幻和叙事艺术:以视觉一致的方式描绘角色在旅程中的变化。 最佳结果的技巧: 使用清晰、放大的图片,其中角色面部特征清晰可见,最好正对镜头,有助于 AI 更好地解读关键面部特征。 从 cw 100 开始,若希望引入变化,可逐渐降低该值。 角色参考: Midjourney 中的 cref 是一个高级命令参数,允许用户在多张图像之间保持角色一致性。无论创作故事板还是创建不同场景中的角色变化,该命令参数能确保角色的核心视觉特征(如面部特征、发型和服装)在每次生成时得以保留。 频道说明: 您可以仅描述环境、周围环境、背景或情境,Midjourney 将努力将角色融入场景中。但可能会出现不连贯的结果,此时可尝试使用更高值的样式化(s),如 s 800。 多个角色的放置: cref 命令适用于单一主题、单一角色的图像。若计划在场景中添加多个角色,需要使用平移按钮来添加。 基于 cref 的多个角色放置到单个画布上的最佳方法是使用平移功能将新的画布与现有画布拼接在一起,每个新画布的部分都将有自己的 cref。 1. 使用 /settings 将 Remix 打开,然后选择 。 2. 选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来。 3. 寻找蓝色小箭头。⬆️⬇️⬅️➡️每个都会在现有图像中添加一条新图像。选择新角色的前进方向并输入提示及其 cref。这将缝合一条新的画布。
2025-03-06
Midjourney教程
以下是关于 Midjourney 的教程: 1. 利用一致性 MJ 出海马体写真: 超低学习成本,会用任意手机修图软件即可。 得益于 cref,能迅速达成角色一致性目的,无需 Lora。cref 代表 character reference(角色参考),cw 代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点,若只想关注人脸,可调低到 0。 风格复制和服装替换,用提示词(prompt)和 sref,默认值 100,越高越接近参考图像的风格。 用 /describe 指令反推海马体的提示词,再配合 sref,可轻松复制图像风格。在回车前检查提示词,避免出现和 sref 风格差异过大的 prompt,也可增加有用的 prompt。 解决“形似而神不似”的问题,即 MJ 直出和原人物在五官等地方的细微差距。 2. 线稿上色 Midjourney + Stable Diffusion: 用 Midjourney 生成线稿,PS 修正错误,再用 Controlnet 控制,Stable Diffusion 上色,多套 AI 组合可快速生成效果惊艳的图。 线稿产出的 mj 关键词:Black and white line drawing illustration of a cute cat cartoon IP character,black line sketch,wearing a fortune hat,wearing a collar around the neck,Carrying a huge bag containing scrolls and ingots,matching rope and straps at his wrists,Chinese element style,popular toys,blind box toys,Disney style,white backgroundniji 5style expressive。 3. 小白 30min 加入离谱村: 选工具,如 SD 或 Midjourney。 抄 prompt,从教程和导航中找喜欢风格的提示词。 找 ChatGPT 改写。 坐等出图,把提示词喂给 Midjourney 机器人,初学者可多按 VU 让其自由修改,先弄出满意的图,V1V4 基于生成的某一张图修改再出 4 张,U1U4 选定某一张细节调整。
2025-03-05
Midjourney
以下是关于 Midjourney 的相关信息: 隐私政策: 适用于 Midjourney,Inc.、Midjourney.com 网站和 Midjourney 图像生成平台的服务。 个人数据指与个人相关、可用于识别个人身份的信息。 适用性包括通过服务、训练机器学习算法、网站收集的数据以及从第三方来源收集的数据,但不适用于 Midjourney 员工等的个人数据。 可能会不时更新政策,适用法律要求时会通知变更。 定义了“您”或“您的”的含义以及使用数据。 收集的数据类型包括个人数据。 图像提示: 将图像 URL 添加到提示中,可通过拖入或粘贴链接的方式。 使用 Midjourney Bot 在私信中上传图像可防止被其他服务器用户看到,除非用户具有隐身模式,否则图像提示在网站上可见。 给出了多个例子,包括不同的起始图像和模型版本。 提示将图像裁剪为与最终图像相同的宽高比以获得最佳效果。 社区准则: Midjourney 是默认开放的社区。 要友善并尊重彼此和员工,禁止不尊重、攻击性或辱骂性的内容,禁止成人和血腥内容。 未经许可不得公开转发他人创作,分享时要小心。 违反规则可能导致服务被禁止,规则适用于所有内容。
2025-02-23
Midjourney怎么用
以下是关于 Midjourney 的使用方法: 使用 Vary Region 编辑器选择并重新生成放大图像的特定部分: 1. 生成图像:使用命令 /imagine 创建图像。 2. 升级图像:使用 U 按钮放大所选图像。 3. 选择不同区域:点击?️Vary按钮,打开编辑界面。 选择编辑器左下角的手绘或矩形选择工具。 选择要重新生成的图像区域。注意选择的大小会影响结果,更大的选择会为 Midjourney 机器人提供更多空间生成新的创意细节,较小的选择则导致更小、更微妙的变化。无法编辑现有选择,但可以使用右上角的撤消按钮撤消多个步骤。 4. 提交您的工作:单击 Submit→按钮将请求发送到 Midjourney Bot。 5. 查看结果:Midjourney 机器人将处理作业并在选择的区域内生成新的变化图像网格。 喂图: 意义:从第一张起,可反复上传优化图片,来达到自己想要的图片。 喂图过程: 1. 上传单张或者一组(4 到 5 张,目前没有限制多少张,但一般 4 张刚刚好,太多会给 AI 带来困扰)到 Midjourney 输入框里,上传有两种方法: 点击输入框前方的加号上传。 鼠标选择图片或一组拖到软件里,回车,点击上传后的图片,在左下角“在浏览器打开链接“打开后复制浏览器上的链接,返回主界面,在输入框里“/imagine:粘贴刚才复制的链接+您所描述的关键词。 常见问题: 1. 小白新手找不到输入框频道。 答:找到 Midjourney 白色图标,点击进去,找带数字结尾的频道,或者在自己社区里添加 Midjourney 机器人。 Seed 种子: Midjourney 机器人使用种子号来创建视觉噪声场(例如电视静电),作为生成初始图像网格的起点。seed 接受 0–4294967295 的整数。seed 值仅影响初始图像网格。使用不同模型版本的相同 seed 值,生成的图像效果不同。 种子参数: 如果未指定种子,Midjourney 将使用随机生成的种子编号,每次使用提示时都会生成多种选项。 查找工作的种子号: 1. 通过对作业使用✉️信封表情符号进行反应。 2. 使用 Show 命令恢复旧作业,复制作业 ID 并使用/show<Job ID>命令来恢复作业,然后使用✉️信封表情符号对新生成的作业做出反应。 更改种子数量:添加seed<value>到提示的末尾。
2025-02-12
生成提示词的提示词
以下是关于生成提示词的相关内容: 生成提示词的思路和方法: 可以根据效果好的图片中的高频提示词去反推效果,结合不同字体效果的描述,打包到一组提示词中。提示词给到 AI 后,AI 会根据给定文字的文义,判断适合的情绪风格,然后给出适合情绪的字体和风格描述、情感氛围等,加上一些质量/品质词,形成输出提示词结构。为了让 AI 更能描述清晰风格,可以先给定多种参照举例。 具体操作步骤: 打开 AI 工具的对话框,将相关提示词完整复制粘贴到对话框。推荐使用 ChatGPT 4o。 当 AI 回复后,发送您想要设计的文字。可以仅发送想要的文字,也可以发送图片(适合有多模态的 AI)让 AI 识别和反推。 将 AI 回复的提示词部分的内容复制到即梦 AI。 对生成提示词的一些观点: 提示词生成提示词并非必要,不一定能生成最好的 Prompt 框架,修改过程可能耗时且不一定能修改好,不如花钱找人写。 一句话生成完整符合需求的 Prompt 非常困难,只能大概给出框架和构思,需要更低成本地调整需求和修改 Prompt。 不同生图工具生成提示词的特点: 即使是简短的描述,生成的提示词也非常细节、专业。 会解析需求,找出核心要点和潜在的诠释点,并给出不同的提示词方案。 提示词构建更多在于增强,而不是发散,生成的内容更符合期望。 同时生成中、英双版本,国内外工具通用无压力。 14 款 AI 生图工具实测对比: 本次实测用到的工具包括国内版的即梦 3.0(https://jimeng.jianying.com/aitool/home)、WHEE(https://www.whee.com)、豆包(https://www.doubao.com/chat)、可灵(https://app.klingai.com/cn/texttoimage/new)、通义万相(https://tongyi.aliyun.com/wanxiang/creation)、星流(https://www.xingliu.art)、LibiblibAI(https://www.liblib.art),以及国外版的相关工具。
2025-04-20
有没有能根据描述,生成对应的word模板的ai
目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如: 在法律领域,您可以提供【案情描述】,按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件,模拟不同辩护策略下的量刑结果,对比并推荐最佳辩护策略,或者为商业合同纠纷案件设计诉讼策略等。 在 AI 视频生成方面,有结构化的提示词模板,包括镜头语言(景别、运动、节奏等)、主体强化(动态描述、反常组合等)、细节层次(近景、中景、远景等)、背景氛围(超现实天气、空间异常等),以及增强电影感的技巧(加入时间变化、强调物理规则、设计视觉焦点转移等)。 一泽 Eze 提出的样例驱动的渐进式引导法,可利用 AI 高效设计提示词生成预期内容。先评估样例,与 AI 对话让其理解需求,提炼初始模板,通过多轮反馈直至达到预期,再用例测试看 AI 是否真正理解。 但需要注意的是,不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化,以获得更符合期望的 word 模板。
2025-04-18
如何自动生成文案
以下是几种自动生成文案的方法: 1. 基于其它博主开源的视频生成工作流进行优化: 功能:通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具:Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。 大体路径:通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频;发布 coze 智能体到飞书多维表格;在多维表格中使用字段捷径,引用该智能体;在多维表格中创建自动化流程,推送消息给指定飞书用户。 2. 生成有趣的《图文短句》: 实现原理: 先看工作流:包括第一个大模型生成标题、通过“代码节点”从多个标题中获取其中一个(可略过)、通过选出的标题生成简介、通过简介生成和标题生成文案、将文案进行归纳总结、将归纳总结后的文案描述传递给图像流。 再看图像流:包括提示词优化、典型的文生图。 最终的 Bot 制作以及预览和调试。 3. 腾讯运营使用 ChatGPT 生成文案: 步骤:通过 ChatGPT 生成文案,将这些文案复制到支持 AI 文字转视频的工具内,从而实现短视频的自动生成。市面上一些手机剪辑软件也支持文字转视频,系统匹配的素材不符合要求时可以手动替换。例如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类 AI 视频制作工具让普罗大众生产视频变得更轻松上手。
2025-04-15
如何通过输入一些观点,生成精彩的口播文案
以下是通过输入观点生成精彩口播文案的方法: 1. 基于其它博主开源的视频生成工作流进行功能优化,实现视频全自动创建。 效果展示:可查看。 功能:通过表单输入主题观点,提交后自动创建文案短视频,并将创建完成的视频链接推送至飞书消息。 涉及工具:Coze平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。 大体路径: 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 发布 coze 智能体到飞书多维表格。 在多维表格中使用字段捷径,引用该智能体。 在多维表格中创建自动化流程,推送消息给指定飞书用户。 2. 智能体发布到飞书多维表格: 工作流调试完成后,加入到智能体中,可以选择工作流绑定卡片数据,智能体则通过卡片回复。 选择发布渠道,重点是飞书多维表格,填写上架信息(为快速审核,选择仅自己可用),等待审核通过后即可在多维表格中使用。 3. 多维表格的字段捷径使用: 创建飞书多维表格,添加相关字段,配置后使用字段捷径功能,使用自己创建的 Coze 智能体。 表单分享,实现填写表单自动创建文案短视频的效果。 4. 自动化推送:点击多维表格右上角的“自动化”,创建所需的自动化流程。 另外,伊登的最新 Deepseek+coze 实现新闻播报自动化工作流如下: 第一步是内容获取,只需输入新闻链接,系统自动提取核心内容。开始节点入参包括新闻链接和视频合成插件 api_key,添加网页图片链接提取插件,获取网页里的图片,以 1ai.net 的资讯为例,添加图片链接提取节点,提取新闻主图,调整图片格式,利用链接读取节点提取文字内容,使用大模型节点重写新闻成为口播稿子,可使用 Deepseek R1 模型生成有吸引力的口播内容,若想加上自己的特征,可在提示词里添加个性化台词。
2025-04-15
小红书图文批量生成
以下是关于小红书图文批量生成的详细内容: 流量密码!小红书万赞英语视频用扣子一键批量生产,这是一个保姆级教程,小白都能看得懂。 原理分析: 决定搞之后,思考生成这种视频的底层逻辑,进行逆推。这种视频由多张带文字图片和音频合成,带文字图片由文字和图片生成,文字和图片都可由 AI 生成,音频由文字生成,文字来源于图片,也就是说,关键是把图片和文字搞出来。 逻辑理清后,先找好看的模版,未找到好看的视频模版,最后看到一个卡片模版,先把图片搞出来,才有资格继续思考如何把图片变成视频,搞不出来的话,大不了不发视频,先发图片,反正图片在小红书也很火。 拆模版: 要抄这种图片,搞过扣子的第一反应可能是用画板节点 1:1 去撸一个,但扣子的画板节点很难用,Pass 掉。用 PS 不行,太死板不灵活,html 网页代码可以,非常灵活。经过 2 个多小时和 AI 的 battle,用 html 代码把图片搞出来了。这里不讲代码怎么写,直接抄就行。要抄,首先要学会拆,不管用什么方式批量生成这样的图片,都必须搞清楚里面有哪些是可以变化的参数,也就是【变量】,如主题、主题英文、阶段、单词数、图片、正文、翻译、普通单词、重点单词等。 想方法: 大概知道批量生成这样的图片需要搞清楚哪些参数,图片用 html 代码搞出来了。但问题是视频怎么搞,这种视频由多张不同的【带文字的图片】生成,比如读到哪句,哪句就高亮起来,图片也可以随着读到的句子变更。最后,视频就是用这样的图片一张张拼起来的。
2025-04-14
ai如何什么生成表格
AI 生成表格通常可以通过以下技术实现: 1. 利用变分自编码器(VAEs)和序列到序列模型(Seq2Seq)等技术生成表格文件、表格公式,并清理、创建、转换和分析表格中的文本数据,例如表格结构设计、数据分析表、表格自动化等。 2. 借助一些办公软件中的 AI 插件,如飞书中的相关插件,先通过 AI 理解图片中的内容并填充到表格列中,然后利用自带插件总结生成相关指令。 此外,在多模态数据生成中,结构化数据生成包括表格生成,多模态合成数据从大类来看有非结构化数据(图片、视频、语音等)和结构化数据(表格等)两大类。非结构化数据生成包括文本生成、图像生成、音频和语音生成、视频生成、3D 生成、合成数据生成等。
2025-04-14
如果改变照片中人物的表情
要改变照片中人物的表情,可以通过以下几种方式: 1. 在使用 SD 脸部修复插件 After Detailer 时,输入如“伤心、流泪”这样针对表情的正负提示词,人物的表情会进行相应改变。但输入“带着墨镜”可能没有效果。 2. 使用 Magic Brush 工具,选中人物的眉毛、眼睛、嘴唇等部位,通过调节轨迹的方向来实现合理的表情变化。 3. 在 Midjourney V6 中,若遇到无法改变角色脸部等问题,可按照以下步骤排除故障:首先确保写了强有力的提示以建议新的姿势、风格或细节;若角色抗拒被操纵,可能是 cref 图像支配了提示,可通过使用 cw进行处理,尝试将提示与较低的 cref 权重一起使用,如 cw 60,按照特定步骤操作,还可考虑使用 来恢复面部区域。
2025-04-14
我想做视频二创,比如把视频背景换掉,人物上的衣服换掉,请给我推荐一下相关AI工具
以下是为您推荐的一些用于视频二创,如更换视频背景、人物衣服的相关 AI 工具: 1. 山寨版阿里 Animate Anyone 开源:利用图像和视频中的人物姿势来合成动画。Novita AI 开源并提供 API 支持,提供照片和视频即可自动生成动画。 GitHub:https://github.com/novitalabs/AnimateAnyone API:https://novita.ai/playgroundanimateanyone https://x.com/imxiaohu/status/1796191458052944072 2. ViViD 视频虚拟试穿技术:由阿里巴巴开发,可以替换视频中人物的衣服,生成真实自然的视频,支持多种服装类型,在视觉质量、时间一致性和细节保留方面表现优异。 https://x.com/imxiaohu/status/1796019244678906340 3. 在进行视频二创时,若需要更精确的蒙版,比如人物的眼睛或身上的配饰等,可以使用 segment anything 中的 GroundingDINO。启用 GroundingDINO 后,AI 会自动下载模型,也可在没有魔法的情况下到云盘直接下载,放到指定文件目录下“……sdwebuiakiv4.2\\extensions\\sdwebuisegmentanything\\models\\groundingdino”。在检测提示词中输入相关内容,AI 可根据语义分割自动检测并设置好蒙版。还能通过预览箱体得到部分编号进行单一调整。比如给人物换背景时,加载生成的背景蒙版,选择合适的大模型和正向提示词,蒙版模式选择“重绘非蒙版内容”,若有需要还可进行后续细化和 PS 修复。
2025-04-01
如何让一张卡通人物动起来
要让一张卡通人物动起来,可以参考以下几种方法: 1. 使用 AnimateX :类似 Animate Anyone,输入角色图片和参考动作序列,即可实现角色动画,尤其适配拟人化的角色。 2. 借助 Pika : 账号注册:访问完成免费注册。 素材整理: 视频:准备一段视频,可手机实拍,≥5 秒,生成时会自动截取前 5 秒,横屏/竖屏均可(建议 1080p 以上)。 图片:准备一张主体清晰无遮挡的角色图片,生成的视频中将参考此图片的角色并融入视频。 文案思路:提前构思角色动态关键词(如“奔跑/挥手/发光”),也可让模型自由发挥。 3. 运用即梦进行图生视频:只需上传图片至视频生成模块,用简单提示词描绘画面中的动态内容,能生成时长为 3 秒钟的画面,运镜类型可根据剧本中的镜头描绘设置,以随机运镜为主,生成速度可选择慢速。 此外,在制作过程中,还可以像桂大羊的教程那样,通过描绘人物的提示词、上传角色参考图、扣除角色背景以便于进行角色加背景的融合生成时进行垫图操作等方式,提高人物和场景的融合度。
2025-03-30
人物一致性
Midjourney 的角色一致性功能: 功能介绍:类似于“风格参考”功能,尝试使人物与“人物参考”图像相匹配。 使用方法:在提示词后输入`cref URL`并附上一个人物图像的 URL。需注意一定要在提示词后面,否则会报错。可以使用`cw`来修改参考“强度”,从 100 到 0。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;强度 0(`cw 0`)时,只会关注面部(适合改变服装/发型等)。 实际效果:例如以甜茶或小公主的图片为案例,不同的强度参数下,发型、衣服等会有相应变化。 相关优势:能节省工期,提升生产管线的可控性。 其他应用:利用 MJ 重绘功能,在重绘提示词里输入`cref cw`保证角色一致性。对于生成图中的黑边,可框住黑边部分重绘输入关键词“background”去除,保证背景一致。 体验网址:MJ 的网页版体验较好,网址为 https://alpha.midjourney.com/
2025-03-29
关于图片生成人物衣服的提示词
以下是关于图片生成人物衣服的一些提示词相关内容: 在使用 Segment Anything 时,启用 GroundingDINO 可自动下载模型,将其放到特定文件目录下,在检测提示词中输入相关内容,如“eye”,可自动检测并设置蒙版。通过预览箱体获取编号,可选择调整单一部分。例如,只想调整左边眼睛,勾选 1 即可。还可给人物换背景,如大模型选择 revAnimated_v122,正向提示词为简单背景、花、国画、工笔,蒙版模式选择“重绘非蒙版内容”。将生成的图片放入图生图中,使用 tile 模型能给人物衣服添加国风元素。 设置模型和提示词时,例如大模型为 ghostmix_v20Bakedvae,正向提示词包含人物特征、服饰等描述,负向提示词包含 EasyNegative、badhandsv5neg 等。生成图片后可进行细节微调。 使用 cutoff 插件时,点击启用后按提示词顺序依次填入颜色提示词,中间用逗号分开,能准确显示颜色。如创建双人物构图,设置好人物形象和提示词,先在不开启插件时生成图片可能有颜色污染,开启插件并输入颜色信息后能保证颜色与提示词的关联性。
2025-03-28
我上传一个ai人物形象,有什么AI能驱动他当做数字人来口播,免费的那种
以下为您介绍一些可以免费驱动 AI 人物形象当做数字人进行口播的工具及使用方法: 1. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 上传后效果如图所示,My Avatar 处显示上传的照片。 点开大图后,点击 Create with AI Studio,进入数字人制作。 写上视频文案并选择配音音色,也可以自行上传音频。 最后点击 Submit,就可以得到一段数字人视频。 2. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 点击网址,点击右上角的 Create vedio。 选择人物形象,可以点击 ADD 添加您的照片,或者使用 DID 给出的人物形象。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 最后,点击 Generate vedio 就可以生成一段视频。 打开自己生成的视频,可以下载或者直接分享给朋友。 3. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI。 使用方法: 点击网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 点击开始创作,选择自定义照片。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 打开绿幕按钮,点击背景,可以添加背景图。 最后,点击生成视频。 4. 剪映: 优势:作为字节跳动旗下的产品,在抖音平台上被广泛应用,海外版 CapCut 也有出色表现。其拥有六大 AI 功能,能在编辑器里完成脚本生成、语音克隆、数字人口播等环节。 下载地址:剪映 制作流程: 打开剪映,添加一个文本到文字轨道,并修改好需要朗读的文字。 点击朗读,并进行声音克隆,剪映的声音克隆现在只用念一句话就可以完成克隆。 克隆完成后,选择喜欢的数字人形象,并把自己的克隆音色换上去。 一键智能生成字幕,再自行调整文字样式并校准。 生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象。 当选择一个数字人形象时,软件会马上播放出该数字人的声音。点击右下角的“添加数字人”,就会将选择的数字人添加到当前视频中。 左下角会提示渲染何时完成。然后可以点击预览按钮,查看生成的数字人效果。 增加背景图片: 可以直接删除先前导入的文本内容。 为视频增加背景图片,点击左上角的“媒体”菜单,并点击“导入”按钮,来选择本地的一张图片上传。 点击图片右下角的加号,将图片添加到视频的轨道上(会覆盖数字人)。 点击轨道最右侧的竖线,向右拖拽,直到视频的最后,也就是和视频对齐。
2025-03-27