Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如果想用几张照片,驱动自己的数字人视频,有哪个平台可以搞

Answer

以下是一些可以用照片驱动生成数字人视频的平台及使用方法:

  1. HEYGEN
    • 优点:人物灵活,五官自然,视频生成很快。
    • 缺点:中文的人声选择较少。
    • 使用方法:
      • 点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。
      • 上传后效果如图所示,My Avatar处显示上传的照片。
      • 点开大图后,点击Create with AI Studio,进入数字人制作。
      • 写上视频文案并选择配音音色,也可以自行上传音频。
      • 最后点击Submit,就可以得到一段数字人视频。
  2. D-ID
    • 优点:制作简单,人物灵活。
    • 缺点:为了防止侵权,免费版下载后有水印。
    • 使用方法:
      • 点击上面的网址,点击右上角的Create vedio。
      • 选择人物形象,你可以点击ADD添加你的照片,或者使用D-ID给出的人物形象。
      • 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。
      • 最后,点击Generate vedio就可以生成一段视频。
      • 打开自己生成的视频,可以下载或者直接分享给朋友。
  3. KreadoAI
    • 优点:免费(对于普通娱乐玩家很重要),功能齐全。
    • 缺点:音色很AI。
    • 使用方法:
      • 点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。
      • 点击开始创作,选择自定义照片。
      • 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。
      • 打开绿幕按钮,点击背景,可以添加背景图。
      • 最后,点击生成视频。
  4. 出门问问Mobvoi:提供了照片数字人的工作流及语音合成(TTS)API,可参考相关效果展示及工作流作者、创意策划等信息。
  5. 剪映数字人“个性化”:
    • 尽管剪映有很多公模数字人,但私模数字人更受欢迎。
    • 使用方法:
      • 第一步打开谷歌浏览器,点击链接https://github.com/facefusion/facefusion-colab 并点击open colab就进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的URL就会打开操作界面。
      • 第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成。
      • 第三步:等着自己专属的数字人视频出炉。
Content generated by AI large model, please carefully verify (powered by aily)

References

AI 数字人|一键让照片说话

想让照片开口讲话嘛?害怕麻烦?不会用AI?看看一键数字人的好用小工具![heading2]HEYGEN[content]优点:人物灵活,五官自然,视频生成很快。五星好评。缺点:中文的人声选择较少[heading3]使用方法[content]1.点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片1.上传后效果如图所示,My Avatar处显示上传的照片1.点开大图后,点击Create with AI Studio,进入数字人制作1.写上视频文案并选择配音音色,也可以自行上传音频1.最后点击Submit,就可以得到一段数字人视频啦~[heading2]D-ID[content]优点:制作简单,人物灵活缺点:为了防止侵权,免费版下载后有水印[heading3]使用方法[content]1.点击上面的网址,点击右上角的Create vedio1.选择人物形象,你可以点击ADD添加你的照片,或者使用D-ID给出的人物形象1.配音时,你可以选择提供文字选择音色,或者直接上传一段音频1.最后,点击Generate vedio就可以生成一段视频啦1.打开自己生成的视频,可以下载或者直接分享给朋友~[heading2]KreadoAI[content]优点:免费(对于普通娱乐玩家,嗯这很重要),功能齐全缺点:音色很ai[heading3]使用方法[content]1.点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能1.点击开始创作,选择自定义照片1.配音时,你可以选择提供文字选择音色,或者直接上传一段音频1.打开绿幕按钮,点击背景,可以添加背景图1.最后,点击生成视频

照片数字人工作流及语音合成(TTS)API- 出门问问Mobvoi

工作流作者:Chaojie https://github.com/chaojie/ComfyUI-mobvoi-openapi/blob/main/wf.json创意策划:JessyJangHi,亲爱的AI爱好者及开发者老师们,ComfyUI全球领导力峰会我们特意搭建数字人workflow(照片数字人驱动),仅需要上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”,希望能让大家感受生成式AI的魅力,应用于更多的使用场景。*本次活动特意提供了免费api额度及操作指南给大家进行体验,诚邀大家玩起来~以下是一些不同风格的照片驱动效果展示👇[未命名项目(9).mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/HKO4bcuK1oXh1Ax6ytZcLVqNncb?allow_redirect=1)我是能扫的动态二维码[未命名项目(5).mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/H1ArbYmVZoXLC2xMkutcgvoHn7T?allow_redirect=1)皮克斯风格(女)[未命名项目(6).mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/MxC9bgyGYobg5KxbJZmc9r29nIc?allow_redirect=1)皮克斯风格(男)[8409_1718172922.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/YwbRb8LgNoUIOqxZzk5cwS5enJf?allow_redirect=1)真人照片效果展示

方案:剪映数字人“个性化“—无限免费私模数字人

尽管剪映已经有很多公模数字人,但是从抖音上大火的数字人账号上看,私模数字人更受欢迎所以这里我将教大家用AI换脸软件来完成最后一步。📍注意:需要谷歌账号(淘宝或者在我们账号解决平台“[有号](https://www.learnprompt.pro/aiMarket)”就可以直接购买)1.第一步打开谷歌浏览器,点击链接https://github.com/facefusion/facefusion-colab并点击open colab就进到程序主要运行界面.在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的URL就会打开操作界面2.第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成!反复调试后给大家选出了最佳参数!1.第三步:等着自己专属的数字人视频出炉!有关数字人使用上的问题,欢迎在底部评论区留言,一起交流~同时如果对数字人课程感兴趣的话,欢迎查看通往AGI之路X AI沃茨的《克隆你自己》课程!📌课程内容:[实战课程:数字人课程](https://waytoagi.feishu.cn/wiki/JOWjwM0qfi2rYVkUIwychk9MnSh)🎉在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0🌍:aiwarts101

Others are asking
想用claude,怎么弄
Claude AI 是由 Anthropic 公司开发的一款基于自然语言处理技术和人工智能算法的聊天机器人,以开创性计算机科学家克劳德·香农(Claude Shannon)的名字命名,利用先进的技术为各种应用提供支持。 要注册 Claude.ai ,可以按以下步骤操作: 1. 访问 Claude 的官方网站 。 2. 点击注册或登录界面中的“Sign Up”或“Continue with email”选项。 3. 填写邮箱地址并设置密码,然后提交表单。 4. 系统会向您的邮箱发送验证邮件,打开邮件并使用其中的验证码完成邮箱验证。 如果在注册过程中遇到需要海外手机号接收验证码的问题,有以下可能的解决方案: 1. 使用虚拟海外号服务,如 SMSActivate、SMSPool 等,购买一个海外虚拟手机号来接收 Claude 的验证码。 2. 借助第三方服务网站如 uiuihao.com 完成注册您的 Claude 账号。 3. 如果有海外朋友,可以请他们帮忙接收验证码,并将验证码告知您。 完成注册后,如果希望升级到 Claude Pro 版本以获取更强大功能和更高的 API 调用限额,需要填写支付信息并选择合适的订阅计划。但需注意,订阅 Claude Pro 可能需要使用海外支付方式。 此外,Claude.ai 目前处于公开测试阶段,未付费用户使用平台可能会受到一些限制。如果在注册过程中遇到问题,可以参考其他用户分享的详细注册教程和解决策略。 另外,还可以利用 Claude 制作 Crossword 小游戏,具体步骤如下: 1. 单词和解释:需要有文字描述和清晰示例,效果展示要稳定,输出格式要优秀。 2. 游戏生成:先从游戏规则入手,包括所有相交字母必须形成有效单词、每个字母格必须是至少一个横向词和一个纵向词的一部分、网格中不允许有 2×2 的纯白色方块区域等。然后逐步从创建的逻辑入手,包括词汇分析、初始布局规划、递归填充算法、完整性验证、输出处理等。后续还需要补充游戏性、难度、显示效果等,可能需要多次修改逻辑和调整效果风格,增加游戏模式、难度等。 利用 Claude 制作「古诗词卡片」的流程如下: 1. 输入 Prompt 。 2. 用户输入主题、风格,AI 就会根据主题、风格直接输出最终结果。获取提示词,如果想立即领取专属古诗词卡牌,可以直接获取开源的提示词。
2025-03-14
我想用ai动漫人物唱歌
以下是一些可以帮助您实现用 AI 动漫人物唱歌的相关信息和资源: 在 AI 图像处理方面,有一些项目可以将图像进行动漫化处理,例如卡通头像制作等。 在音频与音乐制作方面,有专属歌曲创作、声音克隆、AI 唱歌等项目。比如制作专属歌曲、声音克隆/视频对口型等。 腾讯 AniPortrait 可以根据音频和静态人脸图片生成逼真的动态视频,支持多种语言、面部重绘、头部姿势控制。相关链接:https://github.com/ZejunYang/AniPortrait 、https://arxiv.org/abs/2403.17694 、https://x.com/imxiaohu/status/1772965256220045659?s=20 。 Hedra Studio 推出的 Character3 AI 支持全身动态与情感控制,能唱歌、说话甚至表演。
2025-03-12
我想用ai对一个网站进行渗透测试 可以用哪些工具
以下是一些可用于对网站进行渗透测试的 AI 相关工具和信息: GPT4 能够在设计用于数字取证和渗透测试的 Linux 发行版上执行命令,并能扫描网络、确定目标主机、尝试常见密码等操作,但需要注意其使用应在合法范围内。 XBOW 正在开发的 AI 渗透测试员,其性能可与优秀的人类渗透测试员相媲美。 对于学习网络安全知识和技术,可参考以下合法途径: 阅读相关的书籍、论文、博客等。 参加专业的网络安全培训课程。 在合法的实验室环境下进行网络安全实验,如搭建虚拟网络环境、进行漏洞扫描和渗透测试等。 加入网络安全社区,与其他爱好者交流经验和技术。 同时,请确保所有的测试和实践都在合法和道德的范围内进行。
2025-03-10
我想用ai做关于宣传东营的视频
以下是一些利用 AI 制作关于宣传东营视频的方法和步骤: 1. 可以使用飞书多维表格字段插件,通过指令和 AI 生成视频插件来批量生成宣传视频。首先创建一列字段,从字段捷径 AI 中心中选择智谱 AI 生成视频。插件配置较为简单,直接选择视频指令作为文本描述即可批量生成。但视频生成需要一定时间,生成后可点击播放查看效果,如有不满意可重试或手动调整指令。 2. 还有一种无需编程和专业视频制作技能的方法,能以低成本快速制作数字人视频。数字人视频的整体制作流程大致分为三步: 创建视频内容:通过输入文稿内容,确定数字人播出的内容。 生成数字人:通过工具,以及视频内容生产数字人形象及播放语音。 AI 换脸:通过 AI 工具,将数字人的脸转换成指定宣传的形象,以便以自己的品牌形式宣传。 3. 利用 ChatGPT 生成视频脚本,例如设定关键词为“深受年轻人喜欢的电影导演”“长度大约在 1 分钟”“山海经中的神兽在赛博朋克世界”,让其创作宣传视频脚本。之后与 ChatGPT 讨论、修改细节、撰写宣传文案,把控核心内容、优化脚本,最终完成视频脚本定稿。
2025-03-10
我想用AI辅助做科研选题,写学术课题申报书,我需要学习哪些内容,按步骤进行规划
利用 AI 辅助做科研选题并写学术课题申报书,您需要按以下步骤学习相关内容: 1. 确定课题主题:明确您的研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具,搜集相关研究文献和资料。 3. 分析和总结信息:借助 AI 文本分析工具,对收集到的资料进行分析,提取关键信息和主要观点。 4. 生成大纲:利用 AI 写作助手生成课题大纲,涵盖引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:使用 AI 工具辅助撰写文献综述部分,保证内容准确完整。 6. 构建方法论:依据研究需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若课题涉及数据收集和分析,运用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:借助 AI 写作工具撰写课题各部分,并进行语法和风格检查。 9. 生成参考文献:使用 AI 文献管理工具生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具检查课题的逻辑性和一致性,并根据反馈修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具确保课题的原创性,并做最后的格式调整。 请记住,AI 工具只是辅助,不能完全替代研究者的专业判断和创造性思维。在使用 AI 进行课题写作时,要保持批判性思维,确保研究质量和学术诚信。
2025-03-09
我想用ai进行直播建立虚拟的我
如果您想用 AI 进行直播建立虚拟的自己,以下是一些相关信息: 虚拟主播在电商直播间的现状和挑战: 直播间的特点在于真实性,包括真实的商品展示、试用以及评测,这是虚拟主播面临的挑战。如虚拟网红翎 Ling 的美妆带货翻车案例,虚拟人很难让消费者共情。 尽管 3D 交互技术可完善数字人与真实空间的交互,但实现与商品的互动较困难,且用户希望了解商品细节。 虚拟数字人的发展阶段: 拟人化:由计算机虚拟合成高度逼真的三维动画人物,初步基于 AI 实现虚拟人驱动,实时进行信息沟通和反馈。 同人化:从外观模拟进阶到情感可交互,实现与人类高质量情感互动。 超人化:虚拟人的能力超越自然人,“虚拟”实体化,机器人承载虚拟人意识回到现实世界。 虚拟直播间的场景搭建: 绿幕的虚拟直播场景方案是低成本的直播样式,手机上有相关绿幕视频抠图 App,288 元可购买永久会员解锁所有功能。 场景搭建成本因多种因素而异,包括规模、复杂度、细节程度、互动特效等。 MR 设备的普及可能带动新的技术迭代,提供更沉浸式的互动购物体验。 构建高质量 AI 数字人的方法: 建好的模型可使用 web 前端页面或 Native 的可执行程序进行部署,呈现在用户面前的是一个 GUI。 开源数字人项目选择 live2d 作为数字人躯壳,相比其他方式更可控、自然、轻量和简单,卡通二次元形象接受度更高。 品牌使用 AI 驱动虚拟主播的情况: 欧莱雅、YSL、兰蔻、李宁、北面等品牌会使用 AI 驱动的虚拟主播进行自播,但通常只在午夜时段排期。 阿里云提供的品牌智能直播间基础版有多种功能,售价为 99000 元/(年×路)。 淘宝智能直播间的虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设动作库和真实语音表现,展示方式和互动流程有一定特点,但也存在一些问题,如无法与产品接触导致测评缺乏真实性。
2025-03-06
有没有给几张例图就能生成其他图片的AI
以下是为您提供的相关信息: 目前有一些 AI 工具可以根据给定的几张例图生成其他图片。例如 Stable Diffusion 模型,它能依据用户输入的文本指令,利用文本中的语义信息与图片中的像素对应关系生成匹配的图片。其生成的图片样式完全取决于使用者输入的提示词,难以出现完全相同的两张输出图片,类似于画笔,最终的图画构造取决于使用者的设计。 在实际应用中,如列宾、穆夏等著名画家的作品风格可作为 AI 生图的参考。我们曾基于列宾的真迹「伏尔加河上的纤夫」让 AI 生成了「伏尔加河上的海盗」「伏尔加河上的商人」「伏尔加河上的帮工」等仿画,也基于穆夏的代表作生成了多幅仿画。 在 AI 作图的创作中,有一些要点和方法。比如要注重趣味性与美感的结合,通过反差、反逻辑、超现实方式带来视觉冲击,同时在美术基础不出错的前提下将形式与内容结合。在纹身图创作时要强调人机交互,对输出图片根据想象进行二次和多次微调,确定情绪、风格等锚点再发散联想。编写提示词时要用自然语言详细描述画面内容,避免废话词。 此外,全国首例 AI 生成图片著作权案例表明,人工智能并不具备自由意志,使用者根据自己的审美个性通过增删提示词、修改相关参数得出并选定的图片,完全体现出本质上是使用者在利用工具创作,投入了自己的智力以及独创思想,这样生成的图片属于美术作品,具有独创性和智力投入,受到著作权的保护。
2025-03-04
推荐几张ai领域图片
以下为您推荐几张 AI 领域的图片: 1. 节目单: 图片主题:风景,祖国河山 描述:AI 还原的中国自然景观,一些前所未有的角度,带来视觉震撼。 图片主题:AI 与画手的对话 描述:展示 AI 作为艺术创作工具,表明 AI 不是只会抄袭,而是画手的好工具。 图片主题:搞笑图/扩图轮播 描述:全网搞笑图片的二创。 图片主题:诗与远方 描述:诗词与 AI 结合的视觉艺术,呈现唯美画面。 图片主题:AI 红包 描述:直播制作红包封面并分发,炒热气氛。 2. 摊位信息: 摊位主题:乐易科学院 描述:通过 AI 技术,结合量子、暗物质、天体运行规律等能量形式,从科学、物理学、天文学、心理学等方面讲解国学和传统文化,可进行批八字、调风水、性格色彩分析。 摊位主题:AIGC 策划程序美术(3AI 简称 3A 游戏)应用独立游戏开发 摊位主题:AI 人像摄影绘画 摊位主题:B2B AI 营销与 AI 落地项目快速落地 描述:涵盖 AI 训练 to b 出应用、智能体 agent、文生图生视频等,以及美国独立站搭建、Google seo 与 AI 结合等,展示相关技术尝试和工具。 3. 他山之石|如何防止 AI 取代人类思考一切: 原文主要探讨了手写笔记和手绘对于学习和思考的重要性,认为在学习新技能时应先依靠人类自身,不应过早使用 AI,还提到了与朋友 Trevor Muir 关于此问题的交流。
2025-01-21
给你几张图图片,帮我生成是视频的AI
以下为几种利用图片生成视频的方法: 1. 前 Sora 时代的方法:使用 Pika、Pixverse、Runway、SVD 四大 AI 视频工具。为每张图片只抽一次卡,图片和 GIF 动图顺序包括 MJ 图等。生成的视频类型有剧情片(如太空舰队交战、宇航员头盔特写等)、战争片(如士兵在战壕准备迎击等)、奇幻片等。 2. 快影(可灵)处理图片的方法: 打开快影(需先通过内测申请),选择 AI 创作。 选择 AI 生成视频。 选择图生视频。 上传处理好的图片,填写想要的互动动作和效果,然后点击生成视频。 排队等待生成结束,点击下载。 3. 利用 PixVerse 生成视频:涂抹选区,给出相应的运动方向,最后加入配音并剪辑。 您可以根据自己的需求选择适合的方法来将图片生成视频。
2025-01-04
我发给AI几张图,能不能做一个电子画册?哪一个AI做的更好
目前有一些 AI 工具可以帮助您将几张图制作成电子画册,例如谷歌的 Imagen 3。Imagen 3 是谷歌推出的高质量文本到图像模型,能够生成细节更好、光照更丰富且干扰伪影更少的图像。 如果您想快速制作电子画册,以下是一些相关的知识和方法: 1. 对于制作海报,您可以使用国内的 AIGC 绘图平台无界 AI。大致流程包括确定主题与文案(可借助 ChatGPT 等文本类 AI 工具协助完成文案)、选择风格与布局、生成与筛选海报底图、配文与排版。 2. 在游戏截图升级方面,底图制作可以使用 PS 添加内容丰富画面。比如简单粗暴的背景贴人物合成,或者通过一些简单加工让 AI 更清楚您的需求。还可以结合 3D 软件定制内容,如使用 ACCURIG 进行一键绑定等。
2024-12-26
给你一张图片,在一个图库中找到相似度最高的几张图
以下是在图库中找到与给定图片相似度最高的几张图的方法: 1. 寻找两张图:使用童星吴磊的图片,最初尝试了哈利波特的扮演者,但因 InsightFaceSwap 规则限制未采用。 2. MJ 绘图:较为简单,加上简单相机参数、写实风格,使用 MJ v 6.0 绘图,可按需求调整 9:16 的比例。直接描述情况下,MJ 画图效果尚可,可根据需要增加参数。 3. 图片裁剪:直接使用 PS 进行裁剪,也可选用自己顺手的工具,所选照片尽量能一刀完整分割两个人。 4. 使用 InsightFaceSwap 处理图片: 输入“/saveid”,idname 可随意填写,如“child”,上传原图。 换脸操作输入“/swapid”,id=child,上传分割好的图。 选择觉得像的图,效果不好可循环操作,但注意插件每日免费使用次数。 5. 拼接:重新利用 PS 把两张图片拼接回来。但相似程度可能不太理想,插件对老外的脸识别度较好。
2024-12-25
图生视频
以下是关于图生视频的相关信息: 什么是图生视频: 输入一张图片和相应的提示词,清影大模型会将图片转变为视频画面。您也可以只输入一张图片,清影大模型将自行发挥想象力,把图片扩展为一段有故事的视频。 图生视频的两个小技巧: 1. 选用尽可能清晰的图片,上传图片比例最好为 3:2(横版),清影支持上传 png 和 jpeg 图像。如果原图不够清晰,可采用分辨率提升工具将图片变清晰。 2. 提示词要【简单清晰】。可以选择不写 prompt,直接让模型自己操控图片动起来;或者明确您想动起来的【主体】,并以「主体」+「主题运动」+「背景」+「背景运动」的方式撰写提示词(一定要有主体,不然可能会出现 AI 狂乱景象)。如果不明确大模型如何理解您的图片,推荐将照片发送到清言对话框进行识图,明确【主体】的描述。 常见的图生视频模型(从高到低排序)及特点: 1. pd 2.0 pro:即梦生成的画面有点颗粒感,p2.0 模型还是很能打的,很适合做一些二次元动漫特效,理解能力更强,更适合连续运镜。 2. luma 1.6:画面质量挺好,但是太贵了。 3. 可灵 1.6 高品质:YYDS! 4. 海螺01live:文生视频比图生视频更有创意,图生也还可以,但是有时候大幅度动作下手部会出现模糊的情况,整体素质不错,就是太贵了。 5. runway:画面质量不算差,适合做一些超现实主义的特效、经特殊就容镜头的。 6. 智谱 2.0:做的一些画面特效挺出圈的,适合整过,但是整体镜头素质还差点,好处就是便宜,量大,管饱,还能给视频加音效。 7. vidu1.5:二维平面动画的快乐老家,适合做特效类镜头,单镜头也很惊艳,大范围运镜首尾帧 yyds! 就是太贵了!!!!! 8. seaweed 2.0 pro:s2.0 适合动态相对小的,更适合环绕旋转运镜动作小的。 9. pixverse v3 高品质:pinverse 的首尾帧还是非常能打的,就是画面美学风格还有待提升的空间。 10. sora:不好用,文生视频挺强的,但是最需要的图生视频抽象镜头太多,半成品都算不上,避雷避雷避雷,浪费时间。 PixVerse V2 使用教程: 1. 单个视频生成(8s):8s 的视频生成需要花费 30 Credits,5s 的视频生成需要花费 15 Credits,且只能使用 PixVerse V2 模型,生成时请注意模型选择。目前仅支持 16:9 画面比例的视频生成。 2. 文生视频:点击“Text to Video”,在“Model”选择“PixVerse V2”,视频时长。PixVerse V2 支持多风格的视频生成,您可以通过在提示词中加入“Anime”,“Realistic”等词语做到这点。 3. 图生视频:点击“Image to Video”,在“Model”选择“PixVerse V2”,视频时长。图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能,如需要使用上述功能,请将模型切换至“PixVerse V1”。
2025-03-15
现在可以实现0基础制作爆款视频的工作流了么
目前可以实现 0 基础制作爆款视频的工作流,以下是一些相关策略和方法: 1. 发布视频时,鼓励粉丝评论他们想看到的内容或让他们为新内容命名,以增加互动性和激发创意。使用吸引人的标题和描述,包含相关关键词和标签,便于在平台上被更多人发现。 2. 考虑与其他领域的创作者或品牌合作,扩大受众范围。 3. 了解观众最活跃的时间,选择合适的时间发布视频,以最大化观看量。分析前几次视频的数据,从中获得灵感,调整创作方向。 4. 以生物融合项目为例,如野牛与霸王龙的融合,视频分为两个镜头,每个镜头分别是一幅图。第一幅图是融合前,图像中央是一条从上到下的、发光的 DNA 双螺旋结构,纵向贯穿整个画面,把画面一分为二;第二幅图是融合后的,融合后的生物非常可怕、霸气,巨形怪兽,画面为阴暗风格,给人震撼。 5. 对于小红书爆款单词视频,先拆解模板的制作流程,逐个轨道分析图片、音频、文字轨道,理解思路后用相关工作流搭建。制作固定的元素,如在测试工作流中增加插件将图片和音频合并成视频等。
2025-03-15
动画音效ai,用于生成视频中的特殊音效,比如呼吸声,爆炸声,脚步声等等
以下是关于动画音效 AI 用于生成视频中特殊音效(如呼吸声、爆炸声、脚步声等)的相关信息: 1. 11Labs AI 音效:可以在一段提示语中放入不同画面的描述音效来生成一整个视频音效,但目前可用性有待提高,一次生成可能有 2 3 条不能用。实际操作中,分开画面来做音效合成更方便调整。例如 20s 视频可分为 5 个不同的音效合成,如城市背景噪音、无声的脚步声、电子嗡嗡声、心跳加速、警笛声等。 2. 游戏中的生成式 AI 革命:音效是 AI 的一个具有吸引力的开放领域。已有学术论文探讨在电影中生成“现场效果音”(如脚步声)的想法,但在游戏中的商业产品尚属稀少。游戏中传统的音效生成和管理繁琐且重复不真实,使用实时的生成性 AI 模型来制作现场效果音可以在飞行中生成适当音效,每次略有不同,并能根据游戏参数响应。 3. 喂饭级教程:在视频制作中,音效库可以通过搜索框输入关键词(如开门声)来选择合适的音效试听并添加到音轨。
2025-03-15
在使用comfyUI制作ai视频时,如何减小频闪
很抱歉,您提供的内容中没有关于在使用 ComfyUI 制作 AI 视频时如何减小频闪的相关信息。建议您检查 ComfyUI 的设置选项,看是否有与视频帧率、显示刷新率相关的设置,适当调整这些参数可能有助于减小频闪。同时,确保您的硬件设备(如显卡、显示器)性能良好且驱动程序为最新版本,也可能对解决频闪问题有所帮助。
2025-03-15
如何让ai帮我写短视频脚本
以下是一些让 AI 帮您写短视频脚本的方法: 1. 指令逻辑: 自己给出开头,让 AI 知道结尾,避免模糊式提问,如“小王,写一篇自律的报告给我”。 提供内容的上半部,让 AI 撰写下半部,并包含必要内容。 将生成的内容以不同写作技巧、强硬转换风格,多滚动几次,写出多样版本与风格,降低初稿修改时间。 2. 反问法:让 AI 问您问题,能发现它思考更仔细,也能了解其逻辑并修正。 3. 制作技巧: 使用 Fanbook 中的 niji6 模型及sref 指令,确定视频风格一致性,选择 16:9 尺寸。 根据主题确定风格和时长,设定故事主线和镜头。 按照场景、地点、镜号、画面描述、台词、音效等维度填充分镜头,精简人物对话,提炼重点。 借助语言大模型获取画面灵感,多提问、多尝试。 4. 故事来源: 原创(直接经验):自身或周围人的经历、做过的梦、想象的故事等。 改编(间接经验):经典 IP、名著改编、新闻改编、二创等。 5. 剧本写作: 编剧有一定门槛,不能单纯套剧作理论和模版,要多写多实践,再看书总结经验,循环往复。 短片创作可从自身或朋友经历改编入手,或对短篇故事进行改编。 多跟别人讨论故事,听取感受。
2025-03-15
如何做AI数字人,我想做视频,但是不想真人出镜
以下是制作 AI 数字人视频且不想真人出镜的方法: 1. 在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口,并将数字人拖动到合适的位置。 2. 增加字幕:点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 3. 至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。 4. 如果希望数字人换成自己希望的面孔,需要用另一个工具来进行换脸。 此外,还有以下相关信息: 无需真人模特,只需上传产品图片,数字人即可手持产品进行口播展示。支持语音和口型同步,动作、姿势定制,提供 1000+多国家数字人模特,覆盖全球 28+种语言,快速生成产品宣传视频,省去拍摄烦恼。测试视频效果已接近成熟,嘴型部分仍需微调。在线体验: HeyGen 与 Sora 集成推出全新数字人技术,利用 AI 创建完全虚拟的数字人,动作、表情灵活可调,无需真人模特和重复拍摄,适配无限时长视频制作。
2025-03-15
怎么免费生成一张我需要的场景照片
以下是几种免费生成您需要的场景照片的方法: 1. 利用 MJ 应用: 构思适合画绘本的故事,将其分为多个场景,用包含环境、人物、动作的话描述每个场景。例如:故事名《Lily 的奇妙之旅》,场景 1 为“Lily 来到一个阳光明媚的森林,跳过清澈的小溪,愉快玩耍。在路上结识了一只友善的棕熊,她们成为了旅伴。” 为每个场景生成图片时,设置 prompt 包括场景和风格,如“Walking in a mysterious cave with glittering gems,little girl Lily wearing a yellow floral skirt,her friend brown bear,dim,dreamlike,super high details,HDsmooth,by Jon Burgerman,s 400niji 5style expressivear 3:4”。 若只需要场景图像,可使用 mj 的 region vary 工具将人物完全框选,删除人物描述词后重新生成。 2. 悠船的使用: 写好提示词,右上可下载对应图片。 进行参数调整,注意任何点击都会重新生成图片,免费用户可能会提示超出套餐。 常用的图片调整内容包括变化(幅度有细微和强烈之分)、高清(有“直接”和“创意”两种方式)、风格变化(基于生成的图片再创作)、拓展(上下左右拓展图片)、缩放(指镜头)、局部重绘(选择区域要大)。 可以使用垫图、参考风格和提示词配合生成符合要求的图片。 3. Stable Diffusion 的使用: 把觉得好看的照片导进去,如果是从 SD 下载下来的 PNG 格式照片,右边会自动弹出照片的信息,包括正面关键词、负面关键词等,复制这些信息到“文生图”页面的关键词文本框中,点击生成按钮下的第一个小按钮,SD 会自动分配信息,就能得到差不多的照片(前提是有一样的大模型和 Lora)。 如果导入照片后右边没有生成信息,可用“标签器(Tagger)”来生成照片的关键词。
2025-03-07
怎么用AI生成照片?
以下是几种用 AI 生成照片的方法: 1. 使用 Stable Diffusion 模型:它可以根据您输入的文本指令,利用文本中包含的语义信息与图片中包含的像素之间的对应关系生成图片。生成的图片样子完全取决于您输入的提示词,在非排列组合的工作模式下难以出现完全相同的两张输出图片。就像使用画笔,线条、色彩由它提供,而构造出什么样的图画取决于您自己的设计。 2. 利用即梦生成定制化人物肖像写真: 打开即梦官网链接:https://jimeng.jianying.com/aitool/home/?utm_medium=baiduads 。 选择写实肖像。 选择心仪的模板,比如人鱼风,点击“做同款”。 为生成定制肖像,一定要点击“导入参考图”。 点击“人物长相”,注意很多名人的脸无法使用生成。 点立即生成。 查看生成好的照片,若不满意可再点击生成,找出最满意的一张或几张。 生图模型选择最新的 2.0PRO,有照片质感。图片比例可改,有八种比例可选,图片尺寸可自由选择。 3. 使用 Stable Diffusion 的涂鸦功能: 点击空白的地方上传一张纯白的图片作为画纸。 右边的两个小按钮点开可调节画笔的大小和颜色。 在画纸上随便画画。 挑合适的大模型,想要什么画风就挑什么模型。 输入关键词,先输入关于照片质量的词,再告诉它您画的是什么。 把重绘幅度拉到 0.6 0.8,点击生成。
2025-03-07
老照片修复
以下是关于老照片修复的相关内容: ComfyUI 老照片修复 Flux Controlnet Upscale: 以前的高清放大工作流复杂,新模型结合工作流只需十几个基础节点就能实现更好效果。 参数调节方面,一般先确认放大倍数,再根据图片调整 ControlNet 强度。 ControlNetUpscaler 放大模型是 Jasper 研究团队为低分辨率图像开发的,可与 diffusers 库一起使用,采用多种方式对真实图像进行人工退化训练,训练方式类似 Wang,Xintao 等人发表的文献中的方法,遵循 Flux.1dev 模型许可证范畴。 Flux Ultimator 能增加小细节,增强鲜艳色彩,在 0.1 强度设置下有显著效果,能顺利集成到工作流程中,与其他 LORA 结合使用时强度需小于 0.5。 若图片质量细节不够,可选择 T5 Clip 的 fp16 版本。 ControlNet 传递的应是上传的原始图片。 【SD】用 AI 给老照片上色,岁月不改它模样: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。 对于复杂的老照片,可在 PS 中进行角度调整和裁切,若直接上色效果不佳,可放弃人物服装颜色指定,只给场景方向,加入第二个 controlnet 控制颜色,使用 t2ia_color 模型和简单关键词。 新上线的 controlnet 模型中,Recolor 模型可将黑白图片重新上色。 人物照片还原可选择 realisian 的写实大模型,用提示词描述颜色和内容,ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果更好。
2025-03-06
证件照片生成
以下是关于证件照片生成的相关内容: 可以通过搭建证件照应用页面来实现。先创建应用并设置第一个 div 容器,页面分为上中下三块,顶部为标题,中间有原图、过渡和最终结果,底部为展示区域和表单。还需对容器的高度、宽度、排列方向以及文本组件的字体、颜色、加粗等属性进行设置。图片上传处理方面,介绍了图片组件的本地上传和绑定数据功能,需注意微信截图可能导致上传问题。页面也可分为左右两块,左侧展示区域,右侧为表单,左侧还需嵌套容器处理图片和文字展示。此外,前端页面搭建有一些技巧,如在 DIV10 中选择子容器、复制搭建元素等,包括调整表单组件的尺寸、按钮文案和上传文件类型等设置。业务逻辑流程包括用户上传照片、图片理解、图像生成、智能换脸、背景修改等步骤,各步骤中有参数设置、提示词调整和测试方法。 普通人现在可以利用 AI 生成自己的证件照,无需去影楼拍摄。有能将上传照片生成白底、蓝底和红底的证件照生成工具。
2025-03-06
我需要找到一个方法来把我爷爷迷迷糊糊的老照片上的样子生成样貌特征完全一致的数字人脸,如何可以实现?
以下是一种可能实现将您爷爷老照片生成数字人脸的方法: 1. 利用剪映软件: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,比如“婉婉青春”。 软件会播放数字人的声音,您可判断是否需要,点击右下角“添加数字人”,将其添加到当前视频中。剪映会根据提供的内容生成对应音视频并添加到轨道中。 左下角会提示渲染完成时间,之后可点击预览按钮查看效果。 为让视频更美观,可增加背景图片。删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”本地图片,将其添加到视频轨道上(会覆盖数字人)。 拖动背景图的角将其放大到适合尺寸,将数字人拖动到合适位置。 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 完成后点击右上角“导出”按钮导出视频备用。 2. 若希望数字人脸换成特定的面孔,可能需要使用其他工具进行换脸。 3. 对于老照片的处理,还可以启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够的情况下放大图片。 对于复杂的老照片,可先在 ps 里进行角度调整和照片裁切,然后上色。若直接上色效果不佳,可放弃人物服装颜色指定,只给场景方向,让 AI 自行决定。 可加入第二个 controlnet 来控制颜色,使用 t2ia_color 模型,给出简单的关键词,如“蓝天、绿树、灰石砖”。最后经过脸部修复和放大得到最终效果。
2025-03-06
老旧照片修复
以下是关于用 AI 给老旧照片修复上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,在显存不够的情况下,仅使用分块渲染功能将图片放大到足够倍数。 2. 在 PS 里进行角度调整和照片裁切。 3. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。 4. ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 5. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。 6. 把图片发送到图生图中,打开 stableSR 脚本,放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 7. 对于复杂的照片,如人物多、场景复杂、像素低的情况,可放弃人物服装颜色指定,只给场景方向,让 AI 自行决定颜色,还可从网上找参考照片让 AI 匹配色调,加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 作者为白马少年,发布时间为 2023 年 9 月 10 日 19:00,原文网址:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw 。
2025-03-06