知識ベースとの対話 - 如何生成稳定的AI视频

回答

以下是关于生成稳定的 AI 视频的相关信息：

工具推荐：

Runway：
- 网址：https://app.runwayml.com/video-tools/
- 官方使用教程：https://academy.runwayml.com/
- 知识库详细教程：工具教程：Runway Gen-3
- 特点：支持文生视频、图生视频、视频生视频；文生视频支持正向提示词、风格选择、运镜控制、运动强度控制、运动笔刷，支持多种尺寸，可设置种子值；生成好的视频可以延长时间，默认生成 4s 的视频；使用英文提示词。
Stable video：
- 网址：https://www.stablevideo.com/generate
- 知识库详细教程：工具教程：StableVideo
- 特点：支持文生视频、图生视频，仅英文；图生视频不可写 prompt，提供多种镜头控制；文生视频先生成 4 张图片，选择其中一张图片以后再继续生成视频。

技术差异：代表产品如 Runway，在端到端视频生成中，涉及的技术包括 GAN 生成对抗网络、VAE 变分自编码器和 Transformer 自注意力机制。

GAN 生成对抗网络：是一种无监督的生成模型框架，能生成视觉逼真度高的视频，但控制难度大、时序建模较弱。
VAE 变分自编码器：可以学习数据分布，像压缩和解压文件一样重建视频数据，能根据条件输入控制生成过程，但质量较 GAN 略低。
GAN、VAE 生成视频速度快，但存在生成质量和分辨率较低、长度短、控制能力弱的缺点。
Transformer 自注意力机制：通过学习视频帧之间的关系，理解视频的长期时间变化和动作过程，对长视频建模更好，时序建模能力强，可实现细粒度语义控制，但计算量大。

当前面临的问题及解决方案：当前仍面临生成时间长、视频质量不稳定、生成的视频语义不连贯、帧间存在闪烁、分辨率较低等问题。解决方案包括使用渐进生成、增强时序一致性的模型等方法，上述的补帧算法、视频完善策略也可在一定程度上缓解问题。

制作技巧：在镜头衔接上要写运镜提示词，描述多种运镜方式，否则画面会乱变。在做视频时要不断尝试参数。

AIモデルによって生成されたコンテンツであり、慎重に確認してください（提供元: aily）

参照

小歪：AI视频工具合集

https://app.runwayml.com/video-tools/官方使用教程：https://academy.runwayml.com/知识库详细教程：[工具教程：Runway Gen-3](https://waytoagi.feishu.cn/wiki/Eun9wqDgii1Q7GkoUvCczYjln7r)简单介绍：支持文生视频、图生视频，视频生视频使用英文提示词文生视频支持正向提示词、风格选择、运镜控制、运动强度控制、运动笔刷（https://academy.runwayml.com/gen2/gen2-motion-brush-interface），支持16:9、9:16、1:1、4:3、3:4、21:9尺寸，可设置种子值图生视频、视频生视频除了尺寸不可选以外，其他跟文生视频基本相同生成好的视频可以延长时间，默认生成4s的视频相关界面截图：[heading3]Stable video（有免费额度）[content]https://www.stablevideo.com/generate知识库详细教程：[工具教程：StableVideo](https://waytoagi.feishu.cn/wiki/Hf1cwooP5iRH2zkJ6RrcAKLunWb)简单介绍：支持文生视频、图生视频，仅英文图生视频不可写prompt，提供多种镜头控制文生视频先生成4张图片，选择其中一张图片以后再继续生成视频图生视频：文生视频：

AI视频生成(上) | 技术发展概况和应用场景思考

代表产品：RunwayGAN生成对抗网络:是一种无监督的生成模型框架,通过让两个神经网络相互博弈来进行机器学习。可以生成视觉逼真度高的视频,但控制难度大、时序建模较弱。VAE变分自编码器:它是一种可以学习数据分布的网络结构。就像把视频文件压缩成较小的文件再解压一样,它可以重建视频数据。VAE可以根据条件输入控制生成过程，但质量较GAN略低。GAN、VAE生成视频速度快，缺点是生成质量和分辨率较低，长度短，控制能力弱。Transformer自注意力机制:通过学习视频帧之间的关系,理解视频的长期时间变化和动作过程,这种方式对长视频建模更好，时序建模能力强,可实现细粒度语义控制,缺点是计算量大[heading2]1.4 AI视频生成当前面临的问题[content]当前仍面临生成时间长、视频质量不稳定,生成的视频语义不连贯、帧间存在闪烁、分辨率较低等问题。解决方案有：使用渐进生成、增强时序一致性的模型等方法解决。上述的补帧算法、视频完善策略也可在一定程度上缓解问题。[heading2]二.应用场景思考

娜乌斯嘉AIGC商业片制作 2024年11月1日 - 智能纪要

[heading2]智能章节[45:01](https://waytoagi.feishu.cn/minutes/obcnn3u33cq15x132rd3c87d?t=2701000)AI图像与视频生成中的技巧、问题及成功率本章节主要讲述视频制作相关内容。在镜头衔接上要写运镜提示词，描述多种运镜方式，否则画面会乱变。提到不同软件（如季梦、可林）生成图片或视频的情况，包括成功率、生成时间、面部效果等，还指出要对AI生成不稳定情况脱敏并介绍了一些小技巧。[53:56](https://waytoagi.feishu.cn/minutes/obcnn3u33cq15x132rd3c87d?t=3236000)娜娜酱谈视频制作中的AI生成、参数调整与画面关系本章节娜娜酱提到当天有多个内容，先将部分任务生成然后合成，在检查镜头是否都运行正常。还讨论了AI视频稳定相关，认为PS一帧一帧改不可行，AE改尚可。在做视频时要不断尝试参数。此外提到当天的第二个内容是deform，还涉及本地跑双月相关话题。[57:32](https://waytoagi.feishu.cn/minutes/obcnn3u33cq15x132rd3c87d?t=3452000)SD sample diffusion相关，谈defirm及运行SD所需电脑配置本章节主要内容是关于defirm相关。首先询问大家是否有SD sample diffusion基础，然后介绍defirm相关画面类似不断迭代变化的情况。还提到电脑带SD的要求，独立显卡8G以上较好，想做好要花钱。最后强调苹果和a卡跑相关内容存在问题，如速度慢、报错难查等。