Chat with Wiki - 好用的人声合成AI

Answer

以下是一些好用的人声合成 AI 相关内容：

关于 AI 孙燕姿的生成：
- 推荐归臧写的通俗易懂的教程：
  - 《教你打造属于自己的 AI 孙燕姿，AI 歌手模型使用及训练保姆级课程#1/2 使用模型》
  - 《教你打造属于自己的 AI 孙燕姿，AI 歌手模型使用及训练保姆级课程#2/2 训练模型》
- 项目主要使用 So-VITS-SVC 4.0，可在Github 上找到该项目。
- 模型使用分为原始声音处理、推理过程和音轨合并三个部分。使用 UVR_v5.5.0 软件处理声音，保留人物的干声。运行整合包的 Web UI 进行声音推理，需将模型文件和配置文件放置正确文件夹下。分割后的素材尽量不要超过显存大小，使用【slicer-gui】软件进行分割。最终得到的处理好的人声素材可用于训练模型。
深度伪造技术：
- 深度伪造技术（deepfakes）是利用 AI 程序和深度学习算法实现音视频模拟和伪造的技术，投入深度学习的内容库越大，合成的视音频真实性越高，甚至能以假乱真。
- 粉丝们会通过 Stems 音轨分离工具将人声与原始歌曲分离，再使用人声转换模型将人声转换成另一位明星的风格，然后将新的人声轨道与原始作品重新拼接在一起。Diff-SVC 是一种流行的用于此目的的语音传输模型。
制作 AI 古人骂人视频：
- 声音克隆：
  - 工具：Fish Audio
  - 操作：准备一段需要克隆的音频（可以是类似屈原的古风声音，或自行录制一段），打开网站 https://fish.audio/zh-CN/train/new-model/ ，上传音频，按照指引完成声音克隆，进入声音库选择需要使用的声音，将生成的文案输入，使用克隆好的声音生成对应的音频文件并下载备用。
- 视频合成：
  - 工具：Viggle.ai
  - 操作：在网上下载“回答我”的原视频，打开 Viggle.ai 网站（https://viggle.ai/create-mix ），登录后上传“回答我”原视频和人物形象图生成新版本视频，预览效果并下载。
- 视频剪辑：
  - 工具：剪映
  - 操作：打开剪映软件（手机或电脑版均可），导入合成好的新视频和生成的音频文件，将音频与视频时间轴对齐，添加字幕等，如需叠加特殊背景，可导入自己的背景图（如楚国风景），预览整个视频，检查效果并微调后导出最终视频。

请注意版权问题，请勿侵犯他人音乐版权。

Content generated by AI large model, please carefully verify (powered by aily)

References

歸臧写的教程是我看过的最通俗易懂的教程了，推荐一下：《[教你打造属于自己的AI孙燕姿，AI歌手模型使用及训练保姆级课程#1/2使用模型](https://mp.weixin.qq.com/s/bXD1u6ysYkTEamt-PYI1RA)》《[教你打造属于自己的AI孙燕姿，AI歌手模型使用及训练保姆级课程#2/2训练模型](https://mp.weixin.qq.com/s/IeeW1PbMUbxMlLl529JTYQ)》按照此手把手的教程来操作，你也可以生成你所喜爱的歌手音乐。但请注意版权问题，请勿侵犯他人音乐版权。?项目主要使用So-VITS-SVC 4.0，可以在[Github上找到该项目](https://github.com/svc-develop-team/so-vits-svc)。?推荐的两个整合包视频教程分别是羽毛布団和领航员未鸟。?模型使用分为原始声音处理、推理过程和音轨合并三个部分。?使用UVR_v5.5.0软件处理声音，保留人物的干声。?️运行整合包的Web UI进行声音推理，需要将模型文件和配置文件放置正确的文件夹下。➗分割后的素材尽量不要超过显存大小，使用【slicer-gui】软件进行分割。?最终得到的处理好的人声素材可以用于训练模型。

AI 语音合成

所谓深度伪造技术（deepfakes），是一种利用AI程序和深度学习算法实现音视频模拟和伪造的技术，投入深度学习的内容库越大，合成的视音频真实性越高，甚至可以达到以假乱真的程度。[heading2]AI翻唱[content]粉丝们会通过Stems音轨分离工具将人声与原始歌曲分离，再使用人声转换模型将人声转换成另一位明星的风格，然后将新的人声轨道与原始作品重新拼接在一起。Diff-SVC就是一种特别流行的用于此目的的语音传输模型。

?回答我！全网爆火的AI古人骂人视频玩法｜小白保姆级教程（附提示词和变现玩法）

这一步包含三个子步骤，逐步完成声音、视频和最终剪辑：3.1声音克隆工具：Fish Audio操作：1.准备一段需要克隆的音频（可以是类似屈原的古风声音，或自行录制一段）。2.打开网站：https://fish.audio/zh-CN/train/new-model/1.上传准备好的音频，按照指引完成声音克隆。1.进入声音库选择需要使用的声音，将第一步生成的文案输入，使用克隆好的声音生成对应的音频文件。1.下载生成的音频文件备用。3.2视频合成工具：Viggle.ai操作：1.在网上下载“回答我”的原视频。2.打开Viggle.ai网站，登录后进入视频合成功能。https://viggle.ai/create-mix1.上传“回答我”原视频和第二步生成的人物形象图。生成新版本的“回答我”视频。1.预览效果，满意后下载合成好的新视频。3.3视频剪辑工具：剪映操作：1.打开剪映软件（手机或电脑版均可）。2.导入3.2合成好的新视频和3.1生成的音频文件。3.将音频与视频时间轴对齐，确保声音和画面同步，添加字幕等。1.如需叠加特殊背景，可以导入自己的背景图（如楚国风景）。2.预览整个视频，检查效果，微调后导出最终视频。