以下是一些好用的人声合成 AI 相关内容:
请注意版权问题,请勿侵犯他人音乐版权。
歸臧写的教程是我看过的最通俗易懂的教程了,推荐一下:《[教你打造属于自己的AI孙燕姿,AI歌手模型使用及训练保姆级课程#1/2使用模型](https://mp.weixin.qq.com/s/bXD1u6ysYkTEamt-PYI1RA)》《[教你打造属于自己的AI孙燕姿,AI歌手模型使用及训练保姆级课程#2/2训练模型](https://mp.weixin.qq.com/s/IeeW1PbMUbxMlLl529JTYQ)》按照此手把手的教程来操作,你也可以生成你所喜爱的歌手音乐。但请注意版权问题,请勿侵犯他人音乐版权。?项目主要使用So-VITS-SVC 4.0,可以在[Github上找到该项目](https://github.com/svc-develop-team/so-vits-svc)。?推荐的两个整合包视频教程分别是羽毛布団和领航员未鸟。?模型使用分为原始声音处理、推理过程和音轨合并三个部分。?使用UVR_v5.5.0软件处理声音,保留人物的干声。?️运行整合包的Web UI进行声音推理,需要将模型文件和配置文件放置正确的文件夹下。➗分割后的素材尽量不要超过显存大小,使用【slicer-gui】软件进行分割。?最终得到的处理好的人声素材可以用于训练模型。
所谓深度伪造技术(deepfakes),是一种利用AI程序和深度学习算法实现音视频模拟和伪造的技术,投入深度学习的内容库越大,合成的视音频真实性越高,甚至可以达到以假乱真的程度。[heading2]AI翻唱[content]粉丝们会通过Stems音轨分离工具将人声与原始歌曲分离,再使用人声转换模型将人声转换成另一位明星的风格,然后将新的人声轨道与原始作品重新拼接在一起。Diff-SVC就是一种特别流行的用于此目的的语音传输模型。
这一步包含三个子步骤,逐步完成声音、视频和最终剪辑:3.1声音克隆工具:Fish Audio操作:1.准备一段需要克隆的音频(可以是类似屈原的古风声音,或自行录制一段)。2.打开网站:https://fish.audio/zh-CN/train/new-model/1.上传准备好的音频,按照指引完成声音克隆。1.进入声音库选择需要使用的声音,将第一步生成的文案输入,使用克隆好的声音生成对应的音频文件。1.下载生成的音频文件备用。3.2视频合成工具:Viggle.ai操作:1.在网上下载“回答我”的原视频。2.打开Viggle.ai网站,登录后进入视频合成功能。https://viggle.ai/create-mix1.上传“回答我”原视频和第二步生成的人物形象图。生成新版本的“回答我”视频。1.预览效果,满意后下载合成好的新视频。3.3视频剪辑工具:剪映操作:1.打开剪映软件(手机或电脑版均可)。2.导入3.2合成好的新视频和3.1生成的音频文件。3.将音频与视频时间轴对齐,确保声音和画面同步,添加字幕等。1.如需叠加特殊背景,可以导入自己的背景图(如楚国风景)。2.预览整个视频,检查效果,微调后导出最终视频。