以下是一些中文语音克隆能力较强的产品:
通过250,000小时的中英双语数据训练,仅需15秒的声音即可完美克隆,包括音色和情感。基于LLaMA模型,支持从文本生成语音,或基于语音提示生成目标语音(保留情感特征)。参数规模:Llasa-1B:轻量级,适合资源受限硬件部署。?[https://huggingface.co/HKUSTAudio/Llasa-1B](https://huggingface.co/HKUSTAudio/Llasa-1B)Llasa-3B:更高性能,提供更复杂的语音生成。?[https://huggingface.co/HKUSTAudio/Llasa-3B](https://huggingface.co/HKUSTAudio/Llasa-3B)详细介绍:?[https://www.xiaohu.ai/c/a066c4/llasa-tts-llama-3-2-33827b03-e5f4-4a98-9bf2-9c06d43d11ce](https://www.xiaohu.ai/c/a066c4/llasa-tts-llama-3-2-33827b03-e5f4-4a98-9bf2-9c06d43d11ce)3⃣️?️ChatGPT Canvas更新:支持OpenAI o1模型macOS桌面应用程序全面支持Canvas功能,可直接渲染HTML和React代码。o1模型适用于Pro、Plus和Team用户。HTML和React渲染功能对所有用户开放(包括Free用户)。?[https://xiaohu.ai/c/xiaohu-ai/](https://xiaohu.ai/c/xiaohu-ai/)
通过250,000小时的中英双语数据训练,仅需15秒的声音即可完美克隆,包括音色和情感。基于LLaMA模型,支持从文本生成语音,或基于语音提示生成目标语音(保留情感特征)。参数规模:Llasa-1B:轻量级,适合资源受限硬件部署。?[https://huggingface.co/HKUSTAudio/Llasa-1B](https://huggingface.co/HKUSTAudio/Llasa-1B)Llasa-3B:更高性能,提供更复杂的语音生成。?[https://huggingface.co/HKUSTAudio/Llasa-3B](https://huggingface.co/HKUSTAudio/Llasa-3B)详细介绍:?[https://www.xiaohu.ai/c/a066c4/llasa-tts-llama-3-2-33827b03-e5f4-4a98-9bf2-9c06d43d11ce](https://www.xiaohu.ai/c/a066c4/llasa-tts-llama-3-2-33827b03-e5f4-4a98-9bf2-9c06d43d11ce)3⃣️?️ChatGPT Canvas更新:支持OpenAI o1模型macOS桌面应用程序全面支持Canvas功能,可直接渲染HTML和React代码。o1模型适用于Pro、Plus和Team用户。HTML和React渲染功能对所有用户开放(包括Free用户)。?[https://xiaohu.ai/c/xiaohu-ai/](https://xiaohu.ai/c/xiaohu-ai/)
来自倪小末开源:1.GPT-SoVITS:https://github.com/RVC-Boss/GPT-SoVITS对中、英、日语言支持良好,需要10分钟左右干素材,瞬时clone功能未开放。1.OpenVoice:https://github.com/myshell-ai/OpenVoice对中文支持较好,主打瞬时clone,发展势头良好,一个月前测试时中文声音clone有英语味道。[heading2]商业的产品:[content]1.ElevenLab:https://elevenlabs.io支持最多语言种类,支持瞬时clone,综合效果最好,本人是22$每月的订阅用户,已用于内部配音产品。1.Reecho:https://reecho.ai中国团队,支持长音频和瞬时声音clone,据说与火山引擎的声音clone技术同源。1.自得语音:https://zideai.com中国团队,支持瞬时声音clone和声音定制,尚未测试。1.DiD:[heading2]刚刚有小伙伴说希望有个语音训练的交流,建了一个方便交流[heading2]欢迎补充内容,可以提交在评论区