知識ベースとの対話

以下是一些可以生成人物的 AI 软件： 1. HeyGen：这是一个 AI 驱动的平台，能创建逼真的数字人脸和角色。它运用深度学习算法生成高质量的肖像和角色模型，适用于游戏、电影和虚拟现实等应用。 2. Synthesia：这是一个 AI 视频制作平台，允许用户创建虚拟角色并进行语音和口型同步，支持多种语言，可用于教育视频、营销内容和虚拟助手等场景。 3. DID：这是一家提供 AI 拟真人视频产品服务和开发的公司，只需上传人像照片和输入要说的内容，平台提供的 AI 语音机器人将自动转换成语音，然后合成逼真的会开口说话的视频。更多数字人工具请访问网站查看：https://www.waytoagi.com/category/42 。在剪映中生成数字人的步骤如下：在剪映右侧窗口顶部，打开“数字人”选项，选取一位免费且适合的数字人形象，比如“婉婉青春”。选择数字人形象时，软件会播放其声音，可判断是否需要，点击右下角“添加数字人”将其添加到当前视频中，剪映 App 会生成对应音视频并添加到轨道中。左下角会提示渲染完成时间，可点击预览查看效果。关于数字人的相关算法开源代码仓库有： 1. ASR 语音识别： openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition：https://github.com/Uberi/speech_recognition 2. AI Agent：大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分可使用 LangChain 的模块去做自定义，基本包含了 Agent 实现的几个组件 3. TTS：微软的 edgetts：https://github.com/rany2/edgetts，只能使用里面预设的人物声音，目前接口免费。 VITS：https://github.com/jaywalnut310/vits，还有很多分支版本。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc，专注于唱歌。除了算法，人物建模模型可通过手动建模（音频驱动）或者 AIGC 的方式生成人物的动态效果（例如 wav2lip 模型）实现。但这种简单的构建方式还存在一些问题，比如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应动作、数字人如何使用知识库做出某个领域的专业性回答等。请注意，这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用这些工具时，请确保遵守相关的使用条款和隐私政策，并注意保持对生成内容的版权和伦理责任。