Chat with Wiki - WayToAGI

以下是组织一个团队完成属于自己的一套数字人制作技术的相关内容：方案一：剪映数字人“个性化“—无限免费私模数字人 1. 准备谷歌账号（可在淘宝或“”购买）。 2. 第一步：打开谷歌浏览器，点击链接https://github.com/facefusion/facefusioncolab 并点击 open colab 进入程序主要运行界面，在右上角点击“代码执行程序”选择“全部运行”，无需安装和付费。点击红框对应的 URL 打开操作界面。 3. 第二步：点击“source”上传自己的照片和“target”上传之前的剪映数字人视频，保持默认参数，点击“START”生成。 4. 第三步：等待专属数字人视频出炉。方案二：借助开源社区力量构建高质量的 AI 数字人 1. 推荐借助开源社区的像 dify、fastgpt 等成熟的高质量 AI 编排框架，它们有大量开源工作者维护，集成各种主流模型供应商、工具及算法实现等。 2. 可通过这些框架快速编排出自己的 AI Agent，赋予数字人灵魂。在开源项目中，使用 dify 框架，利用其编排和可视化交互任意修改流程，构造不同的 AI Agent，实现相对复杂功能，如知识库搭建、工具使用等，无需编码和重新部署工作。 Dify 的 API 暴露了 audiototext 和 texttoaudio 两个接口，基于此可将数字人的语音识别和语音生成都交由 Dify 控制，低门槛做出高度定制化的数字人。具体部署过程参考 B 站视频：https://www.bilibili.com/video/BV1kZWvesE25 。若有更高度定制的模型，也可在 Dify 中接入 XInference 等模型管理平台部署自己的模型。数字人 GUI 工程中保留了 LLM、ASR、TTS、Agent 等多个模块，能保持更好的扩展。注意事项： 1. 使用 Dify 接口时，必须在应用编排功能中打开文字转语音和语音转文字功能，否则接口会返回未使能的错误。 2. 只有接入了支持 TTS 和 SPEECH2TEXT 的模型供应商，才会在功能板块中展示出来，Dify 的模型供应商图标下标签有展示该供应商支持哪些功能，可自行选择方便使用的。对于 TTS，不同的模型供应商支持的语音人物不同，可根据个人喜好添加。制作数字人的工具： 1. HeyGen：AI 驱动的平台，可创建逼真的数字人脸和角色，适用于游戏、电影和虚拟现实等应用。 2. Synthesia：AI 视频制作平台，允许创建虚拟角色并进行语音和口型同步，支持多种语言，可用于教育视频、营销内容和虚拟助手等场景。 3. DID：提供 AI 拟真人视频产品服务和开发，上传人像照片和输入要说的内容，平台提供的 AI 语音机器人将自动转换成语音，然后合成逼真的会开口说话的视频。更多数字人工具请访问网站查看：https://www.waytoagi.com/category/42 。请注意，这些工具的具体功能和可用性可能会变化，使用时请遵守相关使用条款和隐私政策，并注意保持对生成内容的版权和伦理责任。