Chat with Wiki - AI 数字人最新消息

Answer

以下是关于 AI 数字人的最新消息：

目前业界对于数字人的定义尚未统一，一般可根据技术栈分为真人驱动和算法驱动两类。算法驱动数字人的相关开源代码有很多，如 ASR 语音识别方面的 openai 的 whisper（https://github.com/openai/whisper）、wenet（https://github.com/wenet-e2e/wenet）、speech_recognition（https://github.com/Uberi/speech_recognition，这是一个语音识别的接口集合，包含不同实现的语音识别接口）。AI Agent 大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等，Agent 部分可使用 LangChain 的模块进行自定义（https://www.langchain.com/）。TTS 方面，有微软的 edge-tts（https://github.com/rany2/edge-tts，只能使用里面预设的人物声音，目前接口免费）、VITS（https://github.com/jaywalnut310/vits）以及专注于唱歌的 so-vits-svc（https://github.com/svc-develop-team/so-vits-svc，前段时间很火的 AI 孙燕姿就与其相关）。
4 月 25 日的消息：
- Synthesia 推出新型虚拟数字人 Expressive-1，能通过脚本预测表情，数字人可自动解析和理解文本情绪，实现表情和声音同步。链接：https://x.com/imxiaohu/status/1783505405488054433
- 360 AI 浏览器新版增加了视频总结、提问、转录和翻译功能，支持本地和网络视频的内容分析，但无法提取无对白视频摘要。链接：http://browser.360.cn/ai https://x.com/imxiaohu/status/1783495437422649719
- 全球最大 AI 知识库“通往 AGI 之路”网站访问量突破 1000 万，网站内容丰富，旨在推动 AI 知识的普及。链接：http://WaytoAGI.com https://x.com/imxiaohu/status/1783475002815471669
- 日本横须贺市使用 AI 技术克隆市长，用于发布英语信息，技术应用广泛，包括灾难信息传播和旅游信息发布。

Content generated by AI large model, please carefully verify (powered by aily)

References

上述算法开源的代码有很多，这里列出一些仓库供大家参考：ASR语音识别openai的whisper:https://github.com/openai/whisperwenet:https://github.com/wenet-e2e/wenetspeech_recognition(这是一个语音识别的接口集合，里面有不同实现的语音识别的接口):https://github.com/Uberi/speech_recognitionAI Agent大模型部分就比较多了，包括ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。Agent部分可以使用LangChain的模块去做自定义，里面基本包含了Agent实现的几个组件(https://www.langchain.com/)TTS微软的edge-tts：https://github.com/rany2/edge-tts，只能使用里面预设的人物声音，目前接口免费。VITS：https://github.com/jaywalnut310/vits，还有很多的分支版本，可以去搜索一下，vits系列可以自己训练出想要的人声。so-vits-svc:https://github.com/svc-develop-team/so-vits-svc，专注到唱歌上面，前段时间很火的AI孙燕姿。

XiaoHu.AI日报

?Xiaohu.AI日报「4月25日」 ✨✨✨✨✨✨✨✨1⃣️? Synthesia新技术展示：推出新型虚拟数字人Expressive-1，能通过脚本预测表情。数字人可自动解析和理解文本情绪，实现表情和声音同步。? https://x.com/imxiaohu/status/17835054054880544332⃣️? 360 AI浏览器新功能：新版AI浏览器增加了视频总结、提问、转录和翻译功能。支持本地和网络视频的内容分析，但无法提取无对白视频摘要。? http://browser.360.cn/ai? https://x.com/imxiaohu/status/17834954374226497193⃣️?全球最大AI知识库一周年：通往AGI之路网站访问量突破1000万。网站内容丰富，旨在推动AI知识的普及。? http://WaytoAGI.com ? https://x.com/imxiaohu/status/17834750028154716694⃣️?日本横须賀市AI市长：使用AI技术克隆市长，用于发布英语信息。技术应用广泛，包括灾难信息传播和旅游信息发布。

XiaoHu.AI日报