Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

D-ID

Answer

D-ID 是一家以色列 AI 创业公司推出的产品。该公司此前的“Deep Nostalgia”(将老照片中失散已久的亲人的脸动画化)和“LiveStory”(在动画照片中添加音频,让照片中的人讲述自己的生活史)等项目在 Tiktok 等社交媒体上疯传。D-ID 主打 AI Avatar 生成视频,推出了 Express 和 Premium+两款新数字人工具。Express 通过一分钟视频训练模型,支持同步头部动作;Premium+需要更长视频训练,可支持手部和躯干动作。D-ID 表示互动视频广告的点击率和转化率分别提升了 30%和 35%。D-ID 提供了更多 credits(20 个)让用户试用。除了 AI 视频生成器之外,该公司还提供与 Microsoft PowerPoint 兼容的 AI Presenters,允许用户将虚拟演示者添加到幻灯片中并创建更具吸引力和互动性的演示文稿。但实际测试效果远不如 HeyGen 自然,嘴部模糊较多。官网地址:https://app.heygen.com

Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

?Xiaohu.AI日报「11月2日」✨✨✨✨✨✨✨✨1⃣️?Wonder Dynamics推出自动3D动画生成技术Wonder Animation:只需导入视频,无需手动设置即可自动生成3D场景。可与现有动画和3D渲染软件无缝整合,支持多种格式。显著加速动画和3D内容创作流程,适用于影视和动画项目制作。?详细:[https://xiaohu.ai/p/15091](https://xiaohu.ai/p/15091)2⃣️?HeyGen推出基于照片生成数字人的新功能:上传照片或输入文字提示即可生成个性化的AI数字人形象。可选择性别、年龄、种族,定制肢体动作、服装、姿势和背景。支持脚本编辑,提供多种声音和情感表达,一分钟即可生成视频。?[https://x.com/imxiaohu/status/1852317866038809035](https://x.com/imxiaohu/status/1852317866038809035)3⃣️?‍?D-ID推出Express和Premium+两款新数字人工具:Express:通过一分钟视频训练模型,支持同步头部动作。Premium+:需要更长视频训练,可支持手部和躯干动作。D-ID表示互动视频广告的点击率和转化率分别提升了30%和35%。?[https://x.com/imxiaohu/status/1852331695288234325](https://x.com/imxiaohu/status/1852331695288234325)

XiaoHu.AI日报

?Xiaohu.AI日报「11月2日」✨✨✨✨✨✨✨✨1⃣️?Wonder Dynamics推出自动3D动画生成技术Wonder Animation:只需导入视频,无需手动设置即可自动生成3D场景。可与现有动画和3D渲染软件无缝整合,支持多种格式。显著加速动画和3D内容创作流程,适用于影视和动画项目制作。?详细:[https://xiaohu.ai/p/15091](https://xiaohu.ai/p/15091)2⃣️?HeyGen推出基于照片生成数字人的新功能:上传照片或输入文字提示即可生成个性化的AI数字人形象。可选择性别、年龄、种族,定制肢体动作、服装、姿势和背景。支持脚本编辑,提供多种声音和情感表达,一分钟即可生成视频。?[https://x.com/imxiaohu/status/1852317866038809035](https://x.com/imxiaohu/status/1852317866038809035)3⃣️?‍?D-ID推出Express和Premium+两款新数字人工具:Express:通过一分钟视频训练模型,支持同步头部动作。Premium+:需要更长视频训练,可支持手部和躯干动作。D-ID表示互动视频广告的点击率和转化率分别提升了30%和35%。?[https://x.com/imxiaohu/status/1852331695288234325](https://x.com/imxiaohu/status/1852331695288234325)

AI视频生成(下) | 20个产品推荐及实践教学

2020年成立,和Sythesia类似。主打广告营销、企业培训、讲解、销售等多个需要人物形象出镜的内容。因为更面向ToC消费者,HeyGen比起Sythesia能够体验到更多丰富的功能(需付费使用)。官网地址:https://www.heygen.com/By:Poonam Soni[heading4]功能介绍[content]内置100+AI avatars,支持40多种语言,300+声音,除了语音生成和对口型,这部分内容更偏模版生成。此外还可以创建个人Avatar,需录制两段5-10分钟的视频后生成。支持输入脚本快速创建视频。支持通过prompt的方式创建AI Talking Photo(Avatar),并支持给Avatar更换服装、一键换脸。最近推出的新功能Video Translate可以将视频中的语言翻译成其他语言,并保证嘴型和内容进行对应,该功能非常有助于企业在海外不同国家进行产品营销。(可以在左下角Labs-Video Translate找到)[heading2]D-ID[heading3]产品特点[content]D-ID来自一家以色列AI创业公司,该公司此前推出的“Deep Nostalgia”(将老照片中失散已久的亲人的脸动画化)和“LiveStory”(在动画照片中添加音频,让照片中的人讲述自己的生活史)等项目曾在Tiktok等社交媒体上疯传。D-ID主打方向同样是AI Avatar生成视频,比起Synthesia、HeyGen AI、D-ID提供了更多credits(20个)让用户试用。除了AI视频生成器之外,该公司还提供与Microsoft PowerPoint兼容的AI Presenters,允许用户将虚拟演示者添加到幻灯片中并创建更具吸引力和互动性的演示文稿。但实际测试效果远不如HeyGen自然,嘴部模糊较多。官网地址:https://app.heygen.com

Others are asking
stable video diffusion开发
以下是关于 Stable Video Diffusion 开发的相关信息: SVD 介绍: 简介:Stable Video Diffusion 是 Stability AI 于 2023 年 11 月 21 日发布的视频生成式大模型,用于高分辨率、先进的文本到视频和图像到视频生成的潜在视频扩散模型。它支持多种功能,用户可调整多种参数,但对硬件要求较高,支持的图片尺寸较小,应用场景受限。 模型版本:开源了两种图生视频的模型,一种能生成 14 帧的 SVD,另一种是可以生成 25 帧的 SVDXL,发布时通过外部评估超越了人类偏好研究中领先的封闭模型。 主要贡献:提出系统的数据管理工作流程,将大量未经管理的视频集合转变为高质量数据集;训练出性能优于现有模型的文本到视频和图像到视频模型;通过特定领域实验探索模型中运动和 3D 理解的强先验,预训练的视频扩散模型可转变为强大的多视图生成器,有助于克服 3D 领域数据稀缺问题。 部署实战避坑指南: 直接使用百度网盘里准备好的资源,可规避 90%的坑。 若一直报显存溢出问题,可调低帧数或增加 novram 启动参数。 云部署实战中,基础依赖模型权重有两个 models–laion–CLIPViTH14laion2Bs32Bb79K 和 ViTL14.pt,需放到指定路径下。 总结: Sora 发布后,此前的视频生成模型相形见绌,但 Stable Video Diffusion 作为开源项目可在自己机器上自由创作无需充值。SVD 生成的视频画质清晰,帧与帧过渡自然,能解决背景闪烁和人物一致性问题,虽目前最多生成 4 秒视频,与 Sora 的 60 秒差距大,但在不断迭代。我们会持续关注其技术及前沿视频生成技术,尝试不同部署微调方式,介绍更多技术模型,更多精彩内容后续放出。 同时,您还可以加入「AIGCmagic 社区」群聊交流讨论,涉及 AI 视频、AI 绘画、Sora 技术拆解、数字人、多模态、大模型、传统深度学习、自动驾驶等多个方向,可私信或添加微信号:【m_aigc2022】,备注不同方向邀请入群。
2025-04-15
mermaid编辑工具
Mermaid 是一款用于创建各种图表的工具,它支持多种类型的图表,如思维导图、时序图、UML 图等。以下是关于 Mermaid 编辑工具的一些信息: 可以使用 Mermaid 语法创建简单的思维导图,例如:GRAPH CODE 判断 大语言模型 自然语言处理 机器学习 深度学习 执行 文本分析 情感分析 算法优化 神经网络 结束。 可用于将代码转化为图表,如在“code to diagram”的搜索结果中,Mermaid 不仅支持十几种图像,还提供了在线编辑器,生成器的网址为:https://mermaid.live/ 。 可以通过 ChatGPT 结合自然语法生成 Mermaid 图形语法,生成流程包括确定制作目标、通过自然语言描述逻辑、在线校验测试是否成功。例如,要求 ChatGPT 基于给定内容生成高速公路上车辆切入场景的时序图。
2025-03-25
"如何使用Midjourney"
以下是关于如何使用 Midjourney 的详细介绍: 1. “人物参考”功能: 在提示词后输入`cref URL`并附上一个人物图像的 URL。需注意一定要在提示词后面,否则会报错。 可以使用`cw`来修改参考“强度”,从 0 到 100。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;在强度 0(`cw 0`)时,只会关注面部,适合改变服装、发型等。 2. 喂图: 意义:从第一张起,可反复上传优化图片,来达到自己想要的图片。 过程:上传单张或者一组(4 到 5 张)到 Midjourney 输入框里,有两种方法: 点击输入框前方的加号上传。 鼠标选择图片或一组拖到软件里,回车,点击上传后的图片,在左下角“在浏览器打开链接“打开后复制浏览器上的链接,返回主界面,在输入框里“/imagine:粘贴刚才复制的链接+所描述的关键词。 常见问题:小白新手找不到输入框频道。解决方法是找到 Midjourney 白色图标,点击进去,找带数字结尾的频道,或者在自己社区里添加 Midjourney 机器人。 3. Midjourney V6 更新角色一致性命令“cref”: 官方说明:在提示后键入`cref URL`,其中 URL 是一个角色图像的网址。可以使用`cw`来修改参考的“强度”。 用途:这个功能在使用由 Midjourney 图像制作的角色时效果最佳,不适用于真实的人物/照片。 高级功能:可以使用多个 URL 来混合信息/来自多个图像的角色。 在网页 alpha(测试最初版)上的操作:拖动或粘贴图像到想象栏,有三个图标。选择这些图标设置它是一个图像提示,一个风格参考,还是一个角色参考。按住 Shift 键选择一个选项以将图像用于多个类别。 需注意,虽然 MJ V6 还处于 alpha 测试阶段,但这个和其他功能可能会突然更改,V6 官方 beta 版本即将推出。
2025-03-24
midjourney图怎么 放大
在 Midjourney 中,放大图像的方法如下: 放大(Upscale)将图像尺寸加倍: 精细放大(Subtle):放大图像同时尽量保持原样。 创意放大(Creative):在放大的同时会调整或改变图像中的某些细节。 操作时,您可以点击相应的按钮进行放大。例如,在生成的图像中,点击上面的 U 1 4 即可放大一张图。 另外,使用当前默认模型版本的中途图像的默认尺寸为 1024 x 1024 像素。您可以使用 upscale 工具将文件大小增加到 2048 x 2048 或 4096 x 4096 像素。在网络浏览器中打开 Midjourney 图像,或从 Midjourney.com 下载它们以获得最大文件大小。 需要注意的是,如果没看到放大相关的按钮,可能有以下原因: 1. 该图像已经在 Discord 中生成最满意的一张,不可再放大。 2. 在 More options 文字里没打上相应的对勾。
2025-03-21
Stable Diffusion、MidJourney、DALL·E 这些生成式AI工具有什么区别
Stable Diffusion、Midjourney 和 DALL·E 这三个生成式 AI 工具主要有以下区别: 1. 开源性:Stable Diffusion 是开源的,用户可以在任何高端计算机上运行。 2. 学习曲线:Midjourney 的学习曲线较低,只需键入特定的提示就能得到较好的结果。 3. 图像质量:Midjourney 被认为是 2023 年中期图像质量最好的系统。 4. 应用场景:Stable Diffusion 特别适合将 AI 与来自其他源的图像结合;Adobe Firefly 内置在各种 Adobe 产品中,但在质量方面落后于 DALL·E 和 Midjourney。 5. 训练数据:这些工具都是使用大量的内容数据集进行训练的,例如 Stable Diffusion 是在从网络上抓取的超过 50 亿的图像/标题对上进行训练的。 6. 所属公司:DALL·E 来自 OpenAI。 在使用方面: 1. Stable Diffusion 开始使用需要付出努力,因为要学会正确制作提示,但一旦掌握,能产生很好的结果。 2. DALL·E 已纳入 Bing(需使用创意模式)和 Bing 图像创建器,系统可靠,但图像质量比 Midjourney 差。 3. Midjourney 需要 Discord,使用时需键入特定格式的提示。
2025-03-20
midjourney的平替
以下是关于 Midjourney 的相关信息: Midjourney V6 更新角色一致性命令“cref”:您可以仅描述环境、背景等,Midjourney 会努力将角色融入场景中,但可能会有不连贯的结果,此时可尝试更高值的样式化(如s 800)。场景唯一提示示例:在一个空荒地下,乌云密布的暴风雨天空下。cref https://my.image.host/joisstanding.jpg 。注意该命令适用于单一主题、单一角色的图像,若要添加多个角色,需使用平移按钮。将多个角色放置到单个画布上的最佳方法是使用平移功能将新画布与现有画布拼接,每个新画布部分都有自己的 cref。具体操作:1.使用/settings 将 Remix 打开,然后选择;2.选择包含第二个字符的图像,用 U 将其从网格中分离出来;3.寻找蓝色小箭头(⬆️⬇️⬅️➡️),每个都会在现有图像中添加新图像,选择新角色前进方向并输入提示及其cref,缝合新画布,比如描绘两个人的开场提示。 训练 Midjourney 的 prompt:style<4a,4b or 4c>可在 Midjourney 模型版本 4 之间切换。stylize<number>或s<number>参数影响 Midjourney 默认美学风格应用于 Jobs 的强度。还有uplight 和upbeta 等参数。默认值(模型版本 5)包括纵横比、混沌、质量、种子、停止、样式化等,各有相应的默认值和范围。纵横比大于 2:1 为实验性的,可能产生不可预测的结果。不同模型版本和参数具有兼容性。
2025-03-18