Navigate to WaytoAGI Wiki →
Home/All Questions
给视频里的人换脸用什么AI
以下是一些可以用于给视频里的人换脸的 AI 方法: 1. 使用 facefusion 工具: 点击快捷工具中顶部的“JupyterLab”,打开这个工具。 点击顶部的“+”号选项卡,新打开一个终端窗口。 在终端区域,启动一个终端的选项卡。 在打开的终端窗口中,输入以下 3 条命令: 查看文件列表。输入“ls”并按回车,显示当前位置所在目录下的文件列表。 进入 facefusion 目录,输入“cd facefusion”并按回车,进入程序目录。 启动 facefusion。输入“python./run.py executionproviders cuda cpu”启动程序(注意:后面的参数“executionproviders cuda cpu”非常重要,如果不加“cuda”,则默认不使用 GPU 能力,推理将非常慢)。 当出现提示信息时,说明启动成功。 打开 facefusion 软件,需要返回实例列表,点击自定义服务按钮,会打开一个新的浏览器窗口。 在 facefusion 软件界面上,上传准备好的图片、视频后,在右侧可以看到预览效果。点击下方的开始按钮,执行换脸处理。执行完成后,在输出的位置,会出现处理后的视频,输出窗口的右上角有一个下载按钮,点击它可以导出变量后的视频到本地。 2. 诗云马良平台:早在 21 年,诗云马良平台就推出了给视频中模特换脸、切换语言的能力,方便电商营销商家进行产品的本地化推广。 3. HenGen AI:近期 HenGen AI 也公布了 AI 切换视频内语言的能力,并且能够将 Avatar 口型与视频相匹配。
2024-12-14
问我一个关于AIGC的问题。
以下是一些关于 AIGC 的问题供您参考: 1. AIGC 在内容创作领域的优势和局限性分别是什么? 2. AIGC 如何影响传统的内容创作行业? 3. 目前 AIGC 在图像生成方面有哪些最新的技术突破? 4. 如何评估 AIGC 生成内容的质量和准确性? 5. AIGC 在视频生成领域的应用前景如何? 6. 与 UGC 和 PGC 相比,AIGC 在内容多样性方面表现如何? 7. 哪些行业最有可能率先广泛应用 AIGC 技术? 8. Gen AI/Generative AI 与 AIGC 在技术实现上有哪些关键差异? 9. ChatGPT 作为一种服务,与其他类似的聊天应用有何不同? 10. 未来 AIGC 工具在产品原型设计方面可能会有哪些创新?
2024-12-14
deepfake的技术原理是什么?
深度伪造技术(deepfakes)是一种利用 AI 程序和深度学习算法实现音视频模拟和伪造的技术。其原理在于投入深度学习的内容库越大,合成的视音频真实性越高,甚至可以达到以假乱真的程度。例如,粉丝们会通过 Stems 音轨分离工具将人声与原始歌曲分离,再使用人声转换模型将人声转换成另一位明星的风格,然后将新的人声轨道与原始作品重新拼接在一起。DiffSVC 就是一种特别流行的用于此目的的语音传输模型。 目前,深度赝品的创建需要大量的计算技能,但现在几乎任何人都可以创建它们。生成式人工智能系统迅速导致了许多法律和道德问题,比如由人工智能创建的图像和视频声称是真实的,但实际上并非如此,已经出现在媒体、娱乐和政治领域。
2024-12-14
文本生成ppt的工具
以下是关于文本生成 PPT 工具的相关信息: 目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲。 2. 手动优化大纲。 3. 导入工具生成 PPT。 4. 优化整体结构。 为您推荐以下工具和相关内容: 1. 闪击:国内网站,无需魔法。 网址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 操作步骤:选择模版,输入大纲和要点,将准备的大纲转换成适配闪击的语法,点击文本转 PPT 并在提示框中确定,得到转换后的 PPT 后可在线编辑,导出有会员限制。 参考:https://zhuanlan.zhihu.com/p/607583650 2. 推荐 2 篇市场分析的文章供参考: 《》 《》 此外,还有通过 VBA 代码生成 PPT 的 Prompt 最佳实践,可参考。 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-14
你能帮我找几篇有关deepfake综述的文章吗
以下是为您提供的有关 deepfake 综述的部分内容: 生成式人工智能迅速导致了许多法律和道德问题,“Deepfakes”即由人工智能创建的图像和视频,声称是真实的但实际并非如此,已出现在媒体、娱乐和政治领域。目前深度赝品的创建虽需大量计算技能,但现在几乎任何人都能创建。OpenAI 尝试通过为每个 DALLE 2 图像添加独特符号的“水印”来控制假图像,未来可能需要更多控制,特别是当生成视频创作成为主流时。 生成式人工智能还提出了许多关于原创和专有内容的问题。创建的文本和图像与以前的内容不完全相同,系统提供商认为属于提示创建者,但显然是之前用于训练模型的文本和图像的衍生品。未来此类系统可能很快成为标准做法,用于制作大部分或全部书面或基于图像的内容,这种能力的发展将对内容所有权和知识产权保护产生巨大且不可预见的影响,也有可能彻底改变知识和创造性工作。
2024-12-14
图片反推关键词
在图片反推关键词方面: 对于图生图功能,除文本提词框外还有图片输入口,可通过图片给 AI 创作灵感。随便一张照片拖入后,文本输入框旁有两个反推提示词的按钮,CLIP 能反推出完整含义的句子,DeepBooru 能反推出关键词组。例如一张小男孩的图片,CLIP 反推的提示词为“a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art”,DeepBooru 反推的提示词为“shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers”。但两种方式生成的提示词可能有瑕疵,需要手动补充信息,调整宽度和高度,以及注意提示词相关性和重绘幅度等参数。 第二十一期港风胶片活动中,有利用上一期活动图片反推工作流,使用唯美港风图片进行反推提示词,在大模型后接一个墨悠_胶片 lo 的方法 1,上一期活动链接为;还有利用抱脸的 joycaption 图片反推提示词,然后在哩布上跑 flux 文生图工作流的方法 2。 在【SD】最强控制插件 ControlNet(6)全局重绘 inpaint 中,有时需要去掉画面中的主体形象,填补复杂背景,可使用 inpaint 重绘功能。先将图放入 WD 1.4 标签器(Tagger)中裁剪保留背景部分,然后反推提示词,如“outdoors,no humans,tree,scenery,grass,sky,cloud,day,blue sky,mountain,road,house,path,building,nature,cloudy sky”,检查无误后发送到文生图中。开启 ControlNet,使用 inpaint 模型涂抹人物部分生成,可调整控制权重和模式。也可尝试图生图中的“局部重绘”功能,但可能效果不佳。
2024-12-14
翻译AI工具
以下是一些常见的翻译 AI 工具: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 此外,阿里巴巴发布了 Marco MT 这一 AI 翻译工具,它专为跨境电商量身打造,基于阿里自研的大语言模型 Qwen,支持 15 种语言,包括中文、英语、法语、德语、西班牙语等。在 Flores 基准测试中表现优异,超越谷歌、DeepL 和 ChatGPT。Marco MT 已集成至阿里巴巴旗下的多家国际电商平台,如 AliExpress 和 Lazada,支持文本、图像和实时聊天的三种翻译模式。
2024-12-14
有几秒钟就能生成几百上千条AI视频的工具吗?
以下是一些能够生成 AI 视频的工具: Runway:网址为 https://runwayml.com ,有网页和 app 方便使用。工具教程: 即梦:网址为 https://dreamina.jianying.com/ ,是剪映旗下产品,能生成 3 秒视频,动作幅度有很大升级,有最新 S 模型、P 模型。工具教程: Kling:网址为 kling.kuaishou.com ,支持运动笔刷,1.5 模型可以直出 1080P30 帧视频。视频模型: Vidu:网址为 https://www.vidu.studio/ haiper:网址为 https://app.haiper.ai/ Pika:网址为 https://pika.art/ ,可控性强,可以对嘴型,可配音。工具教程: 智谱清影:网址为 https://chatglm.cn/video ,开源了,可以自己部署 cogvideo。工具教程: PixVerse:网址为 https://pixverse.ai/ ,人少不怎么排队,还有换脸功能。工具教程: luma:网址为 https://lumalabs.ai/ 。视频模型: Minimax 海螺 AI:网址为 https://hailuoai.video/ ,非常听话,语义理解能力非常强。视频模型: SVD:网址为 https://stablevideo.com/ ,对于景观更好用。工具教程: 此外,OpenAI 发布了首款文生视频模型 Sora,能够根据文字指令创造出逼真且充满想象力的场景,生成长达 1 分钟的超长视频,且一镜到底,在人物一致性和镜头切换等方面表现出色。 在视频工作流中,前期策划和后期制作是核心。前期可利用 ChatGPT 生成文案,后期利用 AI 工具进行自动化视频制作。例如,把选题告诉 ChatGPT 能生成完整视频脚本;让 ChatGPT 为视频筛选 BGM 能节省时间。但目前倒入文案一键自动化生成视频可能还未达到直接使用的程度,很多素材仍需人工替换。这类 AI 工具组合更适合短视频账号建立初期,用于快速低成本测试某一垂直领域短视频关键词热门情况。
2024-12-14
生成头像
以下是生成卡通头像的详细步骤: 1. 复杂提示词: 如果觉得提示词简单,可以选择更复杂的,如:“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5”。 效果示例: 不同照片生成:如果对照片风格不满意,可以换一张新照片使用上述提示词重新生成。 其他调整:如果觉得 Disney 风格太过卡通,可把提示词中的“Disney”换成“Pixar”;如果是女孩,把“boy”换成“girl”。 每次生成 4 张图片,对某张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 简单提示词: 在聊天窗口输入“/imainge”找到“/imagine prompt”,然后把图片链接放进去,空格后加提示词(以英文逗号分隔),最后加上设置参数。 设置参数: “iw 1.5”设置参考图片的权重,数值越高与参考图片越接近,默认 0.5,最大 2,可选择中间值调整。 “s 500”设置风格强度、个性化、艺术性,数字越大越有创造力和想象力,可设置 0 1000 间任意整数,这里设置 500。 “v 5”指用 Midjourney 的第 5 代版本,这一代最真实,目前 v5 需要订阅付费,不想付费可用“v 4”。 “no glasses”指不戴眼镜,不喜欢戴眼镜的图片可加上此设置。 完整提示词示例(替换您的 png 图片地址):“simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5”。如果不满意,可调整“s”和“iw”的值多次尝试。 3. 背景: 之前制作过从零开始使用 Midjourney 并通过简单提示词生成图片的视频。 今天教利用 Midjourney 的以图绘图功能生成迪斯尼卡通风格头像。 生成步骤:先选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,在聊天框发送(记得点击回车或发送按钮)。然后图片会上传到服务器并生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。使用这个链接加 prompt 提示词发送给 Midjourney,Midjourney 会根据需求生成特定图片,这就是 Midjourney 的以图绘图。 如果还没有 Midjourney 账号或不懂基础操作,可参考:
2024-12-14
万卡智算中心该如何设计?
设计万卡智算中心可以参考以下思路: 1. 工作流设计: 信息聚合与数据挖掘:通过高度集成的数据采集机制,全面收集关键信息。 卖点提炼与优化:运用先进的大模型,对信息进行分析,提炼出具有竞争力和独特性的卖点。 买点转化与策略应用:将卖点转化为消费者视角的买点,运用行为心理学和市场营销策略增强吸引力。 视觉化信息呈现:设计直观且有冲击力的卡片展示,确保信息传达有效且有视觉吸引力。 文案与脚本调整:根据目标受众偏好和媒体渠道,动态调整文案或脚本,实现内容最佳适配。 流程结果存储与分析:将处理结果系统化存储到飞书,以供未来策略优化和决策支持。 2. 多智能体模式设置: 全局设置:包括角色设定与回复逻辑、记忆管理以及对话体验等全局性因素。 多个代理之间的编排和协调:设计思路关键在于让节点形成完整的互动链条,而非一次性互动。当用户意图未满足跳转条件时,保持与当前智能体沟通对话。采用循环机制,而非单向流程,设计为闭环结构,确保用户能在不同智能体间自由切换。例如在旅游场景中,设计分别负责景点推荐、路线规划和食宿安排的三个智能体。先写好提示词,做好全局人物设定,然后在扣子上进行编排。
2024-12-14