Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

Sd中，使用CN时候，进行预处理跟不进行预处理有什么区别？

Answer

在 SD 中，使用 CN（ControlNet）时，进行预处理和不进行预处理会对生成的图像产生不同的影响。进行预处理可以更好地控制生成的图像，例如通过使用 Canny 预处理可以保留花纹图案细节，使用tile 预处理可以固定画面等。不进行预处理则可能导致生成的图像效果不稳定，需要更多的调整和尝试。因此，建议在使用 CN 时进行预处理，以获得更好的生成效果。

Content generated by AI large model, please carefully verify (powered by aily)

References

SD应用篇银质酒壶表面雕刻/花纹/浮雕效果

教程：深入浅出完整解析Stable Diffusion（SD）核心基础知识 - 知乎

小田：视频转绘制作视频过程中不可或缺的一环

如何用 SD 训练一套贴纸 LoRA 模型

教程：04_春分

Others are asking

对作为知识库的数据进行预处理，用哪个软件比较哈

以下是一些可用于对作为知识库的数据进行预处理的软件和方法： 1. LangchainchatGLM：对于知识库内容的组织要求较高，无需微调训练，适合有结构、界限分明的数据。可使用langchain库比对字典的关键词keys部分，找到相似度最高的相关keys对应的内容文本，送进提示词模板（prompt_template），然后送到LLM进行后处理。 2. 在检索原理方面，可通过嵌入模型（如Word2Vec、GloVe、BERT）将问题文本转化为向量，用于后续检索。例如，在商业化问答场景中，会对接收的问题进行预处理和向量化。 3. 在创建知识库并上传表格数据时，可通过API获取在线API的JSON数据上传，或手动自定义创建数据表结构和数据。需注意指定语义匹配字段，在响应用户查询时，将用户查询内容与该字段内容进行比较，根据相似度进行匹配。

instant-id预处理报错

以下是关于 InstantID 预处理报错的一些常见问题及解决方法： 1. 安装后出现报错问题：请查看。 2. 如果是 MacBook Pro M1 出现 InstantID 依赖的 onnxruntimegpu 无法安装的情况，因为 M1 没有 GPU，不能用 onnxruntimegpu 版本，silicon 是适配 M1 的加速版本。在文件路径 ComfyUI/custom_nodes/ComfyUI_InstantID 的 requirements.txt 文件中，把 onnxruntimegpu 替换为 onnxruntimesilicon 即可。双击用文本编辑器打开，替换保存。 3. 如果出现 Import failed：ComfyUIergouzinodes 的情况，在终端中输入 pip3 install colorama 即可。colorama 是一个用于在命令行界面中生成彩色文本和格式化输出的 Python 库。 4. 如果出现 Import failed：LayerMask:SegmentAnythingUltra V2 的情况，可在 GitHub 上给作者提，说明硬件和软件环境，按照作者回复下载最新的包重新安装。 5. 如果是在 macOS 系统中，二狗子的工作流 json 文件中用的文件路径分隔符是反斜杠\\，macOS 系统无法识别，需要全部替换为正斜杠/，不然无法调用模型。

instantid预处理报错

以下是关于 InstantID 预处理报错的一些常见问题及解决办法： 1. 安装后出现报错问题：请查看。 2. 如果是 MacBook Pro M1 出现 InstantID 依赖的 onnxruntimegpu 无法安装的情况，由于 M1 没有 GPU，不能用 onnxruntimegpu 版本，silicon 是适配 M1 的加速版本。在文件路径 ComfyUI/custom_nodes/ComfyUI_InstantID 的 requirements.txt 文件中，把 onnxruntimegpu 替换为 onnxruntimesilicon 即可。双击用文本编辑器打开，替换保存。 3. 如果出现 Import failed：ComfyUIergouzinodes 的情况，在终端中输入 pip3 install colorama 即可。colorama 是一个用于在命令行界面中生成彩色文本和格式化输出的 Python 库。 4. 如果出现 Import failed：LayerMask:SegmentAnythingUltra V2 的情况，可在 GitHub 上给作者提，说明硬件和软件环境，按照作者回复下载最新的包重新安装。 5. 在 windows 系统和 macOS 系统中，二狗子的工作流 json 文件中，用的文件路径分隔符是反斜杠\\，macOS 系统无法识别，需要全部替换为正斜杠/，不然无法调用模型。

你是一位政策数据分析师，现在我手里有微博爬取并进行预处理的评论文本数据，想要做文本分析（不停留在描述性分析上面，往情感分析那块探索）我可以采取什么样的方式

对于您手中经过预处理的微博评论文本数据，若要进行情感分析而非仅仅停留在描述性分析层面，以下是一些可行的方式： 1. 运用机器学习算法，如朴素贝叶斯、支持向量机等，训练情感分类模型。 2. 借助深度学习模型，例如卷积神经网络（CNN）、循环神经网络（RNN）及其变体，如长短期记忆网络（LSTM）和门控循环单元（GRU），来进行情感分析。 3. 利用预训练的语言模型，如 BERT、ELMO 等，并在其基础上进行微调，以适应您的情感分析任务。 4. 引入词向量技术，将文本转换为向量表示，然后通过聚类或分类算法进行情感分析。 5. 结合词典和规则的方法，构建情感词典，根据词汇的情感倾向来判断文本的情感。您可以根据数据特点和自身技术能力选择合适的方法。

你是以为政策数据分析师，现在我手里有微博爬取并进行预处理的评论文本数据，想要做文本分析（不停留在描述性分析上面，往情感分析那块探索）我可以采取什么样的方式

对于您手中经过预处理的微博评论文本数据，若要进行情感分析而非仅停留在描述性分析层面，以下是一些可行的方式： 1. 运用机器学习算法，如朴素贝叶斯、支持向量机等，训练情感分类模型。 2. 借助深度学习模型，例如卷积神经网络（CNN）、循环神经网络（RNN）及其变体长短期记忆网络（LSTM）和门控循环单元（GRU），来进行情感分析。 3. 利用预训练的语言模型，如 BERT 等，并在其基础上进行微调，以适应您的情感分析任务。 4. 引入词向量技术，将文本转换为向量表示，然后通过聚类或分类算法进行情感分析。 5. 结合词典和规则的方法，制定情感词典和相关规则来判断文本的情感倾向。

在 COMFY UI 中，关于 Tile 平铺预处理器怎么工作流中怎么使用

在 ComfyUI 中，关于 Tile 平铺预处理器的使用方法如下： 1. 平铺和切片都是用于处理大尺寸视频的技术，可以帮助在有限的 GPU 内存下处理高分辨率视频。 tile_sample_min_height:96，最小平铺高度。 tile_sample_min_width:96，最小平铺宽度。这两个参数定义了在使用平铺时的最小尺寸。 tile_overlap_factor_height:0.083，高度方向的重叠因子。 tile_overlap_factor_width:0.083，宽度方向的重叠因子。这些因子决定了平铺时各个块之间的重叠程度。 enable_vae_tiling:设置为 false，表示不启用 VAE（变分自编码器）的图像平铺。 enable_vae_slicing:设置为 false，表示不启用 VAE 切片。如果启用了平铺（tiling），它会将大图像分割成小块进行处理，然后再组合起来，这有助于处理大分辨率的视频。VAE 切片（如果启用）可以通过分割输入张量来分步计算解码，这有助于节省内存。 2. 将您的 ComfyUI 更新到最新。 3. 将 clip_l 和 t5xxl_fp16 模型下载到 models/clip 文件夹。确保您的 ComfyUI/models/clip/目录中，有 t5xxl_fp16.safetensors 和 clip_l.safetensors，您可以改用 t5xxl_fp8_e4m3fn.safetensors 来降低内存使用量，但如果您的 RAM 超过 32GB，建议使用 fp16。跑过 flux 就有这些模型，没有的话翻之前文章有下载。 4. 在您的 ComfyUI/models/vae/文件夹中，有 ae.safetensors。 5. 将最开始下载的 flux1filldev.safetensors 放于 ComfyUI/models/unet/文件夹中。 6. 使用 flux_inpainting_example 或者 flux_outpainting_example 工作流。

Sd文生图的专业术语有哪些

以下是一些关于 SD 文生图的专业术语： 1. 内容型提示词：主要用于描述想要的画面，如“1 个女孩，黑发，长发，校服，向上看，短袖，粉红色的花，户外，白天，蓝色的天空，云，阳光，上身，侧面”。 2. 标准化提示词：例如“，drawing，paintbrush”。 3. 权重：通过括号和特定数值来增加提示词的权重，权重越高在画面中体现越充分，提示词的先后顺序也会影响权重。 4. 反向提示词：告诉 AI 不要的内容，如“NSFw，”。 5. 采样迭代步数：指 AI 绘画去噪的次数，步数越高绘画越清晰，但绘画速度越慢，通常数值控制在 20 40 之间较好。 6. 采样方法：AI 生成图像时的特定算法，常用的有“Euler a；DPM++2S a Karras；DPM++2M Karras；DPM++SDE Karras；DDIM”。 7. 比例：尺寸并非越大越好，模型练图通常按 512x512 的框架绘制，高宽比尽量在这个数值附近。高清修复可放大图像倍率，高宽比主要控制画面比例。

我要用Sd做图片细化，要怎么做？给出具体方法

以下是使用 SD 做图片细化的具体方法： 1. 对于更精确的蒙版，如人物的眼睛或配饰等，可使用 Segment Anything 中的 GroundingDINO。启用 GroundingDINO 后，AI 会自动下载模型，若没有魔法，可去云盘下载并放到指定文件目录下。在检测提示词中输入相关内容，如“eye”，AI 可自动检测并设置蒙版，还可通过预览箱体得到编号来选择调整单一部分。选择要修改的蒙版上传到重绘蒙版中，并添加提示词，如“闭眼”，点击生成即可完成修改。 2. 给人物换背景时，加载生成的背景蒙版。大模型选择 revAnimated_v122，正向提示词可设为“简单背景、花、国画、工笔”，蒙版模式选择“重绘非蒙版内容”。若头发部分没抠好，可将其放入图生图中，使用 tile 模型做整体细化，还能给人物衣服添加国风元素。 3. SD 扩图时，若原本图片尺寸为 1152x1152 需增高高度，可设置为（1152x1526）。ControlNet 设置方面，若无法识别处理，可采取以下措施：提高 ControlNet 的权重（增加预处理权重，降低引导介入时机直到为 0，增加引导终止时机直到为 1）；降低重绘幅度（高清修复大图时使用）；把原始的黑白二维码叠加在二维码上方（正片叠底，保留 4 个定位点，擦去其他地方），调节透明度；使劲抽卡。 4. SD 放大通常重绘幅度设置在 0.3 以下，使用 tile 模型时可提高重绘幅度，如保持重绘幅度为 1 放大 1.5 倍绘图，能加强画面细节且不崩坏。对于草图，可将其导入 ControlNet 中，添加提示词进行细化，还可通过改变控制模式和增加关键词来优化效果，如实现随机提示词转换，用提示词对参考图做出调整。

学习SRCNN的路径可以是什么

很抱歉，目前知识库中没有关于学习 SRCNN 路径的相关内容。但一般来说，学习 SRCNN 可以从以下几个方面入手：首先，深入了解卷积神经网络（CNN）的基础知识，包括卷积层、池化层、激活函数等。其次，查阅相关的学术文献和研究报告，以获取关于 SRCNN 的详细原理和实现方法。还可以在网上搜索相关的教程和课程资源，例如在线课程平台、技术博客等。同时，尝试使用相关的深度学习框架，如 TensorFlow、PyTorch 等，进行实践和代码实现。最后，参与相关的技术社区和论坛，与其他研究者和开发者交流经验和心得，以加深对 SRCNN 的理解和应用。

学习SRCNN可以通过怎样的路径

很抱歉，目前知识库中没有关于学习 SRCNN 路径的相关内容。但一般来说，学习 SRCNN 可以从以下几个方面入手：首先，深入了解卷积神经网络（CNN）的基础知识，包括卷积层、池化层等概念。其次，查阅相关的学术文献和研究报告，以获取关于 SRCNN 模型的详细架构和原理。还可以参考在线的课程和教程，一些知名的在线教育平台可能会有相关的内容。同时，实践是关键，可以通过使用相关的数据集进行模型的训练和优化，来加深对 SRCNN 的理解和掌握。

所以我可以理解为CNN是一种图像分类识别的AI算法技术吗

卷积神经网络（CNN）是一种用于图像分类识别的 AI 算法技术。 ImageNet 成为深度神经网络革命的首选数据集，其中由 Hinton 领导的 AlexNet 就是基于卷积神经网络（CNN）。自 2012 年以来，在深度学习理论和数据集的支持下，深度神经网络算法大爆发，包括卷积神经网络（CNN）等。连接主义的全面逆袭从 2012 年开始，欣顿教授和他的学生建立的 AlexNet 就是使用反向传播算法训练的卷积神经网络（CNN），其在图像识别方面击败了当时最先进的逻辑程序。虽然 CNN 模型取得了显著成果并解决了许多问题，但也存在一些缺陷，如不能从整幅图像和部分图像识别出姿势、纹理和变化，池化操作导致模型不具备等变、丢失很多信息，需要更多训练数据来补偿损失，更适合像素扰动极大的图像分类，对某些不同视角的图像识别能力相对较差。因此，在 2011 年，Hinton 和他的同事们提出了胶囊网络（CapsNet）作为 CNN 模型的替代。

GRU+CNN模型如何操作

GRU+CNN 模型的操作主要包括以下步骤： 1. 编码器部分：使用预训练的卷积神经网络（CNN），如 Inception Resnet V2，将输入图像转换为一组特征向量。在这种情况下，大部分 CNN 部分被冻结，保留预训练的权重。 2. 解码器部分：结构较为复杂，涉及到注意力机制、嵌入层、GRU 层、添加层归一化层和最终的密集层等。可以找到很多关于注意力层和解码器步骤的说明。 3. 组合模型：将编码器和解码器组合在一起，形成一个完整的图像字幕生成模型。 4. 自定义损失函数：由于任务是生成文本序列且序列长度可能不同，使用稀疏分类交叉熵作为损失函数，并屏蔽填充的部分。 5. 编译模型：编译模型，为开始训练做准备。 6. 训练模型：可以根据需求进行更多训练以获得更好结果。 7. 推理与生成字幕：训练完成后，为新的图像生成字幕。在推理阶段，需要重构解码器模型，使其可以接收额外的 GRU 状态输入，并编写自定义推理循环，一次产生一个单词，直到生成完整句子。

我要向一个做母婴大健康MCN公司的老板介绍我能用AI做什么，可以从哪些方面介绍

对于向母婴大健康 MCN 公司的老板介绍您能用 AI 做的事情，可以从以下几个方面展开： 1. 内容创作与优化利用 AI 生成吸引人的母婴健康相关的文章、故事和科普内容，提高内容产出效率。通过 AI 对已有的内容进行语法和逻辑检查，优化文案质量。 2. 个性化推荐借助 AI 算法，根据用户的浏览历史、偏好和行为数据，为母婴用户精准推荐适合的产品、服务和内容。 3. 客户服务与支持部署 AI 聊天机器人，能够实时回答常见的母婴健康问题，提供快速准确的服务。 4. 数据分析与洞察运用 AI 技术对大量的用户数据进行分析，挖掘潜在的市场趋势、用户需求和消费行为模式，为公司的决策提供有力支持。 5. 营销与推广利用 AI 进行广告创意生成和优化，提高营销活动的效果。 6. 视频制作与编辑借助 AI 工具进行视频的剪辑、特效添加和字幕生成，提升视频制作的效率和质量。 7. 社交媒体管理通过 AI 监测社交媒体平台上的舆论动态，及时发现和处理负面信息，维护品牌形象。 8. 预测与规划基于 AI 的预测模型，对市场需求、销售趋势等进行预测，帮助公司制定更合理的业务规划。

CNN的主要应用是什么？

CNN（卷积神经网络）主要应用于以下领域： 1. 模式识别任务，在计算上比大多数其他架构更有效、更快速。 2. 自然语言处理，已被用来击败大多数其他算法。 3. 图像识别，用于图像特征提取。 4. 推荐系统，将用户行为或物品属性映射到低维空间以进行协同过滤或基于内容的推荐。 5. 视觉分析，在 CV（计算机视觉）中发挥核心作用，经历了从零开始的深度学习、有监督、无监督和自监督等阶段。

如何使用cursor进行编程

以下是关于如何使用 Cursor 进行编程的相关信息： Cursor 旨在让您极其高效，是使用 AI 进行编码的最佳方式。您可以从代码库中获得最佳答案，参考特定文件或文档，一键使用模型中的代码。它允许您使用指令编写代码，通过简单的提示就能更新整个类或函数。 Cursor 能通过预测您的下一个编辑，让您轻松完成更改。

请给我提供一个 AI辅助我进行知识管理的方案

以下是一个 AI 辅助知识管理的方案： 1. 利用提示词规划 PARA 分类模式：PARA 代表项目（Projects）、领域（Areas）、资源（Resources）和档案（Archives）。AI 可分析您的工作模式和内容类型，自动生成提示词，助您将信息和知识分类到相应部分，简化分类过程，加快组织和检索信息。核心是理解以行动为驱动的笔记逻辑。 2. 借助提示词设计笔记标签系统：有效的标签系统对知识管理很关键，AI 能分析笔记内容和使用习惯，推荐合适的标签和结构，提高检索效率。 3. 让知识助手 Bot 渐进式积累领域知识：随着在特定领域的深入，需要系统积累和更新知识。知识助手 Bot 可根据学习进度和兴趣点，定期推送相关文章、论文和资源，实现渐进式学习，扩展知识边界并确保知识更新。例如基于 dify.ai 将数百个思维模型整合成知识库，根据不同对话和条件判断为用户选择适用的思维模型分析工具，封装成智能分析的 Bot。 4. 基于已积累知识的 RAG 方法进行深度研究：RAG 是结合检索和生成的 AI 模型，应用于知识管理，能在深度研究时自动检索相关知识点和资料，辅助构建更全面深入的分析。 5. 打造个人知识导师，随时对话辅助梳理线索：创建个人知识管理员机器人，随时与之对话，询问特定知识点或寻求解决问题思路。它能基于知识库自学习，了解您的知识结构和需求，成为不可或缺的知识伙伴。 6. 构建最了解您的智能体作为 AI 写作助手：涵盖构思、草稿生成、内容迭代、润色与优化等全流程。构思阶段利用智能体生成创意点、主题或大纲；草稿生成基于构思让智能体生成文本草稿；内容迭代通过 promptchain 工具设计迭代提示修改完善草稿；润色与优化对最终文本进行语言风格和语调调整。通过实践和反馈优化 prompt 设计，使写作助手贴合个人风格和需求。此外，生成式人工智能在知识管理应用程序方面也有新兴应用，例如用作管理组织内基于文本（或可能基于图像或视频）知识的手段。一些研究表明，针对组织内特定知识体系微调模型培训，可有效管理组织知识。一些公司正与领先的商业提供商合作探索基于生成式人工智能的知识管理理念，但用户可能需要培训或帮助来创建有效提示，且知识输出应用前可能仍需编辑或审查。

请问DeepSeek如何与生产型企业进行结合创造效益？

DeepSeek 与生产型企业的结合可以从以下几个方面创造效益： 1. 模型优化与性能提升：英伟达基于 FP4 优化的 DeepSeekR1 检查点现已在 Hugging Face 上开源。这种优化将模型Transformer 模块内的线性算子的权重和激活量化到了 FP4，适用于 TensorRTLLM 推理。每个参数从 8 位减少到 4 位，使磁盘空间和 GPU 显存的需求减少约 1.6 倍。使用 TensorRTLLM 部署时，需要支持 TensorRTLLM 的英伟达 GPU（如 B200），并且需要 8 个 GPU 来实现 tensor_parallel_size=8 的张量并行。代码利用 FP4 量化、TensorRT 引擎和并行计算，实现高效、低成本的推理，适合生产环境或高吞吐量应用。 2. 部署指南：社区伙伴 Hua 投稿的《在 Azure AI Foundry 部署 DeepSeek 大模型全指南》，手把手指导在微软 Azure AI Foundry 平台上完成 DeepSeek R1（671B）模型的完整部署流程，包含环境准备、资源管理、模型测试及 API 调用说明。 3. 为企业带来实质提升：DeepSeek 的强化学习和联网搜索能力改变了信息获取方式，从“检索—阅读—摘要”转变为“提问—获得答案”，大幅提升工作效率。其开源策略打破了技术垄断，让国内大模型能力迅速提升。在企业级部署方面，通过行业知识蒸馏和领域自适应训练，实现对企业非结构化数据的深度解析能力。特别是在实时决策支持、多模态交互及复杂知识图谱构建方面，为企业打造具备持续进化能力的数字神经中枢。这种“AI 即服务”的部署模式，重构了传统工作流效率，并通过预测性分析和认知自动化开启企业智能化的第二增长曲线。同时，还可以考虑垂直场景强化学习机制的增加，如在智能制造场景中嵌入设备故障模式自发现的奖惩机制；以及可信计算架构的升级，针对金融、医疗等高合规需求场景。

随着 ChatGPT、Deepseek 等 AI 技术的爆发式发展，人工智能正在加速渗透各行业应用场景，包括茶饮行业。请你对 AI 技术在茶饮行业的影响进行研究分析，并提出 AI 技术可以在连锁奶茶店如何应用的设想。

以下是关于 AI 技术在茶饮行业的影响分析及在连锁奶茶店应用的设想：影响分析： 1. 提升运营效率：通过自动化流程和智能预测，优化库存管理、员工排班等环节。 2. 改善客户体验：利用智能客服快速响应顾客咨询，提供个性化推荐。 3. 精准营销：基于大数据分析顾客偏好，制定更有针对性的营销策略。应用设想： 1. 智能点单系统：根据顾客的历史订单和偏好，为其推荐饮品和搭配。 2. 库存管理优化：借助 AI 预测销售趋势，精准控制原材料库存。 3. 员工培训辅助：利用虚拟培训工具，提升员工的服务技能和产品知识。 4. 营销决策支持：通过数据分析，确定最佳的促销活动和推广渠道。目前的知识库中，相关的具体研究报告主要有： 1. 浙江大学：《DeepSeek 技术溯源及前沿探索朱强》（2025/03/19），介绍了语言模型从基于统计的 Ngram 到 Transformer 的技术演化，以及大模型的发展，如 GPT 系列。 2. 浙江大学：《DeepSeek：回望 AI 三大主义与加强通识教育报告》（2025/03/05），围绕人工智能展开，介绍其发展历程、三大主义、技术进展、应用成果以及教育举措。 3. 清华大学：《气象人工智能技术与应用报告》（2024/12/25），围绕气象人工智能展开，介绍了其发展和应用情况。如需下载这些研究报告，可。

如何用rpa来实现读取本地excel表格里的内容进行筛选，提取某些数据值后，再自动化填写到飞书的多维表格去。怎么来实现这个功能

要使用 RPA 实现读取本地 Excel 表格内容进行筛选，并将提取的数据值自动化填写到飞书的多维表格，可参考以下步骤： 1. 关于扣子：“”（Coze）是字节跳动在 2024 年上线的新一代一站式 AI Bot 开发平台，也被称为“字节版 GPTs”。它是一个低门槛的 AI 应用开发平台，其核心目标是让没有编程基础的用户也能够轻松参与到 AI 生态的建设中。 2. 登录后，在左侧功能列表的工作空间中，点击右上角“+字段”创建工作流，自行输入名称和描述。 3. 已做好工作流后，逐步拆解每个节点的配置：开始节点：此节点不需要做任何配置，没有输入以及输出。读取飞书表格内容节点：点击开始节点后面的“+”，搜索“飞书多维表格”，选择“search_record”功能。添加后，点击该节点的配置，在界面右侧的参数框中，需要填写 app_token、field_names。filter 是对数据的筛选条件，没有筛选需求可直接忽略。其中，app_token 是多维表格的唯一标识符，即表格 URL 中的一段；field_names 则是要读取的具体字段，比如“标题”、“内容”，以作为后续操作的输入。该节点运行后，就能将多维表格中的内容提取出来。

有没有全自动AI剪辑工具，丢入素材后可以根据我的规则要求设置进行多素材混剪

目前有一些工具可以帮助您实现全自动 AI 剪辑，以下为您介绍一种多素材混剪的方法： 1. 声音克隆：工具：Fish Audio 操作：准备一段需要克隆的音频（可以是类似屈原的古风声音，或自行录制一段）。打开网站：https://fish.audio/zhCN/train/newmodel/ 。上传准备好的音频，按照指引完成声音克隆。进入声音库选择需要使用的声音，将第一步生成的文案输入，使用克隆好的声音生成对应的音频文件。下载生成的音频文件备用。 2. 视频合成：工具：Viggle.ai 操作：在网上下载“回答我”的原视频。打开 Viggle.ai 网站，登录后进入视频合成功能：https://viggle.ai/createmix 。上传“回答我”原视频和第二步生成的人物形象图，生成新版本的“回答我”视频。预览效果，满意后下载合成好的新视频。 3. 视频剪辑：工具：剪映操作：打开剪映软件（手机或电脑版均可）。导入第二步合成好的新视频和第一步生成的音频文件。将音频与视频时间轴对齐，确保声音和画面同步，添加字幕等。如需叠加特殊背景，可以导入自己的背景图（如楚国风景）。预览整个视频，检查效果，微调后导出最终视频（建议 MP4 格式）。