与知识库对话 - WayToAGI

直达「通往AGI之路」飞书知识库 →

首页/全部问答

comfyui做视频

以下是关于 comfyui 做视频的相关信息：一些人员在相关领域的情况：德方：18600081286，从事设计、建模、绘图、效果图、视频工作。谌峰：13925911177，从事视频，人物，室内设计工作。陈铭生：18861511571，利用 comfyUI 做 AI 视频，掌握 comfy 工作流设计，给一些公司定制 comfy 流程。郑路：18868755172，进行出图、短视频创作。塵：从事绘图与视频工作。阿牛：13720121256，掌握 comfy 工作流。 Stable Video Diffusion 模型核心内容与部署实战中 ComfyUI 部署实战的相关步骤：运行 ComfyUI 并加载工作流。在命令行终端操作，在浏览器输入相应地址，出现界面。默认的 ComfyUI 版本存在一些问题，需安装 ComfyUI Manager 插件。再次运行 python main.py 出现 Manager 菜单，可跑文生视频的工作流。工作流可从指定途径获取，使用 ComfyUI 菜单的 load 功能加载，点击菜单栏「Queue Prompt」开始视频生成，通过工作流上的绿色框查看运行进度，在 ComfyUI 目录下的 output 文件夹查看生成好的视频。若生成视频时出现显存溢出问题，有相应解决办法。关于 ComfyUI 的介绍：现在甚至可以生成视频等，包括写真、表情包、换脸、换装等，只需要一个工作流一键完成，后续会一一讲解介绍如何使用。如何启动搭建 Comfyui 界面的部分简单带过。

gamma如何注册？

以下是关于 gamma 注册的步骤： 1. 登陆 gamma 官网（具体网址需您进一步明确）。 2. 点击进入，查看主页，然后点击“加入测试版”，即可申请内测，一般很快就能获得内测资格。 3. 可能需要加入 gamma 的相关社区并在此使用产品。需要注意的是，由于不太明确您所提到的“gamma”具体是指哪一个产品或服务，以上步骤仅供参考。如果能提供更详细准确的信息，将能为您提供更精准的注册指导。

国内可用的可通过上传的文件生产PPT的AI软件有哪些？

以下是一些国内可用的可通过上传文件生成 PPT 的 AI 软件： 1. Gamma：这是一个在线 PPT 制作网站，允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式，如 GIF 和视频，以增强演示文稿的吸引力。网址：https://gamma.app/ 2. 美图 AI PPT：由知名图像编辑软件“美图秀秀”的开发团队推出。允许用户通过输入简单的文本描述来生成专业的 PPT 设计。可能包含丰富的模板库和设计元素，用户可根据需求选择不同风格和主题的模板，适用于多种场合。网址：https://www.xdesign.com/ppt/ 3. Mindshow：一款 AI 驱动的 PPT 辅助工具，可能提供一系列智能设计功能，如自动布局、图像选择和文本优化等，以帮助用户更高效地创建演示文稿。网址：https://www.mindshow.fun/ 4. 讯飞智文：由科大讯飞推出的 AI 辅助文档编辑工具，利用科大讯飞在语音识别和自然语言处理领域的技术优势，可能提供智能文本生成、语音输入、文档格式化等功能。网址：https://zhiwen.xfyun.cn/ 5. 爱设计 PPT：在国内 AI 辅助制作 PPT 的产品领域中表现出色，背后拥有强大的团队，成功把握住 AI 与 PPT 结合的市场机遇，并已确立市场领先地位。另外，推荐您阅读两篇市场分析文章作为参考： 1. 《》 2. 《》请注意，内容由 AI 大模型生成，请仔细甄别。

以下是关于 AI 总结的相关内容：可以让 AI 总结各种文章（不超过 2 万字），如复制文章全文粘贴发送给 GPTs 即可进行总结，GPT4 能识别重点内容。对于 B 站视频，可利用视频字幕进行总结。若视频有字幕，可安装油猴脚本“Bilibili CC 字幕工具”，下载字幕后复制发送给 GPTs 进行总结。总结类文章，AI 可能不会读完整个文章，而只是头尾读一下，中间随机读。大型模型的能力可能不足以支撑商业运营，产生了一些伪需求。AI 可以帮助总结内容，但可能会忽略有价值的信息，可定制专门的 Prompt 进行总结并不断迭代，但能坚持的人可能本身不太需要这种服务。同时，AI 也可能导致新的信息茧房。

写作提示词

以下是关于写作提示词的全面指导：写提示词（prompt）是决定 AI 模型如何理解并生成文本的关键步骤。一个好的提示词应具备以下特点： 1. 明确任务：清晰定义任务，如写故事时包含背景、角色和主要情节。 2. 提供上下文：若任务需特定背景知识，应在提示词中提供足够信息。 3. 使用清晰语言：尽量用简单、清晰的语言，避免模糊或歧义词汇。 4. 给出具体要求：如有特定格式或风格要求，需在提示词中明确指出。 5. 使用示例：若有期望结果，可提供示例帮助 AI 模型理解需求。 6. 保持简洁：避免过多信息导致模型困惑，影响生成结果的准确性。 7. 使用关键词和标签：有助于模型更好理解任务主题和类型。 8. 测试和调整：生成文本后仔细检查结果，根据需要调整提示词，可能需多次迭代。在 SD 绘画的提示词方面：根据想画的内容写提示词，多个提示词之间用英文半角符号。一般概念性、大范围、风格化的关键词写在前面，叙述画面内容的其次，最后是描述细节的。提示词的顺序很重要，越靠后的权重越低。关键词应具特异性，措辞越具体越好，可使用括号人工修改提示词的权重。在构建提示词时，可将其当作思维磨练。初涉提示词时若不知如何提供细节，可参考类似“StepBack Prompting”（后退提示）的方法，让大语言模型帮助拓展思路。更多相关内容可参考论文《Take a Step Back:Evoking Reasoning via Abstraction in Large Language Models》。请注意，以上内容由 AI 大模型生成，请仔细甄别。

好用的智能扩图，改变图片比例

以下为您介绍一些关于智能扩图和改变图片比例的方法： 1. 在 Midjourney 中：不同模型有不同侧重点，如 niji 针对动漫，v 5 对摄影类质量高，可查看官网介绍。设置图片比例可使用ar 1：1，也可改成其他支持的比例。还有一些不常用设置，如creative 更适合脑暴和创意设计，chaos 100 或c 100 指生成图的视觉风格，取值范围 0100 之间，默认值 0，stylize 1000 或s 1000 数字越大生成图片越有艺术感，v 5 版本取值范围不同。 2. Coze “图像流”：适合用于构图不对想改变构图的图片。节点参数是往 4 个方向扩图，只能选择扩或者不扩，不能选择扩多少像素。试用效果方面，如文生图生成方图后向左扩图会有新构图的长图效果；左边和上面同时扩图效果也不错；实景照片扩图时，扩图部位尽可能简单，不容易出现崩坏，加提示词建议简单，不建议画人之类，崩坏结果可能惨不忍睹。 3. 【SD】ControlNet：以某张图为例讲解，先导入图生图界面。根据情况选择大模型，卡通类一般选“revAnimated”，真实类选“Realistic Vision”，效果不好可尝试其他模型。图生图重要参数包括“缩放模式”选“缩放后填充空白”，尺寸根据扩充方向调整，单批数量按需填写，“重绘幅度”加大到“0.8”以上。 ControlNet 设置方面，升级到最新版本，导入图片，启用插件，“控制类型”选“局部重绘”，预处理器选“inpaint_only+lama”，控制模式选“更倾向 Controlnet”，缩放模式选“缩放后填充空白”，还可增加“reference_only”通道巩固扩图风格。可通过反推提示词增加文本控制，新生成部分和原图可能有色差，需调整参数修正。记住工作流，替换图片改尺寸即可快速扩图。

广告文案提示词

以下是关于广告文案提示词的相关内容：电商运营方面：广告文案：请帮我写 banner 上的广告文案，我的品牌和产品是……，请提供 5 份 50 个字符的{品牌+产品}广告副本。目标是推动销售、增加流量等。市场营销类：暂未提供直接相关的广告文案提示词信息。提示词模板相关网站： Majinai：词图： Black Lily： Danbooru 标签超市：魔咒百科词典： AI 词汇加速器： NovelAI 魔导书：鳖哲法典： Danbooru tag： AIBooru：

ChatGPT最新的版本是什么

目前 ChatGPT 官网主要有以下版本： 1. GPT3.5：免费版本，拥有 GPT 账号即可使用，但智能程度相对较低，无法使用 DALL.E3（AI 画图功能）、GPTs 商店和高级数据分析等插件，知识更新到 2022 年 1 月。 2. GPT4：智能程度较高，知识更新到 2023 年 12 月。想要使用更多功能需要升级到 PLUS 套餐，收费标准为 20 美金一个月，还有团队版和企业版，费用更贵，一般推荐使用 PLUS 套餐。 3. ChatGPT 4o：5.13 发布，可免费体验，但免费体验次数有限，知识更新到 2023 年 10 月。想要更多功能也需要升级到 PLUS 套餐。

可以免费生成视频的ai

以下是一些可以免费生成视频的 AI 工具： Hidreamai（国内，有免费额度）：https://hidreamai.com//AiVideo 。支持文生视频、图生视频，提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制，支持多尺寸，可以生成 5s 和 15s 的视频。 ETNA（国内）：https://etna.7volcanoes.com/ 。Etna 是一款由七火山科技开发的文生视频 AI 模型，能根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒，画质可达 4K，最高 38402160，画面细腻逼真，帧率 60fps。 Dreamina（国内内测，有免费额度）：https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频、视频生视频，支持图生视频首尾帧功能，提示词使用中文、英文都可以。文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择，支持多种尺寸，默认生成 3s 的视频。可灵（免费）：https://klingai.kuaishou.com/ 。支持文生视频、图生视频，支持图生视频首尾帧功能，提示词可使用中文。文生视频支持正向提示词、反向提示词、运镜控制、时长选择（5s、10s），支持多种尺寸，默认生成 5s 的视频。 Pika Labs：被网友评价为目前全球最好用的文本生成视频 AI。目前内测免费，生成服务托管在 discord 中。加入方式：在浏览器中打开链接 https://discord.gg/dmtmQVKEgt 点击加入邀请。在 generate 区生成，输入/create，在弹出的 prompt 文本框内输入描述即可生成视频，也可上传本地图片生成对应指令动态效果。对生成的视频不满意可再次生成优化效果。

你是基于哪个大模型搭建的

我是基于谷歌开源可商用的大语言模型 Gemma 搭建的。 Gemma 是一系列轻量级的最先进开源模型，由 Google DeepMind 和 Google 的其他团队开发，其灵感来自于 Gemini，名称反映了拉丁语中“宝石”的意思。此次开源的 Gemma 重点包括共两个尺寸的模型权重：Gemma 2B 和 Gemma 7B，每种尺寸都提供了预训练和指令调优的版本。模型地址为：。在基于大模型构建模型应用方面，需要注意以下要点： 1. 不做工程化终究会让模型应用变得无法维护。 2. 根据项目需求选择一个合适的开发框架是非常关键的。 3. 了解业务背后的深层次需求，确保模型能够解决实际问题。根据了解到的业务需求设定流程环节。 4. 在每个环节中，精心设计提示词以引导模型提供准确和有用的回复。 5. 确保应用在提供服务的同时，遵守安全和伦理标准。 6. 通过不断的测试和迭代，优化模型性能和用户体验。 7. 成功部署应用后，还需要持续的维护和更新以适应不断变化的需求。此外，Embedding（嵌入）是一个浮点数的向量（列表），两个向量之间的距离度量它们的相关性，小的距离表示高相关性，大的距离表示低相关性。Embedding 共有词、句子、文档、图像等分类。在大模型中具有重要价值，实战中可从数据集中获取 Embedding 结果，并保存为 csv 文件。进阶到企业级应用开发的大模型技术还会涉及到利用开源的 Embedding 模型、向量数据库去做检索增强生成（RAG），以及购买 GPU 服务器去基于开源大模型搭建企业级大模型项目。OpenAI 官网文档链接：https://platform.openai.com/docs/introduction