直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
comfyui做视频
以下是关于 comfyui 做视频的相关信息: 一些人员在相关领域的情况: 德方:18600081286,从事设计、建模、绘图、效果图、视频工作。 谌峰:13925911177,从事视频,人物,室内设计工作。 陈铭生:18861511571,利用 comfyUI 做 AI 视频,掌握 comfy 工作流设计,给一些公司定制 comfy 流程。 郑路:18868755172,进行出图、短视频创作。 塵:从事绘图与视频工作。 阿牛:13720121256,掌握 comfy 工作流。 Stable Video Diffusion 模型核心内容与部署实战中 ComfyUI 部署实战的相关步骤: 运行 ComfyUI 并加载工作流。在命令行终端操作,在浏览器输入相应地址,出现界面。默认的 ComfyUI 版本存在一些问题,需安装 ComfyUI Manager 插件。再次运行 python main.py 出现 Manager 菜单,可跑文生视频的工作流。工作流可从指定途径获取,使用 ComfyUI 菜单的 load 功能加载,点击菜单栏「Queue Prompt」开始视频生成,通过工作流上的绿色框查看运行进度,在 ComfyUI 目录下的 output 文件夹查看生成好的视频。若生成视频时出现显存溢出问题,有相应解决办法。 关于 ComfyUI 的介绍:现在甚至可以生成视频等,包括写真、表情包、换脸、换装等,只需要一个工作流一键完成,后续会一一讲解介绍如何使用。如何启动搭建 Comfyui 界面的部分简单带过。
2024-11-09
gamma如何注册?
以下是关于 gamma 注册的步骤: 1. 登陆 gamma 官网(具体网址需您进一步明确)。 2. 点击进入,查看主页,然后点击“加入测试版”,即可申请内测,一般很快就能获得内测资格。 3. 可能需要加入 gamma 的相关社区并在此使用产品。 需要注意的是,由于不太明确您所提到的“gamma”具体是指哪一个产品或服务,以上步骤仅供参考。如果能提供更详细准确的信息,将能为您提供更精准的注册指导。
2024-11-09
国内可用的可通过上传的文件生产PPT的AI软件有哪些?
以下是一些国内可用的可通过上传文件生成 PPT 的 AI 软件: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。允许用户通过输入简单的文本描述来生成专业的 PPT 设计。可能包含丰富的模板库和设计元素,用户可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,可能提供一系列智能设计功能,如自动布局、图像选择和文本优化等,以帮助用户更高效地创建演示文稿。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,可能提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 5. 爱设计 PPT:在国内 AI 辅助制作 PPT 的产品领域中表现出色,背后拥有强大的团队,成功把握住 AI 与 PPT 结合的市场机遇,并已确立市场领先地位。 另外,推荐您阅读两篇市场分析文章作为参考: 1. 《》 2. 《》 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-09
AI总结文章
以下是关于 AI 总结的相关内容: 可以让 AI 总结各种文章(不超过 2 万字),如复制文章全文粘贴发送给 GPTs 即可进行总结,GPT4 能识别重点内容。 对于 B 站视频,可利用视频字幕进行总结。若视频有字幕,可安装油猴脚本“Bilibili CC 字幕工具”,下载字幕后复制发送给 GPTs 进行总结。 总结类文章,AI 可能不会读完整个文章,而只是头尾读一下,中间随机读。 大型模型的能力可能不足以支撑商业运营,产生了一些伪需求。AI 可以帮助总结内容,但可能会忽略有价值的信息,可定制专门的 Prompt 进行总结并不断迭代,但能坚持的人可能本身不太需要这种服务。同时,AI 也可能导致新的信息茧房。
2024-11-09
写作提示词
以下是关于写作提示词的全面指导: 写提示词(prompt)是决定 AI 模型如何理解并生成文本的关键步骤。一个好的提示词应具备以下特点: 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,应在提示词中提供足够信息。 3. 使用清晰语言:尽量用简单、清晰的语言,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,需在提示词中明确指出。 5. 使用示例:若有期望结果,可提供示例帮助 AI 模型理解需求。 6. 保持简洁:避免过多信息导致模型困惑,影响生成结果的准确性。 7. 使用关键词和标签:有助于模型更好理解任务主题和类型。 8. 测试和调整:生成文本后仔细检查结果,根据需要调整提示词,可能需多次迭代。 在 SD 绘画的提示词方面: 根据想画的内容写提示词,多个提示词之间用英文半角符号。一般概念性、大范围、风格化的关键词写在前面,叙述画面内容的其次,最后是描述细节的。提示词的顺序很重要,越靠后的权重越低。关键词应具特异性,措辞越具体越好,可使用括号人工修改提示词的权重。 在构建提示词时,可将其当作思维磨练。初涉提示词时若不知如何提供细节,可参考类似“StepBack Prompting”(后退提示)的方法,让大语言模型帮助拓展思路。更多相关内容可参考论文《Take a Step Back:Evoking Reasoning via Abstraction in Large Language Models》。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-09
好用的智能扩图,改变图片比例
以下为您介绍一些关于智能扩图和改变图片比例的方法: 1. 在 Midjourney 中: 不同模型有不同侧重点,如 niji 针对动漫,v 5 对摄影类质量高,可查看官网介绍。 设置图片比例可使用ar 1:1,也可改成其他支持的比例。 还有一些不常用设置,如creative 更适合脑暴和创意设计,chaos 100 或c 100 指生成图的视觉风格,取值范围 0100 之间,默认值 0,stylize 1000 或s 1000 数字越大生成图片越有艺术感,v 5 版本取值范围不同。 2. Coze “图像流”: 适合用于构图不对想改变构图的图片。 节点参数是往 4 个方向扩图,只能选择扩或者不扩,不能选择扩多少像素。 试用效果方面,如文生图生成方图后向左扩图会有新构图的长图效果;左边和上面同时扩图效果也不错;实景照片扩图时,扩图部位尽可能简单,不容易出现崩坏,加提示词建议简单,不建议画人之类,崩坏结果可能惨不忍睹。 3. 【SD】ControlNet: 以某张图为例讲解,先导入图生图界面。 根据情况选择大模型,卡通类一般选“revAnimated”,真实类选“Realistic Vision”,效果不好可尝试其他模型。 图生图重要参数包括“缩放模式”选“缩放后填充空白”,尺寸根据扩充方向调整,单批数量按需填写,“重绘幅度”加大到“0.8”以上。 ControlNet 设置方面,升级到最新版本,导入图片,启用插件,“控制类型”选“局部重绘”,预处理器选“inpaint_only+lama”,控制模式选“更倾向 Controlnet”,缩放模式选“缩放后填充空白”,还可增加“reference_only”通道巩固扩图风格。 可通过反推提示词增加文本控制,新生成部分和原图可能有色差,需调整参数修正。 记住工作流,替换图片改尺寸即可快速扩图。
2024-11-09
广告文案提示词
以下是关于广告文案提示词的相关内容: 电商运营方面: 广告文案:请帮我写 banner 上的广告文案,我的品牌和产品是……,请提供 5 份 50 个字符的{品牌+产品}广告副本。目标是推动销售、增加流量等。 市场营销类:暂未提供直接相关的广告文案提示词信息。 提示词模板相关网站: Majinai: 词图: Black Lily: Danbooru 标签超市: 魔咒百科词典: AI 词汇加速器: NovelAI 魔导书: 鳖哲法典: Danbooru tag: AIBooru:
2024-11-09
ChatGPT最新的版本是什么
目前 ChatGPT 官网主要有以下版本: 1. GPT3.5:免费版本,拥有 GPT 账号即可使用,但智能程度相对较低,无法使用 DALL.E3(AI 画图功能)、GPTs 商店和高级数据分析等插件,知识更新到 2022 年 1 月。 2. GPT4:智能程度较高,知识更新到 2023 年 12 月。想要使用更多功能需要升级到 PLUS 套餐,收费标准为 20 美金一个月,还有团队版和企业版,费用更贵,一般推荐使用 PLUS 套餐。 3. ChatGPT 4o:5.13 发布,可免费体验,但免费体验次数有限,知识更新到 2023 年 10 月。想要更多功能也需要升级到 PLUS 套餐。
2024-11-09
可以免费生成视频的ai
以下是一些可以免费生成视频的 AI 工具: Hidreamai(国内,有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 ETNA(国内):https://etna.7volcanoes.com/ 。Etna 是一款由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps。 Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频、视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以。文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持多种尺寸,默认生成 3s 的视频。 可灵(免费):https://klingai.kuaishou.com/ 。支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文。文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持多种尺寸,默认生成 5s 的视频。 Pika Labs:被网友评价为目前全球最好用的文本生成视频 AI。目前内测免费,生成服务托管在 discord 中。加入方式:在浏览器中打开链接 https://discord.gg/dmtmQVKEgt 点击加入邀请。在 generate 区生成,输入/create,在弹出的 prompt 文本框内输入描述即可生成视频,也可上传本地图片生成对应指令动态效果。对生成的视频不满意可再次生成优化效果。
2024-11-09
你是基于哪个大模型搭建的
我是基于谷歌开源可商用的大语言模型 Gemma 搭建的。 Gemma 是一系列轻量级的最先进开源模型,由 Google DeepMind 和 Google 的其他团队开发,其灵感来自于 Gemini,名称反映了拉丁语中“宝石”的意思。此次开源的 Gemma 重点包括共两个尺寸的模型权重:Gemma 2B 和 Gemma 7B,每种尺寸都提供了预训练和指令调优的版本。模型地址为: 。 在基于大模型构建模型应用方面,需要注意以下要点: 1. 不做工程化终究会让模型应用变得无法维护。 2. 根据项目需求选择一个合适的开发框架是非常关键的。 3. 了解业务背后的深层次需求,确保模型能够解决实际问题。根据了解到的业务需求设定流程环节。 4. 在每个环节中,精心设计提示词以引导模型提供准确和有用的回复。 5. 确保应用在提供服务的同时,遵守安全和伦理标准。 6. 通过不断的测试和迭代,优化模型性能和用户体验。 7. 成功部署应用后,还需要持续的维护和更新以适应不断变化的需求。 此外,Embedding(嵌入)是一个浮点数的向量(列表),两个向量之间的距离度量它们的相关性,小的距离表示高相关性,大的距离表示低相关性。Embedding 共有词、句子、文档、图像等分类。在大模型中具有重要价值,实战中可从数据集中获取 Embedding 结果,并保存为 csv 文件。进阶到企业级应用开发的大模型技术还会涉及到利用开源的 Embedding 模型、向量数据库去做检索增强生成(RAG),以及购买 GPU 服务器去基于开源大模型搭建企业级大模型项目。OpenAI 官网文档链接:https://platform.openai.com/docs/introduction
2024-11-09