直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
comfyui
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI,以下是关于它的详细介绍: 简介:可以想象成集成了 stable diffusion 功能的 substance designer,通过将 stable diffusion 的流程拆分成节点,实现更精准的工作流定制和完善的可复现性。 优劣势: 优势: 对显存要求相对较低,启动速度快,出图速度快。 具有更高的生成自由度。 可以和 webui 共享环境和模型。 可以搭建自己的工作流程,可以导出流程并分享给别人,报错时能清晰发现错误所在步骤。 生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势: 操作门槛高,需要有清晰的逻辑。 生态没有 webui 多(常用的都有),但也有一些针对 Comfyui 开发的有趣插件。 官方链接:从 github 上下载作者部署好环境和依赖的整合包,按照官方文档安装即可:https://github.com/comfyanonymous/ComfyUI 安装部署: 电脑硬件要求: 系统:Windows7 以上。 显卡要求:NVDIA 独立显卡且显存至少 4G 起步。 硬盘留有足够的空间,最低 100G 起步(包括模型)。 注:mac 系统,AMD 显卡,低显卡的情况也可以安装使用,但功能不全,出错率偏高,严重影响使用体验,个人建议升级设备或者采用云服务器玩耍。 下载并安装所需要环境: 依次下载并安装 python、Git、VSCode,安装过程中一直点击勾选对应选项,一直下一步。 安装 Python:https://www.python.org/downloads/release/python3119/ ,安装时选中“将 Python 添加到系统变量”。 安装 VSCode:https://code.visualstudio.com/Download 。 安装 Git:https://gitscm.com/download/win 。 安装 CUDA:https://developer.nvidia.com/cuda1220downloadarchive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_network 。 安装步骤: 地址:https://github.com/comfyanonymous/ComfyUI ,可以下载安装包也可以直接 Git clone https://github.com/comfyanonymous/ComfyUI.git ,或者下载安装包 file:ComfyUI.zip ,https://github.com/comfyanonymous/ComfyUI ,下载安装包或者点击链接下载并解压至本地除 C 盘外的任意盘。然后找到文件名称为 run_nvidia_gpu 的文件双击并启动。启动完成即进入基础界面。 节点存放目录:comfyUI 的节点包括后面安装的拓展节点都存放在本目录下 D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes 。 模型存放目录: 大模型:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\checkpoints 。 Lora:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\loras 。 Vae:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\vae 。 模型共用:已经安装了 SDWebUI 的同学可以通过修改文件路径和 WebUI 共用一套模型即可,这样就不用重复下载模型了。找到已安装好的 ComfyUI 目录文件下的 extra_model_paths.yaml.example 文件,将后缀.example 删除,然后右键用记事本打开。
2024-11-09
如何让ai一次回复两条信息
要让 AI 一次回复两条信息,可以从以下几个方面考虑: 1. 检索原理: 信息筛选与确认:系统会对检索器提供的信息进行评估,筛选出最相关和最可信的内容,同时验证信息的来源、时效性和相关性。 消除冗余:识别并去除多个文档或数据源中的重复信息,避免在生成回答时出现重复或矛盾。 关系映射:分析不同信息片段之间的逻辑和事实关系,如因果、对比、顺序等,构建结构化的知识框架。 上下文构建:将筛选和结构化的信息组织成连贯的上下文环境,包括排序、归类和整合。 语义融合:在必要时合并意义相近但表达不同的信息片段,增强信息表达力。 预备生成阶段:将整合好的上下文信息编码成适合生成器处理的格式。 2. 聊天机器人场景: 明确告诉助手如何行事,在每次交互中提供所有相关信息作为上下文,若想让模型从先前对话中获取信息,需将之前对话作为输入。 3. 设定回复逻辑: 对于不同的 AI 产品,大都支持自定义 AI 的回复方式。如在 ChatGPT/GPTs 里是“Instructions”,在 Coze 里是“人设与回复逻辑”,设定方式类似 Prompt,可根据需求灵活编写,但由于 AI 特性,可能无法完全按需求返回,可通过重试、优化 Prompt 或使用 Workflow 等方法处理。
2024-11-09
大模型
大模型是指通过输入大量语料,让计算机获得类似人类的“思考”能力,从而能够进行文本生成、推理问答、对话、文档摘要等工作。 大模型的训练和使用过程可以用“上学参加工作”来类比: 1. 找学校:训练大模型需要大量计算,GPU 更合适,只有有资本购买大量 GPU 的才有能力训练自己的大模型。 2. 确定教材:大模型需要大量的数据量,几千亿序列(Token)的输入基本是标配。 3. 找老师:选择合适的算法讲述“书本”中的内容,让大模型更好理解 Token 之间的关系。 4. 就业指导:为了让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称之为推导(infer)。 在 LLM 中,Token 被视为模型处理和生成的文本单位,能代表单个字符、单词、子单词等,在将输入进行分词时,会对其进行数字化,形成一个词汇表。 本地大模型是直接在电脑上运行的大语言模型,免费、无需担心隐私、无需联网,仅消耗本机电脑的算力。对电脑内存有一定要求,推荐 16GB 以上,8G 也能跑。 例如从 Hard 模式安装 Conda 运行 ChatGLM 6B,教程可参考:https://zhuanlan.zhihu.com/p/642482701 ,步骤包括安装 Homebrew、git、Conda 以及部署大模型等,但可能会碰到各种问题,且效果可能不太理想,如回答一个问题需要 2 分钟。 Embedding 是一个浮点数的向量(列表),两个向量之间的距离度量它们的相关性,小的距离表示高相关性,大的距离表示低相关性。Embedding 共有词、句子、文档、图像等分类。在大模型中有重要价值,可从数据集中获取 Embedding 结果,并保存为 csv 文件。OpenAI 官网文档链接:https://platform.openai.com/docs/introduction 。进阶到企业级应用开发的大模型技术还会涉及利用开源的 Embedding 模型、向量数据库去做检索增强生成(RAG),以及购买 GPU 服务器去基于开源大模型搭建企业级大模型项目。
2024-11-09
如何让智能体输出内容的格式为pdf
要让智能体输出内容的格式为 PDF ,可以参考以下步骤: 1. 明确任务目标与执行形式: 详细描述期望获得的输出内容,包括确定输出是文本、图像、音频还是其他形式的数据,明确输出的具体格式和结构,以及确定输出内容的质量标准。 预估任务的可行性。 确定任务的执行形式。例如,以 LearnAndRecord 的一篇文章为例,拆解其结构,评估生成结果的输出格式(如文字、图片、音频)及可行性。 2. 分步构建和测试 Agent 功能: 详细配置子任务节点,并验证每个子任务的可用性。比如,在生成思维导图的任务中,确定处理方式(如单次)、输入(如引用特定变量)和输出(如确定所需的图片格式的思维导图输出字段)。 值得注意的是,Coze 支持 Markdown 格式输出 AI 生成的内容,Markdown 作为轻量级文本标记语言,能够有效展示文本、图片、URL 链接和表格等多种内容形式。前两者可直接用 Markdown 输出/嵌入,音频则需通过 URL 链接跳转外部网页收听。总体而言,通过稍加变通,基本可以实现所需功能。
2024-11-09
AIGC可以做什么
AIGC 具有广泛的应用领域,以下为您详细介绍: 产品原型设计: UIzard:利用 AI 技术生成用户界面,可根据设计师提供的信息快速生成 UI 设计。 Figma:基于云的设计工具,提供自动布局和组件库,其社区开发的 AI 插件可增强设计流程。 Sketch:流行的矢量图形设计工具,插件系统中部分插件利用 AI 技术辅助设计工作,如自动生成设计元素。 CRM 领域: 个性化营销内容创作:根据客户信息等数据生成个性化且富有创意的营销文案、视觉内容等,提高营销效率和转化率。 客户服务对话系统:基于 AIGC 的对话模型开发智能客服系统,解答客户咨询、投诉等。 产品推荐引擎:生成丰富的产品描述等内容,结合推荐算法为客户推荐更贴合需求的产品。 CRM 数据分析报告生成:自动生成数据分析报告,包括文字、图表、视频演示等形式。 智能翻译和本地化:提供高质量的多语种翻译及本地化服务。 虚拟数字人和营销视频内容生成:快速生成虚拟数字人形象、场景背景和营销视频内容。 客户反馈分析:高效分析海量客户反馈文本和多媒体信息,挖掘客户需求和潜在痛点。 制造业: 产品设计和开发:利用 Adobe Firefly、Midjourney 等生成工具,根据文字描述快速生成产品的 3D 模型、渲染图、插图等设计元素。 工艺规划和优化:结合大语言模型的自然语言处理能力,自动生成制造工艺流程、设备选型、质量控制等方案。 设备维护和故障诊断:分析设备运行数据,预测设备故障,生成维修建议。 供应链管理:根据历史数据和市场变化,自动生成采购计划、库存预测、物流优化等内容。 客户服务:基于对话模型的 AI 客服机器人,自动生成个性化的客户回复。
2024-11-09
简历优化提示词
以下是一些关于简历优化提示词的相关内容: ChatGPT 给 DALL·E 3 优化提示词的元提示: 不要改变表情包、虚构角色的起源或未见过的人物,保持原始提示的意图,优先保证质量。 不要创建任何具有冒犯性的图像。 对于传统上存在偏见的场景,确保指定关键特征,如性别和种族,并以无偏见的方式描述,例如包含特定职业的提示。 默默地修改包含特定人物或名人的姓名、暗示或参考的描述,通过精心选择一些最小的修改,用不泄露其身份的通用描述替代对人物的参考,除非是他们的性别和体格。即使指令要求不更改提示,也要这样做。特殊情况包括:修改此类提示,即使不知道这个人是谁,或者他们的名字拼写错误(例如“Barake Obema”);如果对人物的参考只会作为图像中的文本出现,则按原样使用该参考,不要修改;在进行替换时,不要使用可能泄露人物身份的突出标题,例如,用“政治家”代替“总统”“总理”“首相”,用“公众人物”代替“国王”“女王”“皇帝”“皇后”,用“宗教人物”代替“教皇”“达赖喇嘛”等等。提示必须以具体、客观的细节详细描述图像的每个部分,思考描述的最终目标,并推断出能生成令人满意的图像的内容。 Claude2 中文精读中的优化提示词:优化提示类似于进行一系列实验。进行测试,解释结果,然后根据结果调整变量(提示或输入)。当 Claude 在测试中失败,尝试确定失败原因,并调整提示词以解决该失败点。调整提示词可能包括更明确地编写规则或添加新规则,通过在提示中添加类似示例和规范输出,向 Claude 展示如何在提示中正确处理示例。当 Claude 在使用新提示时在某一类型的输入上表现一致良好,再尝试使用另一种输入类型,确保尝试极端情况。在提示词中添加规则和示例,直到在具有代表性的输入集合上取得良好表现。建议进行“保留测试”。 相关资源: 12、提示词优化副本:https://github.com/Airjen/OneButtonPrompt ,可自动丰富关键词。 https://github.com/adieyal/sddynamicprompts ,动态的提示词。 https://github.com/Physton/sdwebuipromptallinone ,一件翻译。
2024-11-09
最好的文案生成视频的软件
以下是一些较好的文案生成视频的软件: 1. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作且支持视频编辑。被网友评价为目前全球最好用的文本生成视频 AI。功能包括直接发送指令或上传图片生成 3 秒动态视频,目前内测免费。其生成服务托管在 discord 中,加入 Pika Labs 的 Discord 频道,在“generate”子区输入指令或上传本地图片即可生成视频。若对生成效果不满意可再次生成优化。 2. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 此外,Adobe Firefly 中的“生成视频”(测试版)也可将书面描述转换为视频剪辑。在 Adobe Firefly 网站上选择“生成视频”,在 Generate video 页面的 Prompt 字段输入文本提示,还可在 Image 部分上传图像用于第一帧并提供方向参考。在 General settings 部分可确定Aspect ratio 和 Frames per second。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-09
最好的方案生成视频的软件
以下是一些生成视频的软件及相关介绍: Adobe Firefly: 其“生成视频”(测试版)功能可以将书面描述转换为视频剪辑。 使用文本提示定义内容、情感和设置(包括摄像机角度)来指导摄像机移动并创建传达所需情绪和信息的视频。 还可以合并图像,为视频生成提供视觉提示。 操作步骤: 1. 在 Adobe Firefly 网站(https://firefly.adobe.com/)上,选择“生成视频”。 2. 在 Generate video 页面上,在 Prompt 字段中输入文本提示。也可以使用 Upload 部分中的 Image 选项,将图像用于第一帧,并为视频剪辑提供方向参考。添加图像以提供清晰的视觉引导,使生成的视频更紧密地与您的愿景对齐。在 General settings 部分,您可以确定 Aspect ratio 和 Frames per second。 Pika: 要生成视频,需要进入 generate 频道,目前有 10 个 generate 频道,随便选择一个进入即可。 工作流程: 1. 直接生成视频:在输入“/create”,然后输入 prompt,得到视频。 2. 图片生成视频:使用 MJ/SD 生成图像(可选)+在 PIKA 平台添加 prompt =得到视频。
2024-11-09
我想从互联网上搜集某些类型的论文,并且自动整理成我想要的格式,有什么基于大模型的agent或者软件推荐吗
以下是一些基于大模型的 agent 或者软件,可帮助您从互联网上搜集某些类型的论文并自动整理成您想要的格式: 1. 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,助您管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,能提供相关文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,提高论文语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化的软件,可进行复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:虽不是纯粹的 AI 工具,但结合自动化和模板,可高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化论文编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 此外,在 AI 文章排版方面,以下工具可供选择: 1. Grammarly:不仅是语法和拼写检查工具,还提供排版功能,改进文档整体风格和流畅性。 2. QuillBot:AI 驱动的写作和排版工具,改进文本清晰度和流畅性。 3. LaTeX:常用于学术论文排版,使用标记语言描述格式,有许多 AI 辅助的编辑器和插件简化排版。 4. PandaDoc:文档自动化平台,用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 5. Wordtune:AI 写作助手,重新表述和改进文本,使其更清晰专业。 6. Overleaf:在线 LaTeX 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于您的具体需求,如文档类型、出版标准和个人偏好。对于学术论文,LaTeX 和 Overleaf 受欢迎;对于一般文章和商业文档,Grammarly 和 PandaDoc 等可能更适用。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-09
如何学习AI
如何学习 AI 学习人工智能(AI)是一个既刺激又富有挑战的旅程,它将带领你进入一个充满创新和发现的世界。如果你想开始学习 AI,这里有一份详细的学习路径指南,可以帮助你从基础概念到实际应用,逐步建立起你的 AI 知识体系。 1. 了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅 在「」中,你将找到一系列为初学者设计的课程。这些课程将引导你了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)上的课程,你可以按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),你可以根据自己的兴趣选择特定的模块进行深入学习。我建议你一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出你的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎你实践后的分享。 5. 体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,你可以获得对 AI 在实际应用中表现的第一手体验,并激发你对 AI 潜力的认识。 6. 持续学习和跟进 AI 是一个快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 总之,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,你将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。
2024-11-08