「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
sd 学习教程
以下是关于系统学习 Stable Diffusion 提示词的教程: 1. 学习基本概念: 了解 Stable Diffusion 的工作原理和模型架构。 理解提示词如何影响生成结果。 掌握提示词的组成部分(主题词、修饰词、反面词等)。 2. 研究官方文档和教程: 通读 Stable Diffusion 官方文档,了解提示词相关指南。 研究来自开发团队和专家的教程和技巧分享。 3. 学习常见术语和范例: 熟悉 UI、艺术、摄影等相关领域的专业术语和概念。 研究优秀的图像标题和描述,作为提示词范例。 4. 掌握关键技巧: 学习如何组合多个词条来精确描述想要的效果。 掌握使用“()”、“”等符号来控制生成权重的技巧。 了解如何处理抽象概念、情感等无形事物的描述。 5. 实践和反馈: 使用不同的提示词尝试生成各种风格和主题的图像。 对比提示词和实际结果,分析原因,总结经验教训。 在社区内分享结果,请教高手,获取反馈和建议。 6. 创建提示词库: 根据主题、风格等维度,建立自己的高质量提示词库。 将成功案例和总结记录在案,方便后续参考和复用。 7. 持续跟进前沿: 关注 Stable Diffusion 的最新更新和社区分享。 及时掌握提示词的新技术、新范式、新趋势。 此外,为您推荐以下学习资源: 1. SD 从入门到大佬: Nenly 同学的视频合集(点我看合集):https://space.bilibili.com/1 。 想入门 SD 的同学可以在安装完 SD 后,参考 0.SD 的安装:https://qa3dhma45mc.feishu.cn/wiki/Ouiyw6v04iTJlmklDCcc50Jenzh 。 可选的一些图片版教程: 。 2. 第一期:上班的你: 。 。 。 。 。 。 。 。 。
2025-01-06
Midjourney 学习教程
以下是学习 Midjourney 的教程: 1. 注册相关账号:注册 Discord 账号并加入 Midjourney 服务器,Midjourney 也有在线版本可直接使用。 2. 掌握提示词结构:了解 Prompt 的基本组成部分,如“主体”“媒介”“环境”等,学习构建有效的 Prompt 来生成理想图像。 3. 熟悉常用参数和命令:学习 Midjourney 的各种参数设置,如放大、细节等,掌握常用命令,如/imagine、/test 等。 4. 针对不同场景练习创作:尝试针对插画、游戏、框架等不同场景进行创作练习,通过实践提高 Prompt 编写和图像生成技巧。 5. 学习他人作品并模仿:观察学习其他用户的优秀作品,了解其 Prompt 技巧,通过模仿提高创作水平。 此外,还可以通过以下方式学习 Midjourney: 把 Midjourney 的官网说明书喂给 GPT,让其根据说明了解机制和结构,给出适合的提示词。 像案例中的二师兄一样,加入相关社群,如 Prompt battle 社群,打磨文生图提示词学习。 总的来说,系统学习 Prompt 编写技巧、熟悉 Midjourney 的功能,并通过大量实践创作,同时善于学习他人经验,是学习 Midjourney 的有效方法。但需注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-06
mj 学习教程
以下是一些关于 Midjourney(MJ)学习的教程资源: 理论学习方面: 生成式 AI 原理:李宏毅老师风格幽默风趣的课程,很好跟进。 AI 图原理:简单清晰的介绍 AI 生图。 实操方面: 喂饭级实操攻略: MJ 入门:15 分钟快速了解,MJ 的基础技巧,快速入门。 https://www.bilibili.com/video/BV1vm4y1B7gP/?spm_id_from=333.880.my_history.page.click&vd_source=afe0a1f0c730039635f99f5ee84c1276 https://www.bilibili.com/video/BV1ko4y1t7wr/?spm_id_from=333.880.my_history.page.click 新手学习手册和干货网站(必看):https://ciweicui.feishu.cn/docx/DPbidgdBeoNw55xKjO6c7ao3nbc?from=from_copylink MJ 官方学习手册(至少看 1 遍):https://docs.midjourney.com/ B 站·莱森 LysonOber 免费视频教程(基础操作必看):https://space.bilibili.com/630876766?spm_id_from=333.337.0.0 【腾讯文档】野菩萨 AI 课程(小红书@野菩萨)摄影范式:https://docs.qq.com/sheet/DSXRNUGJIQ0tMWkhu?tab=BB08J2 【腾讯文档】副本野菩萨 AI 课程(小红书@野菩萨)绘画范式:https://docs.qq.com/sheet/DSWlmdFJyVVZPR3VN?tab=y0u7ta 【腾讯文档】野菩萨 AI 课程(小红书@野菩萨)Niji 二次元范式:https://docs.qq.com/sheet/DSUxaRmprc0FrR25W?tab=c7lsa8 【腾讯文档】野菩萨 AI 课程(小红书@野菩萨)三维和抽象:https://docs.qq.com/sheet/DSUlaSHVXT1daaFlJ?tab=BB08J3 【腾讯文档】野菩萨 AI 课程(小红书@野菩萨)AI 产品制作与展现:https://docs.qq.com/sheet/DSW1jSFVZTER4Rnlq?tab=BB08J4 【腾讯文档】《野菩萨 AI 课程(小红书@野菩萨)电影范式》:https://docs.qq.com/sheet/DSXJKdmZ3WXhIQ2Vq?tab=BB08J5&scode=
2025-01-06
comfyui 学习教程
以下是一些关于 ComfyUI 的学习资源和推荐学习路径: 学习资料网站: ComfyUI 官方文档:提供使用手册和安装指南,适合初学者和有经验的用户。网站:https://www.comfyuidoc.com/zh/ 优设网:有详细的入门教程,介绍了 ComfyUI 的特点、安装方法及生成图像等内容。教程地址:https://www.uisdc.com/comfyui3 知乎:有用户分享的部署教程和使用说明,适合有一定基础并希望进一步了解的用户。教程地址:https://zhuanlan.zhihu.com/p/662041596 Bilibili:有一系列涵盖从新手入门到精通各个阶段的视频教程。教程地址:https://www.bilibili.com/video/BV14r4y1d7r8/ 共学快闪内容:包括 Stuart 风格迁移、红泥小火炉基础课程、大雨换背景图等众多课程和工作流相关内容。 推荐学习路径: 入门视频教程:学习三个 NENLY 出品的免费视频课程,包括“ComfyUI 入门教程”(https://www.bilibili.com/video/BV1D7421N7xN)、“ComfyUI 自定义节点的秘密”(https://www.bilibili.com/video/BV1pZ421b7t7)、“拆解 ComfyUI 工作流”(https://www.bilibili.com/video/BV1ab42187er/)。 理论宝典教程:学习 ZHO 出品的免费理论视频课程。 文生图实操:学习完上述视频课程后,可使用文生图工作流实际出图实操,工作流地址:https://openart.ai/workflows/lailai/textgeneratesimagesmvpworkflow/ChYNJiXHkZrjyvg1yL9f 内容由 AI 大模型生成,请仔细甄别。
2025-01-06
如果用AI来画流程图、结构图的话,应该用哪款产品?
以下是一些可以用于使用 AI 来画流程图、结构图的产品: 1. Lucidchart: 简介:强大的在线图表制作工具,集成了 AI 功能,可自动化绘制多种示意图。 功能:拖放界面,易于使用;支持团队协作和实时编辑;丰富的模板库和自动布局功能。 官网:https://www.lucidchart.com/ 2. Microsoft Visio: 简介:专业的图表绘制工具,适用于复杂的流程图等,AI 功能可帮助自动化布局和优化图表设计。 功能:集成 Office 365,方便与其他 Office 应用程序协同工作;丰富的图表类型和模板;支持自动化和数据驱动的图表更新。 官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware 3. Diagrams.net: 简介:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。 功能:支持本地和云存储(如 Google Drive、Dropbox);多种图形和模板,易于创建和分享图表;可与多种第三方工具集成。 官网:https://www.diagrams.net/ 4. Creately: 简介:在线绘图和协作平台,利用 AI 功能简化图表创建过程。 功能:智能绘图功能,可自动连接和排列图形;丰富的模板库和预定义形状;实时协作功能,适合团队使用。 官网:https://creately.com/ 5. Whimsical: 简介:专注于用户体验和快速绘图的工具,适合创建多种示意图。 功能:直观的用户界面,易于上手;支持拖放操作,快速绘制和修改图表;提供多种协作功能,适合团队工作。 官网:https://whimsical.com/ 6. Miro: 简介:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制。 功能:无缝协作,支持远程团队实时编辑;丰富的图表模板和工具;支持与其他项目管理工具(如 Jira、Trello)集成。 官网:https://miro.com/ 使用 AI 绘制示意图的步骤: 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录该平台。 3. 选择模板:利用平台提供的模板库,选择适合需求的模板。 4. 添加内容:根据需求添加并编辑图形和文字,利用 AI 自动布局功能优化图表布局。 5. 协作和分享:若需要团队协作,可邀请团队成员一起编辑。完成后导出并分享图表。 示例:假设需要创建一个项目管理流程图,可以按照以下步骤使用 Lucidchart: 1. 注册并登录:https://www.lucidchart.com/ 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-06
常用的多模态大模型
以下是一些常用的多模态大模型: 1. InstructBLIP:基于预训练的BLIP2模型进行训练,在MM IT期间仅更新QFormer。通过引入指令感知的视觉特征提取和相应的指令,能够提取灵活多样的特征。 2. PandaGPT:是一种开创性的通用模型,能够理解6种不同模式的指令并根据指令采取行动,包括文本、图像/视频、音频、热、深度和惯性测量单位。 3. PaLIX:使用混合VL目标和单峰目标进行训练,包括前缀完成和屏蔽令牌完成。这种方法对于下游任务结果和在微调设置中实现帕累托前沿都是有效的。 4. VideoLLaMA:引入了多分支跨模式PT框架,使LLMs能够在与人类对话的同时处理给定视频的视觉和音频内容,使视觉与语言以及音频与语言保持一致。 5. 视频聊天GPT:专门为视频对话设计的模型,能够通过集成时空视觉表示来生成有关视频的讨论。 6. Shikra:Chen等人介绍了一种简单且统一的预训练MMLLM,专为参考对话(涉及图像中区域和对象的讨论的任务)而定制,展示了值得称赞的泛化能力,可以有效处理看不见的设置。 7. DLP:提出PFormer来预测理想提示,并在单模态句子数据集上进行训练,展示了单模态训练增强MM学习的可行性。 8. BuboGPT:通过学习共享语义空间构建,用于全面理解MM内容,探索不同模式之间的细粒度关系。 9. ChatSpot:引入了一种简单而有效的方法来微调MMLLM的精确引用指令,促进细粒度的交互。 10. QwenVL:多语言MMLLM,支持英文和中文,还允许在训练阶段输入多个图像,提高其理解视觉上下文的能力。 11. NExTGPT:端到端、通用的anytoany MMLLM,支持图像、视频、音频、文本的自由输入输出,采用轻量级对齐策略。 12. MiniGPT5:集成了生成voken的反演以及与稳定扩散的集成,擅长为MM生成执行交错VL输出,在训练阶段加入无分类器指导可以提高生成质量。 13. Flamingo:代表了一系列视觉语言模型,旨在处理交错的视觉数据和文本,生成自由格式的文本作为输出。 14. BLIP2:引入了资源效率更高的框架,包括用于弥补模态差距的轻量级QFormer,实现对冻结LLMs的充分利用,利用LLMs可以使用自然语言提示进行零样本图像到文本的生成。 15. LLaVA:率先将IT技术应用到MM领域,引入了使用ChatGPT/GPT4创建的新型开源MM指令跟踪数据集以及MM指令跟踪基准LLaVABench。 16. MiniGPT4:提出了一种简化的方法,仅训练一个线性层即可将预训练的视觉编码器与LLM对齐,能够复制GPT4所展示的功能。 17. mPLUGOwl:提出了一种新颖的MMLLMs模块化训练框架,结合了视觉上下文,包含一个名为OwlEval的教学评估数据集。 18. XLLM:扩展到包括音频在内的各种模式,并表现出强大的可扩展性。利用QFormer的语言可迁移性,成功应用于汉藏语境。 19. VideoChat:开创了一种高效的以聊天为中心的MMLLM用于视频理解对话,为该领域的未来研究制定标准,并为学术界和工业界提供协议。
2025-01-06
如何学习AI
以下是关于新手学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。 6. 对于中学生学习 AI 的补充建议: 从编程语言入手学习,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等,探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 学习 AI 基础知识,包括基本概念、发展历程、主要技术及在教育、医疗、金融等领域的应用案例。 参与 AI 相关的实践项目,如参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题。 关注 AI 发展的前沿动态,关注权威媒体和学者,思考 AI 技术对未来社会的影响。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-06
我从哪开始学习AGI
学习 AGI 是一个长期的过程,建议您参考以下步骤: 1. 应用方面:深入了解 Prompt,选择适合自己的 AI 对话、绘画和语音产品,每天使用并用来解决实际问题或提升效率。 了解 Prompt:https://ywh1bkansf.feishu.cn/wiki/Q5mXww4rriujFFkFQOzc8uIsnah?table=tbldSgFt2xNUDNAz&view=vewo2g2ktO AI 对话:https://ywh1bkansf.feishu.cn/wiki/QddLw0teKi7nUCkDRIecskn3nuc 绘画:https://ywh1bkansf.feishu.cn/wiki/Q5ddwxfkMiVUZBkQXN7cgXf4nOb 语音:https://ywh1bkansf.feishu.cn/wiki/ZXPiw2OuLi2YsxkkmaLcPTyInrc 2. 分析方面:大量阅读各类文章、视频以及行业报告,理解各知识之间的关系。 各类文章:https://ywh1bkansf.feishu.cn/wiki/YjJgwbKnriZBZ0kVn6Kc1gSKnsf?table=tblsQKR3a22uFqsp 视频:https://ywh1bkansf.feishu.cn/wiki/LEnvwwEy0iufT3k4kfVc8Ehenvf?table=tbllpoPWJn6MNOR6&view=vew68BlUHo 行业报告:https://ywh1bkansf.feishu.cn/wiki/FnXcwGrwSimQxnkNo1kcJzPYn7f 3. 记忆方面:先从 AI 的历史、基本术语、重要人物、方法和原理等开始了解,看看入门课程。 AI 的历史:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tbl1tOC3ZKbrcHVn&view=vewTtypUZc 基本术语:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tbltvr7KExCt7Jpw&view=vewjxk9tDu 重要人物:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblLtN12KuvP5reO&view=vewuvGBXhd 方法和原理:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblolGx2mprs1EQz&view=vewx5ROYtl 入门课程:https://waytoagi.feishu.cn/wiki/ZYtkwJQSJiLa5rkMF5scEN4Onhd?table=tblWqPFOvA24Jv6X&view=veweFm2l9w 您还可以参考「通往 AGI 之路」的布鲁姆分类法来设计自己的学习路径,完整的学习路径建议参考「通往 AGI 之路」 。
2025-01-06
我该从哪里开始学习AGI
学习 AGI 是一个长期的过程,建议您参考以下步骤: 1. 记忆方面:先从 AI 的历史、基本术语、重要人物、方法和原理等开始了解,您可以查看入门课程,例如: 2. 应用方面:深入了解 Prompt,选择适合自己的 AI 对话、绘画和语音产品,每天使用它们来解决实际问题或提升效率,例如: 3. 分析方面:大量阅读各类文章、视频以及行业报告,理解各知识之间的关系,例如: 完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-06
Stable Diffusion、comfyui
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI,您可以将其想象成集成了 stable diffusion 功能的 substance designer。它具有以下特点: 优势: 对显存要求相对较低,启动和出图速度快。 生成自由度更高。 可以和 webui 共享环境和模型。 能搭建自己的工作流程,可导出流程并分享,报错时能清晰发现错误所在。 生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势: 操作门槛高,需要有清晰的逻辑。 生态没有 webui 丰富(但常用的都有),也有一些针对 Comfyui 开发的有趣插件。 其生图原理如下: 基础模型:ComfyUI 使用预训练的扩散模型作为核心,通常是 Stable Diffusion 模型,包括 SD1.5、SD2.0、SDXL、SD3、FLUX 等。 文本编码:当用户输入文本提示时,ComfyUI 首先使用 CLIP 文本编码器将文本转换为向量表示,以捕捉文本的语义信息。 Pixel Space 和 Latent Space: Pixel Space(像素空间):图的左边表示输入图像的像素空间,在 ComfyUI 中,对应于“图像输入”模块或直接从文本提示生成的随机噪声图像,生成过程结束时会将处理后的潜在表示转换回像素空间生成最终图像。 Latent Space(潜在空间):ComfyUI 中的许多操作都在潜在空间中进行,如 KSampler 节点执行采样过程,通过节点调整对潜在空间的操作,如噪声添加、去噪步数等。 扩散过程(Diffusion Process): 噪声的生成和逐步还原:扩散过程表示从噪声生成图像的过程,在 ComfyUI 中通常通过调度器控制,如 Normal、Karras 等,可通过“采样器”节点选择不同调度器控制处理噪声和逐步去噪回归到最终图像。 时间步数:在生成图像时,扩散模型会进行多个去噪步,通过控制步数影响图像生成的精细度和质量。 官方链接:https://github.com/comfyanonymous/ComfyUI (内容由 AI 大模型生成,请仔细甄别)
2025-01-06