直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
compy ui 是什么意思
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI,具有以下特点: 简介:可以想象成集成了 stable diffusion 功能的 substance designer,通过将 stable diffusion 的流程拆分成节点,实现更精准的工作流定制和完善的可复现性。 优劣势: 优势:对显存要求相对较低,启动和出图速度快;具有更高的生成自由度;可以和 webui 共享环境和模型;可以搭建自己的工作流程,能导出流程并分享,报错时能清晰发现错误所在;生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势:操作门槛高,需要有清晰的逻辑;生态没有 webui 多(但常用的都有),也有一些针对 Comfyui 开发的有趣插件。 生图原理: Pixel Space 和 Latent Space:像素空间对应输入图像的像素空间,潜在空间中许多操作都在进行,图像被映射到潜在空间后,扩散过程在这个空间中进行。 扩散过程:噪声的生成和逐步还原,通过调度器控制,可选择不同的调度器控制如何在潜在空间中处理噪声和逐步去噪回归到最终图像,时间步数会影响图像生成的精细度和质量。 基础教程: 应用场景和不可替代性:ComfyUI 的 UI 界面复杂,连线方式类似搭建自动化工作流。从功能角度看,与 SD WebUI 提供的功能相同,只是呈现方式不同。这种连线方式的好处是可以根据需求搭建适合自己的工作流,无需依赖开发者,也能根据需求开发并改造某个节点。选择 ComfyUI 最核心的原因在于其自由和拓展。 案例:生成四格故事漫画。 官方链接:从 github 上下载作者部署好环境和依赖的整合包,按照官方文档安装即可:https://github.com/comfyanonymous/ComfyUI 。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-17
小红书与AI的结合
以下是关于小红书与 AI 结合的相关内容: 汉青老师曾分享,生成式 AI 的内容与传统社交媒体内容共存,如小红书、抖音、微信等。短期内可能因新鲜感获流量红利,长期人们仍在意高质量内容。我们掌握了多种先进工具,但应慢下节奏感受真实世界和身边普通人。目前还没想好具体如何与 AI 结合。 有朋友的朋友圈题材提到:同一条街道上,年轻女孩在街上,孤独老人在围墙里;一张照片传递了两种稳固关系和一种爱意;有人认为电商快递外卖的优势是劳动力,图中女孩的状态令人垂头丧气。 还有作者将 AI 与大理石这一古典媒介结合,认为当历史厚重与科技轻盈相遇会激发艺术可能。 此外,2024 年 11 月 30 日举办的 Show Me 扣子 AI 挑战赛大消费行业专场活动中,介绍了扣子平台最新公测的各项能力。活动旨在推动 AI 技术在大消费领域的应用与创新,为内容生产者寻求更多变现可能。获奖作品如“买买买!产品买点提炼神器强化版”专注于市场营销领域,能提炼卖点、生成营销文案等。
2025-02-17
compy ui 工作流是什么意思
ComfyUI 的工作流包括以下方面: 1. 一般的 Workflow 概念:Workflow 是 ComfyUI 的节点结构及数据流运转过程。 2. 推荐的工作流网站: Openart.ai:流量较高,支持上传、下载、在线生成,免费账户有 50 个积分,加入 Discord 可再加 100 积分,开通最低每月 6 美元的套餐后每月有 5000 积分。 ComfyWorkflows 网站:支持在线运行工作流,实际下载量和访问量略少于 openart。 Flowt.ai:https://flowt.ai/community 3. FLUX 低显存运行工作流: 目的是让 FLUX 模型能在较低显存情况下运行。 分阶段处理思路: 初始生成在较低分辨率下进行以提高效率。 采用两阶段处理,先用 Flux 生成,后用 SDXL 放大,有效控制显存使用。 使用 SD 放大提升图片质量。 工作流流程: 初始图像生成(Flux):包括 UNETLoader 加载 flux1dev.sft 模型、DualCLIPLoader 加载 t5xxl 和 clip_l 模型等步骤。 初始图像预览。 图像放大和细化(SDXL):包括 CheckpointLoaderSimple 加载 SDXL 模型、UpscaleModelLoader 加载 RealESRGAN_x4.pth 用于放大等步骤。 最终图像预览。 4. 换装服饰一致性工作流: 应用场景:电商服饰行业、换装、虚拟试穿等。 整体思路: 首先生成适合服装的模特,很多时候换装效果不好是因为服装和人物不匹配,可抽卡抽到满意模特后进入第二步。 第二步进行高精度换装,先预处理拼出 mask,然后重绘 mask 区域。 模特生成:加入 Redux 模型,强度不用太高,让提示词生效。 服装高精度处理:包括 mask 的处理,使用 Flux 的 fill 模型,提示词书写格式有特定要求,Redux 权重需调整为最大。
2025-02-17
大模型评测
以下是关于大模型评测的相关信息: FlagEval(天秤)大模型评测体系及开放平台: 地址: 简介:旨在建立科学、公正、开放的评测基准、方法、工具集,协助研究人员全方位评估基础模型及训练算法的性能,同时探索利用 AI 方法实现对主观评测的辅助,大幅提升评测的效率和客观性。创新构建了“能力任务指标”三维评测框架,细粒度刻画基础模型的认知能力边界,可视化呈现评测结果。 CEval:构造中文大模型的知识评估基准: 地址: 简介:构造了一个覆盖人文,社科,理工,其他专业四个大方向,52 个学科(微积分,线代…),从中学到大学研究生以及职业考试,一共 13948 道题目的中文知识和推理型测试集。此外还给出了当前主流中文 LLM 的评测结果。 SuperCLUElyb:SuperCLUE 琅琊榜 地址: 简介:中文通用大模型匿名对战评价基准,这是一个中文通用大模型对战评价基准,它以众包的方式提供匿名、随机的对战。他们发布了初步的结果和基于 Elo 评级系统的排行榜。 此外,还有小七姐对文心一言 4.0、智谱清言、KimiChat 的小样本测评,测评机制包括: 测评目标:测评三家国产大模型,以同组提示词下 ChatGPT 4.0 生成的内容做对标参照。 能力考量:复杂提示词理解和执行(结构化提示词)、推理能力(CoT 表现)、文本生成能力(写作要求执行)、提示词设计能力(让模型设计提示词)、长文本归纳总结能力(论文阅读)。 测评轮次:第一轮是复杂提示词理解和执行,包括 Markdown+英文 title 提示词测试、Markdown+中文 title 提示词测试、中文 title+自然段落提示词测试;第二轮是推理能力(CoT 表现);第三轮是文本生成能力(写作要求执行);第四轮是提示词设计能力(让模型设计提示词);第五轮是长文本归纳总结能力(论文阅读)。 测试大模型质量好坏时,常用的问题包括检索和归纳、推理性、有日期相关历史事件等。以下是几个专业做模型测评的网站:
2025-02-17
transformer
Transformer 是一种深度学习模型,其核心思想是“Attention is all you need”。以下为您详细介绍其工作流程: 假设我们有一个英文句子“I am a student”需要翻译成中文。 1. 输入嵌入(Input Embeddings):首先,将每个单词映射为一个向量,即单词嵌入(word embeddings)。例如“I”映射为一个 512 维的向量。 2. 位置编码(Positional Encodings):由于 Transformer 没有递归或卷积等捕获序列顺序的结构,所以需要给每个词位置加上位置编码,使模型知道词语的相对位置。 3. 编码器(Encoder):输入序列的嵌入向量和位置编码相加后被送入编码器层。编码器由多个相同的层组成,每层有两个核心部分: 多头注意力机制(MultiHead Attention):捕捉单词间的依赖关系。 前馈神经网络(FeedForward NN):对 attention 的结果进行进一步编码。 4. 解码器(Decoder):编码器的输出被送入解码器层。解码器也是由多个相同层组成,每层除了编码器组件外,还有一个额外的注意力模块,对编码器的输出序列建模依赖关系。 5. 输出嵌入(Output Embeddings):解码器最后一层的输出被映射为输出单词概率分布。例如生成单词“我”“是”等概率。 6. 生成(Generation):基于概率分布,以贪婪或 beam search 等解码策略生成完整的输出序列。 Transformer 主要用于处理序列数据,包括现在最火的 NLP 任务。与之前的模型不同,Transformer 完全基于注意力机制,不使用传统的循环神经网络(RNN)或卷积神经网络(CNN)的计算架构。它可以用来翻译文本、写诗、写文章,甚至生成计算机代码。像 GPT3、BERT、T5 等功能强大的自然语言处理(NLP)模型都是基于 Transformer 模型构建的。
2025-02-17
中小学AI教育场景 生成式 全息
以下是关于中小学 AI 教育场景生成式的相关内容: 北京市新英才学校在中小学 AI 教育方面进行了积极探索。跨学科项目老师带着学生用 AIGC 做学校地图桌游,英语老师在 AIGC 帮助下备课和授课,生物和信息科技老师合作带着学生训练 AI 模型以识别植物。数字与科学中心 EdTech 跨学科小组组长魏一然深入参与其中。 在英语课上,对于初中以上学生,一开始更多是老师带着使用 AIGC 工具,由学生提出 prompt,老师引导。例如在研究学校食堂食物浪费问题时,老师带着学生与 ChatGPT 对话获取信息,还让 ChatGPT 生成单词解释和例句,加工生词生成题目、游戏或文章帮助学生复习单词。在社交媒体的英语辩论课上,尝试让学生自主使用 AIGC 工具做辩论准备。 教育科技长期以来在有效性和规模之间权衡,而有了 AI 这种状况不再存在。现在可以大规模部署个性化学习计划,为每个用户提供“口袋里的老师”。像 Speak、Quazel、Lingostar 已在做实时交流并给予反馈的语言教学。Photomath、Mathly 指导学生解决数学问题,PeopleAI、Historical Figures 通过模拟与杰出人物聊天教授历史。学生在作业中也利用 Grammarly、Orchard、Lex 等工具提升写作水平,处理其他形式内容的产品如 Tome、Beautiful.ai 协助创建演示文稿。
2025-02-17
有哪个AI可以读懂建筑施工图纸
以下是一些能够读懂建筑施工图纸的 AI 工具: 1. HDAidMaster:这是一款云端工具,建筑师能在平台上使用主流的 AIGC 功能进行有趣的集卡式方案创作,在建筑、室内和景观设计领域表现出色,搭载的建筑大模型 ArchiMaster 由建筑设计院开发,软件 UI 和设计成果颜值高。 2. Maket.ai:主要面向住宅行业,在户型和室内软装设计方面有 AI 技术探索,设计师输入房间面积需求和土地约束,软件能自动生成户型图并查看详细设计结果。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,为设计师提供全新设计模式,在住宅设计早期可引入标准和规范约束 AI 生成的设计结果,保证设计合规性。 4. Fast AI 人工智能审图平台:从住宅设计图构件开始,形成全自动智能审图流程,能自动导入、划分区域、识别构件、审查强条和导出结果,同时为建筑信息自动建模打下基础,实现建筑全寿命周期内信息集成与管理。 但每个工具都有特定应用场景和功能,建议根据具体需求选择合适的工具。
2025-02-17
deepseek的技巧
以下是关于 DeepSeek 的使用技巧: 1. DeepSeek 是推理型大模型,其核心在于通过理解用户的真实需求和场景来提供答案,不需要用户提供详细的步骤指令。 2. 它能够理解用户用“人话”表达的需求,无需用户学习和使用特定的提示词模板。 3. 在回答问题时能够进行深度思考,并非简单罗列信息。 4. 可以模仿不同作家的文风进行写作,适用于多种文体和场景。 更多提示词技巧请查看
2025-02-17
和教师相关的ai
以下是与教师相关的 AI 应用: 1. 帮助教师获取信息和学习:可以要求人工智能解释概念,获取良好结果。例如,可参考。 2. 作为自动导师:。但使用时需注意可能产生的幻觉,关键数据要根据其他来源仔细检查。 3. 重构教育服务:授课教师、游戏玩家、情感伴侣等服务都可被 AI 重构。 4. 作为数字教师:借助大型语言模型,人工智能生成的角色可以像古时候的苏格拉底、孔子一样,采用对话式、讨论式、启发式的教育方法授课。例如,让牛顿亲自授课《牛顿运动定律》,让白居易为你讲述《长恨歌》背后的故事。能实现一对一辅导,提高学生参与感,还能根据学生情况提供定制化学习计划和资源,缓解教育资源不平等问题。 5. 生成作业和试题:AI 可以生成作业单和各类测试题,如模仿中高考、托福雅思、SAT(美国高考)、GRE(美国研究生入学考)等的试题,为教师提供真题库,为学生提供错题练习库。
2025-02-17
如何构建自己领域的微调数据集
构建自己领域的微调数据集可以参考以下步骤: 1. 确定目标领域和应用需求:明确您希望模型在哪个细分领域进行学习和优化。 2. 数据收集:广泛收集与目标领域相关的数据。例如,若要训练二次元模型,需收集二次元优质数据;若要微调 Llama3 ,可参考相关文档获取数据集。 3. 数据标注:对收集的数据进行准确标注,以便模型学习到有效的特征。 4. 数据清洗:去除无效或错误的数据,提高数据质量。 5. 特殊处理:如为数据添加特殊 tag 等。 以 Stable Diffusion 为例,可收集如 833 张宝可梦数据,并按照特定步骤进行清洗、标注和添加特殊 tag 。对于 Llama3 ,获取数据集后上传到服务器,编写并执行微调代码即可进行微调。 在微调过程中,还需注意一些问题,如大型语言模型微调可能面临训练时间长、成本高等挑战,此时可考虑参数有效调优等创新方法。
2025-02-17