直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
图生图
以下是关于图生图的相关知识: 概念与功能说明: 首页模型\\帖子\\排行榜:发布了其他大手子炼成的模型、图片。不同模型有 checkpoint 和 lora 两种标签,有些还有 SDXL 标签。点击可看模型详细信息,下方是返图区。 基础模型(checkpoint):生图必需,任何生图操作都要先选定。与 lora 不同,两者在模型广场混着展示,lora 可选可不选。可通过搜索或浏览收集模型用于生图。 lora:低阶自适应模型,类似 checkpoint 的小插件,可控制面部、材质等细节,旁边数值是权重。 ControlNet:控制图片中特定图像,如人物姿态、生成特定文字等,是高阶技能。 VAE:编码器,类似滤镜,可调整生图饱和度,一般选择 840000 这个。 Prompt 提示词:想要 AI 生成的内容,但不绝对有效,需多学习。 负向提示词(Negative Prompt):想要 AI 避免产生的内容,也不绝对有效,需学习。 图生图操作:上传图片后,SD 会根据图片、所选模型、输入的 prompt 等信息进行重绘。重绘幅度越大,输出图与输入图差别越大。 关于 FLUX 之 PULID 换脸的图生图:如果无法科学上网,可注册 bizyair 拿到 key,在 comfyui 中安装最新节点,支持 pulid。没有独立显卡的笔记本也可体验,下载相关包解压即用。准备两张图,如神仙姐姐的图和要换脸的图,用 joy 反推,把文字贴到 pulid 工作流里,也可合在一个工作流里。相关工作流可通过网盘获取。
2024-10-21
制作海报的智能体
以下是为您提供的关于制作海报的智能体的相关信息: 1. 捏 Bot:使用扣子 coze.cn 等平台创建智能体 Agent 的过程被创作者形象地比喻为“捏 Bot”,最简单的 Bot 往往可以在 1 分钟内捏完。常见的 Bot 类型有讲故事、减肥提醒、生成 PPT、真假新闻辨识、新闻资讯收集、扮演“甄嬛”等。国内外有多个 Agent 平台可以几分钟内完成 Agent 创建,比如国内版扣子 coze.cn、海外版 Coze coze.com、百度 AppBuilder、阿里通义千问、智谱 AI 等,我们可以先从扣子 coze.cn 开始。 作品分享: 找三思做二十四节气海报:https://www.coze.cn/store/bot/7382246186440359945 ,作者:七个小扣子团队。 第一个 Bot:https://www.coze.cn/store/bot/7386486483391234057 ,作者:吕昭波 ,https://www.coze.cn/store/bot/7367669913697239052 ,作者:Stuart 。 2. 工具教程:Dreamina 即梦 智能画布功能: 案例一:用于微信小程序的商家奶茶宣传图 成品图 制作步骤: 生图关键提示词:平面插画,国风,留白,新中式,特写镜头,画面正中间房放着一杯纸杯奶茶,周围摆放着白色茉莉,假山石和青色苔藓,干净背景,具有细腻的笔触。 步骤: 第 1 步:找参考图。 第 2 步:用即梦文生图,生成场景底片。 第 3 步:用画布模式融合产品、logo、文字图片(利用了多种控制能力),然后替换杯子,植入品牌 logo 。 第 4 步:用画布模式“局部重绘”等功能做细节的图片美化,用 CapCut Web 版进行文字排版。 案例二:匡威鞋的春季海报 成品图 制作步骤: 生图关键词:上海老城街头有一双匡威运动鞋,超清晰、摄影感、4K 。 步骤: 第 1 步:找了一个目标效果图。 第 2 步:把鞋子用即梦智能画布抠图,用画布模式放到外滩背景上。 第 3 步:使用画布模式轮廓边缘,做融合、扩图、局部重绘,把楼绘制的好看一点。 第 4 步:用醒图 App 增加文案。 3. 野菩萨教学做海报 WaytoAGI 2024 年 9 月 9 日 智能纪要 智能章节 本章节围绕制作与平面设计有关的直播海报展开,讨论了可用 WPS、PPT、Keynote 制作,构想以黑背景呈现一支笔、一把尺子和一台 MacBook Pro 三个元素,还提及在 Keynote 中自动抠图及在 PS 中用特定操作抠图,以及对元素角度和排布的调整。 本章节主要是关于设计课的讨论,涉及字体选择、物体遮挡处理、元素呼应、logo 摆放、日期时间呈现等,如字体有少女水冰乐体,logo 考虑放顶部或底部,还探讨了颜色渐变增加质感等细节。 本章节讨论了设计相关内容,如 AHC 理论上不应多用大字体,提到海报信息乱,以 September Ninth 为例,探讨飞书相关设计,包括位置、字体选用及颜色关系等,还表示虽未达最优但先凑合,后续再调整。 本章节主要讨论了设计素材菩萨投的选用和摆放,提到为计划中的福利设计调色,如加渐变、调整颜色等,还探讨了信息的弱化和不同风格的排版,包括极简、居中以及前卫时尚的字体等。
2024-10-21
AI数字主播
以下是关于 AI 数字主播的相关内容: 节目单方面: 节目单 1.3 中包含了多种传统艺术与 AI 技术结合的节目,如新式变脸换装秀,需要绿幕、大量服装和好身材演员,存在缺服装和场地、缺换脸大佬的问题;剪纸/皮影戏/花灯,需要传统文化串烧脚本、AI 图片诠释、AI 视频空镜和脚本串词,有想法但无人认领。 节目单 1.2 中有 AIGC 技术短片,涉及 AI 转绘和 AI 蒙版抠图等技术;AIGC 温情短片,以叙事为主;原创 RAP,包括原创 RAP、AI Raper 和视频驱动;经典节目再现,需考虑形式;猜真人,属于魔术互动类表演,涉及数字人及 AI 数字人,可参考 heygen 官网视频。 Character.ai 方面:其愿景是让每个人都能获得深度个性化超级智能,例如授课教师、游戏玩家、情感伴侣等服务都可被 AI 重构。在教育培训领域,借助大型语言模型,人工智能生成的角色可作为数字教师,如让牛顿、白居易授课,能实现一对一辅导,提供定制化学习计划和资源,提高教育效率和质量,缓解教育资源不平等问题。还可作为数字陪伴促进儿童成长。
2024-10-21
Stable Diffusion(SD)收费吗
Stable Diffusion 是开源免费的。其优势在于开源免费、可以本地化部署、创作自由度很高,但需要较好的电脑配置,尤其是显卡。 相比较于 DALLE 等大模型,Stable Diffusion 让用户使用消费级的显卡便能够迅速实现文生图。Stable Diffusion 完全免费开源,所有代码均在 GitHub 上公开,大家可以拷贝使用。 目前有关于 Stable Diffusion 的课程,例如《Stable Diffusion 零基础入门宝典》,共计 77 个课时,定价 298 元,上架 CCtalk。因制作字幕课程在逐步解锁中,目前对前 100 名报名的同学有优惠价 198 元。
2024-10-21
Stable Diffusion(SD),怎么操作
Stable Diffusion(SD)的操作包括以下方面: 技术原理: 核心技术来源于AI视频剪辑技术创业公司Runway的Patrick Esser,以及慕尼黑大学机器视觉学习组的Robin Romabach。其技术基础主要来自于他们之前在计算机视觉大会CVPR22上合作发表的潜扩散模型(Latent Diffusion Model)研究。 是一种基于潜在扩散模型(Latent Diffusion Models)的文本到图像生成模型,能够根据任意文本输入生成高质量、高分辨率、高逼真的图像。 原理步骤包括:使用新颖的文本编码器(OpenCLIP)将文本输入转换为向量表示;使用扩散模型将随机噪声图像逐渐变换为目标图像;在扩散过程中利用文本向量和噪声图像作为条件输入给出变换概率分布;使用超分辨率放大器将生成的低分辨率图像放大到更高分辨率。 用AI给老照片上色: 将照片放入后期处理,使用GFPGAN算法将人脸变清晰。 将图片发送到图生图中,打开stableSR脚本放大两倍,切换到sd2.1的模型进行修复,vae选择vqgan,提示词可不写以免对原图产生干扰。 安装要求: 电脑系统为Win10或者Win11,避免使用更低版本系统。查看方法:在桌面上找到“我的电脑”,鼠标右键点击,点击“属性”,查看Windows规格。 检查电脑性能,需满足3个要求:电脑运行内存8GB以上;是英伟达(俗称N卡)的显卡;显卡内存4GB以上。 检查运行内存方法:鼠标右击桌面底部任务栏,点击“任务管理器”,在“性能”里面找到“内存”,查看划线参数。8GB为勉强达到标准,16GB可正常使用,32GB能非常自由使用。 查看“GPU”,先看右上角显卡名字或型号,必须是NVIDIA(英伟达)的显卡,若为AMD或Intel,电脑可能不太支持SD,安装教程较麻烦。
2024-10-21
推荐办公文书方面适合的AI
以下是一些适合办公文书方面的 AI 工具和应用: 1. AI 办公文件分类系统:如腾讯文档分类功能,利用数据分析和机器学习技术,自动分类办公文件,方便管理。 2. AI 语言学习纠错平台:像英语流利说纠错功能,通过自然语言处理和机器学习技术,帮助语言学习者纠正发音、语法等错误。 3. AI 文章排版工具: Grammarly:不仅是语法和拼写检查工具,还提供排版功能,改进文档整体风格和流畅性。 QuillBot:AI 驱动的写作和排版工具,改进文本清晰度和流畅性。 Latex:广泛用于学术论文排版,有许多 AI 辅助的编辑器和插件简化排版过程。 PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 Wordtune:AI 写作助手,重新表述和改进文本,使其更清晰专业。 Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于您的具体需求,如文档类型、出版标准和个人偏好。对于学术论文,Latex 和 Overleaf 较受欢迎;对于一般文章和商业文档,Grammarly 和 PandaDoc 等可能更适用。 此外,还有以下与办公文书相关的 AI 应用: 1. AI 菜谱口味调整工具:如下厨房口味调整功能,根据用户反馈调整菜谱口味。 2. AI 电影剧情分析系统:如豆瓣电影剧情分析工具,利用数据分析和自然语言处理对电影剧情进行分析。 3. AI 美容护肤方案定制平台:如美丽修行定制方案功能,根据用户肤质定制护肤方案。 在企业运营方面,AI 可用于日常办公文档材料撰写整理、营销对话机器人、市场分析、销售策略咨询、法律文书起草、案例分析、法律条文梳理、人力资源简历筛选、预招聘、员工培训等。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-21
适合医院行政公文书写的AI
以下是关于适合医院行政公文书写的 AI 的相关信息: 目前有许多可应用于各类写作场景的 AI 工具,例如在简历写作方面,有 Kickresume 的 AI 简历写作器,它使用 OpenAI 的 GPT4 语言模型自动生成简历,能为摘要、工作经验和教育等部分编写内容并保持语调一致;Rezi 是受到超 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的各方面;Huntr 的 AI 简历构建器提供免费模板及相关生成器和工作匹配功能。更多 AI 简历产品可查看 https://www.waytoagi.com/category/79 。 在医疗保健领域,为实现真正的改变,应投资创建像优秀医生和药物开发者那样学习的“专家”AI 模型生态系统。成为顶尖人才通常从多年密集信息输入和正规学校教育开始,再通过学徒实践从出色实践者那里学习,获得在复杂情况下确定最佳答案的直觉。对于 AI 而言,应通过堆叠模型训练,而非仅依靠大量数据和生成模型解决所有问题,例如先训练生物学、化学模型,再添加特定医疗保健或药物设计数据点。 生成式人工智能在教学中可用于收集整理语料,教师可根据不同教学场景设计恰当提示词,用其辅助教学,例如辅助 AI 搜索总结、思维导图、PPT 制作、论文润色、专业翻译、摘要重点、会议纪要、公文撰写等。
2024-10-21
了解 AI 视频制作的基本概念和常见工具
AI 视频制作的基本概念: 将小说或其他创意内容通过一系列步骤转化为视频,通常包括文本分析、角色与场景生成、视频编辑与合成等环节。 常见工具及网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):用于创建小说中的场景和角色图像的 AI 图像生成工具。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,能生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 制作 AI 短片的故事来源和剧本写作: 1. 故事来源: 原创(直接经验):自身或周围人的经历、做过的梦、想象的故事等。 改编(间接经验):经典 IP、名著改编、新闻改编、二创等。 2. 剧本写作: 编剧是有一定门槛的手艺,不能单纯套剧作理论和模板,要多写多实践,再结合看书总结经验。 对于短片创作,可从自身或朋友的经历改编入手,或者对触动自己的短篇故事进行改编。 多与他人讨论故事,有助于修改和进步。 AI 春晚的制作分工: 1. 制片人AJ:负责影片的制作管理,包括团队组建、日程安排、信息收集、资料整理、各处岗位工作缺失时及时补上等。 2. 图像创意??:负责用 AI 生成富有想象力的角色和场景等所有出现在视频中的画面,并为每个角色赋予人物小传。 3. 视频制作??:将做好的角色场景等图像素材进行 AI 图生文的工作,需要擅长运营工具的笔刷等控制工具,更好的契合剧本。 4. 编剧?:负责撰写剧本,包括故事情节、角色串联、人物台词等。 5. 配音和配乐?:涉及背景音乐、音效、角色配音、声音克隆,用各种声音类 AI 工具捏出来。 6. 剪辑师?:负责把后期剪辑,包括镜头选择、节奏控制和音效配合。 AI 春晚团队高效协作的方法: AI 的创造速度快,每个分工职责中有擅长的共创同学,人员分工明确,形成了高效的 SOP,从而可以快速产出。
2024-10-21
怎么写文档会让RAG 效果更好
要让 RAG 效果更好地写文档,您可以参考以下要点: 1. 文档切割: 合理的文档切割能让系统返回更完整、连贯的结果。例如,对于“猫咪的饮食习惯是什么?”的查询,将相关内容切割为“猫咪的饮食习惯取决于它们的年龄、健康状况和品种。”和“幼猫需要更多的蛋白质,而成年猫则需要均衡的营养。”这样的文档块。 目前免费平台一般提供智能切割和手动切割两种方式。但在当下技术水平下,智能切割效果一般,对于以问答为主的客服场景,将一个问答对切成一个文档片,检索效果会很好。 2. 整理知识库文档阶段: 确定知识库包含的文档类型,如政策原文文档、业务积累的 QA、操作指引、产品说明等,并进行预处理。 知识库本身质量对最终效果至关重要,是大模型生成回答的原始语料。 优化方向包括: 文档格式:PDF 文档格式信息相对简洁,干扰少,但也有说.docx 效果更优的,需根据场景测试。 文档命名:尽量控制在 10 字左右,涵义简洁明了,避免无意义的数字、符号或缩写。 文档语言:尽量统一为同一种,避免中英文混切导致乱码和无用数据。 文档内容:设置清晰的一二级标题,对特殊元素进行处理。 构建问答对:能达到更好效果,但耗费人力和运营成本,需综合考虑。 3. 通用语言模型微调可完成常见任务,更复杂和知识密集型任务可基于语言模型构建系统,访问外部知识源。Meta AI 引入的 RAG 方法把信息检索组件和文本生成模型结合,可接受输入并检索相关文档,给出来源,适应事实变化,不用重新训练就能获取最新信息并生成可靠输出。Lewis 等人(2021)提出通用的 RAG 微调方法,使用预训练的 seq2seq 作为参数记忆,用维基百科的密集向量索引作为非参数记忆。
2024-10-21
我想学习AI视频制作,怎么分段学习
以下是学习 AI 视频制作的分段建议: 1. 基础准备阶段 了解 AI 视频制作的基本概念和常见工具。 2. 小说内容分析阶段 学会使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 3. 视觉描述生成阶段 掌握根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述的方法。 4. 图像生成阶段 能够熟练使用 AI 图像生成工具根据描述创建角色和场景的图像。 5. 视频脚本制作阶段 学会将提取的关键点和生成的图像组合成视频脚本。 6. 音频制作阶段 利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,并添加背景音乐和音效。 7. 视频编辑与合成阶段 熟练使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 8. 后期处理阶段 掌握对生成的视频进行剪辑、添加特效和转场,以提高视频质量的技巧。 9. 审阅与调整阶段 学会观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 10. 输出与分享阶段 能够完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-10-21