直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

ai修图

回答

以下是关于 AI 修图和 AI 绘画的相关内容:

在独立游戏开发中利用 AI 绘画的“踩坑”经验:

  • 遇到的问题:
    • 风格受限,多为二次元,不适合游戏需求,需自己炼丹。
    • 缺乏叙事性,无法作为 icon 使用。
    • 已有素材单一,图生图不可行,训练泛化性差。
  • 解决方法和过程:
    • 尝试了 Embedding、CKPT、Lora 等方法,不断优化,最终达到较好效果。
    • 为引导 AI 画出前景后景区分明显的画,专门绘制引导图并进行Caption 打组。
    • 针对训练集中人物朝向固定问题做镜像处理。
    • 丰富训练集,先进行短时间训练生成建筑、风景图像再放回训练集。
    • 进行正则化处理。
    • 对于复杂的图,先使用底模生成,再用 ControlNet 加上微调模型出新图。

AI 绘画常用的风格提示词包括:pointillism 点彩派、Claude Monet 克劳德莫奈、quilted art 桁缝艺术、partial anatomy 局部解剖、color ink on paper 彩墨纸本、doodle 涂鸦、Voynich manuscript 伏尼契手稿、book page 书页、realistic 真实的、3D 3D 风格、sophisticated 复杂的、photoreal 真实感、national geographic 国家地理、hyperrealism 超写实主义、cinematic 电影股的、architectural sketching 建筑素描、symmetrical portrait 对称肖像、clear facial features 清晰的面部特征、interior design 室内设计、weapon design 武器设计、subsurface scattering 次表面散射、Game scene graph 游戏场景图、character concept art 角色概念艺术。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AI辅助在独立游戏开发中的“踩坑”经验——《玩具帝国》

[title]AI辅助在独立游戏开发中的“踩坑”经验——《玩具帝国》[heading2]二、AI绘画游戏里的科技树图标实在太多了,根本画不过来……在没有AI画画之前,我都不敢想啥时候能把这些玩意填完。AI画画出来之后,我抱着满腔热情去试,结果发现三个严重的问题:•全TM在画二次元,没有适合的风格,想用到游戏里必须自己炼丹。•画出来的画好多都是美少女看镜头,没有叙事性,没法当icon用。•已有素材几乎全是中世纪大胡子男人呆呆站着,图生图不可行,训练出来的泛化性也很差。一开始的规划是:•画出卡通简笔画风格。•资产条件:有98张人像和8张UI,且人像全是男人。•需要能产出带有该画风的具有一定叙事内容的图像,内容形式一定要多元。我尝试了最开始的Embedding:后来换成CKPT(画和训练集里接近的小人已经不错了,但泛化性还是不理想):然后是Lora(好!很接近了!):现在这个版本画人画物画事都很完美了,甚至能从全是大胡子男人的训练集里学会画女人:从中世纪里摘出摩托车:为了引导AI画出前景后景区分明显的画,还专门画了一组引导图。分别是只保留前景、只保留背景、全图共三张图,在Caption里打组:由于训练集中人物朝向太固定,此处额外做了镜像处理。

AI辅助在独立游戏开发中的“踩坑”经验——《玩具帝国》

[title]AI辅助在独立游戏开发中的“踩坑”经验——《玩具帝国》[heading2]二、AI绘画由于训练集缺乏建筑、风景、完整图像,为了丰富训练集,我先进行一次时间较短的训练,并用得到的模型生成与目标画风类似的建筑、风景图像,再将这些图片放回训练集。还做了正则化:模型出来之后,也不是说生了图就能直接用,像一些比较复杂的图,我的方案是先去掉我的微调模型用底模生一张图,然后用ControlNet加上我的微调模型出新图。下面从左到右就是:底模+微调,底模,底模+微调+ControlNet。最后效果不错:而且这个模型在美术做设计参考的时候也能用:

AI绘画常用提示词

[title]AI绘画常用提示词[heading1]风格提示词pointillism点彩派Claude Monet克劳德莫奈quilted art桁缝艺术partial anatomy局部解剖color ink on paper彩墨纸本doodle涂鸦Voynich manuscript伏尼契手稿book page书页realistic真实的3D 3D风格sophisticated复杂的photoreal真实感national geographic国家地理hyperrealism超写实主义cinematic电影股的architectural sketching建筑素描symmetrical portrait对称肖像clear facial features清晰的面部特征interior design室内设计weapon design武器设计subsurface scattering次表面散射Game scene graph游戏场景图character concept art角色概念艺术

其他人在问
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
请起草一份小白学习AI辅助修图的入门到精通的教程,提供学习大纲,包括从基本玩法到高级卡bug玩法,常见红海赛道,常见问题,注意事项,常见误区,避坑指南等等
以下是为您提供的小白学习 AI 辅助修图从入门到精通的教程大纲: 一、基础知识与基本玩法 1. 了解 AI 辅助修图的概念和基本原理。 2. 熟悉常见的 AI 修图工具和软件。 二、常见问题与注意事项 1. 风格局限性:如全是二次元风格,缺少适合特定需求的风格。 2. 图像叙事性不足:画出来的多为美少女看镜头,缺乏叙事内容。 3. 素材局限性:已有素材单一,图生图可行性低,训练泛化性差。 三、常见误区与避坑指南 1. 避免盲目依赖初始的 Embedding、CKPT 等方法,不断尝试和改进。 2. 注意训练集中人物朝向固定等问题,采取相应处理措施,如镜像处理。 四、从入门到精通的进阶玩法 1. 掌握不同的训练方法,如 Lora 等,以获得更理想的效果。 2. 学会引导 AI 画出具有前景后景区分明显的图像,如制作引导图。 五、高级卡 bug 玩法 探索一些非常规但有效的技巧和方法,以突破常规限制,实现更出色的修图效果。但需注意,此部分玩法可能存在一定风险和不确定性。 六、常见红海赛道 分析当前 AI 辅助修图在不同领域的竞争激烈程度和应用热点。 在学习过程中,还需了解以下 AI 相关的技术原理和概念: 1. 生成式 AI 生成的内容称为 AIGC。 2. 相关技术名词: AI 即人工智能。 机器学习包括监督学习、无监督学习、强化学习,监督学习有标签,无监督学习无标签,强化学习从反馈中学习。 深度学习参照人脑神经网络,神经网络可用于多种学习方式。 生成式 AI 可生成多种内容形式。 LLM 为大语言模型,不同模型有不同擅长的任务。 3. 技术里程碑:2017 年 6 月谷歌团队发表的《Attention is All You Need》提出了 Transformer 模型。
2025-03-05
AI修图网站
以下为一些 AI 修图相关的网站: 1. ILLUMINARTY(https://app.illuminarty.ai/):通过对大量图片数据的抓取和分析,给出画作属性的判断可能性,但在测试中可能存在对真实摄影作品的误判。 2. Visual Electric(https://visualelectric.com/):适合设计师,不需要操心技术,只需要发挥创意,图片分享链接也可以直接 remix。 3. MewXAI(https://www.mewxai.cn/):是一款强大专业且新手友好、操作简单的 AI 绘画创作平台,具有众多功能,如 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。但需注意内容由 AI 大模型生成,请仔细甄别。
2025-02-27
ai修图
以下是关于 AI 修图的相关内容: AI 作图的创作方法与实操演示: 趣味性通过反差、反逻辑、超现实方式带来视觉冲击,美感需在美术基础不出错前提下形式与内容结合。 纹身图创作要点在于强调人机交互,对输出图片根据想象进行二次和多次微调,确定情绪、风格等锚点再发散联想。 以魔法少女为例,发散联想其服饰、场景、相关元素等,并可采用反逻辑反差方式。 提示词编写要用自然语言详细描述画面内容,避免废话词,Flux 对提示词的理解和可控性强。 实操演示准备时,以未发布的 Lora 为例,按赛题需求先确定中式或日式怪诞风格的创作引子。 人物创作过程从汉服女孩入手,逐步联想其颜色、发型、妆容、配饰、表情、背景等元素编写提示词。 比赛要求及作图思路: 参加由麦乐园和摩达社区发起的 AI 梦一单一世界比赛,须用摩搭平台和麦橘超然模型作为底膜训练 Lora,提交训练好的 Lora 及用其生成的六张以上高质量、展现完整世界观的作品。 作图分三步,一是明确创作主题即锚点,根据 Lora 风格确定创作方向;二是确定主体,联想主体的角色设定;三是增加叙事感,让画面有一到两个及以上角色,制造反差和联想。 图片构成因素与构图: 好看的图片的构成因素包括构图、色彩以及光影。 构图指在框架或空间内元素的摆放位置、形状、物体形状及纹理等,好的构图能引导观看者并创造和谐平衡。 构图分类包括景别(远景、全景、中景、近景、特写)和拍摄视角(俯视、平视、仰视,正面、侧面、背面)。 构图要素有主体、陪体、前景、背景、点线面,合理运用可丰富画面。 构图方式如点中心构图、九宫格构图、三分法构图、对称构图、对角线构图、曲线构图、框架构图、三角形构图等。在 AI 绘图中,推荐中景及以上景别,全身景别可能需开 AD 跳以确保作图质量。 AI 修图行业现状: 目前的 AI 修图新应用,与移动互联网时代的“美图秀秀”相比,缺乏颠覆性创新。“美图秀秀”等主流修图产品也在积极引入 AI 功能,新应用很难脱颖而出。 妙鸭这款产品是特例,2024 年凭借独特的产品功能和用户体验收获大量用户关注和使用,其“先试用后付费”的策略及 9.9 元的定价有吸引力,背靠互联网大厂有资源优势,但市场空间和后续发展潜力需观察。 相较 AI 类应用,传统移动互联网时代成熟的 APP 商业模式通过免费吸引用户,再通过广告等方式实现间接收入,当前阶段或许不再适用于 AI 应用,ToC 创业公司在产品发布早期阶段要敢于向用户收费。
2025-02-24
ai修图变清晰
以下是关于使用 AI 修图变清晰的方法: 1. 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰。您可以参考文章——。但此步骤无法将照片中的头发、衣服等元素变清晰。 2. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章——。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免干扰原图。 3. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时将图片放大到足够倍数。 4. 对于复杂照片,可先在 ps 里调整角度和裁切,然后使用上述步骤上色。若直接上色效果不佳,可放弃人物服装颜色指定,只给场景方向,让 AI 自行决定。比如加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 另外,在 Stable Diffusion 中,AI 出图默认分辨率为 512x512,用于商业不够。提高最终出图分辨率的方法之一是高清修复:在文生图功能中有内置的高清修复(HiresFix)功能,将初始分辨率设为 800x420,选择放大倍率为 2,理论上放大倍率越高图片越清晰,但实际效果与电脑配置和显卡显存有关。先以 800x420 画图,获取种子值并填入随机数种子固定图片,放大时算法选择需根据绘图风格,二次元可选 RESRGAN 4x+Anime6B,写实类可选 RESRGAN 4x+。
2025-02-24
ai修图的原理
AI 修图的原理主要包括以下几个方面: 1. 对于 Stable Diffusion 这类软件,其工作原理类似于学习画画。就像学习梵高的风格,需要大量临摹,而 AI 则通过对成千上万美术风格作品的学习形成大模型,如 Checkpoint。用户要想获得满意的作品,需选择合适的大模型。大模型可在 C 站下载,但需科学上网。 2. ComfyUI 是一个开源的用于生成 AI 图像的图形用户界面,主要基于 Stable Diffusion 等扩散模型。其原理包括 Pixel Space(像素空间)和 Latent Space(潜在空间)。像素空间对应输入图像或随机噪声图像,最终生成的图像也会转换回像素空间。许多操作在潜在空间进行,如通过 KSampler 节点执行采样过程,可通过节点调整潜在空间的操作,如噪声添加、去噪步数等。 3. 扩散过程是从噪声生成图像的过程,通过调度器控制,如 Normal、Karras 等,可选择不同调度器控制在潜在空间中处理噪声及逐步去噪回归到最终图像。时间步数也会影响图像生成的精细度和质量。 在实际的 AI 修图过程中,还涉及到提示词编写、对输出图片的二次和多次微调、确定情绪和风格等锚点再发散联想等操作,以获得更符合需求的修图效果。
2025-02-13
修图ai是哪个
以下是一些常见的修图 AI 工具: 1. Niji·journey 5:在二次元绘画领域表现出色,能够生成令人惊叹的二次元风格角色。 2. 无界 AI:国内网络可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 如果您想了解更多关于这些工具的详细信息或使用方法,可以进一步向我提问。
2024-12-25