生成的图片为黑色可能有以下原因:
请尝试猜测以下哪些图画是由Yoko直接画的,哪些是生成的。答:AI模型生成的图像拥有一个非白色背景。经济效益的巨大提升,能够创造新风格和概念的灵活性,以及生成完整或几乎完整的工作成果的能力,这些因素使我们预见,在所有创意资产是业务重要组成部分的行业中,我们将看到明显的变化。而且,这并不仅限于图像,而是适用于整个设计领域。例如:生成性AI可以为[游戏](https://a16z.com/2022/11/17/the-generative-ai-revolution-in-games/)创建2D艺术、纹理、3D模型,并协助关卡设计。在营销中,它看似有望取代库存艺术、产品摄影和插图。我们已经看到它在网页设计、室内设计和景观设计中的应用。我们实际上才刚刚开始。如果一个用例需要创造性地生成内容,那么很难理解为什么生成AI不会颠覆它或至少成为这个流程的一部分。那么,这篇文章的要点是什么呢?尽管它在某种程度上集中于代码生成和图像生成,但我们怀疑这些结果更具普遍性。特别是,全面的创意努力——无论是视觉的、文字的还是音乐的——都可能在系统构建之前就被AI打破。
Photogram是一种无需[相机即可拍摄的](https://en.wikipedia.org/wiki/Camera)[摄影图像](https://en.wikipedia.org/wiki/Photography),方法是将物体直接放置在感光材料(例如[相纸)](https://en.wikipedia.org/wiki/Photographic_paper)的表面上,然后将其暴露在光线下。通常结果是负片阴影图像,其色调会根据所用物体的透明度而变化。纸张上未接受光线照射的区域呈现白色;曝光时间较短或通过透明或半透明物体曝光的区域呈现灰色,而完全曝光的区域在最终印刷品中呈现黑色。这种技术有时被称为无相机摄影。[曼·雷](https://en.wikipedia.org/wiki/Man_Ray)在他的[光影摄影作品](https://en.wikipedia.org/wiki/Photogram#Man_Ray's_'rayographs')中运用了这种技术。其他尝试过这种技术的艺术家包括[拉斯洛·莫霍利-纳吉](https://en.wikipedia.org/wiki/L%C3%A1szl%C3%B3_Moholy-Nagy)、[克里斯蒂安·沙德](https://en.wikipedia.org/wiki/Christian_Schad)(他称其为“Schadographs”)、[伊莫金·坎宁安](https://en.wikipedia.org/wiki/Imogen_Cunningham)和[巴勃罗·毕加索](https://en.wikipedia.org/wiki/Pablo_Picasso)。
在画图的时候,当我们的提示词中有多个条件,sd生成的图像可能无法帮我们全部满足。比如我想要绘制这样一幅图片,关键词是:一个女孩、戴着贝雷帽、绿色夹克、黄色印花裙子,在森林里弹吉他,盲盒风格。使用的大模型是revAnimated,加“blindbox”lora。但是图片生成的时候,我们却发现,夹克变成了黄色,裙子变成了绿色,而且人物的身材比例是接近真实人物的,而不是我们想要的“chibi”盲盒风格。这个情况和我们的一个参数有关,那就是提示词引导系数,它关系到出图与我们文字的相关程度。我们使用“X/Y/Z脚本”来做一个横向对比,测试分别在5/10/15/20/25/30的CFG值下,画面的效果。可以看到,随着CFG值的提高,画面与提示词关联度更高,衣服和裙子的颜色与提示词相符了,但是问题是画面出现了崩坏。