目前在国内,关于 AI 照片处理和创作,以下是一些相关信息:
需要注意的是,在中国的 AI 创业生态中,高质量的数据处理服务相对稀缺,中文互联网数据的质量相对较低。
朱啸虎:现阶段文字创作等项目肯定是最容易的,比如说帮助写一些广告文案、工作概要、演讲等,而且都能完善得比较好;其次是生成照片,比如Midjourney就做得很好;国内我们感觉生成短视频反而更好,因为中国有很多短视频数据,美国没有,他们所有的电商网站,比如亚马逊等,几乎还是基于图片。而过去三年,中国所有电商基本从图片转到短视频了,所以今天电商网站所有的流量都是优先分发给短视频,不是优先分发照片。中国有很多短视频的产品和数据,用这个数据可以训练自己的垂直模型,所以Fancytech在产品转型上做得非常好。Q:这对于投资人来说是一个足够大的投资机会和赚钱机会吗?图片文字生成还是比较小众的领域。朱啸虎:我们就希望在开始投的时候,大家都觉得是小众市场,这样大的平台才不会关注,或者不会花重兵去做这件事。等过几年以后它长大了,就有更多的空间了。Q:今年AI虽然火,但是头部项目大部分人进不去,小的项目大家可能还在观望,所以年底都不投AI了,开始去投造车上下游,比如新能源、双碳了。朱啸虎:新能源也有狂跌的。
目前比较成熟的通过输入图片生成类似图片的AI产品主要有:1.Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。2.Retrato:AI工具,将图片转换为非凡肖像,拥有500多种风格选择,适合制作个性头像。3.Stable Diffusion Reimagine:新型AI工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。4.Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的AI工具,将上传的照片转换为芭比风格,效果超级好。这些AI模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。内容由AI大模型生成,请仔细甄别
接下来,让我们把目光转向数据这个同样关键的要素。在人工智能的世界里,数据就像是原油,而高质量的数据则是精炼后的汽油。虽然OpenAI训练大模型所用的中文数据也源自中国的互联网平台,但他们在数据处理上的额外努力,就像是将粗糙的原石打磨成璀璨的钻石。这种数据质量的提升,远非简单的数据标注工作所能企及,而是需要一支专业团队进行深度的数据清洗和精细整理。然而,在中国的AI创业生态中,高质量的数据处理服务就像是稀缺资源。在国内,数据获取的门槛相对较低,这看似是一个优势。然而,虽然数据获取容易,但高质量数据的获取却是另一回事。国内的大模型主要以中文数据为基础,这看似是一个自然的选择。但业内普遍认为中文互联网数据的质量相对较低。这种情况让人想起了信息论中的"垃圾进,垃圾出"原理。如果输入的数据质量不高,那么即使有最先进的算法,输出的结果也难以令人满意。这个现象在IT从业者的日常工作中得到了印证。当需要搜索专业信息时,他们往往会首选Google、arXiv或Bing等国际平台,而不是国内的搜索引擎。