发布时间:2024-08-07 10:11:49 浏览量:142次
互联网上有一条经典的“第 34 号规则”(Rule 34):如果一个东西存在,那么它必然会被用来搞黄色。AI 绘画就很好地说明了这一点——目前最流行的几个 AI 绘画分享网站,都有至少三分之一的内容是各种黄图。
图源:GIPHY
但是这里出现了一个小小的问题:人们普遍觉得,这些图里的大多数,虽然黄,但不“色”。
是千篇一律的僵硬神色和动作?或许是扭曲不自然的姿态?又或许是依旧容易画错的手指和奇怪的透视?是什么让人能够一眼分辨出某些图是 AI 画的?我们真的要乞灵于“灵性”“灵魂”这样的词语吗?
当我们能够理解,是什么让人能够判断出一张图是否是 AI 画的,我们就能够更好的理解 AI 绘画本身。
图源:GIPHY
如今,我们都多少大致了解过 AI 绘画的原理:首先,我们要有一个训练数据集,这个数据集里包括一系列的图片,和与图片对应的、描述图片元素的一系列文本;把这些数据喂给 AI,AI 就能学会将这些文本和图片之间联系起来;专业的术语,就是将图片中的内容翻译成一个“高维的文本向量”;如果这种内容到向量之间的翻译足够合理,那么我们就可以将这个翻译机制,也就是“多层神经网络”反过来使用,通过一系列的文本提示词(prompts),将文本向量重新翻译回相应的画面。
如果我们将中间的 diffusion model 之类的技术细节省略,我们会发现一个目前 AI 绘图和人类绘画最基本的逻辑区别:AI 绘画是从文字语言出发的;而人类的视觉艺术,是从视觉本身出发的。
图源:unsplash
我们与周遭的世界和环境,与其他人的接触,都是我们对于这个“世界模型”的调用和运行;如果没有这个世界模型,智能本身就不存在了。在认知科学里,这叫做“具身认知”:我们身体和外界的关系构成了我们“认知模型”里非常重要的部分。而人类的抽象思维和语言(最关键的思考工具),则基本上完全依赖于对于这个物理世界的类比和模拟,这被称作“具身模拟”。
相关的内容可以参考几本书《我们赖以生存的隐喻》《我们赖以生存的意义》《表象与本质》。
这种对于物理世界的认识和建模,则是目前人工智能开发里最大的障碍:如何让人工智能建立一个世界模型?让它能够理解它看到了什么,而不是作为一个单纯的统计分类机器?自动驾驶实际上就卡在这里:机器智能机械的分类它接受到的影像数据并且做相应的反应,而很难将这些数据统计和归纳,建立一个世界模型,所以自动驾驶才会出那么多的无穷无尽的 corner case。
图源:GIPHY
AI 绘图与人类绘画根本差异的原因也就在此:绘图 AI 是没有世界模型的。所谓的“上下文”或者说“逻辑”,就是这个世界的基本的规律;人手一般都会有五根手指,这就是规律之一。绘图 AI 要能够理解它看到了什么,而不是神经网络单纯的记住了,某些元素和另一些元素一同出现的概率比较高,它才能表现得像一个人类画师。
曾有很多人质疑,AI 绘图是否能真的从事“创造性”工作,最本质的原因,就在于“创造性”本身就需要深刻的理解规律。
中国各地的景点一向有一个我很不喜欢的传统:一块石头,一座山峰,甚至是岩壁上的纹路,都要强行的把它攀附成某种具象的形象,然后再编出一段神话,相传这里原本有一个巨大的天界的 XXX,因为惹怒了玉皇大帝被打入凡间,然后流落此地化成了这块巨石 / 这座山峰云云。这种强行地,要把自然的随机起伏特征强行解释为有意义的特征,在统计学上,叫做“过拟合”。
图源:GIPHY
那么这跟 AI 绘画又有什么关系呢?这种强行地,要把自然的随机起伏特征强行解释为有意义的特征,在统计学上,叫做“过拟合”。当然,如果用自然语言,这就叫用力过猛。
所以除开“手指法”,我们识别 AI 绘画的一个很重要的手段,就是 AI 绘画经常会“用力过猛”。人类画师画的图一般而言都会有自己的轻重缓急:画师会为自己想要强调的画面增加更多细节,而其余的部分就可以糊一点、简单一些,自己省力之外观众也能自然而然地注视那些更重要的部分;而 AI 生成的画面往往是平均的,AI 会在整个画面上不分青红皂白地堆满各种似是而非的细节,让整个画面显得没有重点。
一个熟悉 AI 绘画的人能够一眼鉴 AI,很多时候就在于这种视觉上的疲劳感觉:所有东西都很清晰,都很细致,都没有必要。但是这种用力过猛如果放在合适的情境下,就不再是用力过猛了:使用合适的模型和充满脑洞的提示词,AI 绘画能画出那些人类画师不太可能画出来的离奇的图出来。
图源:civitai
在摄影圈里一直有个说法:金头红头,最终看相机后面那颗头。摄影师也会抱怨:总有人问,这张照片拍得真好,是用什么相机拍的?但是绝不会有人问画家,这张画画得真好,是用什么画笔画的?
实际上在 AI 绘画的现在,问题是同样的:使用什么工具其实不是那么重要,重要的还是使用工具的人。绘画的 AI 模型本身是没有创造性的,而创造性要从使用 AI 的人那里生发出来。
热门资讯
想将照片变成漫画效果?这篇文章分享了4个方法,包括Photoshop、聪明灵犀、VanceAI Toongineer、醒图,简单操作就能实现,快来尝试一下吧!
2. 华为手机神奇“AI修图”功能,一键消除衣服!原图变身大V领深V!
最近华为手机Pura70推出的“AI修图”功能引发热议,通过简单操作可以让照片中的人物换装。想了解更多这款神奇功能的使用方法吗?点击查看!
近年来,人工智能逐渐走入公众视野,其中的AI图像生成技术尤为引人注目。只需在特定软件中输入关键词描述语以及上传参考图就能智能高效生成符合要求的...
4. AI视频制作神器Viggle:让静态人物动起来,创意无限!
Viggle AI是一款免费制作视频的AI工具,能让静态人物图片动起来,快来了解Viggle AI的功能和优势吧!
5. Logo Diffusion——基于sd绘画模型的AI LOGO 生成器
这下LOGO设计彻底不用求人了。接下来详细演示一遍操作流程首先进入Logo D... 想学习更多AI技能,比如说关于怎么样利用AI来提高生产效率、还能做什么AI...
6. 零基础10分钟生成漫画,教大家如何用AI生成自己的漫画
接下来,我将亲自引导你,使用AI工具,创作一本既有趣又能带来盈利的漫画。我们将一起探索如何利用这个工具,发挥你的创意,制作出令人惊叹的漫画作品。让...
7. AI显卡绘画排行榜:4090无悬念,最具性价比出人意料
在AI绘图领域,Stable Diffusion的显卡绘图性能备受关注。本文整理了Stable Diffusion显卡的硬件要求和性能表现,以及2023年3月显卡AI绘图效率排行榜和性价比排行榜。欢迎查看最新的AI显卡算力排行榜。
以下是一些免费的AI视频制作网站或工具,帮助您制作各种类型的视频。 1. Lumen5:Lumen5是一个基于AI的视频制作工具,可将文本转换为视频。 用户可以使...
就能快速生成一幅极具艺术效果的作品,让现实中不懂绘画的人也能参与其中创作!真的超赞哒~趣趣分享几款超厉害的AI绘画软件,提供详细操作!有需要的快来...
10. 10个建筑AI工具,从设计到施工全覆盖!肯定有你从来没听过的
讲述了建筑业比较著名的AI公司小库科技做出的探索,在这儿就不多说了。今天,我们试着在规划设计、建筑方案设计、住宅设计、管道设计、出渲染图、3D扫...
同学您好!