当AI把绘画艺术变成一门“语言艺术”_

文/郝晓茹

“一名宇航员骑在一匹马上，超现实主义风格”——将这句话的英文原文输入最流行的AI绘画程序，几分钟后，就能得到几张宇航员在太空中骑马的图片。在我们普通人看来，AI生成的图片质量已经达到相当高的水平。

对于技术研究人员来说，人工智能技术这几年的发展是稳步向前的，一步一个脚印。但是对于普通人而言，体会AI技术的进展，主要是靠有冲击力的时刻或事件，比如近十年来最具冲击力的时刻必然是2016年人工智能围棋程序AlphaGo战胜人类顶尖棋手。而2022年最具冲击力的时刻，莫过于人们“突然”发现AI绘画生成的部分作品质量之高，似乎已经能够以假乱真了。更重要的是，人们可以自己亲自“操控”AI绘画程序，生成各种自己想要的作品。

为了方便普通人理解，我们可以大致认为AI绘画程序背后的工作原理是这样的：互联网上有无数张图片，大部分图片都带着描述性的说明文字，通过学习人们是怎么给每一张图片配说明文字的，AI绘画程序学会了用文字来反向生成图片。也就是从海量“给图片配的文字”数据中，学会了“给文字配图”。

这句轻描淡写的“无数张图片”实际上却是个新一代AI绘画程序成功的关键。专业人士从超大规模语言模型的发展上了解到，训练数据量的量变会产生质变，经过海量数据训练的模型，可以学到一些“通用的能力”。我们可以认为，AI绘画程序是把有史以来互联网上出现过的数亿张带文字描述的高质量图片作为训练数据（学习资料）进行学习。研究人员发现，AI绘画程序学到的能力包括组合两种不相关的概念，例如骑马的宇航员、创造动物或物体的拟人化版本，例如人形的白萝卜、把文字渲染成图片，例如做广告牌、转换一张已有图片的艺术风格、延伸一张画的原有边界或补画、修改一张画上的元素等等，更多能力仍在陆续解锁中。

仅仅在一年前，最具代表性的AI绘画程序还没有引发如此高的关注度，或者说没有“出圈”，只是在人工智能行业内受到了关注。那时候，AI绘画程序生成作品中的代表作是一把“牛油果样子的扶手椅”。虽然不足以冲击普通人的感官，但它生成图片的方式——“喂”给AI一句描述语即可，已经让很多人跃跃欲试。到了2022年，对技术敏感的先锋人士终于可以亲自上手，输入文字，用AI来作图，把想象力转化为绘画作品，进而引发了AI画画的热潮。

原则上讲，现在只要会写字甚至会说话的人都可以用AI来画画了。AI终于把绘画艺术变成了一门“语言艺术”。但当人们带着尝试的心态，找到一个AI绘画程序，通过输入文字进行绘画时，很快就会发现，把自己的想象力用语言描述出来，似乎并不容易，做不了几张图就词穷了，而且做出来的图往往都很普通，甚至还会有点儿吓人，这是因为现阶段的AI绘画程序还有很多缺陷，所以也不免会有些失落。

再看那些令人叫绝的精美二次元漫画女主角AI图片背后，它们所使用的“描述语”，可能包含数百个字符。首先，完整描述了从眉毛到袜子再到人物所处背景的每一个细节。其次，添加了很多正向“咒语”，类似“最佳质量”“大师级作品”“超高清分辨率”“细节丰富的壁纸”“某某平台的编辑之选”等等。最后，还使用了大量的反向“咒语”，要求AI绘画程序不要生成什么样的图，比如不要手指错乱的、不要低质量的、不要带签名的、不要带水印的、不要中等质量的图片、不要低质量的图片、不要长脖子的……甚至还需要标记出不同描述语的权重值。而那些精美的写实风格AI画作背后使用的描述语，可能添加了另一种类型的“咒语”，比如光圈值、快门值，包含了光线、视角等方面的描述，甚至包含了高端相机品牌的名字。现在，已经有专门的网站，反向从AI生成的画中推导出它是用了哪些描述语（prompt）进行描述的。

也就是说，虽然从那些精彩的AI绘画作品上，人们看到了AI绘画程序的潜力，但要挖掘这种潜力，则需要好好掌握一门新的语言，一种专门用来跟AI绘画程序打交道的方式。不仅要学会这门新的“外语”，而且要掌握各种不同的“方言”——不同的AI绘画程序，对描述语的辨别又各有特色。

站在技术与艺术交汇处的、懂技术又懂绘画的专业人士，只有真正掌握了这门新的“外语”，才能知道集合了全人类智慧的AI绘画程序的上限会在哪里、不足是什么。这时候，再来讨论AI绘画对普通人、对创作者、对艺术和设计从业者的影响，才会比较合理。

而这时候，理性的人们几乎得到了一致的结论：现阶段的AI绘画程序，对普通人而言，是个不错的新玩具，输入直白的语言或关键词，就能得到一张看上去还不错的画；对文字内容的创作者而言，是个不错的新工具，只要给大白话再加上一些AI程序能听得懂的“咒语”，就有可能得到一张不错的文章配图；对专业的画师、设计师、艺术家而言，在掌握了跟AI精确沟通的新语言之后，完全可以把AI当成一个不知疲倦的好帮手，用来做前期概念和灵感的整合，用来开开脑洞，也可以直接生成一些对精细程度要求不算高的作品……

除了帮助人们完成工作，丝毫不用怀疑，在AI的帮助下，用不了多久，就会有新一代的艺术家出现。其实现在已经有AI辅助完成的画作得到专业人士的肯定：2022年8月，在美国科罗拉多州举办艺术博览会，由AI绘画程序生成，然后经过图片编辑软件处理的《太空歌剧院》获得了数字艺术类别的冠军。

但行业里也出现了“抵制”的声音，一些艺术家联合发出声明，禁止AI程序“学习”他们的作品。这种担忧其实是非常合理的，因为AI是在未经允许的情况下，把人类艺术家的公开作品，他们的智慧结晶，作为了自己的训练数据库，未来还可能靠着“模仿”他们的作品来赚钱盈利，却不会给人类艺术家带来收益。

这个问题可以拆解为两部分。第一部分是禁止AI程序在训练过程中学习人类艺术家的作品，就目前而言，AI收录互联网上的公开图片并不违法，但解决这个问题有现成的参考答案，就是建立一个大家都认可的行业规范，像一些网页不允许搜索引擎的“爬虫”收录时可以用代码标记出来一样，在互联网上公开的图片，可以添加一行“不允许AI绘画程序收录”的代码，让艺术家们可以控制他们的作品是否被“学习”。

第二部分稍微复杂一些，因为涉及到“模仿”和“抄袭”的定义。事实上，新一代的AI绘画程序从技术上已经尽量避免了直接“抄袭”原有画作——新技术是根据文字面描述的内容，一个像素一个像素重新“画”出来的，并不是直接从人类的绘画作品中“拼贴”一个新作品。系统也专门做了处理，不允许生成与数据库中的已有图片相似度过高的画作。但是，AI程序切切实实地学到了艺术家风格，而且允许人们生成单个艺术家风格或几个艺术家风格相融合的画作。这时候，较为合理的方案是，在生成特定艺术家风格的作品时，如果最终作品被使用在商用场景，就需要按照一定的分成比例让艺术家获得收益。

除了版权方面的待解争议，其实AI绘画程序的研究者和开发者，花了更多时间处理的问题是程序被滥用的潜力风险和无处不在的偏见。被公认AI生成图片效果最好的几家公司（包括谷歌和OpenAI），都没有很快将AI程序公开给所有人使用。因为他们一方面需要花更多的精力限制AI的能力，例如禁止生成色情和暴力的作品；另一方面需要处理AI绘画程序潜在的“偏见”问题，包括性别和种族的平衡，例如生成一张CEO照片时几乎不会出现女性或黑人。这些问题是复杂的，部分原因在于，AI绘画程序学习的海量数据中本身就包含“偏见”内容，去除一些“偏见”内容时，可能引起另一些“偏见”问题，例如打击色情时，更多打击的是女性内容，带来了新的性别偏见……还有很多风险和难题有待科学家们来解决。

最后让我们回到一个更有意思的角度，在人类历史上，绘画比文字更早出现。人类中的“艺术家”更多情况下是把灵感和想象力直接转化为图像，中间并不需要经过语言文字的“转译”过程。当AI绘画变成了一门“语言艺术”时，那些难以用语言文字描述的灵感和想象力依然无处呈现。所以虽然现在的AI绘画方案已经取得了重大突破，但我们同样期待未来出现更有想象力的方案。

作者系科技行业独立观察者

（校对：颜京宁）

头条号入驻

中国经营报为中国商业进步加油！

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

4000520066 欢迎批评指正

当AI把绘画艺术变成一门“语言艺术”

头条号入驻

“五一”酒店预订：县域市场崛起

上市首日跌超26% 茶百道加盟模式还“灵”吗？

茶饮品牌出海：从产品到品牌的一次大考

财经自媒体联盟更多自媒体作者

热文排行榜