——为什么人工智能无法驱动艺术?

为什么人工智能只能旧酒装新瓶地冒充艺术?


Visualization from Daniel Bolojan/Nonstandardstudio’s Machine Perceptions: Gaudí + Neural Networks, 2021.

讨论人工智能与艺术的关系,至今是《论新人文主义》写得最好。作者 Mario Carpo 是Bartlett 建筑学院和维也纳应用技术大学的教授,认为当前人工智能驱动的从文本到图像(text-to-image)的聊天机器人和制图,非但没有预示后人类主义式的图像和艺术上的发展,反而愚蠢地还魂着模仿和风格涂抹,而这些反动的视觉策略主导过艺术和艺术理论,却早就沉睡地下,被现代主义艺术尤其是建筑所唾弃。文章的结论是:人工智能无法自己聪明,它的推销者只是在炫耀它的说明书里的功能声称,但它聪明到何种程度,是由它在完成我们交给它的任务中学到和体现出来的。是我们使它聪明的。

这种对基于AI的图像制作技术的描述,是对人工智能的当代批判的基础。

一、

根据作者,AI式创作或图像制作由分析、生成、模仿也就是风格转让(style transfer)三步构成。

分析:从一堆狗的图像里提炼有共同特征的狗的各种变量。先有一条名义上的(nominal)狗,然后就有了原型狗,再从后者出发来统合所有狗的图像。

生成:计算机主动模仿它自己对已有图像的分析。

融合或渲染也就是风格转让:这是AI界目前吹得最厉害的,但从来都被艺术史和现代主义艺术和建筑实践所彻底唾弃。

2022 年,谷歌的DeepMind 提出imitation learning(计算机通过模仿来学习)这一概念,围绕后者而形成了从文本到图像的人工智能聊天机器人,如Midjourney和DALL-E 2的新逻辑。

此前,2010年代中期出现的AI生成的艺术曾是数码艺术内的大路货。这也就是GAN,是这样一种操作:艺术家先收集关联图像的一个集(dataset),然后让机器学习算法来寻找这些图像的共享特征,将它们的共同点形式化。这一归纳过程导致了一个数学矩阵——计算机科学家称之为 latent space,大致对应哲学家说的原数据集的定义、观念、公式、或的本质。这一定义在今天既不属于言语也不属于视觉,而是属于数学的,是矢量式的(vectorial),反过来被用来识别外在图形的内容,或从同一个数据集生成出新的图片。但用这种算法的艺术家不是要让计算机或机器人担当人类画家的主权。但今天的人工智能图像制作胡里胡涂地将人工智能当有主权、行动位置的画家了,人工智能专家也错认了图像识别和生成技术的目标,真以为在设计人工智能画家了。他们不知道,通过之前所有绘画踪迹之数据库来计算的机器人画家没有创意,最多只有提醒功能,而这才是要从这些图像算法中真正利用的。

比如在这种对图像数据集的计算而不是创作中,如果一个数据集里含有狗的图像,使系统能识别真实的狗,或能够将每只新狗的特征映射(mapping)到系统所能识别的所有数据集里的狗之上,就会创造现实主义式的假狗图像。这就是绘画机器人的全部创新。

生成式AI 没有改变数码艺术或GAN的原有概念框架。

所以,Midjourney 或 DALL-E 2 也许会制作出自动、定制的、微控制的图像,但其结果往往过于generic,因为它们是从标注(给文本和图像配对)过的从网上捞取的图像的众包智慧的宝藏库里派生出来的。哲学家许煜在《艺术与宇宙性技术》里咬定了这一点。当代艺术才是更高的人工智能。基于开放式人工智能的新绘画或图像制作算法,是为人的高级人工智能如艺术而服务的。