AI作画时代到来:“吃”了足够数据后,AI会取代插画师吗
日期:2022-10-14访问量:来源:新京报,作者:罗亦丹
【编者按】本文为新京报贝壳财经记者报道AI作画与多模态预训练成果,北京智源研究院文澜团队成员、中国人民大学卢志武教授受访。“文澜”是北京智源研究院首席科学家、中国人民大学高瓴人工智能学院文继荣教授,卢志武教授和宋睿华长聘副教授等领衔的师生团队研发的首个中文超大规模多模态预训练模型,产生了广泛影响。
只要输入若干关键词,再等上几秒钟,一幅可以媲美人类画师的绘画作品就能“新鲜出炉”,旁人甚至无法分辨哪一幅画是由人类完成,哪一幅画是AI所画。
上个月,一幅名为《太空歌剧院》的作品获得了美国科罗拉多州博览会艺术比赛的金奖,但这幅作品是一位游戏设计师用AI作画工具Midjourney(中途)创作的,这引发了极大的争议。
“AI作画依赖于多模态预训练,实际上各类作画AI模型早已存在,之所以近期作品质量提升很多,可能是因为以前预训练没有受到重视,还达不到媲美人类的程度,但随着数据量、训练量的增多,最终达到了现在呈现的效果。”10月10日,智源研究院悟道团队成员、文澜BriVL模型的设计者卢志武在接受新京报贝壳财经记者采访时表示。
网易雷火艺术中心原画师奕艾发文称,AI作画对部分插画设计从业者的冲击会比较大,对电影行业冲击可能也不小,“有了AI作画之后,很多工作甲方可以自己完成,对乙方的需求量就会大大减少。”
15秒生成一幅图 可指定包含元素、创作风格
10月10日至11日,贝壳财经记者发出了一份问卷调查,在三幅画作中选择哪幅是AI作画。其中一幅是某艺术家在社交平台发布的作品,另一幅为国内插画学校老师在课堂上示范插画创作步骤时的图片,第三幅则是由网友使用AI作画工具中途生成。
在问卷调查中,有52.7%的受访者正确选择了AI生成的画作,一些受访者选择的理由包括“感觉人物没有情绪”“过于精致”等。
有趣的是,不论选择正确还是选择错误,“画得太好”和“画得不好”都是受访者判断AI作品的依据。此外,还有不少受访者在问卷调查中对记者直言,根本无法分辨哪一幅是AI的作品。
10月9日至10日,贝壳财经记者登录多个AI作画网站实测发现,可能“无法分辨”才是正确的答案。这是因为用户可以通过关键词指定画面的精细程度、人物表情甚至美术风格,而且相同的关键词之下,不同的AI模型给出的画作也不同。
“其实可以作画的AI模型早就存在,这两年扩散模型更火一点。”卢志武对贝壳财经记者表示,“无论什么模型,都依赖多模态大规模预训练。”
贝壳财经记者了解到,虽然模型不同,但AI作画用以学习的“教材”往往都是现成的人类绘画作品,而随着数量庞大的训练数据的增加,AI对人类作品意境的“临摹”技巧也越来越高明,如记者使用关键词“新京报”+“齐白石风格”就得到了一幅水墨画风的AI画作,而使用“新京报”+“莫奈风格”则得到了一幅印象派的AI画作。
新京报记者使用中途制作的齐白石风格“新京报”图片
新京报记者使用中途制作的莫奈风格“新京报”图片
贝壳财经记者发现,能否使用AI创作出一幅佳作往往需要考验创作者的“关键词调试”能力,即能否使用AI能够理解的语言创作出符合创作者需求的画作,一些调试参数包括具体关键词、生成图像的步骤、图像与关键词相似程度、采样方式等。
在实际操作中,如果关键词较为抽象或相互矛盾,则往往作品也会效果不佳,如贝壳财经记者以描述感觉的“温暖凉爽”为关键词生成图片时,某些模型只能生成以“冷”和“温暖”为主要元素的大字报式画作,中途的表现也不尽如人意。
卢志武对贝壳财经记者表示,这与AI模型的训练方法有关,比如对于诗句“出淤泥而不染,濯清涟而不妖”,由于其中不含“荷花”这一关键词,许多AI工具不会将其与荷花联系起来,此时就需要更加特别的训练方式。
文澜BriVL模型以“出淤泥而不染,濯清涟而不妖”为关键词生成的图片。受访者提供
AI作画如何应用于商业化?订阅模式赚钱 作品对外售卖
据了解,早在2015年谷歌就推出过DeepDream(深度梦境),而AI作画工具的代码也已在互联网上开源,并在谷歌Colab(合作实验室)中以代码的形式呈现,可以提供简单的输入关键字生成图像的操作。不过彼时AI作画的效果还不尽如人意,特别是脸部往往不够拟真,容易激发“恐怖谷”效应,但随着技术层面上的不断进化,包括中途在内的不少AI作画工具克服了这一缺陷,并终于在2022年成功“出圈”。
这也为AI的商业化应用带来了无限遐想。
目前,不少AI作画模型均可以通过网站对外免费使用,不过其往往会限制用户的使用次数,如贝壳财经记者在中途上免费生成了约25次AI画作后,若再想进行图片生成就需要进行订阅,价格分每月10美元生成200张图片和每月30美元生成图片不限次两个档位。中途官方网站显示,目前其一共有317万注册用户。
在AI画作的售卖上,2018年,一幅由巴黎艺术团体Obvious使用GAN(生成对抗网络)完成的仿照油画模式的肖像画曾拍出43.25万美元的高价,但相比当时的技术能力,目前的AI作画可以完成更加具体的画作类型,且由于其开源特性,不考虑前期投入,用户可用几乎为零的成本创作出更好的画作。
10月11日,有从事智能创作的人士向贝壳财经记者透露,目前一些AI生成的画作已经受到了甲方的青睐,一些火热的题材一幅画的售价在几千至上万元不等。
那么,用户通过向AI作画模型输入关键词生成的作品,版权归属于谁?
中途在官方网站的版权提示中称,用户将拥有自己生成的作品的权利,这意味着这些图片可以商用,不过,该作品的版权同时也将被授予中途。如上文中所谈到的美国科罗拉多州博览会艺术比赛的金奖作品,署名为“杰森·艾伦通过中途(创作)”。
贝壳财经记者了解到,目前国内对于AI生成的内容的版权管理还没有详细的规定,广东长昊律师事务所发文称,学界在对人工智能生成内容的法律性质的探讨中分歧较大,引发这一讨论的原因在于人工智能生成内容已经具备了人类作品的外观,但人工智能并不具备法律主体资格,因此人工智能生成内容的法律定性存疑。
贝壳财经记者了解到,目前机构自己使用人工智能模型创作出的内容的版权归属于机构自身,如一些新闻媒体使用AI写稿生成的作品版权归属于媒体。此外,有AI从业者对记者表示,AI作画模型的创造者会借机创作出一个虚拟人形象,然后将其自研AI模型生成的绘画作品版权安置在该虚拟人身上。
10月11日,北京海润天睿律师事务所律师褚轶对贝壳财经记者表示,AI生产的作品的争议主要集中在,一是著作权保护的创作主体,是否可以从自然人扩展到AI,二是AI作品是否具有独创性,“AI和拥有人的独立意识仍有距离,因此其生产的内容,是属于著作权法意义上文学和艺术创作,还是仅仅通过数据和算法对已知事物进行反映需要探讨。”
科技大厂看上“智能创作”人员
贝壳财经记者在采访中发现,AI作画效果的突飞猛进也让美术行业从业者受到了冲击。
“AI学习就是吃数据,哪怕本质是复制粘贴,最终也能粘贴出顶级的画作,而且几秒一张,成本只是几分钱电费。首先钱这个角度就让很多人不愿意找传统画师约稿,除非你是顶级画师,AI都比不过你那种。”10月10日,艺术生张同学对贝壳财经记者表示,“但一个普通画家没十几年走不到顶尖层次,这意味着学画画,在成为业界顶尖之前甚至接不到稿子,你愿意走一条十几年学习一分钱也赚不到的行业吗?”
张同学告诉贝壳财经记者,目前已经发现有人直接拿AI作画作品去约稿的现象了,“正常画师要几天才能画完的画,他十几秒可以得到,然后以更低价出售,一天下来就赚了几千,都传到我班级群了,虽然已经遭到了声讨,但是这种现象不管,后果绝对不会好。这样的画如果取代了传统的人工画,我是觉得挺可悲的,别的画师画的比我好,我还能知道别人背地里练得多辛苦。但是有些人拿着AI随便整出一个很厉害的作品,就说自己画的,让我很难表达。”
奕艾认为,AI绘画对一部分的插画设计从业者冲击会比较大,因为插画这个行业有相当一部分的甲方没有太多的审美要求,他们可能只是需要插图整体的一个效果,不需要太多细节,只要能让受众意会就行了。所以,有了AI绘画之后,很多工作甲方自己就可以完成,对乙方的需求量就会大大减少。
在他看来,AI绘画降低了美术的门槛,可以让更多的创意加入进来。有很多人有非常好的点子,但因为不会画画只能通过文字表达或者干脆不表达。这些人就可以通过AI绘画让自己脑海里的东西具象化,大大地扩充了创意来源。
贝壳财经记者发现,AI作画在让一部分人受到冲击的同时,也扩充了新的岗位,包括现在很多科技大厂都在重金投入的智能创作。
贝壳财经记者在某头部短视频平台的“多模态智能创作算法工程师”职位招聘信息上看到,其要求求职者具备“对海量多媒体素材(如图片、视频、文本、音乐等)进行深入语义理解,在此基础上进行素材打散、内容匹配和智能创作,形成多样化高质量的内容”的要求,而创作出内容的应用场景则包括“智能广告生成、视频智能混剪、特效制作”等方向。