Sora真正降临之前,再深入讨论一次AIGC吧

Sora真正降临之前,再深入讨论一次AIGC吧
2024年03月11日 12:17 动画学术趴

Sora文字提示词:A bicycle race on ocean with different animals as athletes riding the bicycles with drone camera view文 /  刘书亮(野草)、赵欣

2024开年,OpenAI发布了Sora的宣传物料之后,媒体报道和分析铺天盖地,许多行业都炸开了锅。动画这个尤其受到AI技术冲击的领域自然也不例外。

虽然Sora目前只揭开了一半的面纱,但已经成了大家开会、日常工作甚至茶余饭后讨论的议题。AIGC究竟目前已经如何影响动画产业,未来又将如何影响,是值得反复思考的问题。

3月5日,我们应邀参加了一场未公开招募观众,研讨格外深入的高规格研讨会。这场活动题为“AIGC:中国动画与数字艺术新视野沙龙”,由中国动画学会、北京市西城区委宣传部、北京市西城区文化和旅游局、北京市西城区文化创意产业促进中心联合主办,由中国传媒大学动画与数字艺术学院承办。

沙龙邀请了相关领域的知名专家和学者,分享AI技术在动画领域的最新进展和应用案例。

目前,虽然每个人对AIGC都已经有了自己的基本判断,无论是论文、自媒体评论,还是网上的各方评价也都接触了很多,但在这场活动上发言的各位领导和专家仍然给出了许多重要判断,有不少能够激发思考的观点与洞见,可谓“金句频出”!在此,我们作为现场为数不多的听众,在得到了主办单位的授权后,为大家做了相对完整的记录和分享——

01无论「狼」来没来,都要做好准备

会议由中国动画学会会长马黎担任主持。

在开场时她谈到,由Sora掀起的这波新的浪潮,对于动画人来说感受尤其明显。AI一直是动画行业关注的焦点,AI领域快速集中发展的时间并不算长,却已经展现了许多全新的可能性。

马黎

对于文生视频(text-to-video),有些人认为历史巨变即将发生,有些人则认为它无外乎“狼来了”的故事重演,其实没有那么惊人的应用效果。而马黎会长指出:“无论狼来没来,我们都应该做好准备。必须尽早关注动画与AI技术的关系,及时研究讨论,力求形成共识,以充分准备迎接新的挑战。”

随后,国家广播电视总局原副局长乐玉成为活动致辞。

他指出,AI技术的迭代直接关系到动画影视行业的生存与发展。技术的发展让我们不断进入到的是一个“人人都可以”的时代:互联网使得人人可以当记者,每个人都是一个电视台……而如今,人人都可以借助AI当导演、做编剧的时代也为期不远。

“相对于ChatGPT刚面世时的争议,现在从上到下,各个部门、各个企业都动起来了”。乐局长认为,动画从业人员要有与时俱进的紧迫感,不断提升适应时代的眼界和能力,做动画行业人工智能的引领者、促进者、贡献者。

乐玉成

02动画,一定是事先制作好的吗?

这次研讨会共有三位主讲人。发言的第一位,是中央美术学院实验艺术与科技艺术学院院长冯梦波教授。他是中国最早将电子游戏作为媒介进行新媒体艺术/当代艺术创作并引起关注的艺术家之一。

发言当中,他回顾了自己创作生涯中所经历的两次重大变革:一次是在1995年他作为首次接触互联网的一批用户,另一次则是近几年涉足AI。

冯梦波教授

谈到对AI的尝试,他说自己从Midjourney的V2版本就开始用了——可以说冯老师确实是很早的一批AI玩家(相比之下,Midjourney“出圈”要等到至少V3的阶段)。此外,Stable Diffusion,包括ComfyUI的运行环境他也全都用过。冯梦波认为,AI对整个时代的重要性和历史地位完全可以与互联网媲美。在此之前,他专注于虚幻引擎技术。这和他一直以来对影像实时性的格外关注一脉相承。在他对AI的尝试中,其中一个重点便是实时生成的AI影像。

在会上,他展示了他的团队利用StreamDiffusion(一个基于扩散模型的实时影像生成解决方案)根据正在播放的视频实时生成新的AI视频。“通常我们认为动画是事先制作好的,而这类新技术为动画创作提供了一种全新的思路,使动画有了实时制作的可能性。我认为‘实时’有一些不能替代的作用,结合DJ/VJ做现场表演,等等,都会非常有意思。”

其实,在一定程度上,实时动画这件事本身就是一个悖论般的概念。但目前的现代技术正是在不断为我们提供视觉奇观的同时,也让我们体验悖论本身。

一切都在重新洗牌。

图为StreamDiffusion在Github上的官方案例

冯老师还提到了AI的几个痛点,尤其是画面闪烁和难以稳定的特征。但他也认为,这恰恰也让AI影像具备一种特殊的美感,带来一些令人意外的惊喜。当然,由AI引领的创作“还很难形成一部完整的作品,艺术家仍需坚定地表达自己的创作意愿”。

03AI能看懂萌宠短视频吗?

接下来,中国人民大学高瓴人工智能学院长聘副教授宋睿华进行了精彩的演讲。

她是计算机出身的AI专家,研究兴趣主要集中在多模态理解创作和交互。她曾担任微软小冰首席科学家。几年前,颇具话题性的AI小冰创作诗集出版,就有宋老师的深度参与。

宋睿华

宋老师分享内容的核心是AI的理解力。这种理解不仅限于语言或文字,还包括视觉、听觉、味道、运动和触感等多种感官。对她来说,这是一次具身性的体验变革。人类思考和使用语言的能力不仅与语言有关,还与其他头脑和肉身合作的产物。而AI与人类相比,虽然没有身体,但也可以有多感官的体验。

观摩这次会议时,宋老师的分享很容易让人联想到著名的“莫拉维克悖论”:计算机做逻辑推理、处理复杂的运算,那绝对是一把好手;但想让计算机像一个真正的人类那样,哪怕是像小孩子那样,有感知力和直觉,反而是难上加难。很明显,宋老师在这件事上对未来的AI充满信心——

AI能读懂Bob Dylan的歌词/诗吗?AI能给无声视频配音吗?AI能看懂网上的萌宠短视频吗?……

宋老师在会上分享了她团队所做过的许多有趣工作。宋老师也在继续尝试让AI写诗。通过多模态训练的实验,她和团队发现,当为AI提供图像信息之后,AI生成的诗歌会比纯文字的训练更跳跃,有了一些更独特的属性。

宋睿华老师在分享的结尾给出了一个非常值得玩味的观点:“图灵测试”是不是应该被“电影测试”所取代?

给AI看电影,它能看懂吗?图片由笔者让DallE3生成挺好,不过机器人吃爆米花就算了吧

在半个多世纪前,计算机科学家图灵提出了那个经典的思想实验——简单来说,就是让计算机模仿人来和真人分别跟受试者文字对话,而如果受试者猜不出哪个是真人、哪个是计算机,那我们就可以说这台机器通过了图灵测试,具备了人的思维属性。但宋老师指出,这个测试今天可能已经过时了;或许让AI看一场电影,然后测测它能否看懂,是我们判断一个AI够不够好的理想路径,也将成为AGI的重要指标。

宋老师这个畅想是非常令人兴奋的。说实话,真的很想让OpenAI组织未来的新版GPT做做这个实验。

04未来,还没有真的「已来」

最后发言的是中国传媒大学动画与数字艺术学院院长王雷教授。王雷老师是动画导演出身,他的作品曾在多个国际电影节、动画节中入围和获奖。他以动画创作者的视角,分享了对AIGC的很多观点。

王雷

他从OpenAI官方新公开的一批Sora生成视频开始谈起。

Sora文字提示词:fly through tour of a museum with many paintings and sculptures and beautiful works of art in all styles

上面这个片段以一种无人机式的视角展示了从博物馆室外到室内穿梭的完整空间。王雷老师为我们做了成本上的对比:以传统手段制作这样一个镜头,成本可能要几十万;然而使用Sora只需在其中输入一句话,实际制作成本可能只有几块钱!从几十万到几块钱,这种新技术的出现让影视动画制作者感到畏惧、焦虑和恐慌。似乎旧有的视频制作手段面临崩溃。

然而真的是这样吗?王老师认为,事实并非完全如此。

他借用IT界的术语“技术负债”来概括AI的实际应用现状:技术企业在产品未成熟前为了商业目的而推出,但其可用性却堪忧,这些短期决策将会导致更多的维护成本等。他强调,目前的生成式AI是“一场技术债务的雪崩”,市面上已经发布的生成式AI工具其实仅是beta版本,还不能以正式产品的标准去衡量,甚至我们对AI模型的测试还缺乏公认的标准,问题和瑕疵仍在不断被发现的过程中。

王雷老师慨叹,未来没有真的“已来”。

他以团队结合AI制作的水墨动画《龙门》为例来说明这件事。最初,团队“预计一两个月无论如何也完成了,但实际却花了大半年时间,因为需要自行训练模型,也需要大量的算力支持”。在这个过程中,他对生成式AI有两点感受:

第一,动画一百多年的历史,本身是从手工到自动化的过程,而生成式AI实际上是前所未有的自动化的内容创作工具;

第二,传统动画制作是一种瀑布式的线性流程,制作过程中不能回头,试错成本高,所见不能即所得。但AI做动画是非常不同的,训练数据的过程实际是一个不断试错的过程,但每个生成的画面都接近最终效果,实现了所见即所得。

《龙门》片段

当然,AI动画也带来了一些新的问题。王雷老师提到,除了虚假信息满天飞和可能产生的人的社会性懈怠之外,AI对著作权观念也形成了巨大挑战,已成为亟需解决的问题。

目前,他和团队还在做的新尝试,继续探索Al动画的潜能,比如尝试将AI与三维动画主流软件的工作流程无缝融合。他指出,在AI时代,动画将迎来前所未有的发展,甚至可能让这个充满魅力的行业将成为下一代互联网的基石。

参加这次活动,给了我们不少新启发、新思考。

技术本身会朝什么方向发展,其实没有谁能提供权威的、必定正确的预测。但我们很清楚的是,AI服务与产品日新月异,每个新作都可能对未来走向之变化产生影响。

对AI动画领域影响最全面的技术之一当属扩散模型(Diffusion Model),而Stable Diffusion当初开源的决定,让大大小小的团队、商业或独立动画人均能以各种方式搭载与使用AI生成图像的工具。这几天,马斯克和OpenAI在网络上的争论正劲,马斯克讽刺道“如果OpenAI把名字改成ClosedAI,我就撤诉”,意指OpenAI没有选择技术开源,违背了非营利初衷。反过来看,其实很难想象,假设Stable Diffusion从未选择开源,也从没有人开发WebUI或ComfyUI,我们今天的AI辅助动画创作又将是如何。

等到Sora开放注册使用,乃至完全开源(如果可能的话),可以预见新的风暴将会来临。

本文来自「动画学术趴」,未经授权请勿转载。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部