刚刚,AI再出王炸!现实世界真的要被颠覆了?

刚刚,AI再出王炸!现实世界真的要被颠覆了?
2024年02月16日 14:03 首席品牌评论

一觉醒来,AI世界又出王炸。

刚刚,人工智能公司OpenAI发布了首个视频生成大模型产品——Sora。

Sora是什么AI产品?

简单来讲,Sora可以根据提供的文本,自动创建长达60秒的高清视频。

以上视频由Sora生成

在AI行业,根据文本自动生成视频,不算新鲜事。

但是,Sora的问世,之所以被称为“王炸”,主要实现了以下几点突破:

1.多镜头,多视角(类比影视业,对摄影师的颠覆)

如何理解这一技术突破,打个比喻:

此前的AI自动生产视频,好比对同一场景,同时配备了几个水平参差不齐的摄影师,多个镜头拍摄,然后将每个人的镜头拼接在一起。

单视频,单镜头,看起来画面不连贯,风格不统一,违和感强烈。

Sora的出现,如同配备了多个技术高超且水平完全一致的摄影师,同时多镜头、多角度拍摄,能保证成品视频,既能一镜到底,也可以实现多角度镜头切换,并且还能保证场景与主体的完美一致性。

以上视频由Sora生成

2.长时间,高清还原(类比影视业,对摄影器材的颠覆)

如果说传统的AI视频生成,是用传统卡带摄影机拍摄视频。Sora的出现,则是直接替换成了高清数码摄影机。

首先是大幅提高了视频长度。

在大多数AI视频还在一个镜头3s时长努力时,Sora直接拉爆至60s,这也意味着AI视频创作,直接提升至作品级标准。

其次是视频质量的高清还原。

Sora创作的视频质量,无论是高清度还是还原度,都可谓极其逼真。

比如人物的眼睛,神情动态之难,往往成为AI创作的壁垒。Sora的世界里,人物眼睛直逼真人,几乎没有任何AI创作的破绽。

以上视频由Sora生成

这样细节直接拉满的视频,哪怕是顶级动画制作公司,制作下来也需要数日时间,而Sora几分钟就搞定了。

这就是技术震撼!这就是行业颠覆!

3.世界模型初具雏形(类比影视业,对演员理解剧本能力的颠覆)

传统的AI视频生成,只能一板一眼地照本宣科翻译提供的文案,而Sora的可怕在于它可以开始理解文案,并基于文案自己进行发挥和拓展。

Sora生成的视频中,可以看到充满了大量文案没有描述的细节,这些都代表Sora的大模型中,已经具备了对于现实世界模型的理解与认知。

以上视频由Sora生成

基于以上,Sora的出现,对传统AI视频生成的冲击,毫不夸张地讲,如同鸟枪换炮。一夜之间,引发了无数行业的焦虑。

电影制作公司,视频动画公司,美术公司,广告公司,甚至包括视频网红,都在担心Sora带来的冲击。

有人把AI的诞生比喻为当年的“工业革命”,无论是当年的蒸汽机还是如今的ChatGPT、Sora,本质上还是生产工具带来生产力的大幅提升。

生产力的提升,带来的是生产效率的提升,其中必然意味着有些岗位乃至行业面临淘汰。

从ChatGPT诞生之日起,我们的世界就正式进入了“AI时代”。从ChatGPT到Sora,可以看到AI时代的发展速度远超人们的理解与想象。

进入AI时代后,每一个人都应该问自己一个问题:我的饭碗,有没有被AI打破的可能?

尽管Sora的技术极具震撼性,但毕竟刚刚发布,缺点还是很明显。

Sora目前最大的缺点,还是无法理解现实世界的“因果关系”。

这个因果关系,包含物理上的因果关系,人情世故的因果关系,时间和空间的因果关系。

从某种意义上来看,对因果关系的理解,或许是AI虚拟世界与现实世界最后的一道屏障

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部