刚刚，AI再出王炸！现实世界真的要被颠覆了？_

一觉醒来，AI世界又出王炸。

刚刚，人工智能公司OpenAI发布了首个视频生成大模型产品——Sora。

Sora是什么AI产品？

简单来讲，Sora可以根据提供的文本，自动创建长达60秒的高清视频。

在AI行业，根据文本自动生成视频，不算新鲜事。

但是，Sora的问世，之所以被称为“王炸”，主要实现了以下几点突破：

1.多镜头，多视角（类比影视业，对摄影师的颠覆）

如何理解这一技术突破，打个比喻：

此前的AI自动生产视频，好比对同一场景，同时配备了几个水平参差不齐的摄影师，多个镜头拍摄，然后将每个人的镜头拼接在一起。

单视频，单镜头，看起来画面不连贯，风格不统一，违和感强烈。

Sora的出现，如同配备了多个技术高超且水平完全一致的摄影师，同时多镜头、多角度拍摄，能保证成品视频，既能一镜到底，也可以实现多角度镜头切换，并且还能保证场景与主体的完美一致性。

2.长时间，高清还原（类比影视业，对摄影器材的颠覆）

如果说传统的AI视频生成，是用传统卡带摄影机拍摄视频。Sora的出现，则是直接替换成了高清数码摄影机。

首先是大幅提高了视频长度。

在大多数AI视频还在一个镜头3s时长努力时，Sora直接拉爆至60s，这也意味着AI视频创作，直接提升至作品级标准。

其次是视频质量的高清还原。

Sora创作的视频质量，无论是高清度还是还原度，都可谓极其逼真。

比如人物的眼睛，神情动态之难，往往成为AI创作的壁垒。Sora的世界里，人物眼睛直逼真人，几乎没有任何AI创作的破绽。

这样细节直接拉满的视频，哪怕是顶级动画制作公司，制作下来也需要数日时间，而Sora几分钟就搞定了。

这就是技术震撼！这就是行业颠覆！

3.世界模型初具雏形（类比影视业，对演员理解剧本能力的颠覆）

传统的AI视频生成，只能一板一眼地照本宣科翻译提供的文案，而Sora的可怕在于它可以开始理解文案，并基于文案自己进行发挥和拓展。

Sora生成的视频中，可以看到充满了大量文案没有描述的细节，这些都代表Sora的大模型中，已经具备了对于现实世界模型的理解与认知。

基于以上，Sora的出现，对传统AI视频生成的冲击，毫不夸张地讲，如同鸟枪换炮。一夜之间，引发了无数行业的焦虑。

电影制作公司，视频动画公司，美术公司，广告公司，甚至包括视频网红，都在担心Sora带来的冲击。

有人把AI的诞生比喻为当年的“工业革命”，无论是当年的蒸汽机还是如今的ChatGPT、Sora，本质上还是生产工具带来生产力的大幅提升。

生产力的提升，带来的是生产效率的提升，其中必然意味着有些岗位乃至行业面临淘汰。

从ChatGPT诞生之日起，我们的世界就正式进入了“AI时代”。从ChatGPT到Sora，可以看到AI时代的发展速度远超人们的理解与想象。

进入AI时代后，每一个人都应该问自己一个问题：我的饭碗，有没有被AI打破的可能？

尽管Sora的技术极具震撼性，但毕竟刚刚发布，缺点还是很明显。

Sora目前最大的缺点，还是无法理解现实世界的“因果关系”。

这个因果关系，包含物理上的因果关系，人情世故的因果关系，时间和空间的因果关系。

从某种意义上来看，对因果关系的理解，或许是AI虚拟世界与现实世界最后的一道屏障

头条号入驻

首席品牌评论 O2O新媒体第一平台，专注干货！

今日推荐优秀作者看点月榜

4000520066 欢迎批评指正