Sora无法替代人类,亚马逊工程师断言:实际工作冲突不可能靠AI解决

Sora无法替代人类,亚马逊工程师断言:实际工作冲突不可能靠AI解决
2024年02月27日 13:43 新浪科技

新智元报道

编辑:Aeneas

【新智元导读】Sora 一出,让很多人心生恐惧:饭碗彻底被砸了!这位亚马逊工程师却告诉我们:真的不必担心生成式 AI 会抢人类的饭碗,顶多担心一下你的人类同行吧。

这一周,OpenAI 视频 AI 工具 Sora 一出现,可谓是炸翻了天。「饭碗保不住了」的恐惧,真实地击中了许多人。

不过,亚马逊的一位工程师 Cameron Gould 则认为,其实并不必对 AI 如此惧怕,它并不会导致我们失去工作。

为什么?原因如下。

Prompt 的自相矛盾

首先,生成式 AI 应用在创意内容时,生成的一般是图像、视频以及一般的非虚构内容。

给一个生成式 AI 模型 prompt,就像照看一个恶毒的孩子,他的唯一目标,就是通过「从字面上理解你所说的一切」来惹恼你。

你必须用词准确,不能在不重要的细节上浪费一个字符,因为这可能就会使结果向完全不同的方向倾斜。但是同时,你又需要提供尽可能多的详细信息,让模型不会误解你。这种自相矛盾的操作,简直太糟糕了!

跟计算机进行单向对话,试图理解它为什么没能产生自己想要的结果,能让人产生一种连续 3 小时撞墙的冲动……

Gould 表示,在自己作为软件工程师的职业生涯中,其实已经习惯了和计算机的这种单向对话,但生成式 AI 给他的体验,绝对更糟。

它不是一种可预测的编程语言,拥有幂等的函数。

它完全是一个黑匣子,几乎每次都可以在相同的输入下,产生完全不同的结果。即使在 prompt 里要求 AI 要保持一致性,它也未必会听你的。

市值数十亿的公司,就曾受到这一现实的困扰。最近,加拿大一家法庭裁定,加拿大航空公司必须向其中一名乘客支付赔偿金,因为聊天机器人提供了误导性建议,导致该乘客为机票支付了近一倍的费用。

速度确实快,但……

当然,尽管在一致性方面存在缺陷,但生成式 AI 可以帮我们快速产出东西来。

比如上面这张图,就是用生成式 AI 创建的,只花了几秒钟就做出来了。所以,AI 可以让我们比艺术家出图的速度更快,这件事是有可能的。

而 Sora 也让普罗大众就可以用比以往快许多倍的方式,生成更复杂的媒体素材。所以,由于现在一个人可以做几个人的工作,我们真的不需要那么多的艺术家、软件工程师、撰稿人了吗?

不,它的细节不对

答案并没有那么简单。使用生成式 AI 创作艺术时,可能你时常会想:「不,这不是我想要的。」这也是在论坛上常常出现的观点。

有人会反驳说:这是因为你的 prompt 缺乏细节,你需要给出更具体的 prompt。这个观点确实有道理。

我们自己的图片和票房收入超过 1 亿美元的专业电影,有何不同?我们自己的个人博客,和专业的全职作家的博客,有何不同?我们自己做的游戏视频标题,和 30 小时的 AAA 视频游戏标题,有何不同?

答案就是细节。

AI 生图

正是细节,将业余爱好者和专业人士区分开。

如果想使用生成式 AI 来创作与专业内容一样令人印象深刻的作品,我们将需要一个包含大量细节的提示。此外,还需要大量的试验和错误,才能让模型产生我们想要的东西。

生成式 AI 只是一种工具,类似于自动完成、编译器、拼写检查器或任何其他辅助工具。它不会为你做任何工作,除非是它自己的苦差事。

AI 生图

让我们回到 Sora 的例子。

它只能生成无声的视频。其中没有音频,没有对话,没有一个对象可以说话,或者发出声音。

但如果我们想用它拍电影,就需要用它 ——

生成脚本?

阅读剧本?

生成视频以配合脚本?

究竟是现代电影的哪些方面,让电影变得有趣呢?突然间,我们就需要集成一堆不同的生成式 AI 工具,才能完成工作。

当然,OpenAI 有一个名为 Jukebox 的音乐生成工具,它可以在视频中添加音乐,但却无法添加对话。

在一段视频中,该如何添加对话呢?这项任务听起来太艰巨了。我们不仅需要生成一个特定场景的视频,还需要让场景中角色的嘴部动作和台词保持一致。此外,视频生成器还需要知道单词是怎样说出的。不仅仅是语气,还有节奏。

想象一下,要解决全部这些细节,需要多大的人力才能解决?

细节,变得相当困难。在每一个步骤的每一个级别上,都有大量会影响实质性后果的细节。

Gould 表示,自己最近读到一篇非常喜欢的博文《现实拥有惊人的细节量》。

现实的细节是无限的,然而 AI 模型的 token 却是有限的。

它只能带你走这么远,之后,我们就需要依靠其他人来完成工作。

目前为止,人类仍然做着最繁重的工作。

殖民宇宙的一些重要细节

更少的细节,更多的变化

专注于细节,听起来实在是太累了。如果让你保持简单,会发生什么呢?如果你只需要提供很短的描述,只用几分钟就可以写出来?

最终,你会得到多样化的结果,大部分与你的想法完全不一致。你需要在成百甚至上千个结果中,才能找到你想要的那一个,因为 prompt 太通用了。你可能永远都找不到一个能用的结果。

如果 prompt 太简单,模型天马行空的想象力,会提供无限的排列供你选择。比如输入这个 prompt——「一个男人」,你会得到各式各样的男人。

但实际上,我想要的是一个蓝头发、棕色眼睛、留着小胡子、穿着一件黑色夹克、戴着兜帽的男人。

如果只输入「一个男人」作为提示,需要多长的时间才能找到确切的输出呢?

深度和广度之间有一个平衡点,你可以最大限度地减少你的努力。这就需要对细节进行大量批判性思考,并进行大量搜索。

AI 不会取代我们

所以,为什么说 AI 不会取代我们?因为,企业并不是为了解决生成图像、视频剪辑这类小问题而存在的。企业是为利益相关者解决更大型、更复杂的问题。

解决这些问题最困难的部分,就是后勤工作。解决大型、复杂的问题需要一大群问题解决者的时间和精力,而所有这些问题解决者又需要由其他问题解决者组织起来,以保持事情的进展。

如果随机抓来两个人,让他们自我管理、自我组织工作,很可能他们的标准和时间表会不一致。如果你要让他们一起工作,你就得设立标准,让他们在同样的时间工作,并且产生相同质量的结果。

凝聚力是一种力量,你需要做一些工作,让独立的单位保持一致。一个团队单独运行,可以顺利完成任务;但是当我们把多个团队引入单个环境中时,就会出现很多冲突。

多个相互依赖的团队朝着一个目标努力时,需要一定的凝聚力,才能完成有意义的事。

这项「凝聚力」工作其实很复杂,经常需要解决人际冲突,而这些冲突通常是不合逻辑的、情绪化的。

显然,AI 无法解决这种类型的冲突。

总结来说就是 ——

企业通过为很多人 / 企业解决大问题来赚钱

大问题很难解决,因为涉及很多团队

我们需要精心策划如何统筹这些团队,来解决人际冲突,并保持凝聚力

在解决人际冲突方面,人是最可靠的资源

很显然,机器人根本无法胜任这些工作,它们的表现会很糟糕。

AI 不会抢走你的工作

当我们仔细看一下目前生成式 AI 的现状,这个事实是显而易见的 —— 目前没有任何方法,可以让工作自动化。

提示界面和模型缺乏自主性和批判性思维,导致了关键的局限性。没错,生成式 AI 的确可以让我们提高工作效率,但也就仅此而已。

这句话已经被越来越多人所赞同:AI 不会抢走你的工作。真正会对你造成威胁的,是会比你更熟练地使用 AI 工具的人。

生成式 AI 是帮助你加快速度的绝佳资源,但它不会完全自动化你的工作。你要做的,就是把它们添加到你的工具箱,熟练地掌握它们。

参考资料:

https://www.camggould.com/posts/The-AI-Endgame/

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部