AI是如何帮助创造看起来和听起来都和我们一样的仿真数码人的

AI是如何帮助创造看起来和听起来都和我们一样的仿真数码人的
2022年12月05日 12:32 大数据_文摘

作者:Anthony Green

翻译:顾伟嵩

校对:赵茹萱

仿真数码双胞胎捕获了真实人类的外表和表情。这些复制品越来越多地出现在娱乐业和其他行业。它带来了一些有趣的机会和棘手的问题。

我们的通话对象:

格雷格·克罗斯(Greg Cross),Soul Machines首席执行官兼联合创始人

声音来源:

  • 2PAC全息图| Coachella现场录制|高质量(2PAC HOLOGRAM | LIVE Coachella Recording | High Quality)-通过YouTube

  • 我是Miquela,一个真实的机器人餐厅(I'm Miquela, A Real-Life Robot Mess)-通过YouTube

  • Capitol Records签约AI或“虚拟”说唱歌手……然后在推拒后放弃这位歌手(Capitol Records signs AI, or 'virtual', rapper ... then drops the artist after pushback)-通过YouTube

  • FN Meka Voice Glad Capitol终止合同,Hitmaka同意|TMZ(FN Meka Voice Glad Capitol Killed the Contract, Hitmaka Agrees | TMZ)-通过YouTube

  • 《黑镜》:你、我和艾希礼也是(Black Mirror: You, me and Ashley Too)——通过Netflix

  • FN Meka-月球漫步(FN Meka - Moonwalkin’)-通过YouTube

  • 国会唱片公司在对种族主义陈规定型观念的激烈抨击后抛弃了虚拟说唱歌手FN Meka |公告牌新闻(Capitol Records Drops Virtual Rapper FN Meka After Backlash Over Racist Stereotypes | Billboard News)-通过YouTube

  • Kyle the Hooligan,FN Meka背后的黑人说唱歌手称他正在起诉| TMZ(Kyle the Hooligan, the Black Rapper Behind FN Meka Says He's Suing | TMZ )-通过YouTube

  • 数字人类的未来——Mao Lin Liao(Future of digital humans – Mao Lin Liao)-通过YouTube

信用:

这一集由安东尼·格林(Anthony Green)在艾玛·齐勒肯斯(Emma Cillekens)的帮助下制作。它由詹妮弗·斯特朗(Jennifer Strong)和马特·霍南(Mat Honan)编辑,加雷特·朗(Garret Lang)混音,雅各布·戈尔斯基(Jacob Gorski)原创音乐。它由詹妮弗·斯特朗(Jennifer Strong)主持。

完整剧本:

【TR ID】

【音乐和掌声响起】

詹妮弗:这是20-12年科切拉音乐节的闭幕之夜……德雷博士(Dre)和史诺普·道格(Snoop Dogg)通过一位神秘嘉宾登上了舞台:图帕克(Tupac)……尽管这位嘻哈传奇人物早在15年前就去世了。

图帕克全息图:是的!你知道这是……什么!

【观众欢呼】

图帕克全息图:德雷!

德雷:我很冷,帕克怎么了?

图帕克全息图:科切拉在发生……什么?!

【淡出】

【配乐】

詹妮弗:一张已故说唱歌手的全息照片出现在真实世界中的德雷博士和史诺普·道格旁边……与他们开玩笑……并向人群发表讲话。

这个场景花了一年多的时间来创造,并通过将这位说唱歌手去世前录制的表演中的音频、身体特征和动作拼凑在一起来实现。

对于电影节的参与者和现场直播的观众来说,效果是惊人的……而且有点令人不安。

如今,仿真数码人正以越来越微妙的方式从事着娱乐的工作。

米奎拉(Miquela):我被设计成一个19岁、半巴西、半西班牙的女孩,名叫米奎拉。

詹妮弗:这个仿真数码人和模型是一个以CGI instagram简介开始的项目……但一直在发布音乐,并与卡尔文·克莱恩(Calvin Klein)和普拉达(Prada)等奢侈品牌合作……一路上积累了数百万粉丝。

米奎拉:你们不用担心。我是一个机器人,但我不是来这里的做坏事的,比如,黑客入侵你的venmo或泄露你的私人浏览器历史记录。

詹妮弗:对于下一代系统……AI是核心创造工具。伴随而来的是互动的、人性化的体验……以及一些熟悉的、棘手的关于所有权的问题。

WFAA新闻主播:我的意思是,有很多想进入这个行业的真正的人,但你选择签一个虚拟的人?

希特马卡(Hitmaka):如果这件事被曝光,他们就会从中赚取数亿美元。没有人会什么都不说。

詹妮弗:我是詹妮弗·斯特朗,在这一集中,我们将探索构建这些仿真数码人类的真正任务。

【标题】

OC:……您已经到达目的地。

【音乐响起】

格雷格·克罗斯:你知道,创造数码角色和数码个性的艺术,我的意思是,这在电影行业已经得到了很好的磨练,让我们爱上了这些虚拟形象和这些CGI角色的原因是他们确实以一种非常人性化的方式表达情感。

格雷格·克罗斯:嗨,我是格雷格·克劳斯。我是Soul Machines的首席执行官和联合创始人。Soul Machines是一家人工智能公司。我们制作虚拟形象,并使用动画世界中的一种全新范式将其赋予生命。我们称之为自主动画。因此,自主动画是我们在本次对话中所做的。所以,我的大脑在激励我。它给我带来了生命。它选择了我的语言,我用这种方式表达它们。这只是自主发生的。在我说话的同时,你的大脑正在给你带来活力。你在听我说话的时候,你在决定如何看待它们,如何感受它们。因此,如果我们考虑高质量的CGI或虚拟形象类型的动画,那都是人类行为的内容。因此,人类演员扮演虚拟形象的角色。他们被这些难以置信的专用摄像机捕获,然后处理数据。这些数据用于使虚拟形象栩栩如生。

詹妮弗:这是《指环王》中创造咕噜(Gollum)的过程,它改变了2009年大片《阿凡达》的整个演员阵容。

但Soul Machines的方法依赖于AI。

格雷格·克罗斯:AI已经成为我们思考自主动画的一个重要部分,它使我们能够制造更像我们自己的机器。我们可以用更人性化的方式与他们互动。因此,我们的数码用户、我们的虚拟形象在云中呈现,实际上,它们正以视频流的形式从云中广播到设备中。所以,这就像一个缩放通话,只是你在和一个数字用户通话,而不是一个真实的用户。

詹妮弗:而且它在娱乐界也越来越流行了。

格雷格·克罗斯:名人们正在寻找新的方式与他们的粉丝接触。因此,社交媒体开创了这一趋势,名人可以与粉丝建立直接联系。这将把它带到下一个层次。

詹妮弗:并且,名人选择生数码双胞胎有很多原因。

格雷格·克罗斯:我们最近开始与杰克·尼克劳斯(Jack Nicklaus)合作,你知道,杰克在现实生活中已经82岁了。对他来说,这是一个遗留项目。

他如何使自己的遗产与今天第一次打高尔夫球的孩子相关?因此,我们宣布将重新塑造玛丽莲·梦露(Marilyn Monroe)。面向21世纪,与拥有玛丽莲数码版权的Authentic Brands Group员工合作。所以,你知道,这是一个项目,你知道的,我的意思是,今天对玛丽莲有着巨大的兴趣。这是我们讲述她的故事的另一种方式。K-pop,呃,Mark Tuan,世界上最大的K-pop明星之一。Mark只是这些人中的一个,他时间非常少。你知道,他从来没有足够的时间与粉丝互动,而他想与粉丝互动。因此,这成为一种方式,他可以做到这一点,而不必一直在那里。

詹妮弗:这对电视剧《黑镜》的粉丝来说可能很熟悉……在这部电视剧中,一位由现实歌手麦莉·赛勒斯(Miley Cyrus)饰演的流行歌星使用AI创建了她的个性的数码版本。

报幕员:现在你可以和你最喜欢的流行歌星做最好的朋友了!

年轻女孩:艾希礼,醒醒。

艾希礼:嘿,我也是艾希礼!

报幕员:基于Ashley O的真实个性的全新智能伴侣。

詹妮弗:Soul Machines捕捉到他们正在数字化的人的外表和表情……然后,真正的工作开始了。

格雷格·克罗斯:就合成人声而言,我们与合作伙伴合作,重新创造这些人声,并且这些人声可以根据现有的音频内容进行训练,卡梅洛·安东尼(Carmello Anthony)最近出版了一本书。他录制了这本书的有声读本。因此,我们使用有声读物版本来创建他的合成语音。但事情是这样的。

我们只是不能用英语创造合成语音,你知道,用他的自然语音,我们可以用日语、普通话和韩语创造合成语音。你知道,卡梅洛现在可以用他自己的自然语音说15种语言中的任何一种。

詹妮弗:尽管被称为数码孪生兄弟……这在其他所有行业都意味着某种东西的精确复制品……这些仿真数码人不一定和他们的本体同行一样。例如,他们可能会选择为粉丝创建一个不那么焦虑或更健谈的版本。

格雷格·克罗斯:我的意思是,我们特别与卡梅洛探讨的一件事是,杰克希望数码杰克能代表他那个年龄段的人。卡梅洛实际上想让他的数码孪生兄弟拥有不同的个性,这样他们就可以互相玩弄,相互交流,并彼此取乐。你不想做的事情之一是你不想把名人连接到互联网上,因为你知道,你这样做,你最终会得到TikTok视频,其中的内容不合适或与他们的品牌或形象不一致。因此,数码领域的内容必须得到管理,你知道,就像名人在社交媒体上管理他们的内容一样,他们也必须对他们的数码胞胎做同样的事情。

詹妮弗:不过,有些公司确实把这种管理权交给了一种算法。

FN Meka:走在丛林里,我是一支行进的乐队。(轰,轰!)太深了,就像小丑在面包车里(小丑)50人说得最好。不是很多人(很多人)当你踩到我的时候,来抓我,伙计(格拉)

詹妮弗:这首歌的一部分是由FN Meka创作的,这是一家由Factory New……公司创建的AI,该公司自称是一家专门从事虚拟艺术家的唱片公司。

该系统分析特定流派的流行歌曲,并生成新歌曲的构建块…例如旋律和节奏…由真人演唱。

FN Meka的设计和营销是为了代表一种数字说唱歌手…他的TikTok视频显示他穿着名牌服装和豪华轿车,发型前卫,态度丰富…平台上的浏览量超过10亿次。

8月,有消息称,这名数码人已签约世界上最强大的音乐公司之一:国会唱片公司,该公司保留对ABBA和凯蒂·佩里(Katy Perry)等艺术家作品的版权。

然后……事情发生了

公告牌新闻主播:从踏入虚拟未来到回到众所周知的街头,大家都在谈论的AI说唱歌手已经从他的标签上消失了。

詹妮弗:除了他的虚拟珠宝和定制特斯拉网络卡车,FN Meka还被描绘成一个黑人……而本体却不是。

这个系统很快就被“行业封锁”组织(Industry Blackout)质疑了……这是一个代表音乐行业黑人的组织。

WFAA新闻主播:在推特上的一份声明中,该组织称这位说唱歌手是“一幅攻击性漫画,是对黑人社区和我们文化的直接侮辱。”

詹妮弗:在声明发表后的几个小时内,国会唱片公司切断了与AI的联系,并向黑人社区道歉。FN Meka的音乐很快就从流媒体服务中删除了,至于他的病毒性TikTok内容……它几乎消失了。

黑人说唱歌手凯尔(Kyle the Hooligan)正对该公司采取法律行动,他的真实声音被用于该系统。

凯尔:总的来说,我的律师一直在联系他们和他们的律师,但我们还没有收到回复。嗯,当时……我还年轻,你知道我在说什么吗?我没有代理人。所以……到目前为止,他们还没有真正的资金支持。所以他们答应给我股权。

这本质上就是一场合作。所以我们可以一起做这件事,就像建立它一样,而不是像预付款之类的东西。

詹妮弗:但他说那没有发生。

凯尔:所以我想解释一下这一点,并表明仅仅使用文化和鬼魂而并不对他们进行补偿是不对的。因为这个,我知道…这个行业经常发生。所以这基本上就是我想要的。得到补偿并了解情况。

希特马卡:我认为这是对文化的伤害。就像这样,这是我很长时间以来看到的最无礼的事情。

詹妮弗:这是格莱美(Grammy)提名的说唱歌手兼制作人希特马卡,在接受TMZ采访时说的。

希特马卡:你知道,为了达到这一点,必须要经历多少层、合同和事情。因此,法律部门、A和R团队、高层管理人员都同意这一点。如果这件事被曝光,他们就会从中赚取数亿美元。没有人会什么都不说。所以这真的很荒谬。

【音乐】

詹妮弗:你可以在节目记录中找到我们报道的链接……你可以通过tech review.com/订阅来支持我们的新闻报道。

我们之后回来。

【中卷】

【音乐响起】

詹妮弗:不仅仅是名人想要使用数码复制品……这项技术正在从客户服务到执法的各个方面进行试验……

Mao Lin Liao:所以,这个项目是关于一个虚拟女孩,用来吸引网上的恋童癖者的。

詹妮弗:这是Mao Lin Liao,在会议上发言。他是REBLIKA的首席执行官——一个仿真数码人设计师。

Mao Lin Liao:整个故事对我们来说非常重要,因为它帮助世界变得更安全。

詹妮弗:这个项目代号为“甜心”(Sweetie)。它是一个电脑模型,它的外观和动作都像一个真正的女孩。甜心被部署在多个在线聊天室,她似乎坐在菲律宾的摄像头前。实际上,一组侦探正在阿姆斯特丹的一个仓库中操作该系统。

甜心AI:我的名字叫甜心的。我今年10岁。我住在菲律宾。每天我都要坐在摄像头前和男人聊天,就像成千上万的其他孩子一样。男人们叫我脱掉衣服。但他们不知道的是,我不是真的。我是一个一块一块制作的电脑模型,用来追踪做这件事的人。

詹妮弗:在短短10周内,研究小组发现了来自71个不同国家的1000只掠夺者……这在很大程度上要归功于该系统能够复制与真人交谈时所产生的微妙的身体差异。

正是这些细微的差别,如目光的转移或微笑的回复,支撑了Soul Machines创造的数码人类的真实性。

数码杰克:嗨,你好吗?

格雷格·克罗斯:我很好,谢谢你,杰克。

数码杰克:我很高兴听到。我是杰克·尼古拉斯,大约1978年来找你。我在这里告诉你我作为职业高尔夫球手的生活。我们应该从哪里开始?

格雷格·克罗斯:所以我现在只是让杰克安静下来。所以你可以在屏幕上看到杰克。他在看着我。你知道,如果你仔细看,你可以看到我的手在倒影。

詹妮弗:这是首席执行官格雷格·克罗斯演示高尔夫球手杰克·尼克劳斯的数字孪生兄弟……该系统使用计算机的麦克风和网络摄像头,似乎可以听到和看到另一端的真人。它有上下文意识,知道它应该像在视频通话中一样聊天。

詹妮弗·斯特朗:当你说他的名字时,他笑了笑。

格雷格·克罗斯:是的,当然,如果我对他微笑的话。

格雷格·克罗斯:他会报以微笑。我的意思是,这是自然的…这是自然反应。因此,如果我对你微笑,你的眼睛会看到微笑,然后你的大脑,或者你大脑中的边缘系统,这是我们的情感连接系统,分泌多巴胺和血清素,快乐药物,通过你的神经系统,从你的大脑向你的面部肌肉发送电信号,然后你也会微笑。这是人类对微笑的自然反应。因此,杰克的数字大脑实际上以完全相同的方式工作。所以如果你知道,你会关心或担心。

詹妮弗·斯特朗:我明白了。

格雷格·克罗斯:他会表现得更有同情心。你知道,这是我们使用杰克的数码大脑实时将其激活的一些方式。

格雷格·克罗斯:你能告诉我们1978年英国公开赛的情况吗?

数字杰克:1978年,英国公开赛回到了最传统的位置。1964年,我第一次访问圣安德鲁斯时,就爱上了圣安德鲁斯的老球场。从那里开始,我的唯一依恋群体。你去过苏格兰吗?

格雷格·克罗斯:是的,我去过。

数字杰克:这真的很重要。高尔夫的诞生地等等。不用说,1978年再次与圣安德鲁斯队比赛是一个梦想,但学期前的几个月并不理想。你是否曾经试图处理一个问题,结果却看着它成长?你越想处理好它?

格雷格·克罗斯:不,我没有任何问题,杰克。

数码杰克:真的,那你真是太幸运了。

格雷格·克罗斯:随着时间的推移,我们可能最终会建立一些不同版本的数码杰克。我是说,杰克选择了那个年龄。他想要38岁。他认为自己在那个年龄段打的是他职业生涯中最棒的高尔夫球,所以他选择了这个年龄段。但我们可能会,你知道,1962年,我的意思是,杰克是一个,你知道的,非常英俊的年轻高尔夫球手,长得像电影明星。所以我们可以做那个版本的杰克,或者,你知道,我们甚至可以做一个流行的,你知道的,嗯,杰克,当他70多岁的时候。因此,在我们前进的过程中,这些都是我们发展概念的不同方式。

詹妮弗:这个团队还一直在探索这些数码双胞胎如何在视频会议的2D世界之外发挥作用。

格雷格·克罗斯:我想……你知道,目前即将到来的重大转变是从互联网的2D世界进入元宇宙的3D世界。所以,我的意思是,这是我们一直在思考和准备的事情,我是说,杰克以全3D的形式存在,嗯,你知道,杰克以全身的形式存在。所以我的意思是,杰克可以,你知道,今天我们有,你知道的,我们正在构建增强现实,杰克在高尔夫球场上漫步的原型。你知道,我们可以去问杰克,我们该怎么打这个洞?嗯,这些是我们开始想象的一些事情,从数码人的方式,数码名人的方式来看。当我们进入3D世界时,请与我们互动。

詹妮弗:他认为这项技术可以走得更远。

格雷格·克罗斯:医疗和教育是这类技术的两个惊人应用。这很令人惊讶,因为我们没有足够的真正的人在现实世界中提供医疗和教育。所以,我的意思是,所以你可以,你知道,你可以想象如何使用数字劳动力来扩充。而且,扩展技能和能力,不是取代,而是扩展真正的人的技能和能力。

詹妮弗:这一集是安东尼·格林在艾玛·齐勒肯斯的帮助下制作的。它是由我和马特·霍南编辑的,由加雷特·朗混音,雅各布·戈尔斯基的原创音乐组成。

如果你对这个故事或你想了解什么,请在技术评论网站的播客上留言。

谢谢收听……我是詹妮弗·斯特朗。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部