真正的数字人,离诞生还差一个通用人工智能

真正的数字人,离诞生还差一个通用人工智能
2022年02月25日 15:29 未尽研究

人类在疫情期间,对技术产生了感情。

人类彼此之间变得隔膜,不信任,但是加深了对技术的依赖;有些人对技术如此地信任,以至于激进地想建立起完全自治的数字世界。

或者说颠倒虚拟与现实。数字世界才是真实的、美好的。

数字人(Digital People)开始涌入元宇宙。他们也被称为虚拟人,以数字形式存在,往往栩栩如生,甚至能让真实人类感觉到情绪与人格。他们成为了连接人与机器的互动界面。

发达和即将发达的经济体,普遍面临人口崩溃,但机器人和数字人开始被接生和豢养。

创造他们的初创企业,正在受到风险资本的追捧。软银愿景基金领投了新西兰初创公司灵魂机器(SoulMachines)的B1轮,金额高达7000万美元;次世文化获得了红杉中国的独家投资,其半年来的第三轮融资。

数字人大量诞生,背后是元宇宙的热炒,更重要的是底层技术的进步与商业化场景的落地。去年1月初,百度研究院预测称,结合知识图谱和深度学习,以及3D 建模、情绪识别、智能推荐等技术,数字人将在2021年大量出现,并在服务行业大放异彩。

刚刚闭幕的冬奥会,就采用了手语播报数字人。燃麦科技推出的数字偶像AYAYI,不仅以数字员工身份入职阿里,还拿下了LV、欧莱雅、保时捷等品牌的代言。数字人首先是数字喉舌。

(数字手语播报员翻译测试,来源:央视)

另一大场景则是客户服务。灵魂机器试图在日益数字化的服务行业中,提供能够与人类用户情景化互动的数字劳动力。该公司发布了一份白皮书,提到新冠疫情以来,C端用户需求更多更好的远程教育和零接触服务,B端客户则希望既能提供差异化服务,增加用户黏性并提升转化率,但同时又希望能降低成本。

与频繁占线的人工服务不同,数字劳动力可以起早贪黑地干活,在绝大多数智能设备上,以多种语言提供规模化的一对一服务。Gartner称,在2021年,全球15%的客服交互由人工智能处理,比2017年增加了4倍。与基于文本或音频的人工智能客服,数字人在互动中展示的面部表情与肢体动作更具亲和力。

灵魂机器已经揽获了多家客户,并初步验证了其商业价值。雀巢、西太平洋银行与世界卫生组织等,已经通过该公司的技术创建了数字人。灵魂机器称,一位能与年轻女性交流的皮肤问题的数字护肤顾问(不用分成的数字李佳琦?),让该网站的转化率提高了4.6倍。

数字人的基因,需要多模态算法,也就是同时处理或输出听觉、视觉与知识逻辑等相关的信息。人物建模与互动表达,需要CGI(计算机生成图像)、自然语言处理与语音合成的支持;对互动内容的捕捉,需要计算机视觉与语音识别技术。

当用户与数字人互动时,前者的面部表情与情绪反应,都会在脱敏的前提下收集起来,用于训练与优化算法,变成数字人的“灵魂“。

灵魂机器引入了认知科学与神经科学,帮助算法理解真实人类的声音语调、节奏和面部表情变化的含义。

人类急不可待地想拥有这些永不躺平的数字人。尽管诸多数字人技术初创公司,纷纷勾勒出了其技术框架与商业模式,但这项技术还需要很长一段路要走。为了衡量技术进展,灵魂机器参照自动驾驶技术L0-L5的分级模式,将数字人技术根据人类介入程度与系统互动性,分为L0-L5等阶段。

L0级被称为无自主动画,由人类提前录制,系统再向用户重复播放公司提供的脚本。L1级的动画,类似电影《阿凡达》,虚拟人物的肢体语言来源于对真实演员表演动作的捕捉,这套动作预先针对某个特定问题设计,系统根据用户选定的问题呈现动画。L2级的动画,不再需要真实演员,而由算法根据指定脚本生成,但用户互动仍较为受限。

上述三个级别,动画呈现与人机交互都提前预设,人类主导。目前市场上的数字人技术应用场景,多数都划入了为L0至L2级。

实际上,这就是目前自动驾驶所达到的水平。

L3至L5级是实时的、动态生成的、内容感知的动画。随着级别的提升,对系统自由度的要求会更高。灵魂机器认为自己目前处于L3级别,也就是指导性动画。这个级别的动画由算法自动生成,人类定义动画内容的范围,但不预设具体问题;系统能向人类报告用户互动中出现的异常。这个级别的产品,类似于数字客服,在互动中为用户提供标准化的咨询服务。

L4级被视为目标导向的动画,L5级被视为价值导向的动画。前者的产品形态更类似于数字金融投顾,系统要在互动中学习,为客户实现投资目标;后者则更类似于偏远地区的数字医护人员,系统要尝试自主学习,完全根据患者输入给出个性化医护建议。

L4与L5目前尚无公司能够实现,它们有赖于通用人工智能技术(AGI)的进步。狭义人工智能,只能完成特定任务,解决特定问题,通用人工智能类似人类,能够处理全局性任务。但这项技术在Garnter技术成熟度曲线上,尚处于起步阶段。

在元宇宙中,很多应用场景所提供的客户服务,可以由数字劳动力来完成,而不需要真实人类的数字分身来扮演。这些数字劳动力足够自主,不断与真实人类互动,推动AGI技术的进步。

灵魂机器自称是AGI技术公司,并坚信这就是未来。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部