前沿专访 商汤科技栾青 :人工智能的基础是现实世界数字化

前沿专访 商汤科技栾青 :人工智能的基础是现实世界数字化
2022年04月04日 08:48 人民资讯

本文转自:财联社

《科创板日报》(上海,记者 黄心怡)随着元宇宙概念的兴起,AR/VR与人工智能的结合备受关注。想要构建元宇宙,“沉浸感”至关重要,而两者的融合,将推动全新的用户体验以及人们与世界互动的新方式。Frost

近日,商汤科技数字空间事业群数字文娱事业部总经理栾青接受了《科创板日报》记者的专访,分享了对于AR/VR与AI结合的应用前景与挑战的看法。

栾青认为,AI是把现实世界数字化的重要工具。有了人工智能,就可以在虚拟世界里更快生成人、物、场景,大大降低元宇宙的构建门槛和成本。AR/VR与AI的结合,能跨行业解决很多不同问题。除了游戏、社交外,在工业、建筑、医疗等产业数字化领域,也有比较多的应用空间。

不过,栾青也指出,目前相关产业还是处于初期发展的阶段,不管是硬件体验、内容生成平台,还是所涉及的经济系统、授权认证系统等均需时间来建立。五年通常被认为是硬件的一个迭代周期,而最终的成熟时间依然很难预测。但在终极的数字世界建立之前,会有比较多的雏形形态,能够解决日常生活中的一些问题。

人工智能的核心,在于持续把现实世界数字化

《科创板日报》: AI 与AR/VR的结合,是业内较为关注的热点,您认为AI将会为元宇宙带来哪些价值?

栾青:不管是称其为元宇宙,还是叫混合现实,或者数字世界也好,类似的概念已经存在非常久了。目前来看,AI所起到的作用主要包括三个方面。

首先,人需要拥有一个新的身份,AI将帮助大家以数字分身Avatar,更好地进入到虚拟世界里;其次是虚拟世界的多模态人机交互体验,即这些数字人对不同的虚拟世界、不同服务进行人机的交互;第三,虚拟要与真实结合,AI可以更快速地构建虚拟世界。

《科创板日报》:当下已经有哪些落地的应用场景?

栾青:目前所基于的载体是各类屏幕、电子设备,比如手机、电脑、大屏,当然还有开始初步应用的VR和AR眼镜。

在To C的应用方面,包括了各种各样的VR社交应用、会议系统等。在To B的方向,较为常见的是通过智能数字人,来替代某一项服务的重复性劳动。比如在商场、银行、医院等,数字人可以帮助前台来完成刷卡、来访登记等这些简单、重复的工作。

AI还能实现三维内容的快速生成,比如通过无人机或者手机快速扫描,就可以把现实场景在数字空间里建立起来。这在智慧城市的管理,智能遥感技术的应用已经非常多了。

在今年冬奥会期间,我们就对冰壶赛场冰立方的整个场馆进行了三维数字化。通过AI技术捕捉冰壶在三维场景中的位置,成功实现了在超大空间范围内,远距离精准检测并识别定位跟踪可能被遮挡的运动冰壶。不仅如此,我们还通过“虚实结合”的方式,在现场大屏和咪咕视频还原冰壶的运动轨迹曲线。这不仅可以帮助运动员分析研判对战形式,适时调整战术,还能让观众更好地了解和感受冰壶运动的精髓。

《科创板日报》:完成对水立方场景的三维数字化重建,大概需要多久时间?

栾青:我们在场馆内走一圈的时间大概是十几、二十分钟,然后在两个小时之内就能把整个水立方冰壶比赛场馆进行完整建模。这还是普通服务器的建模速度,如果使用性能更强的服务器,还有可能会更快。

《科创板日报》:AI为现实世界数字化所带来的效率提升,您有没有相关的数据?

栾青:比如,过去建立一个数字人,平均时长大概剩3-4个月。通过AI的优化之后,在初步情况下可达到一个月以内。未来我们还将会把整个流程优化到以天为单位的级别,这样可以让很多行业高效率使用自己的虚拟形象代言人,这是我们正在努力的方向。

可以说,现实世界数字化,是AI最核心在做的事情。如何更快生成人、物、场景,降低成本和门槛,而不是需要专业的设计师花很长时间才能做完。

《科创板日报》:所谓现实世界数字化,在产业化场景也有应用空间,比如说像工业领域一直在提的数字孪生。

栾青:是的,三维建模和数字化管理是比较通用的技能,可以跨行业解决很多不同问题。在工业、建筑、医疗等等,都有比较多的可能性。

其中,工业是非常典型的场景。我们也实现了许多工厂,包括对工业园区、工业厂房等的快速三维建模。通过快速三维建模后,对现有的各种摄像头设备或者其他分配的信号进行连接,就形成了一个典型的数字孪生场景。

AI的优势在于,不需要设计师进行场景的三维重建,这是一项较为劳动力密集的工作。我们用普通的民用摄像头产品,甚至手机围绕现场走一圈就可以把场景快速地建立出来

而且这些部署的摄像头,可以实现三维高清定位,快速地标定至三维的空间位置中,这样不管厂区还是园区的数字化管理就会非常高效地进行。

数据化和硬件体验是两大挑战

《科创板日报》:“AI+XR”的结合应用还是处于初期发展阶段,您觉得可能还存在哪些挑战?

栾青:挑战主要有两个方面。

首先是体验。这是需要全行业一起解决的事情,包括大家常说的VR或AR内容生态,依赖整个行业一系列的技术提升,把整个体验和内容建立起来。

其次则是数据化。虚拟世界或者说数字世界的存在,最终要帮助到真实世界解决实际的问题。但挑战在于,很多的场景是具有长尾效应。比如在工厂,有些设备是在别的厂区见不到的,或者在这个特殊行业才拥有的,那就需要进行一系列长尾内容的数据化。如何高效率低成本识别不同的内容,并且实时的数据化到我们系统当中,这也是一大挑战

《科创板日报》:虚拟现实应用要真正发展起来的话,可能涉及到哪些关键产业链?

栾青:首先硬件的产业链肯定是第一步。必须采用大家习惯、能够日常使用的体验方式,才能普及。就像手机如果非常重,又很昂贵,那么大家不太可能用起来,很多应用也无从落脚。

所以,硬件成本的降低,以及重量、散热、耗能等的提升,仍然要不断去攻克的瓶颈。由此来看,光学显示,包括轻量化的芯片等,应该都会有较强的发展空间。同时,基于硬件的各种智能化,包括手势识别、面部驱动,三维人建模等内容工具,也亟待发展

内容生成平台也非常关键。三维比二维的内容制作要复杂很多。以前可能只有游戏厂商,需要做复杂的三维内容,但投入也是非常大的。如果我们希望走向全民普适,比如银行、商场、办事大厅等,都进入到三维数字世界之中,你发现成本就会变得非常巨大。各种各样高效的内容生产工具和平台也会有一轮需要被突破的过程。

此外,如果所有人都需要在三维互联网进行更深入地交流,那么大规模云端的协同性计算,也会有一个巨大的发展契机。当然,还包括经济系统、授权认证系统等,都要在这个体系下被建立起来。

看好数字文创和数字人

《科创板日报》:您预估成熟期需要多久呢?

栾青:现在还比较难预测。不过,在终极的数字世界建立之前,会有比较多的雏形形态,可以解决日常生活中比较多的问题

比如刚才提到的数字人在垂直领域的应用,已经可以消除很多服务体验和效率上的难点。并不一定非要有全新的硬件或者不同的内容生产生态。只要在专业领域做得比较好,就可以有效地提升生产效率。这种行业级别的应用,我们认为已经到来了。

全民的、普适性的三维互联网级别,可能还需要一定的发展周期,大家常说5年是一个硬件迭代周期,我们也拭目以待

《科创板日报》:目前比较有前景的应用,除了数字人之外还有哪些?

栾青:数字世界需要各种各样的内容,人是一方面,物是另一方面。把很多现实物品进行数字化,也已经成为一个重要的体验环节。

在这方面,数字文创拥有比较大的发展契机。我们已经与敦煌、故宫等大型IP合作,来进行数字内容的体验提升,更好地展示中国传统文化的魅力。

事实上,数字世界可以有更大的创造空间,展示现实文创产品展现不了的内容。过去是数字赋能实物,现在是实物赋能数字,通过AI/AR的方式,把虚拟的数字内容附着在实体上面,这是我们对数字文创的定义

《科创板日报》:您在人工智能从事研究工作多年,您认为人工智能对人类而言,所具有的最大意义是什么?

栾青:人工智能本质上模拟了人类大脑处理信号的方式。在人工智能出现之前,计算机只能处理数字化的信号,没有办法表达自己的思想,依然需要人对这些信号进行解析,才让其变得有意义。

人工智能出现,首先是把现实世界数字化。这样计算机在很多领域就能看懂现实世界的信号,而不用依靠人力。计算机可以自动地、主动去做一些事情,这样提升了数据处理的效率。其核心是解决了信息入口的问题。也就是原先需要人进行输入,现在整个世界的数据信息不断自动地流入到计算世界里。

当然,人工智能不只是解决入口问题,还要进行各种三维数字内容生成,这是另一价值所在。这方面,人工智能可以把许多重复性劳动替代掉,也是我认为未来重要的发展方向。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部