人工智能行业专题研究:三类人工智能企业或终将同台竞技

人工智能行业专题研究:三类人工智能企业或终将同台竞技
2022年01月15日 11:17 未来智库官网

(报告出品方/作者:安信证券,焦娟、夏瀛韬)

1.人工智能:将“人”由现实映射到虚拟世界的技术脉络之一

人工智能的本质是希望计算机具备像人类一样感知、处理与分析问题的能力。从人类应对外 界刺激所作出的反馈的流程来看,大概需要以下三步:1)通过眼睛、耳朵等感官获得外界 刺激;2)将信息传输至大脑进行处理,并基于大脑的处理结果与此前的经验积累,做出判 断;3)借助语言进行表达或者指导手、脚等四肢做出行动,对外界刺激做出反馈或者进行 互动。

参考人类处理问题的流程与能力来看,人工智能系统应当具备的三大核心模块为:

1)感知模块:类似于人类的眼睛、耳朵等感官一样,人工智能需要借助摄像头、传感器等 进行图像、声音等信息的收集,并将其传输至像大脑一样的数据处理中枢进行信息处理;

2)思考模块:类似于人类大脑,人工智能应该有数据处理中心对所收集的数据进行处理分 析,人类根据大脑处理后的信息,并基于一定的经验与知识对所处的环境进行判断,并 最终做出决策,所以在人工智能中,需要对计算机进行大规模的数据训练,使其具备一 定的知识积累,产生类似于人类的“经验”,从而具备对新接收的数据进行分析和判断的 能力;

3)行动模块:在做出判断后,人类通过语言或行动对外界做出反馈,那么人工智能则需要 借助语音输出或向硬件设备等发出信号指导其行动,对应语音合成等技术。

根据计算机所具备的能力,我们可以将其发展阶段划分为计算智能、感知智能、认知智能这 三个阶段:1)计算智能:计算机能够实现存储与计算,并作为传输信息的重要手段,比如 在过去一段时间内,计算机最大的发展是将一切信息都尽可能的数字化,从早期的计算与文 字,到发展至今的电商、娱乐等场景的数字化;2)感知智能:计算机开始看懂与听懂,并 能够做出一些判断及行动,比如 Siri 语音助手等;3)认知智能:机器能够像人一样进行思 考,并主动的做出行动,比如在完全自动驾驶场景下,汽车能够自己做出超车、转弯的行动 等。

站在当前时点来看,现实世界的数字化不断深入,我们认为计算机已经基本具备了计算智能, 当前阶段是帮助计算机从计算智能进一步走向感知智能,能够看懂与听懂外界环境并做出一 定的反馈;并随着知识的积累所带来的智能化的提升,使计算机由感知智能逐步向认知智能 的阶段进行演进。

移动互联网之后,新一轮现实映射到虚拟世界的探索中,我们认为硬件与 AI 分别是两种技 术脉络。硬件实时传输与人体机能相关的弯曲、力度、触感;AI 模拟人的大脑对人行为、动 作、表情的驱动。这两种技术脉络的结合应用,预计将开启此轮探索的软硬一体化的运行特 质。

2. 奠定当下的商业化的理论知识,可以追溯到 70 年前

2.1. 1943-2006 年:理论知识积累的时期,相关研究进展缓慢

回顾人工智能早期发展史,其可以追溯至 1943 年,直至 2006 年之前由于当时的算力受限 且数据不足,算法没办法充分发挥其作用,这一阶段主要是人工智能理论知识的启蒙与积累 阶段,期间也曾产生一些阶段性成果,但整体研究进展较为缓慢。其中,一些典型的理论积 累如下:

思想启蒙:1943 年,沃伦〃麦卡洛克和沃尔特〃皮茨发表了《神经活动中内在思想的逻辑 演算》,这启发了后来神经网络和深度学习的产生。1950 年著名的图灵测试诞生,按照“人 工智能之父”艾伦〃图灵的定义:如果一台机器能够与人类展开对话(通过电传设备)而不 能被辨别出其机器身份,那么称这台机器具有智能。1956 年夏天,美国达特茅斯学院举行 了历史上第一次人工智能研讨会,被认为是人工智能诞生的标志。会上,麦卡锡首次提出了 “人工智能”这个概念,纽厄尔和西蒙则展示了编写的逻辑理论机器。

从推理期至知识期,期间推出大量专家系统。20 世纪 50-70 年代,人们认为如果能赋予计 算机推理能力,机器就有智能,人工智能研究处于“推理期”,之后人们意识到人类能够进行判断、决策还需要知识,人工智能在 70 年代进入“知识期”,诞生了大量的专家系统如 Dendral,但由于当时的计算机有限的内存和处理速度不足以解决任何实际的人工智能问题, 导致研究缺乏进展,美国和英国相继缩减经费支持,人工智能进入第一次低谷。

第五代计算机项目:1981 年,日本经济产业省拨款 8.5 亿美元用以研发第五代计算机项目, 在当时被叫做人工智能计算机。随后,英国、美国纷纷响应,开始向信息技术领域的研究提 供大量资金。但是专家系统的实用性仅仅局限于某些特定情景。到了上世纪 80 年代晚期, 美国国防部高级研究计划局(DARPA)的新任领导认为人工智能并非“下一个浪潮”,拨款 将倾向于那些看起来更容易出成果的项目;此外第五代计算机项目宣告失败,人工智能进入 第二次低谷期。

2.2. 2006-2016 年:算法、算力与数据三重合力推动,人工智能取得重大突破

人工智能算法的开发通常离不开三个核心要素,即算法、算力、数据。2006-2016 年这十年 间,这三大核心要素均迎来了质的飞跃:

第一重飞跃:深度学习算法能够支持训练更大规模的神经网络。深度学习算法能够训练更大 规模的神经网络 2006 年 Geoffrey Hinton 和他的学生 Ruslan Salakhutdinov 在《科学》上发 表文章,给出多层神经网络更好训练方法,至此神经网络算法才开始真正具有深度。与过去 传统的人工智能算法相比,深度学习算法能够训练更大规模的神经网络,从而解决更复杂的 问题,而且随着数据规模的提升,规模越大的神经网络的深度学习算法表现出的效果越显著。

第二重飞跃:芯片发展遵循摩尔定律,算力得到质的提升。摩尔定律指出芯片上可容纳的晶 体管数目,约每隔 18 个月便会增加一倍,性能也将提升一倍。1945 年世界上第一台计算机 ENIAC 的速度是能在一秒内完成 5000 次定点的加减法运算,到 2007 年采用英特尔酷睿芯 片的个人电脑计算速度为每秒 500 亿次浮点运算,是 ENIAC 的 1000 万倍,体积和耗电量 却小了很多;到 2012 年全球最快的计算机 IBM 的红杉的计算速度为 1.6 亿亿次,比 19 个 月前竟提高了将近 6 倍。(数据来源:吴军《浪潮之巅》)通过以上几组数据可以发现,自 2006 年 Geoffrey Hinton 发布有关深度学习的文章后,计算机的算力得到了质的提升,可以有效 的支撑大规模的模型训练。

第三重飞跃:PC 互联网与移动互联网的发展为人工智能模型训练提供了庞大的数据积累。 PC 互联网的发展使用户的许多场景线上化,比如新闻讯息、邮件、电商等,产生了相当规 模的数据;而移动互联网又进一步地将智能手机等更多终端纳入互联网体系,并产生丰富新 的应用,使数据规模得到了进一步地增长。根据 IDC 预测,全球数据圈将从 2018 年的 33ZB 增至 2025 年的 175ZB。

三重合力推动人工智能在多领域取得技术突破,逐步开始具有商业价值。在更强大的算力支 撑下,通过大规模训练数据喂养的深度学习算法模型表现出更优异的效果,推动计算机视觉、 语音识别等领域取得了重大的技术突破,比如 2014 年香港中文大学汤晓鸥教授团队发布 DeepID 系列人脸识别算法准确率达到 98.52%,全球首次超过人眼识别率,突破了工业化应 用红线;根据易观数据,2009 年深度神经网络算法被应用于语音识别领域时,语音识别准 确率突破 90%,至 2016 年百度、搜狗等头部公司都先后宣布其语音识别率达到了 97%。这 一阶段,人工智能开始呈现出一定的应用价值,开始逐步走向商业化。

2.3. 2016 年至今:人工智能全面走向商业化应用,中国在应用场景优势突出

Alpha Go 打败李世石进一步推动人工智能走向大众,并引爆了资本的热情。2016 年 Alpha Go 打败了人类围棋世界冠军李世石,引发了全世界的关注,这是人工智能史上里程碑事件, 自此人工智能从学界开始走向大众市场。同时也推动一级市场投融资热潮,根据 IT 桔子数据, 2016 年国内 AI 投融资事件快速增加,融资总额较 2015 年近乎翻倍。2016-2018 年 AI 投融 资事件总数为 2917 起,投资总额为 4006.48 亿,为 AI 创业提供了强大的资本助力。

同时,各大科技巨头先后将人工智能确认为未来的重点发展战略。在国外以谷歌为代表,将 未来发展战略将从移动为先(Mobile First)调整为“人工智能为先”(AI First),通过内生增 长(发展自研算法体系 Tensor Flow 等)与外延收购(大规模并购人工智能领域公司,如 DeepMind)提升人工智能综合实力;国内以百度为代表,率先布局人工智能战略,并于 2016 年就推出百度大脑、飞桨算法等产品,建立起强大的人工智能底层基础。

全球各国都很重视人工智能,中国尤甚。人工智能引起了全球各国的关注,中国更是将人工 智能上升至国家战略的层面,给予行业的发展强有力的政策支持。政府不仅从 2015 年人工 智能应用发展初期,就将人工智能写入《中国制造 2025》、《“十三五”规划纲要》等重要政 府文件中,确定了人工智能在我国未来经济发展中的重要作用;还随着人工智能行业的不断 发展,对政策内容也持续进行细化,从顶层设计至创新成果转化路径,再到芯片、开源平台 等技术层面都有相应政策指导,为行业提供了清晰的路径指引。

政策支持等多重因素推动下,中国人工智能应用场景的发展尤为显著。政府对人工智能行业 的支持不仅体现在政策方面,同时政府也是人工智能应用的重要采购商,从商汤科技与旷视 科技的收入构成来看,2020 年营业收入占比最高的均为包含安防在内的城市管理场景。政 府的有力扶持、国内强大的数字基建能力叠加广阔的市场体系,中国人工智能应用场景遍地 开花。AI 被广泛应用至大数据研判、运筹优化、智能风控、人机交互等生产活动的各个环节, 特别是在政府、金融、互联网、交通等行业的渗透率较高,AI 所发挥的价值已被验证并且正 在进入规模化的阶段;在制造、能源等行业也已经产生了一些标杆案例,待进一步挖掘为典 型应用场景。对比国外在底层架构上的优势,我们认为中国在应用场景上的优势将尤为突出。

得益于国内丰富的应用场景,国内 AI 创业企业营收已达一定规模,开始密集进入资本化阶 段。国内以安防、金融、城市运维等为代表的的人工智能应用场景的快速发展也推动 AI 创 业公司的业绩增长,目前头部 AI创业企业的营收规模也达到一定的体量,开始积极准备 IPO。 我们统计了部分公司的 IPO 进展现状,目前商汤科技已经于 2021 年 12 月底在港交所成功 上市,成功摘下“AI 第一股”的称号,截止 2022 年 1 月 7 日,商汤市值达到 2450 亿港币, 较发行时上涨超过 90%;此外,旷视科技、云从科技、格灵深瞳、云天励飞已经通过上交所 审核,进入注册阶段;第四范式、创新奇智已在港交所提交招股书。整体来看,AI 创业企业 多处在 IPO 的最后阶段,再考虑商汤科技上市后超预期的股价表现,我们判断 2022 年将有 望迎来人工智能企业的上市潮。(报告来源:未来智库)

3. 基础层蓬勃发展,关注场景规模的增长

人工智能产业链主要分为基础层、技术层、应用层三个层级,其中:1)基础层以数据、算 力、算法为核心;2)技术层是建立在基础层的核心能力之上,通过打造一套人工智能系统 使机器能够像人类一样进行感知与分析,其中最关键的领域包括计算机视觉(图像识别与分 析)、语音识别与自然语言处理技术(语音识别与合成)、机器学习与深度学习(分析决策及 行动)等;3)应用层是将技术能力与具体场景相融合,帮助企业/城市管理者等客户降本增 效,目前主要应用的场景有泛安防、金融、医疗、自动驾驶等领域。

3.1. 基础层:算法实力大幅提升,ASIC 与云计算将进一步释放算力

人工智能算法的开发通常离不开三个核心要素,即深度学习框架、强大的数据运算能力、大 量的训练用数据,目前这三大基础要素的变化主要呈现在几个方面:1)算法:算法实力大 幅提升,目前 Tensor Flow、Pytorch 为主流算法框架,百度飞桨算法影响力不断增强;2) 算力:近年涌现出非常多定制化 AISC 芯片,进一步推动终端算力提升;另一方面云计算的 发展将更加充分地支撑超大规模的计算力;3)数据:人工智能快速发展的核心原因之一是互联网、移动互联网两个时代的发展实现了大规模的数字化,为算法的训练提供了充足的数 据资源。展望未来,5G 的到来将推动万物互联,数据连接量及规模将实现高速增长。以下 我们将重点介绍算法与算力的演进与现状:

3.1.1. 算法:算法实力大幅提升,Tensor flow 与 Pytorch 为主流框架

算法的基本原理。算法是指解决不同问题的特定模式。以最为典型的神经网络算法为例,它 可以简单理解为从输入层到输出层的一种函数关系。输入一张图片后,系统会经过 计算最终确定是什么进行输出,这里从输入图片到对应得出是 T-Shirt 之间的关系就代表着 解决该类问题的算法模型。模型内部可能是通过赋予前一层输入参数不同权重加总得出下一 层的每个节点(神经元)的数据,依次逐层计算,最终得出输出层结果。为了得出这一模型, 需要进行大量的训练,比如在此处案例中,需要输入大量带有标记的图片信息,让计算机自 己学习规律,从而分辨出图片中的是 T-shirt 还是动物等其他物体。当训练结果达到一定标准 时,模型可以进行使用。

近年人工智能算法实力得到大幅提升。以历代 AlphaGo 版本的实力对比为例:1)2016 年 3 月,AlphaGo 以 4-1 的成绩战胜世界围棋冠军李世石;2)2017 年 1 月,AlphaGo 以大师 (Master)为注册名,依次对战数十位人类顶尖高手,取得 60:0 的胜利;3)2017 年 10 月, 谷歌下属公司 Deepmind 在《自然》上发表论文,表示新版程序 AlphaGo Zero 在无任何人 类输入的条件下,从空白状态学起,能够迅速自学围棋 40 天后,击败所有此前的 AlphaGo 版本;4)2017 年 12 月,AlphaGo 研究团队提出了 Alpha Zero,它可以在 8 个小时训练击 败李世石版本 AlphaGo,也可以轻松击败训练 3 天时间的 AlphaGo Zero。

Tensor Flow 与 Pytorch 算法框架使用最为广泛,国产百度飞桨算法影响力逐步提升。算法 框架可以理解是算法模型的集合,是可以解决某些特定问题的工具集。为推动研发的进步与 生态建设,谷歌等大型公司及组织将自研的算法框架进行开源,目前主流的算法框架有谷歌 旗下的 Tensorflow 与 Keras、Meta(原 Facebook)旗下的 Pytorch、微软旗下的 CNTK、 伯克利大学推出的 Caffe 等,其中 Tensor Flow 与 Pytorch 是当前使用最为广泛的两个开源 算法框架。从国内看,百度 2016 年推出的自研飞桨算法框架也形成强大的开发者影响力, 根据 2021 年百度开发者大会公布的数据,目前接入的开发者已经超过 400 多万。

国内 AI 算法公司以自研框架为主,有望在应对复杂场景具有更快的反应能力。国内头部 AI 算法公司大多成立于 2014 年前后,当时 Tensorflow、Pytorch 还未开源,缺少相对成熟完善 的算法框架,因此各家公司的底层算法多以自研为主,比如商汤科技的 SenseParrots、旷视 科技的天元框架等。自研的算法框架一方面有效地支撑了公司自身前端业务,另一方面在面 对复杂的场景变化时,也保证了更快的反应能力,团队能够及时调整模型而无需等待开源算 法框架的更新,本质上也代表了 AI 算法公司在底层技术能力上更有优势。

3.1.2. 算力:芯片逐步走向定制化,云计算将进一步释放算力

GPU 处理大规模并行运算,在人工智能场景中更适用。通用芯片主要分为 CPU、GPU 两种 类型,两者的设计构造不同,适用场景有所差异:1)CPU 芯片中算术单元相对较小,控制 单元较多,主要用于处理小数据量的复杂逻辑运算;2)GPU 是图形处理芯片,控制单元较 少,算术逻辑单元较多,可用于处理大规模数据量的简单运算。2009 年吴恩达以及斯坦福 大学研究小组发现,由于 GPU 芯片中有大量的算术逻辑单元,具有更强的并行计算处理能 力,并于 2011 年吴恩达将其应用于谷歌大脑众取得了显著效果,此后纽约大学、多伦多大 学的研究人员均采用 GPU 加速器神经网络算法的训练,因此 GPU 芯片在人工智能算法训练 中应用更为广泛。

FPGA 与 ASIC 芯片因可定制化受到关注。FPGA(Field Programmable Gate Array),即现 场可编辑门阵列,其设计初衷是为了实现半定制芯片的功能,即硬件结构可根据需要实时配 臵灵活改变。相较于 CPU、GPU 芯片,FPGA 芯片的灵活性高、性能强、能耗低,但是价 格更高,因此也存在着明显缺陷。近年来,科技巨头纷纷在为人工智能算法定制的 ASIC 芯 片上发力,比如谷歌推出了适配 Tensor Flow 算法的 TPU 芯片、高通的 Cloud AI 芯片、英 伟达的 Teala 系列芯片等;国内也涌现出一批 AI 芯片厂商,不仅包括中星微、寒武纪、海思 半导体等芯片设计厂商,还包括百度、阿里等互联网公司,以及 AI 算法公司如依图科技、 商汤等。ASIC 针对不同的人工智能场景进行了定制优化,能够达到性能更强,同时能耗更 低的效果。

各类芯片各有场景需求,预计 ASIC 将逐步成为主流。人工智能算法的应用简单可以概括为 训练与推理两个阶段,其中一般训练阶段需要通过多轮迭代得出最优的模型,可能会遇到大 规模的并行运算;而推理阶段主要做逻辑判断,相较而言数据需求量比较小,此时使用 CPU 芯片、FPGA 芯片处理有时更合适,所以不同场景下对各类芯片均具有一定的需求。整体来 看,未来由于人工智能场景不断增长,将导致的芯片需求增加,且对效率有更高要求,因此 预计定制化的 ASIC 芯片将成为主流。

此外,云计算也为超大规模的算力需求提供了一种解决方式。云计算支撑下,应用场景可以 不受硬件终端性能限制,进行大规模的数据运算;同时在云端可以实现不同数据中心的算力 共享,能够集成更大规模的数据资源作为底层基础设施,支撑超大规模的模型调度需求。以 商汤科技为例,公司在上海临港建立的人工智能算力基础设施——商汤智算中心(AIDC)将 于 2022 年初投入使用,能够提供每秒 3.74 百亿亿次浮点运算的总算力,进一步夯实了公司 的人工智能基础设施。

3.2. 技术层:以计算机视觉为核心,广泛作用于多个场景

人工智能的三大核心技术分别是计算机视觉、自然语言处理、知识图谱,主要是帮助计算机 看得懂、听得懂、具备一定的推理与逻辑能力,是推动计算机具备感知智能的关键技术。

3.2.1. 计算机视觉:人工智能最大细分市场,在安防领域应用最为广泛

计算机视觉为人工智能领域最大细分市场,预计行业规模超过千亿。根据艾瑞咨询测算,2020 年计算机视觉市场规模为 862.1 亿,是人工智能产业最大的细分市场,占比为 57%;预计至 2025 年计算机视觉行业市场规模将达到 1537.1 亿,年均复合增速为 12.26%;同时其所带 动的产业规模将达到 4858.4 亿,市场空间广阔。

计算机视觉应用广泛,安防影像分析占据市场份额最大。计算机视觉行业的应用主要分为七 大类,包括安防影像分析、广告营销分析、泛金融身份认证(解决方案)、互联网娱乐、泛金融身份认证(云服务、SDK 等)、手机及创新领域等,其中安防影像分析占据一半以上的 市场份额,高达 67.9%,其他应用如广告营销分析、泛金融身份认证(解决方案)、互联网 娱乐、泛金融身份认证(云服务、SDK 等)、手机、创新领域的占比分别为 18.1%、4.0%、 3.8%、3.7%、1.7%、0.9%。

3.2.2. 自然语言处理:语音助手快速发展,广泛应用于物联网

智能语音转写是自然语言处理中相对基础且应用较为广泛的一种场景。智能语音转写是语音 识别的一种,很多公司以此为基础打造了非常多成熟的产品,比如科大讯飞旗下的“讯飞听 见”、搜狗旗下的“搜狗听写”、迅捷文字语音转化器、灵云听语等,目前该类产品的语音识 别准确率可达 98%,在日常的办公、学习中得到了广泛的应用。围绕着这一功能,这些公司 都形成了全面的产品体系,并发展出较为成熟的商业模式。

语音助手得到快速发展,被广泛应用于物联网。苹果在 2016 年开发者大会上发布了 Siri 功 能,用户可以使用 Siri 查询路线、拨打电话、发送信息等。Siri 作为一个语音助手,其背后 的核心技术就是自然语言处理。根据 AI 前线数据,通过对多语言说话者的 12.8 万个带有相 应交互上下文的口述话语内部语料库进行严格训练,Siri 在同时执行自动语音识别和说话者 识别的任务时平均准确率达到 87%。在 Siri 的示范效应下,语音助手得到了快速发展,被广 泛应用于智能家居、智能车载等物联网领域,比如百度目前以 Dueros 为基础,打造了非常 多元的硬件体系,目前在智能家居领域支持超过 60 多个品类的产品接入。

3.3. 应用层:城市治理相关占比近半,关注传统场景渗透率提升与新场景突破

人工智能产业规模突破千亿,政府城市治理与运营场景占比接近一半。根据艾瑞数据测算, 2020 年中国人工智能产业规模达到 1512.5 亿,同比增长 38.94%;预计 2025 年中国人工智 能产业规模将增长至 4532.6 亿,年均复合增速为 24.55%。同时,预计 2023 年由人工智能 所带动的相关产业规模将突破万亿,人工智能行业的发展将成为推动经济增长的重要力量。 从下游场景来看,政府城市治理和运营为最大的应用场景,市场份额接近一半(49%),互 联网、金融行业的市场份额分别为 18%、12%,排名第二、三位。

展望未来,关注传统场景的大规模智能化升级浪潮及新型场景的快速突破。人工智能在不同 场景中的渗透情况存在较为明显的差异,在安防、金融等领域等应用相对成熟且渗透率较高, 人工智能所发挥的价值主要是通过智慧化改造帮助企业降本增效,在这些场景中,如何通过 不断解决客户痛点建立行业影响力来保证持续的订单与供给上的规模效应将成为行业下一 阶段主流;同时人工智能也在塑造新的产业生态,比如智能驾驶、内容生产(如虚拟数字人 的生成与驱动)等,这些新业态的发展与技术突破将为行业带来新的增量与弹性。

以虚拟数字人创作为例,涉及 NLP、TTS、知识图谱等多项人工智能技术。具体而言,虚拟 数字人要有感知,包括视觉感知与听觉感知,即能看得见、听得懂、会思考、能回答、能呈 现,涉及多维度的技术点,比如看得见就涉及识别物体、识别表情、识别图像等;听得见指 的是语音识别,将听见的声音转换成文字去理解,达到听得懂状态,涉及到自然语言理解 (NLP);理解之后还需进行回复,涉及到知识图谱;如何回复(是生成声音还是生成图形) 涉及到语音合成(TTS)。

AI 的价值在于大幅降低了制作成本、简化了制作流程。即使突破了静态下高仿真的瓶颈,如何让数字虚拟人自然地交互,也是一大难题。人类可以从表情、肢体中读取丰富的非语言信 息,因此数字虚拟人的表情、动作中一些细微的不自然都能被人们所察觉到。比如一个简单 皱眉,将牵动骨骼、肌肉、皮肤的一系列变化,若用传统的手工方式去调整,工作量极其巨 大。此时,AI 的价值就体现了,可以大幅降低工作量与制作成本。

4. 三类企业各有所长,或终将同台竞技

在人工智能发展的大浪潮中,入局者众多,目前行业内的参与方主要分为三类:1)人工智 能初创企业,如商汤科技、旷视科技、云从科技、依图科技等 AI 四小龙,它们以顶尖的人 工智能技术见长,创始人均具有深厚的前沿技术背景;2)向 AI 技术方向升级的传统硬件厂 商,如海康威视、大华股份等,主要为客户提供软硬一体的综合智能解决方案;3)互联网 科技巨头,如字节跳动、百度等,基于既有业务不断夯实的算法能力,并逐渐将该能力拓展 至新的应用场景。整体来看,行业参与者众多且资源禀赋各异,呈现出百花齐放的竞争态势。

4.1. 互联网科技巨头: 资源最为全面,竞争优势突出

互联网科技巨头发展人工智能一般是起源于自身的业务需要,比如谷歌、百度搜索业务对于 人工智能具有较大需求,随着数据积累和业务能力提升产生价值外溢,逐步对外提供人工智 能解决方案,并在各个场景进行业务尝试与布局。此处我们主要以谷歌、百度为例介绍该类 企业发展情况,具体如下:

4.1.1. 谷歌:AI First,人工智能领域综合实力 Top1

2017 年在 Google O/I 大会上,谷歌提出公司战略将由 Mobile First 转变为 AI First,谷歌通 过投资与引入人才打造了强大的人工智能体系。2016 年 AlphaGo 打败围棋选手李世石,推 动人工智能受到市场广泛关注,是人工智能发展历程中重要的里程碑事件,而 AlphaGo 的背 后就是谷歌于 2014 年收购的开发团队 DeepMind;2015 年谷歌开发深度学习系统 Tensor Flow,目前是深度学习领域使用最为广泛的深度学习框架之一。

发展至今,谷歌在 AI 研发人员、学术论文数量等都处于行业领先水平,根据沙利文评估, 谷歌在综合 AI 的技术实力与落地能力两个维度都在科技巨头中处于行业前列,具有非常强 大的 AI 综合实力。

在底层技术与架构方面,谷歌采用软件与硬件结合的方式,为企业及开发者提供开源深度学 习框架 TensorFlow 及相对应的 TPU(Tensor Processing Unit) 芯片,其中

Tensor Flow是谷歌AI及机器学习的核心算法框架,谷歌将该算法进行开源,目前Tensor Flow 是全球范围内使用最为广泛的 AI 算法框架,被广泛应用于 PC、移动应用的开发 场景中;

TPU 是谷歌专门为深度学习框架 Tensor Flow 所推出的芯片,随着人工智能场景所处理 的数据量急剧增长,传统的通用处理器芯片有些性能不足,TPU 的芯片相较于 GPU 芯 片而言,可以采用矩阵计算的方式,能够同时处理更强大的数据量级,更加适应 AI 时 代爆发增长的数据规模。

在应用层,谷歌不仅将 AI 的技术能力全面应用于自身的各项前端业务,比如谷歌搜索、 Youtube、谷歌翻译、谷歌地图等,同时在安卓系统的迭代上不断融入 AI 的技术能力,自 2018 年谷歌发布 Android 9.0 开始,基于 AI 的功能逐渐增加,包括 Google Assistant、为用户提 供软件预测、自适应电池容量、智能相册标记功能等。

4.1.2. 百度:中国最早 all in AI 的科技巨头,率先抢占 AI 时代

百度布局 AI 较早,并逐步释放 AI 能力。百度先于阿里、腾讯布局 AI,以搜索场景为起点, 现已经形成完整的 AI 生态:1)2010 年以前,百度技术的迭代主要围绕其搜索业务开展。 2010-2015 年,百度持续布局 AI 技术,并逐步向 NLP、机器翻译、语音、图像、知识图谱、 机器学习等技术研发;2)2016 年百度大脑发布,并对外开放 AI 核心技术,不断赋能各个 产业;3)2016 年百度还推出飞桨深度学习平台,赋能自身移动生态,提高搜索效率,根据 2019 百度世界大会,百度搜索结果的首条满足率在 2017-2019 年分别达到 16%、37%、58%; 4)2018-2021 年,百度通过组织架构升级及战略升级,不断推动“云+AI”战略,通过自身 AI 体系中的飞桨深度学习平台与百度昆仑芯片在软硬件方面分别积累了算法与算力等方面 的优势,推动百度智能云实现“云智一体”。

目前百度已经形成了全方位的人工智能生态体系,以百度大脑为底层技术核心引擎,在飞桨 深度学习平台、百度昆仑芯片、DuerOS 平台与智能硬件的加持下,不断深化 AI 技术在 B 端客户侧的商业化,并通过 AI 赋能云服务,以百度智能云为载体,加速 AI 在各行业的商业 化。具体来看如下:

在芯片方面,2018 年百度正式推出百度昆仑芯片,并于 2019 年下半年流片成功,2020 年 初实现量产,2021 年 8 月,百度宣布昆仑第二代芯片实现量产。高性能、低成本的昆仑芯 片可赋能多个业务场景,助力百度多个业务协同发展,例如云智一体的百度智能云、Apollo 自动驾驶开放平台、DuerOS 等。

在算法方面,TensorFlow、PyTorch 以及百度旗下的飞桨 PaddlePaddle 深度学习平台是被 最广泛使用的三大 AI开源平台,其中 TensorFlow、PyTorch 分别为国外的 Google、Facebook 旗下的平台,而百度飞桨深度学习平台则是市场三强中唯一国产品牌。根据百度世界 2021 大会,截至 2021 年 8 月,飞桨的开发者数量累计达到 360 万,开发了 40 万个 AI 模型,累 计服务 13 万企事业单位,覆盖工业、农业、医疗、城市管理、交通、金融等众多领域。

在平台层面,百度大脑以昆仑芯片为硬件,以飞桨为开源框架,以数据库为发动燃料,使其 成为底层支柱;通过整合内部开发的用于语音识别、计算机视觉、NLP 与知识图谱的算法, 向合作伙伴及开发人员开放其技术供前端的业务场景进行调用。

在应用场景方面,百度大脑在提升搜索等前端业务效率的同时,重点支撑 Apollo、DuerOS、 智能云三大平台,分别代表着百度在智能驾驶、物联网、其他企业应用场景方向的布局:

Apollo:2017 年推出全球首个自动驾驶开放平台 Apollo。公司明确了 Apollo 智能驾驶 业务的三种商业模式:1)为主机厂商提供 Apollo 自动驾驶技术解决方案,助力车企快 速搭建自动驾驶能力,目前百度 Apollo 自动驾驶产品已经迭代至 6.0 版本,是目前国内 互联网公司中发展时间最早、积累最为深厚的自动驾驶市场的领先者;2)百度造车, 端到端地整合百度自动驾驶方面的创新,如与吉利展开合作,成立智能电动汽车公司集 度汽车;3)共享无人车,百度无人车商业化进程一直在加速,Robotaxi 已开启常态化 商业运营,截至 2019 年年底,百度无人驾驶车队已有 300 辆车,且在 13 个城市开始 测试;

DuerOS :DuerOS 是百度度秘事业部研发的对话式人工智能系统。2015 年,机器人 助理度秘(Duer)首次亮相。2017 年,对话式人工智能操作系统 DuerOS 发布,并与 海尔、美的、联想等合作,赋予设备语音交互功能,实现设备智能化。2018 年,百度 参投 BroadLink,推进“AI+IoT”产业发展。2019 年,小度助手 5.0 发布,同时推出小 度智能音箱大金刚、小度智能音箱 Play 及小度在家 1C 4G 版。2021 年 8 月,百度继续 推出智能巨屏电视 V86、小度主动降噪耳机等产品;

智能云:随着产业智能化的逐步深入,百度逐步形成从纯 AI 技术架构发展到软硬件协同对接,从 AI 本身发展到 AI 与大数据、云计算相结合,使得百度可对外提供多种云产 品与云解方案。目前百度智能云已经在智慧工业、智慧金融、智慧城市、智慧医疗等多 个领域落地,根据 IDC 数据,2020 年百度智能云在中国公有云 Iaas 市场份额为 3.7%, 排名第七;在中国 AI 公有云市场份额为 33.3%,排名第一,百度在“云智一体”市场 上的优势更为突出。(报告来源:未来智库)

4.2. AI 创业企业:多以自研框架为主,技术优势突出

深度学习算法推动人工智能在计算机视觉、语音识别等领域的技术突破,从而带动了一批 AI 创业企业先后成立,如“AI 四小龙”中的商汤科技、旷视科技、云从科技、依图科技等一批 公司在 2014 年前后成立,其创始人多来自学界或具有深厚的科研背景,开启了人工智能领 域的技术创业。

4.2.1. 商汤科技:以强大底层基建支撑长尾场景布局,规模效应初现

2014 年3 月,香港中文大学多媒体实验室的汤晓鸥团队发布 Gaussian Face 人脸识别算法, 在全球首次突破人眼识别能力,将计算机视觉能力进一步向前推进。2014 年 10 月,汤晓鸥 带领团队创立商汤科技,开启了将实验室成果推向市场的商业化路径。发展至今,商汤科技 已经成为行业领先的人工智能软件公司,总部位于上海及香港,业务辐射国内及日本、新加 坡等地。公司通过向客户销售人工智能软硬一体产品及相关服务获取收入,2020 年已经实 现 34.46 亿收入,服务全球超过 1200 名客户。

商汤科技专注于计算机视觉和深度学习技术,独创了“1(基础研究)+1(产品及解决方案) +X(行业)”的商业模式,坚持以原创基础研究为支撑,以自主研发的深度学习训练框架 SenseParrots 为核心,逐步打造出一套通用人工智能基础设施 SenseCore。同时公司也通 过自研芯片与传感器,以及自建超算中心 AIDC 为 SenseCore 提供强大的算力支持。得益 于人工智能底层基建的不断完善,截止 2021 年,公司的商业化人工智能模型数目已经超过 22000 个,专利及专利申请数目超过 8000 个,具有强大的技术研发能力。

基于人工智能基础设施平台 SenseCore,公司已经将商业化应用场景拓展至智慧商业、智慧 城市、智慧生活、智能汽车四大核心领域,为客户打造针对性人工智能综合场景解决方案。 具体来看,其产品矩阵包括:

1)面向智慧商业的商汤方舟企业开放平台:主要满足制造、基础设施、金融等行业客户在数据感知、流程自动化等方面的需求,从而提高企业运营效率;

2)面向智慧城市的商汤城市开放平台:主要为城市管理者提供城市运营系统,通过 AI 模型 将来自于物联网设备的监测信息转化为运营洞察、事件警报及管理行动,帮助提高城市运营 的安全性、便利性等;

3)面向智慧生活的 SenseME、SenseMars、SenseCare 平台:其中 SenseME 主要赋能 IoT 设备,使其具备感知智能及内容增强的能力;SenseMars 主要赋能手机、AR/VR 设备、智 慧大屏,提升用户体验;SenseCare 平台主要为诊断、治疗及康复等医疗服务进行赋能;

4)面向智慧汽车的商汤绝影智能汽车平台:主要为车企客户提供 ADAS 系统、智能座舱系 统以及帮助其实现车辆及道路、交通信号等及路侧设施的检测等自动驾驶相关的技术。

得益于 SenseCore 成熟完善的人工智能模型生产流程,公司的研发效率不断提升。截至2021 年 6 月 30 日,公司已积累生产超过 22,000 个驱动不同应用的商用人工智能模型,涉及多个垂 直行业;2019-2020 年公司每年生产的商用模型数分别为 1152 个、9753 个, 2021 年上半年 进一步提高到了 8377 个;2019-2020 年研发人员每人年均生产的商用模型数量分别为 0.44 个、3.45 个,2021 年上半年又继续提高到了 5.24 个。

4.2.2. 旷视科技:重点布局三大物联网场景,打造“算法-软件-硬件”协同模式

旷视科技创立于 2011 年,其三位创始人为印奇、唐文斌、杨沐,他们是来自于清华大学计 算机科学实验班(“姚班”)同学,在计算机视觉领域具备相关的研究与从业经历。公司发展 至今已成为全球领先的人工智能产品和解决方案公司,参与制订了 20 余项人工智能相关的 国家、行业及团体标准,服务数十万开发者和超过 3000 家行业客户,业务遍布全球。

公司自主研发的新一代 AI生产力平台 Brain++,包括深度学习框架 MegEngine(旷视天元)、 深度学习云计算平台 MegCompute 以及数据管理平台 MegData,将算法、算力和数据能力 融为一体,助力AI技术实现了从算法生产到应用的全流程化和规模化供给。依托于 Brain++, 公司构建了强大的 AIoT 产品体系,通过“算法-软件-硬件”的协同设计模式,实现了从 IoT 连接、数据处理、数字孪生到应用赋能的功能集成。

基于业界顶尖的人工智能基础研究与工程实践能力,公司以物联网作为人工智能技术落地的 载体,通过构建完整的 AIoT 产品体系,面向消费物联网、城市物联网、供应链物联网三大 核心场景提供行业解决方案:

1)消费物联网:提供基于移动终端的解决方案和基于云端 SaaS 的解决方案,通过 AI 技术 赋能摄像头,提高客户运营效率,进而改善持有移动终端的用户体验。

2)城市互联网:提供应用于智慧城市及智慧建筑管理的解决方案,智慧城市管理协助政府机构改善公共安全、优化交通管理、改进城市资源规划;智慧建筑管理则可协助企业加 强物业安保,提升物业住户和访客体验。

3)供应链互联网:提供智慧物流解决方案和智慧工业解决方案,通过AI技术赋能操作系统、 机器人与自动化装备,帮助企业实现仓库、工厂的数字化、智能化升级,提高供应链效 率。从而帮助物流公司和制造商有效部署、协调和管理机器人及自动化装备,以支持复 杂的物流和生产任务。

整体来看,旷视科技从人工智能算法出发,围绕三大重点场景深度布局“算法-硬件-软件” 一体化的生态,具有较强的业务落地能力。同时,相较于其他公司,旷视科技在供应链物联 网领域形成差异化布局,具备一定的竞争优势。

4.3. 传统硬件厂商:推进智能化业务布局,在客户资源与产品交付方面占优

在人工智能对各个场景进行智能化改造的过程中,许多传统硬件厂商、ISV 等公司通过跟进 人工智能技术的发展,完成了自身产品矩阵的智能化升级,并抓住行业增长的机遇实现了业 绩的增长。此处,我们以海康威视为代表,对这类公司进行简要介绍:

4.3.1. 海康威视:安防龙头向智能化升级,积极布局全方位产品生态

安防龙头全面向智能化方向升级。海康威视成立于 2001 年,2010 年5 月于深交所上市,发展 至今二十余年,其业务发展可以概括为三大阶段:

1)数字化发展阶段(2001-2010 年):公司推出后端视频压缩产品,并进军前端摄像头业务;

2) 网络、高清化发展阶段(2010-2015 年):公司从传统模拟 DVR 加矩阵方案向高清化、 IP 化解决方案发展;

3) 智能化发展阶段(2015-2021 年):公司研发的人工智能、云计算、5G 等技术逐步落地,推 出的安防产品进入智能化阶段。

聚焦于智能物联网、大数据服务和智慧业务,致力于为客户提供从软硬件一体化的项目解决方 案,其中:

1) 硬件产品可分为边缘节点产品、边缘域产品与云中心产品三个部分:边缘节点产品聚焦全面智能 感知,包括前端摄像机产品、智能交通与移动执法产品、门禁与对讲产品、报警产品等;边缘域 产品服务于场景化智能落地,包括多功能一体化智能设备和智能视频传输设备;云中心产品服务 于数据中心建设,包括通用计算、智能计算、通用存储、流式存储和大屏显示等产品;

2) 软件产品可分为软件平台、智能算法、数据模型和业务服务四个部分:软件平台提供底端支持, 包括云计算、云存储平台等基础软件平台,AR 实景指挥平台、VR 全景应用平台等跨多行业通 用软件平台与 100 多个行业应用软件平台;智能算法服务于人工智能分析,包括可用于多个行 业智能应用开发的通用算法和针对不同行业需求开发的行业专用算法;数据模型基于物信融合数 据资源平台,为各行各业提供大数据应用服务;业务服务针对部分行业提供系统运维服务、数据 工程服务与业务运营服务。

面向三大客群,助力客户数字化升级。2018 年海康威视进行业务组织架构重组,将国内业 务分为公共服务事业群(PBG)、企事业事业群(EBG)、中小企业事业群(SMBG)三大业 务群,分别面向不同的客户,助力其实现数字化转型升级:1)公共服务事业群(PBG)面 向公共服务领域用户,赋能智慧城市、智慧警务、智慧交通、智慧城管等多方面智慧业务, 推动行业和城市数字化转型;2)企事业事业群(EBG)面向企事业用户,基于 AI Cloud 架 构,为用户提供智能物联、物信融合技术,推出传统信息化、设备设施物联、场景智能物联 融于一体的数字企业解决方案;目前已在煤矿冶金、商业地产、制造企业、烟酒盐、物流、 零售连锁、教育教学等多个行业用户中实践落地;3)中小企业事业群(SMBG)面向中小 企业用户,致力于打造泛安防产业互联网,由海康互联和海康云商两大主线平台构成泛安防 互联网产品矩阵,通过生产端、流通端、营销端、使用端的全链路数字化,为中小企业提供 多元应用场景下的泛安防服务。此外,公司还通过八大创新业务进行前瞻性业务布局,包括 海康机器人等,形成完整的业务框架体系。

4.4. 三类企业对比:当前共享增长红利,长期看或终将同台竞技

我们认为算法、数据、客户资源是当前阶段较为重要的三项能力,综合三类企业公司的发展 历史、业务模式来看,我们尝试推演三类公司在算法、数据、客户资源三个维度上各自的优 劣势:

1)互联网科技巨头:互联网巨头在人工智能方向上的能力最为全面,本身具有较强的算法 能力,又掌握了大量的数据资源(特别是 C 端数据),并且大多公司已经具有国民认知度, 品牌效应显著,所以在竞争中占有较大优势;但是互联网巨头多数有自身业务基本盘,比如 阿里的电商、字节跳动的短视频等,目前公司更多是将人工智能作为底层支撑进行布局,而 不完全是独立业务线,未来可能面临资源分配问题;

2)AI 创业企业:其优势在于具有突出的技术研发能力,且多数以自研框架为主,在一些特 定场景会体现出算法能力的优势;不足在于公司的发展时间相对较短,缺少行业与客户的积 累,销售渠道布局相对薄弱,可能在竞争中处于相对弱势;

3)传统硬件厂商等:以海康威视为代表的传统厂商在特定场景中有多年的业务积累,具有 成熟的销售渠道与更强的客户拓展能力,以及对产业链上下游的理解更深。以此为基础,公 司也在寻求智能化升级,打造从硬件到软件一体的解决方案,形成了较强的产品交付能力。 其相对弱势的地方主要体现在算法能力上,需要一定时间追赶 AI 算法公司。

当前共享增长红利,长期看或终将同台竞技。目前人工智能仍具有较大的增长空间,如前所 述,其驱动力来自于传统场景的渗透率提升及新业态的不断涌现与增长。在行业增长的背景下,三类公司各凭资源禀赋从不同方向切入,我们认为在一段时间内三类公司都将充分受益 于行业增长红利,并逐渐在竞争中找到适合自己的场景定位与角色定位,去构建自身竞争壁 垒。从长期来看,行业增长逐步放缓,三类公司或终将走向竞争,体现在客户资源的竞争或 价值链的利益分配上,彼时竞争格局有望更加清晰。

5. AI 创业企业面临的共同课题

5.1. 盈利的压力:强化获客与商业化能力,重视规模化产出水平

目前 AI 四小龙都处于亏损状态,分析其财务表现报表来看,主要问题在于研发投入较高等 原因所导致的亏损问题。从财务视角来看,实现盈利的路径主要来自于收入端的快速增长与 费用端显著下降,反映在业务层面,我们认为可以重点关注以下两个方面的变化: 关注一:客户拓展与模式创新带来的收入增长。从收入端的增长来看,一方面需要企业能够 深耕应用场景与产业链上下游,为服务的客户提供精细化的能力,打造标杆性案例,并通过 客户口碑传播不断拓展新的客户资源;另一方面可以通过商业模式的创新,找到更契合公司 核心竞争力的盈利模式,比如目前主流的收入模式为项目制或者软件销售,未来是否有可能 演化出咨询模式、平台模式等。

关注二:规模效应逐步显现推动费用率显著下降。人工智能行业的最大的成本与费用主要来 自于人员成本,背后的原因在于:一方面自研算法框架需要投入大量人员进行基础研究,以 保证技术的持续领先;另一方面是由于场景复杂性所导致的底层模型的复用率不高。提高模 型的复用性,减少个性化研发的需求数量,从而降低对研发人员的需求,是未来人工智能企 业扭亏为盈的关键之一。

综上,对盈利能力的关注将推动 AI 算法公司在加大获客能力的同时,也将考虑如何規模化、 低成本地生产高性能的 AI 模型。

5.2. 路径的分歧:场景垂直化 or 产业链分工化,终将面临选择

人工智能场景落地复杂且业务链条长,未来或将产生一定的业务路径分歧。AI 技术的落地可 能带来颠覆性的业务变革,所以算法需要与所落地的场景有深度的融合,前端场景的细微变 化都可能带来后端技术与算法的调整,对于单个厂商而言,既需要考虑与业务场景的融合, 又需要从技术层面具备适应业务场景变化的能力,同时还需要保证与硬件设备具有较高的兼 容性,以及落地施工的工程能力,所涉及的业务链条较长。如果从规模经济的角度来看,单 一的公司很难做到对多元的业务场景和完整的产业链条的兼顾,所以在追求业务扩张与规模效应的大背景下,我们判断上述入局的厂商势必需要进行一定的取舍。这种取舍将主要沿着 两条路径进行:一是沿着场景进行取舍,从而产生业务场景的垂直化;二是沿着产业链环节 进行取舍,从而带来产业链的分工化:

1)路径一:场景分化

全场景布局 or 垂直场景?以城市与商业为核心,细分行业上有所差异。目前商汤科技的应 用场景最为全面,覆盖智慧城市、智慧企业、智慧生活、智能汽车四大场景,其中智慧城市 与智慧商业为核心。AI 四小龙中的其他三家公司除了在城市与商业上也有布局外,在部分场 景上已经存在差异化,比如旷视科技差异化布局智慧物流、智慧仓储等供应链物联网,云从 科技在金融领域较为突出,依图科技在智能医疗方向投入较多。

2) 路径二:产业链分化

软硬一体 or 软件为主?产业链环节不同,导致业务毛利率水平存在差异。人工智能可能对 应用场景带来颠覆性的改变,因此发展初期多以定制化方案为主,多采取软硬一体的项目制 合作方式。旷视科技深耕于三大重点场景,打造了“硬件-软件-算法”协同的模式,与行业 更贴近,能够提供的服务更加综合,但是由于存在硬件成本导致毛利率相对较低,2021H1 旷视科技毛利率为 34.44%。而商汤科技在招股说明书中表示,公司将采取优先推广软件的 销售策略,未来将更倾向于提供软件服务,也推动了公司毛利率的明显上升,2021H1 毛利 率提升至 72.95%。

我们推断未来看不同 AI 企业是适合采用软硬一体的商业模式还是以算法等软件为主的商业 模式,核心在于其所处行业客户所需要的产品是以标准化为主还是定制化为主,比如在安防、 智慧社区等场景中,产品需要结合客户的需求进行定制化,可能更适合软硬一体的解决方案; 而在医疗、自动驾驶领域,产品可以被标准化,则通过售卖标准化的软件产品有望获得更高 的毛利。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】。

财经自媒体联盟

新浪首页 语音播报 相关新闻 返回顶部