信创系列之大数据,分布式数据库产业链跟踪梳理笔记…

信创系列之大数据,分布式数据库产业链跟踪梳理笔记…
2023年05月23日 17:47 优塾君

【产业链地图,版权、内容与免责声明】1)版权:版权所有,违者必究,未经许可不得翻版、摘编、拷贝、复制、传播。2)尊重原创:如有引用未标注来源,请联系我们,我们会删除、更正相关内容。3)内容:我们只做产业链研究,以服务于实体经济建设和科技发展为宗旨,本文基于各产业链内公众公司属性,据其法定义务内向公众公开披露之财报、审计、公告等信息整理,不采纳非公开信息,不和任何利益关联方接触,不为未来变化背书,不支持任何形式决策依据,不提供任何形式投资建议。我们力求信息准确,但不保证其完整性、准确性、及时性,亦不为任何个人决策和市场变化负责。内容仅服务于产业链研究需求、学术讨论需求,不提供证券期货市场之信息,不服务于虚拟经济相关人士、证券期货市场相关人士,以及无信息甄别力之人士。如为以上相关人士,请务必取消对本号的关注,也请勿阅读本页任何内容。4)格式:我们仅在微信呈现部分内容,标题内容格式均自主决定,如有异议,请取消对本号的关注。5)主题:鉴于工作量巨大,仅覆盖部分产业,不保证您需要的产业链都覆盖,也不接受任何形式私人咨询问答,请谅解。6)平台:内容以微信平台为唯一出口,不为任何其他平台负责,对仿冒、侵权平台,我们保留法律追诉权力。7)完整性:以上声明和本页内容以及本平台所有内容(包括但不限于文字、图片、图表、产业链地图)构成不可分割的部分,在未详细阅读并认可本声明所有条款的前提下,请勿对本页面以及本平台所有内容做任何形式的浏览、点击、转发、评论。

产业升级、补链强链

已积累1000+篇战略新兴产业链梳理笔记

bgys2015

数据库,简单来说就像生活中一个存放货物的仓库,我们要按一定的规则把物品整整齐齐的摆好,这样就方便我们去检索出货(查数据)。

常见的数据库就是每个人都用过的Excel文档,一个文件可以看成一个数据库,每个 sheet 就是数据表,表里的列就是字段,每一行就是存储的数据。

数据库的分类方式较多,可以按照部署方式、数据模型、架构模型、业务负载特征等进行分类。不同分类方式间又可以互相组合,例如:云部署的分布式分析型数据库、本地化部署的集中式关系型数据库等。

编辑

添加图片注释,不超过 140 字(可选)

图:数据库主要分类方式

来源:申万宏源

现阶段来看,数据库演进阶段处于分布式数据库阶段。

编辑

添加图片注释,不超过 140 字(可选)

图:数据库演进

来源:华泰证券

分布式数据库产业链各环节,包括:

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:分布式数据库产业链

来源:并购优塾

上游——关键产品主要是CPU芯片、服务器主机、存储设备、操作系统等基础软硬件行业。

目前国内主要使用IBM Powe小型机,以及Intel、AMD等芯片。国内的代表公司为:CPU 主要包括飞腾、龙芯、申威、鲲鹏、海光、兆芯等品牌,服务器主要包括浪潮、长城、曙光、联想等品牌,操作系统则有麒麟软件、统信软件等厂商。

编辑

添加图片注释,不超过 140 字(可选)

图:服务器厂商全球市占率

来源:IDC、西部证券

中游——分布式数据库提供商,国外的代表公司及产品为:GoogleSpanner、MongoDB、国内代表公司及产品为:阿里巴巴的 OceanBase、华为的 GaussDB、腾讯TBase、华为Guass、星环科技的ArgoDB和KunDB、东方国信CirroData等。

编辑

添加图片注释,不超过 140 字(可选)

图:部分分布式数据库产品汇总

来源:广发证券

下游——可用于各行业,特别适合大规模的数据存储以及高并发访问的行业,例如:金融、电商、社交、互联网、物联网、政府部门等。

从产业链上的参与者近期的增长情况来看:

东方国信(北京市)——2023Q1年实现收入5.01亿元,同比增长6.77%;归母净利润0.46亿元,同比增长11.04%。

星环科技(上海市)——2023Q1年实现收入0.43亿元,同比增长76.38%;归母净利润-0.85亿元,同比增长2.36%。

从产业链上的参与者近期的增长情况来看:

编辑

添加图片注释,不超过 140 字(可选)

图:Wind机构一致预期增长和景气度情况

来源:并购优塾

本报告,将更新到产业链地图

(一)

在过去的 40 年间,数据库产品主要是集中式。然而,随着数据量爆发式的增长以及应用负载的快速增加,例如2017 年~2021 年,我国数据产量从 2.3ZB 增长至 6.6ZB,年复合增长率为 130.2%。

集中式数据库存在容量限制,一般只能达到TB级别,无法适应大数据时代数据快速增长的存储和处理需求(注:ZB>PB>TB>GB)。

随着2012年谷歌发布的Spanner和F1论文解决了分布式数据库的关键难题,数据切片以及数据同步问题,技术落地成为可能。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:传统数据库和分布式数据库对比

来源:中信证券

(二)

首先,从收入体量和业务结构方面,对各家公司有一个大致了解。

从2022年收入体量来看,东方国信(22.8亿元)>星环科技(3.73亿元)

东方国信——早期业务主要针对电信行业的数据分析(BI,Business Intelligence),上市后通过一系列并购拓展其他行业领域的大数据应用。2017年后入局工业互联网、云计算领域。

目前收入中84%来自于技术开发(软硬件结合产品),7.72%来自系统集成。下游客户中电信行业占比44.75%,金融行业28.09%、工业14.90%、政府9.32%。

编辑

添加图片注释,不超过 140 字(可选)

图:收入构成(单位:亿元)

来源:并购优塾

“技术开发”产品主要涵盖了数据采集、数据存储计算、数据分析挖掘、数据应用、数据治理管控、云基础服务与应用开发。具体包括:大数据、云计算、人工智能、移动互联网等产品。

东方国信的数据库产品为:CirroData 分布式数据库,具体收入情况未披露。

CirroData的特点是采用自研模式,定位于在线事务处理/在线分析处理(HTAP)的融合型数据库,结合了Hadoop、Spark、Hbase 等大数据开源组件技术,兼容SQL,可处理多模态(结构化、半结构化、非结构化)数据。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:技术产品主要内容

来源:公司官网

星环科技——创始人曾在英特尔数据中心软件部担任亚太区CTO,创立之初就针对大数据应用,面向数据全生命周期。

目前收入构成中,软件产品占比80%,应用与解决方案16.41%。从下游应用来看,目前金融占比32.5%、政府31.38%、能源14.06%、电信6.37%、交通3.56%、制造业2.7%。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:收入构成(单位:亿元)

来源:并购优塾

其中,软件产品已形成大数据与云基础平台(TDH和TDC)、分布式关系型数据库(ArgoDB和KunDB)、数据开发与智能分析工具(TDS和Sophon)的产品线。其中,核心平台软件产品 TDH、TDC 已经获得高认知度,具有超过1000家稳定客户,主要覆盖金融、政府两大行业,占到了收入的40%。

编辑

添加图片注释,不超过 140 字(可选)

图:大数据平台具体内容

来源:并购优塾

详细看数据库产品,从招股说明书来看,21年分布式数据库产品实现收入0.14亿元,占比4.22%。数据库同样采用自研模式,分布式数据库ArgoDB自研率98%,KunDB自研率超70%+。

分布式分析型数据库ArgoDB——主要用于构建离线数据仓库、实时数据仓库、数据集市等数据分析系统。

分布式交易型数据库KunDB——主要用于支持操作型业务场景(如ERP、OA、HIS 等)和高并发场景(如消费者的手机APP应用、健康码查询等)的核心数据系统的构建。

此外,混合交易和分析处理解决方案,可以在一个数据库系统里同时支撑交易与分析混合型的业务场景,已有一批落地案例。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:主要产品以及国外对标

来源:公司官网

(三)

接下来,我们将近10个季度的利润增速,以及近期的季度增长情况,做拆解:

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:单季度利润同比增速

来源:并购优塾

对增长态势有所感知后,我们接着再将各家公司的收入和利润情况拆开,看新一季度数据。

东方国信(北京市)——2023Q1年实现收入5.01亿元,同比增长6.77%;归母净利润0.46亿元,同比增长11.04%。

23Q1利润增长主要是卫生事件影响减退,并且单季度毛利率已环比改善恢复至和2021年报基本相同的41%。

数据库方面,2022年公司CirroData 在国有政策银行和头部城商行等多家银行完成了节点扩容采购,稳步扩大金融行业的影响力和占有率,此外,CirroData-Times分布式时序数据库通过信通院“可信数据库”评测,在能源、电力、煤炭等行业部署落地。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:单季度利润及同环比增速

来源:并购优塾

星环科技(上海市)——2023Q1年实现收入0.43亿元,同比增长76.38%;归母净利润-0.85亿元,同比增长2.36%。

23Q1利润增长同样来自于卫生事件影响减退。

此外,从在手订单来看,2022年公司新签订单金额为5.0亿元,同比增长36.5%,23年会逐渐释放。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:单季度利润及同环比增速

来源:并购优塾

(四)

再来看一下各家现金流质量。

一、净利润现金含量

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:净利润现金含量

来源:并购优塾

东方国信2022年利润亏损,主要因为卫生事件导致子公司全年业绩不达标。从公司的发展模式来看,主要通过并购拓展新业务和客户。

尽管星环科技净利润和现金流均为亏损,从经营活动现金流量净额来看,整体和亏损相匹配。

二、经营活动现金流VS资本支出

编辑

添加图片注释,不超过 140 字(可选)

图:现金流、固定资产投资

来源:并购优塾

东方国信的资本开支明显较大,主要因为公司每年的研发费用中有60%进行资本化,分年摊销。从22年底具体金额来看,研发资本化金额较大的项目是:工业互联网云平台1.28亿元、东方国信云0.8亿元、5G+工业互联网融合接入0.6亿元、CirroData数据库0.15亿元。

(五)

我们再来看利润率、资本回报率,以及产业链价值分配情况:

一、毛利率

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:综合毛利率(%)

来源:并购优塾

从毛利率来看,星环科技>东方国信

东方国信毛利率较低,因为公司除了软件产品还涉及到硬件产品,硬件产品的毛利率在30%左右。

两家公司2020年毛利率均呈现下滑态势,因为卫生事件影响项目验收,同时人员增长属于先置成本。

二、净利率

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:净利率(%)

来源:并购优塾

从净利率来看,东方国信>星环科技

星环科技一直处于亏损,是因为:1)整体营收规模较小;2)支出主要投向销售和研发人员的工资,并且研发人员的平均薪酬为48万元,处于行业内较高水平。

三、净资产收益率

编辑

添加图片注释,不超过 140 字(可选)

图:杜邦分析

来源:并购优塾

从净资产收益率来看,东方国信>星环科技,净利率是主导因素。

四、产业链

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:产业链分析

来源:并购优塾

1)价值分配情况

从价值链分配来看,上游芯片毛利率、净利率明显较高;净资产收益率方面,下游银行业普遍较好。

2)成长性

从成长性来看,上游国产芯片23和24年增速较高,因为国产替代还在早期影响。

(六)

行业景气度怎么样?我们通过下游需求来看:

一、全行业服务器销量

分布式架构一般基于X86服务器部署,因此采用服务器出货量作为景气度的代理指标。

根据IDC发布的2023年Q1全球服务器出货量来看,同比增加1.4%达到221万台。

从地区来看,中东欧(CEE)是增长较快的地区,同比增长7.2%,其次是加拿大2.8%,亚太(不包括日本)0.9%。在亚太区,中国温和增长1.7%。美国下滑2.3%,日本下滑4.3%,西欧下滑14.3%,拉丁美洲下滑14.6%,中东和非洲下滑14.8%。

二、数据库流行趋势

此处采用DB-engines的月度的趋势流行度进行比较,评分系统按照大众流行度、技术论坛提及频率、相关工作offer数量等进行打分。

排名前15的数据库中,分布式数据库:MongoDB、Redis、Elasticsearch、Snowflake、Cassandra、Splunk、Amazon DynamoDB的评分增速明显好于传统的集中式数据库,如Oracle、MySQL、Microsoft SQL Server等。

其中,值得注意的是2020年后使用规模快速上升的Snowflake,截止2023年5月的分数是111.73,同期2022年5月分数为93.57。

严格意义上来讲,Snowflake属于云原生数据仓库(更注重大规模数据存储和分析,而不是实时事务处理),不过从技术角度来看,采用了分布式架构,可以实现数据和计算任务的分布式处理。同时,弹性扩展能力、高性能查询、数据共享和集成、安全性和合规性以及易用性和兼容性等特点。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:数据库流行趋势

来源:DB-engines

三、国产信创情况

信创招投标数据较为缺乏,此处采用信创各领域的23年一季度业绩以作感知。

根据民生证券的统计,计算机板块总收入增速中位数为 7.42%,全部上市企业总收入增速中位数为2.25%;计算机板块净利润增速中位数为 9.17%,全部 A 股净利润增速中位数为4.88%。

其中,信创细分领域23Q1收入增速为20%,位于计算机行业内排名第三;

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:23Q1计算机行业细分收入中位数对比

来源:民生证券

(七)

据中国信通院测算,2020年全球数据库市场规模为671亿美元,其中中国数据库市场规模为35亿美元(约合240.9亿元人民币)。

预计到2025年,全球数据库市场总规模将达到798亿美元,对应CAGR为3.5%;中国数据库市场总规模将达到688亿元,对应CAGR为23.4%。

重点来看分布式数据库,我们采用公式:

分布式数据库市场空间=量*价

一、量

需要注意,分布式和集中式、关系型和非关系型、交易型分析性和混合型数据库,不是彼此替代关系,而是一种特定场景下的补充。

我们以高可靠需求的银行业为例,银行通常采用集中式关系型数据库如Oracle来存储客户信息、交易记录和账户余额等强一致性数据,用分布式数据库来存储客户的社交媒体数据、日志文件和其他非结构化数据。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:数据库技术变革发展趋势

来源:申万宏源

1)数据仍然在增长

随着智能移动手机的普及和云计算的兴起,全球数据产生量不断上升。从2010年的 1.2ZB 上升至2018年的33ZB。

未来几年内,随着各类智能物联设备的推广以及云计算的进一步应用,数据量有望进一步上升。根据IDC预测,2025年全球数据生产量可达到163ZB,对应2020~2025年CAGR为30%。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:全球数据声场量

来源:IDC

2)数据库的需求增速基本匹配数据的增长速度。

全球来看,2005年后,分布式数据库的发展关键在于NoSQL化,但目前增速已经趋于放缓。

NoSQL 是一种非关系型数据库,其存储数据的方式与传统的关系型数据库(Oracle、SQL)不同。这种数据库的类型因数据模型而异,主要类型包括文档、键值、宽列和图形。

NoSQL 数据库不需要预定义架构,因此可以存储各种形状和大小的数据(包括结构化、半结构化和多态性数据)。这使得开发人员能够更加灵活地存储和查询数据,而不必担心数据结构的限制。

由于发展较早,因此目前NoSQL快速增长的阶段已经过去。

二、分布式数据库价格

分布式大数据平台的收费模式分为两种,一种是根据节点数量采用软件一次性收费的模式,另一种是根据节点数量的使用时长,采用按年/按月的订阅制收费模式。

(1) 按节点数量,软件一次性授权模式:以星环科技为例,公司根据每个节点上安装的不同的软件产品类型,收取一次性的软件授权费。2021年,其数据云平台TDC的均价为4.7万元/节点,分布式分析型数据库ArgoDB的均价为7.4万元/节点。

(2) 按节点数量的使用时长,订阅制收费模式:以Cloudera公司为例,公司的核心产品大数据平台CDH,其根据部署节点的数量按月/按年收费。在这种模式下,即便客户没有采购服务器的需求,客户只要在使用数据库就需要支付费用。

根据IDC预计2025 年全球NoSQL数据库将增长至190 亿美元,对应2020-2025 年复合增速为 27.6%。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:全球NoSQL市场规模预测

来源:IDC

(八)

那么,整个数据库行业中,哪些细分结构的增长更快?

1)国内市场存在额外增量

国内受到自主可控以及去IOE((IBM、Oracle、EMC))化的影响,会有一部分额外增量。传统IOE集中式架构服务器、存储、操作系统、数据库等基础设施层次相互依赖,难以单一替换。而分布式架构可以基于高性价比的硬件和国产软件构建,能够大幅降低对国外巨头软硬件的依赖程度。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图:存算一体和存算解耦优缺点比较

来源:中信证券

因此,中国分布式数据库相关的专利申请量远快于全球,从2012年的全球占比22%,到2021年已经爬升到76%。

【产业链地图,版权、内容与免责声明】1)版权:版权所有,违者必究,未经许可不得翻版、摘编、拷贝、复制、传播。2)尊重原创:如有引用未标注来源,请联系我们,我们会删除、更正相关内容。3)内容:我们只做产业链研究,以服务于实体经济建设和科技发展为宗旨,本文基于各产业链内公众公司属性,据其法定义务内向公众公开披露之财报、审计、公告等信息整理,不采纳非公开信息,不和任何利益关联方接触,不为未来变化背书,不支持任何形式决策依据,不提供任何形式投资建议。我们力求信息准确,但不保证其完整性、准确性、及时性,亦不为任何个人决策和市场变化负责。内容仅服务于产业链研究需求、学术讨论需求,不提供证券期货市场之信息,不服务于虚拟经济相关人士、证券期货市场相关人士,以及无信息甄别力之人士。如为相关人士,请务必取消对本号的关注,也请勿阅读本页任何内容。4)格式:我们仅在微信呈现部分内容,标题内容格式均自主决定,如有异议,请取消对本号的关注。5)主题:鉴于工作量巨大,仅覆盖部分产业链,不保证您需要的行业都覆盖,也不接受任何形式私人咨询问答,请谅解。6)平台:内容以微信平台为唯一出口,不为任何其他平台负责,对仿冒、侵权平台,我们保留法律追诉权力。7)完整性:以上声明和本页内容以及本平台所有内容(包括但不限于文字、图片、图表、产业链地图)构成不可分割的部分,在未详细阅读并认可本声明所有条款的前提下,请勿对本页面以及本平台所有内容做任何形式的浏览、点击、转发、评论。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部