月活千万、峰值破亿,智能语音独角兽如何大幅提升数据性能

月活千万、峰值破亿,智能语音独角兽如何大幅提升数据性能
2020年12月03日 17:43 GrowingIO

2019 年全球语音交互市场规模已达到 13 亿美元,每一个消费者都体验着从触屏到语音的交互变革。GrowingIO 服务的某智能语音助手,根据其 2019 年财报显示:loT 平台连接设备数达到 2.35 亿,智能语音助手月活超过 6000 万,逐步成长为行业独角兽。

用户数和交互量快速增长的背后,海量数据集成和处理也给该团队造成了不小的挑战。同时,如何依靠数据推动用户活跃度保持高速增长,也困扰着运营团队。

该智能语音助手与 GrowingIO 在 2019 年正式合作。凭借 GrowingIO 提供的产品和增长方法论,逐步搭建起数据增长体系。GrowingIO 增长平台不仅高效满足了亿级数据处理需求,还有效降低了数据的硬件存储成本。

基于 BitMap 存储模型,满足海量数据性能需求

语音作为最自然、便捷的交互方式,也会产生高于传统方式的海量行为数据;GrowingIO 服务的该智能语音助手,6000 万月活用户数会产生大量交互数据,海量数据会给查询和分析造成阻碍,同时产生高昂的硬件存储成本。

在部署 GrowingIO 之前,业务团队进行基于数据分析的流程较长。原因是数据需求要提交研发部门,通过 SQL 现查的方式获得。随着数据量达到亿级规模,计算所需要的资源和时间线性增长,一个图表的加载可能需要数个小时。

增加计算资源或者对查询结果进行缓存、预热已经无法满足海量数据的性能需求。该客户经过多方评估,综合考量技术水平和项目交付能力,选择部署 GrowingIO 增长平台。建立以 CDP 为核心的数据增长平台,满足业务端看数、取数和用数的数据增长需求。

1. 海量数据秒级查询,维度无限扩充满足更多分析场景

为了满足业务团队需求,在公司内部推行数据增长体系,解决数据平台的性能问题首当其冲。

GrowingIO CDP 采用 BitMap 的存储模型,并在多年项目服务经验中不断攻克技术难关,能够兼顾计算和存储优势,面对千万级 ID 数量时,也能得到很好的计算效果。

通过以下性能对比图,可以看出随着数据量的不断递增,SparkSQL 的计算时间线性递增,但是 BitMap 的计算时间却相对比较稳定。

x 轴含义: 数据量/用户量

y 轴含义: 计算时间, 单位毫秒

SparkSQL 和 BitMap 性能对比

GrowingIO 增长平台的查询速度相比同类产品能够快 10 倍以上;若想达到同等性能水平,自研所需的时间、周期都非常可观,这也是众多企业选择部署 GrowingIO 增长平台的原因。

如今,业务团队可以通过 GrowingIO 增长平台自助看数、取数和用数,无需通过数据部门,时效性大大提升。同时,即使对全量用户数据进行分析,也能保障秒级出图。

此外,事件和维度的可扩展性也是一个常常被忽略的问题。目前同类数据产品在事件和维度的拓展上普遍只能做到 20-30 个的水平。

智能语音系统作为物联网中心,面临越来越多的用户场景、越来越精细的用户数据维度,这个水平显然不能满足分析需求。而 GrowingIO 支持事件和维度无限扩展,满足不断增长的数据需求。

2. 软硬件深度优化,存储成本大幅度降低

传统的分散式存储管理方式,不仅管理成本高,硬件存储成本也十分昂贵。GrowingIO 基于业务需求对分布式存储模型进行优化,自研了整个文件系统栈。

实现不依赖本地文件系统、高可用性,同时承载的容量和文件数量都没有限制。此外,由于每个目录下的内容可以通过多个接入节点同时访问,使处理能力具备了水平扩展性。

这样深入的源码开发和软硬件优化,数据的硬件储存成本将会大幅度降低,同时也提高了资源的分配效率,助力计算资源的弹性调度。

陪伴式客户成功服务让数据增长体系融入工作流

该智能语音助手团队隶属于某大型互联网集团,GrowingIO 增长平台项目则是由业务团队牵头、数据部门配合,在企业内部影响范围甚广。工作习惯的改变、学习成本的增加都给数据增长体系的搭建造成了一定阻力。

GrowingIO 不仅满足工具层面的性能需求,更为客户提供陪伴式服务,短期内降低新工具在企业内部落地的摩擦,长期则保障数据增长体系的持续迭代和进步。

1. 降低新工具在企业内部落地的摩擦

GrowingIO 的客户成功服务将落地服务分为 5 个阶段,分别是引导期、稳定期、推广期、成熟期、共创期。首先帮助客户培养核心使用人员,实现项目目标。后续逐步梳理企业协作流程、组织规模化培训,通过服务启动会、培训会等多种形式完成服务落地。

截止目前,已初步实现了业务团队全员看数、用数,随着合作的深入,后面将逐步利用 GrowingIO 增长平台产出更大的业务价值。

2. 数据增长体系持续迭代

另一方面,数据增长体系能否持续迭代,也会影响数据增长体系的建设效果。GrowingIO 陪伴式服务对客户使用情况进行定期“体检”,与客户一起探讨增长平台的使用场景,改善内部数据平台的使用状况。

一系列措施使数据增长体系快速融入客户的工作流,打造有活力、持续迭代的数据增长体系。

结语

经过近两年的合作过程,业务团队逐步搭建起以数据驱动的增长体系。在此过程中,GrowingIO 的产品能力和客户服务都给该智能语音助手团队留下了良好的印象。

随着智能家居、车载语音、智能客服等语音交互场景的成熟,智能语音助手业务正在变得举足轻重。GrowingIO 也将从智能语音场景优化、用户精细化运营体系搭建等方面帮助业务团队提升用户激活、活跃和留存表现,实现业务价值的突破。

关于 GrowingIO客户数据平台(CDP)

GrowingIO 客户数据平台(CDP)通过整合跨平台、多类型数据,帮助企业构建以用户为视角的数据池,搭建用户标签和画像系统,提供从数据采集、整合、分析到自动化运营的一站式用户运营闭环,推动产业向“深度结合用户行为” 的方向发展,从而提供更加智能化、自动化的数据监测服务,发掘业务增长点,快速落地企业数据化转型。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部