打造一个一站式“解决”80%问题的数据库?OceanBase想挑战一下

打造一个一站式“解决”80%问题的数据库?OceanBase想挑战一下
2024年04月26日 22:04 品玩

当你在海底捞吃起热乎乎的火锅时,海底捞后台的数据库也开始了它们的工作。

以服务著称的海底捞,不只依靠热情的服务人员,为了让每个会员都能看到为他定制的推荐内容,海底捞的实时系统也压力山大”——它不仅要实时的处理交易等事务性的需求,还要能够实时的分析数据库里保存的会员信息,第一时间提供反馈。

在过去,从数据库技术角度,这其实是两类数据库各自擅长的工作。处理大量交易等事务性任务的数据库,被称为TPTransaction Processing)数据库,或者也可以叫它事务性数据库(TP)。它擅长数据一致性等更强调稳健的工作——你不能给顾客点错菜,也不能算错账。

而给不同的会员推荐不同的菜品,则是APAnalytical Processing)数据库的工作,也可以直接称它为分析性数据库(AP)。它强调多个节点间进行并行处理,保证系统能及时快速的分析并响应。

但显然今天像海底捞这样的场景越来越多,它需要这过去两类数据库的能力并在一起,且都要很强。

怎么解?OceanBase成了海底捞挑选的方案。用OceanBase CTO杨传辉的话说,它给海底捞实现了一份数据两份收益的效果。最终TCO降低了35%,同时我们的AP的性能相比之前提升了30%

把两类曾经属于不同数据库的能力结合到一起,并不是OceanBase一家在做的事情。所有数据库都在按这个趋势做研发。但技术路线上的差异依然存在。这种把APTP结合的路线,有个名字叫HTAP,但杨传辉认为,过往强调把TPAP放到一个系统的思路不一定是万能的。

今天我们抛出一个新概念,HTAP一体化的另外一层含义,也可以是把我们的分布式的TP能力直接融合到AP系统里面,做出更好更加实时对开发者更加易用的新型实时数据库。

这个纸面推演明显更优的路线,真正的门槛儿在于是否在严酷真实环境里打磨过。许多AP系统是鱼龙混杂的没有应用在核心业务场景打磨的经验,可靠性跟稳定性也是有所欠缺的。

2024Oceanbase的开发者大会上,杨传辉发布了OceanBase 4.3版本,进一步沿着这个路线前进。

“OceanBase4.3版本包括三个最重要的核心技术升级,推出列式存储引擎,进一步强化TPAP一体化,打造PB级实时分析数据库。他在大会上说。而不仅靠说,他还直接展示了一场打榜

大家应该都知道OceanBase发布会的特点,尤其是我这个环节,最喜欢干的事情是打分,所以这一次还是现场见证OceanBase分析型负载跑分测试。他选择了实时分析场景业界的标杆ClickBench,并且直接和提出这个评测标准的数据库ClickHouse做对比。4台电脑用4个系统进行跑分,最终OceanBase4.3.0用了14.5秒,而ClickHouse23.11用了14.8秒,而在另外两个内测版本的对比上,OceanBase也取得了更快的成绩。

OceanBase脱胎于蚂蚁,2010年开始内部研发。之后,OceanBase的技术经历两次重大升级,一次是2016年发布OceanBase1.0版本,把单写多读架构升级为全分布式架构,之后在2022年又发布4.0版本,提出单机分布式一体化架构,后又提出一体化数据库,开始支持更多类型的客户。

同时,它开始用各种方式对外提供服务,2020年正式成立公司商业化运作,2021年发布开源版本。20243月,蚂蚁最新一轮组织架构升级中OceanBase单独成立董事会,开始正式独立面向市场。

而这也是它独立后的第一次开发者大会。在上海的会场,人头攒动,据透露,目前OceanBase已经服务超过1000家行业客户,其中30%将其应用于核心系统。在生态方面,目前其核心仓库拥有300多位外部贡献者,共建代码量超5万行。

而回顾这一路的研发和商业化历程以及这场4.3版本的发布会重心,可以看到有一个关键词贯穿始终,就是一体化

今天4.3版本的一体化不只是强调APTP的一体化,而是一整个关键业务负载的一体化战略。杨传辉形容,他们今年将重点打造PB级实时分析数据库的最强六边形战士,从TP性能、分布式、兼容性、AP存储、AP计算、AP工具生态能力等多方面提高能力。

这是个很有野心的目标。

事实上,从数据库的发展历程来看,这个作为一切数字世界基础设施的基础设施的行业,繁荣于80年代初期,在90年代迎来两个最主流的开源关系数据库,但之后最近的20多年来,全世界再未出现新的关系型数据库。

互联网出现了之后全球其实出现了很多新的数据库,但是可能没有一个像以前那几个数据库这么主流。这些系统缺了一个关键的东西,就是事务的处理能力。有一些系统号称说我能处理事务,但是你问问他,这些系统在什么样的生产环节里得到过考验的?其实发现没有。”OceanBase的首席科学家阳振坤在开发者大会上说。

真正能挑战主流的数据库,必须是由生产环节的复杂艰巨任务催生出来的,是经过考验的。而一体化就是OceanBase感受到的那个考验

我们支持一个场景叫实时AP,实时AP能支持到一个PB,再往后我们甚至有可能对文档的支持、搜索支持包括未来还会拓展AI的能力。

而且它不只是能力上的一体化,还要做到体验上的一体化。

今天的数据库经历了上面提到的几个发展阶段后,因为各自擅长的技术能力不同,而其实形成了诸多数据库产品在一个业务场景里共存的现状。而很多时候,一个成熟的复杂产品的分类是人为设定的,受最初定义这个行业的技术提供方的影响根深蒂固。

但需求是不停变化的。而中国市场在需求侧尤其如此,这里有更加复杂的需求。对于老牌数据库厂商来说,产品形态固定后,用户的需求往往要自己从产品中寻找,搭配,这注定对开发者和管理人员带来挑战。而OceanBase开源之后,由于它脱胎于蚂蚁自己的同样复杂的需求场景,因此许多特性反而吸引了这些用户。一体化的能力和策略,某种程度上是客户和开发者一起催生出来的。

的确我们做的产品规划并不是自己想象出的,到底做这个东西还是那个东西,哪些功能有用,这些需求来自于开发者和用户使用过程中的反馈。我们根据使用过程中的反馈做进一步的抽象,最后才有了每年的产品技术规划。”杨传辉说。

最重要的是,好的数据库都是用出来的,这是很简单的道理,没有人用的数据库肯定不太行。

OceanBase的目标是,用一个数据库解决80%场景的问题,它希望成为一个能打通这些环节的那个一体化的数据库。我们的概念不是很窄的HTAP,而是更广泛用一套系统,充分复用一套底层系统能力支持各种各样的工作负载。

而回顾互联网技术和产品的历史,一个很简单的道理是,当你用一个产品替代了好几个产品,你就是在制造一个新的更大的事物了。

OceanBase显然也有更大的野心。“从同行的实践探索来看,这样的一体化架构它不管是在国内还是在国外、全球范围内它会有很大的前景能够成为新的主流。杨传辉说。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部