无论是开发人员还是dba,想要了解数据库行业发展现状,通过各类排行榜是最方便的,其中以国际上知名已久的db-engines数据库流行度排行(下简称“db-engines排名”)与国内的墨天轮中国数据库流行度排行(下简称“墨天轮排名”)最为出名。但是二者有很大的不同但也有一些关联。本篇结合最新一月的墨天轮排名对比最新的db-engines排名对国产数据库发展现状进行分析。
米乐app官网下载主页:
db-engines 创建于 2012 年 10 月,由奥地利 it 咨询公司 solid it 创建和维护,根据当前流行程度对数据库管理系统进行排名的列表。该列表每月更新一次。
该流行度排行主要依据数据库产品在搜索引擎的被提及次数、搜索趋势及招聘数量等维度计分,主要可参考《排行榜|当 db-engines 遇见墨天轮国产数据库排行》一文中的整理,以下为指标截图:
米乐app官网下载主页:https://www.modb.pro/dbrank
墨天轮国产数据库流行度排行于2019年6月推出,通过近50个维度的数据来考察近300个国产数据库的流行度排行,每月1日更新排行数据,用于体现国产数据库在互联网上的流行度。
该榜单主要根据百度、必应、谷歌以及微信公众号文章(搜狗)等搜索引擎的内容条目数,数据库关键字趋势指数,3方测评、专利、论文、招聘岗位数等指标进行计分,其计分规则具体说明请查看:https://www.modb.pro/db/189802。
首先说明一点,db-engines和墨天轮排名之间的数据库统计范围和计分规则是完全不同的,这里仅是通过一些表象做出一些简单分析,以期为大家思考国产数据库行业发展提供一个新的角度。
3.1 top 10对比
db-engines前十数据库模型相对多样,有关系型、键值、文档、搜索引擎等大多数主流模型数据库。
而对比墨天轮排名前十均为关系型且大多数为分布式数据库,这也说明了国产数据库目前主要还是在关系型数据库发力,目的在于替换主要为中大型oltp场景的相关业务,力求在各大重点行业的各个核心业务层面,诸如运营商计费、海量电子商务、互联网金融、银行等场景中争得一片天地。
3.2 收录总量与主流数据库模型对比
(这里仅对db-engines和墨天轮排名中的主流数据库模型分类进行对比,关于所有分类详情请至对应网页查看)
从数据库收录总量来看,db-engines收集全球范围内的数据库数量,其收录数量远大于墨天轮排名,这主要是因为db-engines成榜时间较早且国外数据库发展已逾半个世纪,数量庞大;另一方面墨天轮排名收录的均为国产数据库,而国产数据库的蓬勃发展期不过几年。
基于全球流行度的原因,db-engines收录的国产数据库仅刚刚进入两位数,总数约为13个(由于榜单较为庞大且收录语言有所不同,可能存在遗留)。
从数据库模型占比来看,两个排行榜中关系型数据库均占大头,但是db-engines中关系型数据库的占比却低了很多,除时序、向量和图数据库之外其他类型数据库的比例是远高于国产相关产品的,国产数据库在数据库多样性上还有巨大的差距。(这里需要注意很多数据库的多模式数据类型属性,故分类总和是大于总量的)
同时从分类总数来看,db-engines也更多,这也意味着db-engines覆盖了更多的数据库类型与其涉及的应用场景。细看数据库类型,国产数据库仍然倾向于oltp的主航道和新兴航道,仍需要进一步扩展数据库的模型数量以求更加全面的覆盖业务需求。
4.1 tidb
(产品百科:https://www.modb.pro/wiki/20)
db-engines初次上榜时间:2017年5月,最高得分3.856。
作为一段时间内db-engines排名中国产数据库的独苗(已在榜超过5年),pingcap的tidb在墨天轮排名中一直名列前茅,期间也有很长一段时间霸榜第一。作为一款自研云原生分布式金融级高可用htap关系型数据库,兼容mysql协议和生态。虽然近期在db-engines排名有所下滑,但仍是db-engines排行榜中的国产数据库第一,不得不说tidb是第一个走向国际的“国产之光”。
4.2 oceanbase
(产品百科:https://www.modb.pro/wiki/34)
db-engines初次上榜时间:2022年6月,最高得分2.854。
墨天轮排名的本月状元oceanbase,在db-engines中排名121,相较于1年前上升75名,相较于上个月提升9个名次,涨势喜人。oceanbase 数据库是阿里巴巴和蚂蚁集团不基于任何开源产品、完全自研的原生分布式关系数据库。拥有支持金融级高可用、htap混合负载、超大规模集群水平扩展、主流商业和开源数据库兼容等优势。经过淘宝天猫血雨腥风洗礼过的oceanbase,在国内、国际数据库行业中均未来可期。
4.3 gbase
(产品百科:https://www.modb.pro/wiki/26)
db-engines初次上榜时间:2018年9月,最高得分1.686。
墨天轮本月第八名来自于南大通用的gbase数据库,相较于半年前上升一名,在db-engines中排名183,相较于上个月提升14名,同样实现了双榜双涨。作为自主研发的国产数据库系列品牌,gbase系列数据库产品包括分布式逻辑数据仓库gbase 8a、基于共享存储的数据库集群gbase 8s、多模多态分布式数据库gbase 8c等,能通过不同产品解决不同的数据库应用场景。
4.4 opengauss
(产品百科:https://www.modb.pro/wiki/601)
db-engines初次上榜时间:2022年5月,最高得分1.55。
墨天轮本月探花opengauss,在db-engines中排名187,从其近一年的发展来看排名是不断提升的,共提升22名。opengauss是华为基于postgresql 9.2.4开发并开源的关系型数据库,具有高性能、高可用、高安全、易运维、全开放等核心特性。在华为、社区、下游厂商的共同努力下,不断进步与发展。
4.5 alibaba cloud
db-engines:
alibaba cloud maxcompute 初次上榜时间:2017年8月,最高得分0.927。
alibaba cloud analyticdb for mysql 初次上榜时间:2020年3月,最高得分0.887。
alibaba cloud analyticdb for postgresql 初次上榜时间:2017年8月,最高得分0.672。
alibaba cloud apsaradb for polardb 初次上榜时间:2020年5月,最高得分0.714。
alibaba cloud log service 初次上榜时间:2020年5月,最高得分0.602。
alibaba cloud table store 初次上榜时间:2017年8月,最高得分0.502。
alibaba cloud tsdb 初次上榜时间:2020年3月,最高得分0.489。
阿里云是db-engines排名中上榜最多的国产数据库厂商,共有7款数据库上榜,其中4款关系型数据库、1款搜索引擎、1款列存数据库、1款时序数据库。同时3款且模型不同的国产非关系型数据库入围榜单,着实不易。但这3款数据库产品也全都是云上产品,这也说明了阿里云影响力在国际的扩展。
对比墨天轮排名:
polardb也进入前五,作为阿里巴巴自主研发的下一代关系型分布式云原生数据库,100%兼容mysql、postgresql、高度兼容oracle语法,拥有mysql引擎、o引擎、postgresql引擎3个子产品。(产品百科:https://www.modb.pro/wiki/37)
analyticdb也进入前十,是阿里云自主研发的云原生数据仓库,采用存储计算分离 多副本架构,支持最大5000节点规模的弹性扩容,对复杂sql查询速度比传统的关系型数据库快10倍以上。analyticdb高度兼容mysql、postgresql,oracle应用,迁移成本低,可对万亿级别的数据进行实时的多维度分析透视,极大地提升了企业挖掘数据价值效率。拥有for mysql和for postgresql两个版本。(产品百科:https://www.modb.pro/wiki/87)
aliababa tsdb则排名41的,相较于上个月大幅提升6名。time series database ,简称 tsdb 是一种集时序数据高效读写,压缩存储,实时计算能力为一体的数据库服务,可广泛应用于物联网和互联网领域,实现对设备及业务服务的实时监控,实时预测告警。(产品百科:https://www.modb.pro/wiki/477)
4.6 kingbase
(产品百科:https://www.modb.pro/wiki/13)
db-engines初次上榜时间:2021年9月,最高得分0.764。
国内老牌数据库厂商人大金仓,本月墨天轮排名第七,db-engines相较于上个月提升6位来到了259名。作为一款面向大规模并发交易处理的企业级关系型数据库。该产品支持严格的acid特性、结合多核架构的极致性能、行业最高的安全标准,以及完备的高可用方案,并提供可覆盖迁移、开发及运维管理全使用周期的智能便捷工具。
4.7 antdb
(产品百科:https://www.modb.pro/wiki/55)
db-engines初次上榜时间:2023年2月,最高得分0.345。
墨天轮涨势喜人的antdb,本月在db-engines排名位列321,相较于上个月的340名进步18位同样涨势喜人。antdb 是亚信科技出品的一款通用企业级、高可用、高性能的原生分布式关系型数据库,具有htap混合负载、广泛的语法兼容、一键进行迁移、在线弹性扩容、内核级读写分离、数据安全可靠等特性。
在数据库国产化大趋势的背景下,国产数据库的发展形式是喜人的。部分国产数据库也冲出了国门走向了世界,从一支独苗走向了集群冲锋,扩展了中国软件行业在全球的影响力。
但是不得不说国产数据库与国际上主流的商业、开源数据库之间还有不小的差距,尤其是以下一些问题:
- 数据库的高性能,尤其是在大数据量、大规模并发的情况下,国产数据库需要展现出与主流商业数据库如oracle一样的高性能发挥和快速的响应效率;
- 数据库的稳定性,在数据量不断增大、业务规模不断扩大、数据库本身也越来越庞大的情况下,确保数据库本身的安全稳定运行的同时也应确保数据库有一如既往稳定的性能表现;
- 数据库的兼容性,数据库的变更带来的数据库特性、语法的改变,可能要求业务代码进行极大的改变,需要数据库厂商努力减少数据库中不兼容的内容;
- 生态建设,现在大多数国产数据库的生态是做的极其糟糕的,虽不是闭门造车但也相对封闭,但这对于扩展开发、维护人员规模,在扩张过程中不断改良自己,与复杂业务场景和其他类型数据库适配的过程是非常不好的现象;
- 分布式数据库的引入,要求业务从业务逻辑设计、数据库库表设计上进行分布式改造,导致更大规模的代码侵入,引发业务侧的强烈反弹,数据库与开发、存量业务之间的矛盾难以调和,这一点也需要强大的生态建设;
- 数据库行业的环境(也是很多行业的环境)是百花齐放与自相残杀并存的,很多国产数据库厂商内心浮躁、目标简单或不明,同时过多厂商的竞争也造成了融资方面的困难。
但是相信在大家的共同努力下,终将实现国产化数据库的跨越式发展,这里也对数据库国产化发展提出一些建业,也算是愿景:
- 各个数据库厂商应该戒骄戒躁,沉下心好好打磨数据产品,面对友商要包容并蓄、相互学习;
- 加强数据库生态建设,无论是开源还是商业数据库,都应该以更开放的态度面对it行业从业者以求整个it行业向国产化转变,同时摒弃壁垒、加强友商合作特别是优势互补;
- 从高校出发加强数学等基础学科教育投入与人才培养,力求从更底层的地方做好数据库。
本文为墨天轮社区特约作者 尹海文 独家供稿,内容原创,仅代表作者个人观点,欢迎大家交流、讨论。如需转载请联系作者或墨天轮官方。