ITPub博客

首页 > 数据库 > 国内数据库 > 从《国产分布式数据库应用现状调研报告》看分布式数据库发展现状

从《国产分布式数据库应用现状调研报告》看分布式数据库发展现状

原创 国内数据库 作者:老鱼 时间:2023-10-26 17:33:37 0 删除 编辑

1、分布式数据库在国内发展迅速,已广泛应用于国内企业,且云化部署已成常态;

调研结果显示,大部分受访者所在企业已经部署了分布式数据库,占66.92%的大比率,而计划部署和正在部署的企业也占15%以上,仅10%左右的企业仍然未有计划使用分布式数据库。

对于已经部署分布式数据库的企业,我们对其部署形态进行了调研,结果显示企业数据库云化部署已经是目前分布式数据库部署的最常见形态,其中私有云占36.60%,混合云占27.36%,公有云占16.82%,而纯软件部署的分布式数据库只占13.31%。

2、企业应用分布式数据库的重要原因

目前国内企业选用分布式数据的根本出发点仍在于其所提供的技术先进性可以弥补传统数据库在海量数据处理能力、高并发处理能力以及高可用性等方面的不足,体现了分布式数据库在动态扩展能力、分布式并行计算以及多副本高可用等方面的显著优势。

3、企业选型分布式数据库的 4+1要素

企业选型分布式数据库基本围绕4+1要素,即:可靠性和稳定性、整体成本、产品功能和易用性、兼容性,以及分布式数据库最具吸引力的可扩展性;

受访者认为分布式数据库最吸引人的特性依次为“可扩展性”、“高可用性”和“数据一致性”。其中“可扩展性”和“高可用性”是分布式数据库相对于传统数据库的优势所在,而“数据一致性”虽然在传统观念上被认为是分布式系统的一个弱项,但随着分布式数据库技术发展,越来越多的分布式数据库能够基于分布式协议实现全局的数据多副本强一致性。分布式数据库在数据一致性方面的不断加强,让越来越多企业可以放心将分布式数据库应用在核心交易系统上,这也成为分布式数据库能落地于越来越多应用场景的关键所在。

对分布式数据库选型的考量,受访者最关注的是产品的可靠性和稳定性,占比达18.57%,远高于其他因素,可见稳定是一切的前提和基础仍然是企业使用分布式数据库的普遍共识。其次,整体成本、产品功能及易用性、兼容性依次位列于第二、三、四位,也是分布式数据库选型的主要考量因素。

4、加密与审计是最被看重的国产分布式数据库的数据安全能力

近年来,我国不断推进以数据为新生产要素的数据经济的发展,同时,国家、行业和地方性法律法规也相继出台,促使企业对自身数据安全愈加重视。数据库作为企业数据存储和应用的主要载体,在数据存储、数据通信、身份识别/鉴权、访问控制、数据分级、安全审计、防篡改等方面都具备不同的数据安全管理能力。在本次调研中,我们也对受访者希望国产分布式数据库具备的数据安全管理能力进行了调查。

结果显示,23.56%的受访者认为应该优先实现数据库内存储加密,19.36%认为应该加强在数据传输阶段的加密,另外也有19.19%认为数据访问的安全审计最为重要。这三项实际分别对应了整个数据存储、通信传输以及访问使用的三个环节,可见这三个环节是目前企业在数据安全层面最为关注的。

5、数据库容灾技术普遍应用于核心系统

数据库存储着企业关键的业务数据资产,若数据丢失,将会对企业造成不可估量的经济损失,尤其是金融行业,其事务特点决定了对数据保护以及数据库服务的可用性有更高的RTO和RPO要求。

从本次调研数据可见,33.46%的企业采用两地三中心的数据库容灾架构,采用同城异地容灾以及同城双中心容灾的分别有12.75%以及17.01%,本地同数据中心主备容灾的也有22.37%。由此可见,当前国内企业对数据库的容灾建设十分重视,对核心系统的数据保护和可用性保障投入非常大。

调研中仅有5.18%的企业采用三地五中心的容灾方案,我们认为虽然这种方案可以提供城市级别的数据容灾保护,但过于高昂的建设成本、严苛的网络带宽和时延要求是主要的实施障碍。此外,值得注意的是仍然有近10%的企业没有针对自身的核心系统建设容灾方案,一旦这些无容灾保护的数据库停机,业务将可能受到长时间的影响,建议企业后续多加注意和改善。

6、稳定性保障、运维复杂度、改造成本,是企业使用分布式数据库的主要难点;

调研结果显示,企业在使用国产分布式数据库时普遍认为以下三个问题最棘手,这三个问题在收集样本量上非常接近。

第一,可靠性和稳定性。数据库是整个应用系统的核心,一旦瘫痪意味着承载应用和业务中断,因此数据库的可靠性和稳定性尤为重要。

第二,运维与备份复杂度提升。使用分布式架构会导致整个数据集群运维和备份等操作的难度增大,同时运维人员也会担忧迁移到国产分布式数据库后,运维技能和方式与原来相比有过大差异,无法对数据库进行有效运维。

第三,对原有应用系统升级的改造成本较高。企业已经建设的应用代码和架构可能与分布式数据库并不兼容,需要进行相关改造,两者兼容性越低,改造的工作量和成本越大。

因此,国产数据库厂商应当加强对上述问题的攻关,不断优化数据库产品的可靠性和稳定性,联合社区研发更多运维、备份和迁移相关的工具,以便用户更好地使用分布式数据库。

7、分布式数据库整体使用成本比传统数据库略有下降,但也有部分企业出现成本大幅上升的情况;

对于分布式数据库的整体使用成本,根据已经部署了分布式数据库的受访者反馈,成本略有下降的占多数,为35.31%,其次是29.16%的人表示与原有支出持平,21.41%的人表示有了大幅下降,值得注意的是还有14.12%的人表示成本不降反涨,有了大幅上升。

分布式集群在业务使用初期,如对大量业务做数据整合和治理,在成本层面的收效会更加明显,会节约很多冗余的服务器资源成本,也就是成本会比预期低很多;

部分用户对分布式数据库的预期过高,有点偏向于“银弹”的设计思想,会采用ALL-IN的方式解决一切问题,在成本方面投入明显要多一些;

分布式集群因内部节点通信的协议实现,对资源的要求相对较高,对基础资源配置,如CPU、内存和磁盘IO都提出了更高要求,否则单一节点的资源瓶颈可能会对整体集群性能造成负面影响。在同等业务规模和容量的情况下,投入的资源成本持平或者会多一些;

分布式集群是一种全新的数据库设计方案,需要一定的学习成本,对企业自身的体系设计和维护方面都有较高要求。在节点规模和数量上,由于多数据副本的设计,与原本数据管理方式的成本考量存在较大差异;

8、将核心应用系统迁移到国产分布式数据库仍面临巨大挑战;

将核心业务迁移到国产分布式数据库是一项重大的工程,并非所有的迁移都是简单的数据库替换,更多的是关于整个技术堆栈的替换,并且涉及整个业务链路自上而下的信息传递。

对于将核心应用系统迁移到国产分布式数据库中可以接受的停机时间,仅有11.43%的受访者可以接受24小时以内。从整体上看,受访者对于国产分布式数据库的迁移能力抱有很高期望,而期望停机时间在分钟级和2小时以内的受访者高达27.74%和24.70%,意味着很多业务需要实现在线平滑迁移,这对于多数国产分布式数据库来说是一个很大的挑战。

9、国产分布式数据库生态建设仍有较大发展空间,需加强文档体系、技术社区的建设和完善,数据库专业人员亟需补充和强化;

在本次调研中,近半数的受访者认为要掌握一种数据库的开发和运维技能,最有效的途径是借助完善丰富的文档体系和活跃的技术社区。

在我国信息化发展初期,Oracle之所以能在国内取得实际市场的统治地位,与其完善丰富的文档体系和活跃的技术社区密不可分。借助文档和社区,能对Oracle进行体系化的学习和针对性的问题讨论,就此培养出大量熟悉Oracle的开发者和数据库管理员,也由此推动了Oracle自身产品的不断成熟。目前,不少国产数据库厂商对产品文档和社区建设还缺少足够的投入,例如产品文档中存在不少错漏或前后不一致的表述,这些都是各厂商后续仍需改进的地方。

10、SQL兼容性需求更倾向于MySQL与Oracle

SQL兼容性是业务迁移到分布式数据库绕不开的议题,SQL兼容度高意味着更低的业务逻辑改造成本和更稳定持续的业务服务保障。目前行业内主流的三类数据库技术栈协议包括Oracle、MySQL和PostgreSQL,本次受访中43.78%和31.34%的人更倾向基于MySQL和Oracle的SQL兼容性,PostgreSQL则占据了19.39%,在近些年也有较快的发展。

通过以上数据可以看出,在大多数企业中,很可能会基于多种数据库技术选型来满足当前的业务需求,如Oracle与MySQL或PostgreSQL组合,主要是基于业务现状,考虑到会导致的迁移风险与成本,核心/复杂业务仍运行在传统商用数据库上,所以商用与开源共存的现象也会相对普遍;相较于传统行业,互联网行业的业务包袱会轻一些,所以直接使用MySQL与PostgreSQL等开源数据库的技术栈组合更多。

在SQL兼容性方面,如果能够兼容多种SQL协议,对于业务接入和选择的空间会更大,同时一体化的接入方案对研发也会更加友好。

来自 “ ITPUB博客 ” ,链接:https://blog.itpub.net/11310314/viewspace-2991370/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
私人笔记,记录老鱼日常所见所闻所感!

注册时间:2007-12-05

  • 博文量
    201
  • 访问量
    538709