日前,艾瑞咨询发布2022《中国数据库研究报告》(简称《报告》),通过深入172家、覆盖全国各区域、有代表性的数据库用户单位进行调研,揭示了数据库行业新阶段特征、国产厂商市占情况、不同行业市场空间差异、核心决策人的选型要点、发展走向等重要趋势。
天云数据作为国内新兴厂商入围报告中国数据库产业图谱。
业务驱动HTAP技术成为重要底座,与分布式技术天然适配
报告称,随着业务系统接入数据源复杂性提升,混合负载需求愈发强烈,数据库技术正向多源异构、高实时并发、多SQL标准接口的方向演进。过去,HTAP数据库的技术架构以扩展主行存技术,在行存基础上加列存的方式为主,典型代表有SQL Server,Oracle 和 L-store 等。随着分布式技术不断成熟,天然适配HTAP数据库,于是开启了分布式的架构实现,满足了高并发需求,典型代表有SingleStore、MySQL Heatwave 和 Greenplum。
我们常规认为,数据库分为关系型数据库和非关系型数据库,而HTAP数据库只是其中的一个小品类,这种认知是错误的。MySQL路径是国内数据库的普遍实践方式,然而经典MySQL体系的创始人兼CTO Michael Widenius认为,未来HTAP是一个主导性趋势:“按数据容量划分,一个大型企业在可单机部署的数据库之上还需要Share Everything的HTAP架构。”天云数据雷涛认为:HTAP不是小品类,应该说在单机版之上,HTAP就是行业主导趋势。
分布式现状:技术特性趋于融合,云化部署大势所趋,使用门槛不断降低
根据报告,分布式数据库是通过计算机网络将物理分散的多个数据库单元连接组成的逻辑上统一的数据库。目前分布式数据库的技术路线分为三类:分库分表+中间件方案、共享存储分布式数据库、去中心化的分布式数据库。当下分布式数据库市场产品繁多,但其技术特性逐渐趋同,从两个角度分析:其一,系统架构。存储采用开源或者自研内核,用一主多从的数据副本保证数据完整性,计算通过SQL语句解析分发和结果汇聚,管控用于保证各模块的高可用和故障切换等管理功能。其二,开源和自研两条研发线路。开源主要基于MySQL 和PostGreSQL,难点在于源代码改造的技术难度大;自研周期长且技术要求高,国内完全自研产品屈指可数。未来分布式数据库的核心竞争要素为分布式事务的稳定性、产品全面性以及生态工具的完备性。
首先,工信部开展源代码自主度测试方案,在400W+开源项目、10000W+组件数进行多维度自主度分析。核心功能包括源代码开源率分析、软件成分分析、开源安全漏洞风险分析、开源许可证合规性风险分析。天云数据公司自主研发的Hubble数据库源代码国产化率93%,系统自主研发率99.62%,是真正意义上自研数据库。
其次,继同一产品同一软著同时通过信通院的事务和分析评测,天云数据Hubble数据库再次通过中国信通院首批“可信数据库”-HTAP数据库产品评测,成为三家通过测评单位之一。
最后,Hubble数据库100%基于GO语言编写,可编排、可调度、运维量小,适合云原生时代,弹性伸缩,按需分配。我们知道,PC时代的产品语言是C/C++,C语言的理念是信任程序员,但应对大规模问题还是会捉襟见肘;互联网时代换成了Java语言,虽然Java语言跨平台异构的能力强,但因其编码繁琐,所以运行效率很低。C语言、Java语言都是业界的主流语言,为什么天云数据会选择Go语言?在数据库产品线,天云数据团队早期沿着HBase技术路径探索。后创立天云数据公司,面对银行A类核心系统ACID 的事务需求,以及银监会要求的两地三中心容灾要求,团队开始面向交易体系进行分布式计算的原创路径探索,Hubble数据库重写了HBase存储引擎,采用Go语言研发,更适于服务化的云原生时代。相比与C语言、Java语言,Go语言在工程化能力以及性能上都是最适合天云数据的,可以实现逻辑层、调度层、计算层、存储层的更小颗粒度的解析。天云数据就是站在Google这样巨人的肩膀上,卸掉了C语言的包袱,快速地奔跑。