以数据库技术为核心的数据安全领域,有望迎来 " 大提速 "。

文/每日财报 苏锋

昨天我们介绍了数字中国下ERP的发展机遇,今天来讲讲站在风口上的数据库。

我国信息技术软硬件底层标准、架构、 产品、以及生态体系被外国把控,这些上游核心技术遭遇美国 “卡脖子”严重影响了我国关键科技和产业的发展。近年来,中央出台多项信创相关的支持政策、指导意见,大力支持信创产业持续发展,努力实现国产替代。

特别是今年“两会”期间,最新组建的“国家数据局”,引发了人们的特别关注。

数据库作为信息系统的核心,其重要性不亚于芯片,它在计算机中承担着承上启下的重要作用,向下调用硬件基础资源,向上是各种应用软件的重要支撑引擎。随着我国数据经济的快速发展,数据量的快速提升,作为信创基础软件重要环节的国产数据库将迎来重大机遇。

高速增长,竞争激烈

数据库管理系统市场持续加快增长。

据 Gartner 报告显示,2021 年全球数据库管理系统市场收入接近 800 亿美元,相比 2020 年增加了 145 亿美元,同比增速达到 22.3%,2020 年这个数字是 19%,市场规模正在加速增长。据统计,数据库管理系统市场已连续六年实现增长,自2017年以来,市场规模已经翻了一倍,四年的年复合增长率达到 19.7%。

据中国信通院发布的《数据库发展研究报告2021》统计,2025年中国的数据库市场规模将达到 688 亿元,5年年复合增长率达23.4%。目前,海外巨头仍占据国内数据库市场较大份额,但国产数据库经历多年沉淀,已经具备初步竞争力。

据《中国信创产业发展报告 2021》统计,2020 年数据库国产化率已达47.4%。根据 IDC统计,目前华为、达梦、人大金仓、阿里云等国产数据库软件已经在市场中占有一定份额,未来随着国产数据库技术不断提升,数据库国产化率有望进一步扩张。从行业来看,2021 年在国内数据库市场份额中占比最高的是金融行业,达到了20.2%,其办公系统和一般系统使用我国数据库产品的机构数量已经超过40%。

从全球范围来看,头部数据库厂商屹立不倒,中下游厂商竞争激烈。

根据 Gartner 发布的 2011- 2021年数据库管理系统市场份额统计显示,Oracle、微软、AWS、IBM、SAP等头部传统数据库厂商的市场排名基本稳定。近年来随着互联网的不断发展和云技术的兴起,华为、阿里、谷歌、 腾讯等互联网大厂也加入了数据库市场的竞争中,依靠自身的资源优势迅速进入了排名前列。随着数字经济快速发展以及数据量的爆发式增长,新兴数据库厂商不断涌现,中下游厂商之间的竞争也愈发激烈,市场排名变动较为明显。

从中国范围看,新数据库产品加速涌现,头部厂商竞争仍然激烈。根据墨天轮统计,2022 年 4 月时共有 205 个国产数据库产品参与排名,2022 年 11 月这个数字增长到了 246 个。头部数据库产品之间的竞争也非常激烈,PingCAP 旗下的 TiDB 长期位于国产数据库榜首,其他数据库产品的排名则变动明显。中国数据库领域暂未出现某几个厂商独大的现象。

搜索引擎数据库中,Elasticsearch占据优势地位。根据DB-Engines 数据,2022年11月共有26款搜索引擎数据库参与排名,Elasticsearch自 2016年起就一直占据榜首地位,Splunk 和 Solr也 一直居于前三名。排名中仅有两款中国产品,一款为阿里云日志服务,排名第 19 位,另一款为日志易,排名第24 位。

本土强势企业

拓尔思是国内人工智能和大数据技术服务提供商,是语义智能领域的领导者。公司成立于1993 年,2011 年在创业板上市,以“语义智能+”为主要发展战略,业务覆盖三大板块:内容安全和互联网空间治理、数字政府和数据智能,应用于党政、金融、能源、互联网传媒等多个行业与市场。

作为国内拥有自主核心技术的人工智能及大数据产品服务的领导者,拓尔思在多个细分领域具有领先地位和品牌优势,目前公司的产品已经服务于 8000 多家机构客户,受到市场广泛认可。

拓尔思是国内中文搜索引擎技术的开创者。在拓尔思成立之初,公司就推出了第一代全文检索系统 TRS Database Server,并服务于新华社、专利出版社等用户。随着大数据时代的到来,拓尔思又顺势推出了功能更加强大的 TRS Hybase 海贝大数据管理系统,服务用户已覆盖公安大数据、媒体大数据、政府大数据以及专利大数据等众多细分行业。目前,海贝大数据管理系统已经推出了 9.0 版本,吸收了拓尔思在信息检索和 NLP 领域多年的技术积累,从内核到系统完全国产自研, 保证了搜索引擎的自主可控与高效安全。

海贝大数据管理系统更适配中国应用场景,相比海外开源搜索引擎数据库产品性能更优。海贝自带的TRS分词器实现了单一分词器覆盖全语种分词,支持中日韩等方块文字和英法德等拉丁语系, 还支持藏文、蒙文、维文等少数民族语言,应用场景全面。公司基于其优势所在的自然语言处理技术,实现了非结构化数据一体化的搜索引擎,利用基于深度学习的基因编码计算技术,实现了图像和文本一起混合搜索,进一步提高了搜索精度。

星环科技拥有自主研发的成熟大数据软件替代方案,是国家信创基础软件领域的重要参与者。Transwarp Scope 是星环科技自主研发的分布式搜索引擎,能提供比 Elasticsearch 更强的扩展性与可靠性。随着数据量的剧增以及性能要求的不断提高,Elasticsearch在集群扩展性、可靠性、数据读写性能、以及数据恢复速度等方面越来越难以满足用户的需求。

星环科技自主研发了 Scope这一分布式搜索引擎产品,提供 PB级海量数据的交互式多维检索分析服务,能够实现高可靠、高扩展性的全文搜索与灵活查询。并且能够兼容常用的 Elasticsearch读写接口,拥有比Elasticsearch 更强的数据一致性和可靠性。为了更方便地实现国产替代,星环科技还提供了从 Elasticsearch平滑迁移到 Scope 的方案,保障国产替代能够顺利进行。

综上可见,随着国产化替代的加速,各个细分市场的国产化厂商进一步“攻城略地”,不断提升市场份额,在此背景下,国产数据库市场有望再度突破期。