自研数据库华为自研的数据库gaussdb怎么样

编程之家2023-10-1983次浏览

本篇文章给大家谈谈自研数据库，以及华为自研的数据库gaussdb怎么样对应的知识点，文章可能有点长，但是希望大家可以阅读完，增长自己的知识，最重要的是希望对各位有所帮助，可以解决了您的问题，不要忘了收藏本站喔。

国产分布式数据库到底怎么样

海内外数据库在部分场景上的性能差距还比较大，难以做进核心业务系统。比如说在RAC（实时应用集群）这块，数据量大、并发量大、变化速度快，国内所有的数据库厂商做的都不如Oracle好，其他如果说兼容性、安全机制等方面国产数据库其实没什么问题，所以国产数据库应用在一些小的边缘业务系统上是没什么问题的，但核心业务系统上还是很难的。现在国家要求金融行业全替换，也是针对办公系统的数据库全替换，在业务系统层面更多的是在小业务系统上做做实验，现在去谈核心业务系统的数据库国产化还为时尚早。

国产数据库厂商要先争取拿到小业务系统的备份系统机会，不要急着喊“国产替代”。存在即合理，Oracle、IBM DB2现在能在金融等行业广泛使用，客户还要接着续购，一定是有原因的。但如果客户愿意在小业务系统上试用国产数据库，那国产数据库厂商可以从备选系统的国产化上先入手。也就是以前的业务系统和海外数据库继续作为主系统使用，在旁边用国产数据库搭一个备选系统来应用，两个系统同时跑看看有没有问题；如果跑一段时间没问题的话就把两个系统切换一下，用国产当主应用，海外当备应用继续跑；这样跑一段还没问题的话，再切回最初的样子，以后两个系统就一直跑下去了；未来一旦海外的主系统出现问题的时候，20s内会自动切换到国产备系统上运行。

做这样的工作并不是一刀切的“国产替代”，只是在海外产品旁边预备一个国产数据库，就足够让国产数据库成长起来。对于客户来说，一方面备选系统采购国产数据库满足了国家对国产化的考核要求，另一方面海外的产品还能维持不动继续使用，满足业务的安全性和稳定性，而且备系统用国产也比主备都用海外产品的开销更低，降低成本压力。

信创环境下国产数据库价格战激烈，厂商生存压力大。由于性能上确实和海外有较大差距，本身国产数据库厂商在信创投标时价格就会报低一点，Oracle的分析型数据库过去在央采里卖三四十万一套，而国产数据库在信创上报价就只报十几万一套，中标价折扣加上集成商一分到手也就五万块，客户采购数量一多再打个折就只能三四万块一套，后续还要去做三年的运维实施，成本压力很大。

国产数据库非良性的竞争下价格越来越低，最后每家公司当年挣的钱只能够支撑当年的运营，如果拿不到项目挣不了钱就难以继续运营，在这种情况下必须要保证当年有钱挣，不管项目是挣多还是挣少，只要有收入就干，有项目发标就去低价抢。这种过度的低价竞争下如果厂商单卖数据库一款产品目前很难实现盈利，也逼退了像华为这样的公司在信创数据库市场的发力，因为投入产出比达不到公司的预期。

另一方面就是跑马圈地现象严重。20年作为信创规模化采购的第一年，厂商都想先占坑抓住客户，所以就降价竞争，有些厂商甚至签的是五年的长期运维合同，这意味着未来五年都是一个低价运维的状态，但一个很核心的问题是后续的业务系统替换国产数据库厂商到底能不能搞定？如果搞定不了，那其实之后是不会有新的利润点出来的，现在占的坑也是白占。

国产信创数据库市场正处于发展早期。根据我们的产业调研，2020年党政信创电子公文系统的数据库市场几乎被人大金仓和达梦瓜分，我们估计二者合计约6个亿收入。目前信创数据库的市场机会在于党政信创电子公文系统的持续替换以及各大央企的OA办公系统的全替换，今年金融、能源、电信等重要行业在信创政策的驱动下已经开始在OA系统和小业务系统上进行国产信创数据库的测试。后续如果信创数据库的试用表现良好，国产数据库将在电子政务系统和重要行业的业务系统上迎来更大的市场发展机会。

过去有些行业客户直接使用开源数据库，之后可能转去采购商业发行版数据库，这也是国产数据库厂商的机遇。根据我们的产业调研，过去我国自然资源行业60%的地理信息系统公司都在使用PG开源数据库，他们自己养十几个人的IT团队去写、去维护自己的PG数据库，但随着国家监管政策的加强，继续使用自研的数据库是需要去进行一系列的测评并拿到相应的证书，客户进行数据库投入的成本会越来越大，而且随着技术的迭代，跟上开源进步的节奏难度也在加大，在第三方专业的数据库厂商发展壮大之后，客户会更愿意去采购商业发行版数据库，这样也能降低自己的成本，让自己更专注于地理信息系统的研发，像超图软件、航天宏图这样的上市公司已经开始与第三方数据库厂商进行兼容性测试，对于走PG技术路线的数据库厂商来说可以无缝兼容，这块未来会成为一个重要的业务拓展场景。

综上所述，当前信创政策的启动为国产信创数据库带来了难得的市场机会，国家投入了大量的人力和财力去推动信创环境的适配工作，客户也给了国产数据库厂商去做到业务系统中的机会，都是希望国产数据库能够逐步发展壮大。但由于数据库技术壁垒高，且直接关系到客户业务系统运行的稳定性，目前国产数据库性能相比海外还有较大差距，还很难做进核心业务系统中，这是产业发展的正常现象。

国产数据库厂商应该抓住政策机遇和客户的信任，多跑客户做案例落地试用，少去论坛空谈技术前景；从小系统的备份先做起，不要急于在核心系统上做一刀切的“替换”，在小系统上经过长时间的验证后再去考虑切入核心场景；加强产业自律与合作，避免过度的价格战对产业长期发展带来伤害，将战略重心放在产品性能和竞争力的提升上。数据库行业没有弯道超车，只有脚踏实地的发展，数据库的国产化会是一个漫长的过程，我们认为在政策和庞大国内市场的培育下，未来十年有望成长出一批具备国际竞争力的优秀国产数据库厂商。

华为自研的数据库gaussdb怎么样

华为自研的数据库gaussdb，还可以吧，用起来算是比较方便。

GaussDB(for Redis)（下文简称高斯Redis）是华为云数据库团队自主研发的兼容Redis协议的云原生数据库，该数据库采用计算存储分离架构，突破开源Redis的内存限制，可轻松扩展至PB级存储。

高斯Redis基于计算存储分离架构，计算层实现热数据缓存，存储层实现全量数据的落盘，中间通过RDMA高速网络互连，通过算法预测用户的访问规律，实现数据的自动冷热交换，最终达到极致的性能提升。

一份难得的数据库市场分析报告

-数据库分类维度：关系型/非关系型、交易型/分析型

- NoSQL数据库的进一步分类

- OLTP市场规模：关系型数据库仍占营收大头

-数据库市场份额：云服务和新兴厂商主导NoSQL

-开源数据库 vs.商业数据库

-数据库三大阵营：传统厂商和云服务提供商

最近由于时间原因我写东西少了，在公众号上也转载过几篇搞数据库朋友的大作。按说我算是外行，没资格在这个领域品头论足，而当我看到下面这份报告时立即产生了学习的兴趣，同时也想就能看懂的部分写点心得体会分享给大家。

可能本文比较适合普及性阅读，让数据库领域资深的朋友见笑了：）

数据库分类维度：关系型/非关系型、交易型/分析型

首先是分类维度，上图中的纵轴分类为Relational Database（关系型数据库，RDBMS）和Nonrelational Database（非关系型数据库，NoSQL），横轴的分类为Operational（交易型，即OLTP）和Analytical（分析型，即OLAP）。

按照习惯我们先看关系型数据库，左上角的交易型类别中包括大家熟悉的商业数据库Oracle、MS SQL Server、DB2、Infomix，也包括开源领域流行的MySQL（MariaDB是它的一个分支）、PostgreSQL，还有云上面比较常见的SQL Azure和Amazon Aurora等。

比较有意思的是，SAP HANA正好位于交易型和分析型的中间分界处，不要忘了SAP还收购了Sybase，尽管后者今天不够风光了，而早年微软的SQL Server都是来源于Sybase。Sybase的ASE数据库和分析型Sybase IQ还是存在的。

右上角的分析型产品中包括几款知名的列式数据仓库Pivotal Greenplum、Teradata和IBM Netezza（已宣布停止支持），来自互联网巨头的Google Big Query和Amazon RedShift。至于Oracle Exadata一体机，它上面运行的也是Oracle数据库，其最初设计用途是OLAP，而在后来发展中也可以良好兼顾OLTP，算是一个跨界产品吧。

再来看非关系型数据库，左下角的交易型产品中，有几个我看着熟悉的MongoDB、Redis、Amazon DynamoDB和DocumentDB等；右下角的分析型产品包括著名的Hadoop分支Cloudera、Hortonworks（这2家已并购），Bigtable（来自Google，Hadoop中的HBase是它的开源实现）、Elasticsearch等。

显然非关系型数据库的分类要更加复杂，产品在应用中的差异化也比传统关系型数据库更大。Willian Blair很负责任地对它们给出了进一步的分类。

NoSQL数据库的进一步分类

上面这个图表应该说很清晰了。非关系型数据库可以分为Document-based Store（基于文档的存储）、Key-Value Store（键值存储）、Graph-based（图数据库）、Time Series（时序数据库），以及Wide Cloumn-based Store（宽列式存储）。

我们再来看下每个细分类别中的产品：

文档存储：MongoDB、Amazon DocumentDB、Azure Cosmos DB等

Key-Value存储：Redis Labs、Oracle Berkeley DB、Amazon DynamoDB、Aerospike等

图数据库：Neo4j等

时序数据库：InfluxDB等

WideCloumn：DataStax、Cassandra、Apache HBase和Bigtable等

多模型数据库：支持上面不只一种类别特性的NoSQL，比如MongoDB、Redis Labs、Amazon DynamoDB和Azure Cosmos DB等。

OLTP市场规模：关系型数据库仍占营收大头

上面这个基于IDC数据的交易型数据库市场份额共有3个分类，其中深蓝色部分的关系型数据库（RDBMS，在这里不统计数据挖掘/分析型数据库）占据80%以上的市场。

Dynamic Database（DDMS，动态数据库管理系统，同样不统计Hadoop）就是我们前面聊的非关系型数据库。这部分市场显得小（但发展势头看好），我觉得与互联网等大公司多采用开源+自研，而不买商业产品有关。

而遵循IDC的统计分类，在上图灰色部分的“非关系型数据库市场”其实另有定义，参见下面这段文字：

数据库市场份额：云服务和新兴厂商主导NoSQL

请注意，这里的关系型数据库统计又包含了分析型产品。Oracle营收份额42%仍居第一，随后排名依次为微软、IBM、SAP和Teradata。

代表非关系型数据库的DDMS分类中（这里同样加入Hadoop等），云服务和新兴厂商成为了主导，微软应该是因为云SQL Server的基础而小幅领先于AWS，这2家一共占据超过50%的市场，接下来的排名是Google、Cloudera和Hortonworks（二者加起来13%）。

上面是IDC传统分类中的“非关系型数据库”，在这里IBM和CA等应该主要是针对大型机的产品，InterSystems有一款在国内医疗HIS系统中应用的Caché数据库（以前也是运行在Power小机上比较多）。我就知道这些，余下的就不瞎写了。

开源数据库 vs.商业数据库

按照流行度来看，开源数据库从2013年到现在一直呈现增长，已经快要追上商业数据库了。

商业产品在关系型数据库的占比仍然高达60.5%，而上表中从这列往左的分类都是开源占优：

Wide Cloumn：开源占比81.8%；

时序数据库：开源占比80.7%；

文档存储：开源占比80.0%；

Key-Value存储：开源占比72.2%；

图数据库：开源占比68.4%；

搜索引擎：开源占比65.3%

按照开源License的授权模式，上面这个三角形越往下管的越宽松。比如MySQL属于GPL，在互联网行业用户较多；而PostgreSQL属于BSD授权，国内有不少数据库公司的产品就是基于Postgre哦。

数据库三大阵营：传统厂商和云服务提供商

前面在讨论市场份额时，我提到过交易型数据库的4个巨头仍然是Oracle、微软、IBM和SAP，在这里William Blair将他们归为第一阵营。

随着云平台的不断兴起，AWS、Azure和GCP（Google Cloud Platform）组成了另一个阵营，在国外分析师的眼里还没有BAT，就像有的朋友所说，国内互联网巨头更多是自身业务导向的，在本土发展公有云还有些优势，短时间内将技术输出到国外的难度应该还比较大。（当然我并不认为国内缺优秀的DBA和研发人才）

第三个阵容就是规模小一些，但比较专注的数据库玩家。

接下来我再带大家简单过一下这前两个阵容，看看具体的数据库产品都有哪些。

甲骨文的产品，我相对熟悉一些的有Oracle Database、MySQL以及Exadata一体机。

IBM DB2也是一个庞大的家族，除了传统针对小型机、x86（好像用的人不多）、z/OS大型机和for i的版本之外，如今也有了针对云和数据挖掘的产品。记得抱枕大师对Informix的技术比较推崇，可惜这个产品发展似乎不太理想。

微软除了看家的SQL Server之外，在Azure云上还能提供MySQL、PostgreSQL和MariaDB开源数据库。应该说他们是传统软件License+PaaS服务两条腿走路的。

如今人们一提起SAP的数据库就想起HANA，之前从Sybase收购来的ASE（Adaptive Server Enterprise）和IQ似乎没有之前发展好了。

在云服务提供商数据库的3巨头中，微软有SQL Server的先天优势，甚至把它移植到了Linux拥抱开源平台。关系型数据库的创新方面值得一提的是Amazon Aurora和Google Spanner（也有非关系型特性），至于它们具体好在哪里我就不装内行了：）

非关系型数据库则是Amazon全面开花，这与其云计算业务发展早并且占据优势有关。Google当年的三篇经典论文对业界影响深远，Yahoo基于此开源的Hadoop有一段时间几乎是大数据的代名词。HBase和Hive如今已不再是人们讨论的热点，而Bigtable和BigQuery似乎仍然以服务Google自身业务为主，毕竟GCP的规模比AWS要小多了。

最后这张DB-Engines的排行榜，相信许多朋友都不陌生，今年3月已经不是最新的数据，在这里列出只是给大家一个参考。该排行榜几乎在每次更新时，都会有国内数据库专家撰写点评。

以上是我周末的学习笔记，班门弄斧，希望对大家有帮助。

参考资料《Database Software Market:The Long-Awaited Shake-up》

https://blocksandfiles.com/wp-content/uploads/2019/03/Database-Software-Market-White-Paper.pdf

扩展阅读：《数据库&存储：互相最想知道的事》

尊重知识，转载时请保留全文。感谢您的阅读和支持！

OK，本文到此结束，希望对大家有所帮助。

自研数据库 华为自研的数据库gaussdb怎么样

国产分布式数据库到底怎么样

华为自研的数据库gaussdb怎么样

一份难得的数据库市场分析报告

自研数据库华为自研的数据库gaussdb怎么样