local quorum查询某个分区键的条数,每次查询,条数都不一样。”
“按这个分区键的token修复,直接瞬间修复结束。但是再查,还是每次查询条数不一致。”
“之前遇到墓碑丢失的问题,单个token查询结果不一致,修复也解决不了”
……

不用再为数据不一致苦恼,因为强一致的Cassandra来了,DBA们不用加班修数据了。
GaussDB(for Cassandra)是一款基于华为自主研发的计算存储分离架构的分布式云数据库服务。是一个强一致性的系统,在华为云高性能、高可用、高可靠、高安全、可弹性伸缩的基础上,提供了一键部署、备份恢复、监控报警等服务能力。高度兼容开源Cassandra接口,并提供高读写性能,具有高性价比,适用于IoT、气象、互联网、游戏等领域。

本文将从架构、主要特性、竞争力、应用场景等方面进行介绍。
设计架构:

GaussDB(for Cassandra)基于计算存储分离架构,该架构基于华为内部强大且广泛使用的自研分布式存储系统DFV(数据功能虚拟化/Data Function Virtualisation),实现了一套Share Everything的云开源架构,充分发挥了云开源的弹性伸缩、资源共享的优势,高度兼容Cassandra协议,拥有超强写入性能,同时相比社区版具有分钟级计算扩容、秒级存储扩容、数据强一致等优势,性能更强更稳定,数据更可靠,扩容更敏捷,适用于IoT、实时推荐、金融反欺诈检测等场景。

GaussDB(for Cassandra)牛在哪?
高可靠:数据强一致,提供企业级数据可靠性
开源Cassandra读写数据采用最终一致性,此处用读场景举例:如果读一致性要求为ONE,会立即返回离客户端最近的一份数据副本,那么这意味着第一次读取到的数据可能不是最新的数据。如果读一致性要求为QUORUM(即读取任一数据中心中quorum数量的节点的结果,返回合并后timestamp最新的结果),则内核会自动触发读修复,然后返回给客户端。假如此时有副本所在节点出现坏盘,在gc_graces的周期内没有完成数据修复,部分副本属于坏盘节点的业务数据,业务查询过程中发现数据会概率性不正确。

GaussDB(for Cassandra)采用存算分离架构,数据的副本在DFV存储平台保证,对计算节点来说数据单副本、数据强一致,查询只需要从协调节点直接到数据节点取数据即可完成,规避了数据不一致修复数据造成的人力成本、业务查询过程中发现数据会概率性不正确等问题。另外支持N-1个节点故障容忍,提供10倍以上的故障重构性能和备份恢复性能,保证数据的可靠性。

高扩展:秒级扩容,快速更神速
开源Cassandra采用一致性Hash算法对数据进行分区打散,整个环代表数据从负无穷到正无穷区间。集群中每个节点会有虚拟节点(Token)在环上,虚拟节点的数量可配置。黄圈代表节点1,蓝圈代表要扩容的节点2,2个Token之间组成整个数据的其中一段Range区间,扩容后加入了新的Token,会产生新的Range,这些Range中的一部分会归新节点2管理。那么就需要把数据从节点1迁移到新节点2上去。迁移是通过读取节点1上的数据写入到节点2上,迁移的速度可以通过配置参数调整,整体迁移的时间由数据量与迁移过程中的读写速率有关。

GaussDB(for Cassandra)把多副本策略下沉到共享存储,大幅提升弹性伸缩能力,如图右侧展示,新扩容的节点2只需要重新映射Token2到节点2,就可以完成,无需做数据的读取与写入的搬迁动作,实现分钟级计算扩容,相比开源扩容时间提升几十倍。随着业务的不断增长,Cassandra可以分钟级水平弹性资源扩展。在类似圣诞节等热门节日,提前1天进行弹性扩容,为业务高峰预留资源,业务高峰过后进行缩容,这些对业务无感知。计算节点可以通过文件系统控制集群在DFV中的数据使用量,扩容缩容磁盘时通过重新分配最大使用量,可实现秒级存储扩容,单实例支持海量数据存储。

高性能:超高写入,读性能数倍提升
GaussDB(for Cassandra)在超强写入性能的基础上,通过使用C语言重构存储引擎,减少系统GC,实现了数倍读性能提升,拓宽了使用场景的外延,使其不仅仅适用于写密集型的业务场景,在读密集的场景中也具备了强竞争优势,整体性能超越开源自建2~3倍。

高安全:构筑多层保护,为数据安全保驾护航
GaussDB(for Cassandra)通过VPC、子网、安全组、DDoS防护以及SSL安全访问等多层安全防护体系,帮助用户抵御网络攻击,让用户上云无忧。

为什么选择GaussDB(for Cassandra)?
能力 技术能力对比
开源自建Cassandra GaussDB(for Cassandra)
自动备份能力、PITR × √
超大数据量及复杂查询支持 × √
流表(数据变更捕获) × √
离线分析 不完善 √
高可靠:双向数据同步、无损升级 × √
分钟级扩容 × √

全局索引 不完善 √
数据强一致 × √
适用多种场景
工业制造&气象业
随着科技进度,采集的气象数据指数增长,需要一种系统对地面、高空、海洋、重要天气报、闪电、环境监测等卫星、雷达采集的数据能够高性能写入、查询、在线、离线分析。

1.需要存储对地面、高空、海洋、重要天气报、闪电、环境监测等卫星、雷达等降雨量、湿度、温度等PB级数据量
2.支撑来自各气象采集点数据高并发写入到Cassandra,GaussDB(for Cassandra)集群性能高于自建2~3倍,更适合高并发写入读取
3.GaussDB(for Cassandra)数据能够支撑实时在线分析,为气象算法、天气预报做到实时精准分析
4.访问数据库进行离线数据分析,GaussDB(for Cassandra)能将离线分析时效缩短到60%

互联网
GaussDB(for Cassandra)具备高并发写入性能和高可扩展性,保障集群高可用和业务连续稳定性,非常适用于写入规模量较大的互联网大数据场景,如记录大规模的用户行为数据等。
1.存放用户画像数据,能够完美解决特征:数据量大、可以应对数据结构Scheme频繁变更
2.查询性能要求高;比如要买一双鞋,搜索出的鞋子数据会根据用户画像的特征做一定的排序展示,那么要求查询用户特征表的查询性能非常高
3.推荐系统:根据用户最近浏览的数据做分析之后,推荐相关资源给用户
4.点赞系统:点赞计数系统

实时数据分析场景
GaussDB(for Cassandra)群组今天新来了一个成员,或者yutou今天发布一篇新文章,华为云数据库官方自动向该用户发出欢迎邮件。

昵称为yutou的同学今天发布了一组新照片,那么另外一个程序自动向yutou的好友发送通知。

原生不具备的数据变更捕获能力,GaussDB(for Cassandra)具有变更捕获能力,能对数据的变更做实时在线分析,提供秒级的实时推送动作做出相应处理;具有完善的离线分析解决方案,可以将离线分析时效缩短到60%,为商家争取更多的时间做出相应决策。

购买建议
GaussDB(for Cassandra)性能为开源2倍以上,存储空间仅需开源自建1/3,帮助客户节省成本,举例如下:开源自建8u32g * 3节点 数据量:90G(三副本),购买GaussDB(for Cassandra)可选择创建4u16g * 3节点 数据量:30G(DFV存储三副本)。

初识华为云数据库GaussDB(for Cassandra相关推荐

  1. 华为云数据库GaussDB(for Cassandra)揭秘第二期:内存异常增长的排查经历

    摘要:华为云数据库GaussDB(for Cassandra) 是一款基于计算存储分离架构,兼容Cassandra生态的云原生NoSQL数据库:它依靠共享存储池实现了强一致,保证数据的安全可靠. 本文 ...

  2. 云图说|初识华为云数据库GaussDB(for openGauss)

    摘要:本文带你了解华为云华为云数据库GaussDB(for openGauss),将AI 技术融入分布式数据库的全生命周期,实现自运维.自管理.自调优.故障自诊断和自愈. 本文分享自华为云社区< ...

  3. 再识华为云数据库——GaussDB

    目录 一.GaussDB: 立足创新与自研,助力企业核心数据安全高效上云 二.GaussDB: 基于华为openGauss开放生态打造的 金融级分布式数据库 三.GaussDB(for MySQL): ...

  4. 华为云数据库 GaussDB(for MySQL),让企业无忧数据恢复

    可能很多网络运营单位在数字化转型过程中都遇见过因为停电导致信息数据丢失,进而致使整个网络运营单位的云上业务被迫中断这样的问题?这时候网络运营单位需要探索到业务中断的原因,并且寻找相应的办法来解决.比如 ...

  5. 华为云数据库GaussDB(for MySQL)携高新技术强势而来

    华为云数据库GaussDB(for MySQL)携高新技术强势而来 企业数据库堪比人的心脏一样重要,不仅要承担企业数据存储.维护.管理.分析等任务,还要保证企业数据的完整性和准确性,并且需要承载着对其 ...

  6. 华为云数据库 GaussDB(for MySQL),为企业云上业务发展保驾护航

    华为云数据库 GaussDB(for MySQL),为企业云上业务发展保驾护航 近年来,随着企业数字化转型地不断深入,应该会有企业都会碰到这样一些问题, 如企业云上业务的运行因而计算机任务闪退而中断, ...

  7. 华为云数据库-GaussDB for MySQL数据库

    华为云数据库-GaussDB for MySQL数据库 GaussDB是华为云自主研发的一款高性能关系型数据库,它完全兼容了MySQL,而且它是华为云最新的一代企业级分布式关系型数据库,它也继承了华为 ...

  8. 华为云数据库GaussDB(for OpenGauss)的连接

    使用可视化工具连接 1.连接工具DataStutio 链接:https://pan.baidu.com/s/1GxB8i3RN5sbvchIloPQG3w 提取码:r762 使用这个工具可以直接连接上 ...

  9. 六、华为云数据库GaussDB(for openGauss)

    1.(判断题)GaussDB(for openGauss)数据库只能采用分布式架构进行部署. 错误 2.(单选题)GaussDB(for openGauss)开启三权分立后,以下哪个不是GaussDB ...

最新文章

  1. 【linux】Valgrind工具集详解(三):打印信息说明
  2. git-svn:通过git来管理svn代码
  3. 5.QT5中的connect的实现
  4. java byte 正数最大_为什么Java byte 类型的取值范围是-128~127
  5. 计算机应用计算题(88)10,计算机应用考试习题(88页)-原创力文档
  6. 成功解决NameError: name 'file' is not defined
  7. 智能合约重构社会契约(11)天德区块链智能合约系统
  8. 简单易变的CSS阴影效果
  9. Leetcode 杂题
  10. ORACLE PATCH 版本的查询 PL/SQL
  11. 每天一道剑指offer-重建二叉树
  12. 浅谈SpringMVC的概念及执行原理
  13. 计算机怎么剪切音乐然后合在一起,电脑怎么剪辑合并音乐
  14. C# Excel文件合并
  15. 学生报告-大学生活经验
  16. PHP合并两张(多张)图片
  17. 好佳居软装十大品牌 软装拥有与众不同的体验
  18. 【项目实战】 ---- 简单整合SpringBoot + MyBatis + Themyleaf小项目
  19. 有向完全图 java_图结构(一)
  20. DCCI发布Q1外卖报告 美团外卖市场份额持续增长至64.6%

热门文章

  1. 统计学(五):几种常见的假设检验
  2. 【C++】哈希——unordered系列容器|哈希冲突|闭散列|开散列
  3. Shell脚本循环语句及exit、continue和break用法
  4. linux insert最后一行,insert基础用法及进阶
  5. 服务器有国产化系统吗,服务器国产化
  6. poi读取excel表
  7. String.prototype.padStart()
  8. 与Anthony Baldino一起塑造声音
  9. win10耳机有杂音滋滋_蓝牙耳机的底噪和电流声有区别吗?双11五款高续航平价蓝牙耳机分享...
  10. 深度学习故障诊断之-使用条件生成对抗网络CGAN生成泵流量信号