Cassandra数据分区

当启动Cassandra集群时,需要选择数据如何在集群中划分,这个由partitioner来完成。

Cluster中管理的所有数据被表示成环(ring).环被划分为和节点数量等同的范围(range). 每个节点加入集群时候,都要发放一个令牌(token),它决定了节点在环中的位置以及负责的数据的range.

Column Family(也就是对应关系数据库的表)就是按照分区来的。

配置partitioner,则需要指定分区策略:

RandomPartitioner(随机分区):这是Cassandra集群中默认的分区策略,它使用了一致性hash的算法。这个算法说明详细见:

http://www.cnblogs.com/coser/archive/2011/11/06/2238359.html

这种策略优点是:一旦你token被分配了,那么column family的数据会被平均的分配到多个集群节点中,并且简化了负载均衡。对于column family数据的读写也是平均的。

OrderedPartitioner(排序的分区):这个Cassandra集群并不推荐。

这必须保证所有的key已经排序了。

我们查看下我们系统的分区策略选择:

转载于:https://blog.51cto.com/supercharles888/865191

Cassandra 数据分区相关推荐

  1. Cassandra数据模型设计最佳实践

    2019独角兽企业重金招聘Python工程师标准>>> 本文是Cassandra数据模型设计第一篇(全两篇),该系列文章包含了eBay使用Cassandra数据模型设计的一些实践.其 ...

  2. DDIA笔记—第六章 数据分区

    第六章 数据分区 数据分区与数据复制 分区通常与复制结合使用,即每个分区在多个节点都存在副本,这就意味着某条记录属于特定的分区,而同样的内容会保存在不同的节点上以提高系统的容错性. 每个节点同时充当某 ...

  3. cassandra数据备份_Cassandra中的数据建模

    cassandra数据备份 在关系数据模型中,我们为域中的每个对象建模关系/表. 对于Cassandra,情况并非如此.本文将详细介绍在Cassandra中进行数据建模时需要考虑的所有方面. 以下是C ...

  4. cassandra 数据量_Cassandra和Spark的数据处理简介

    cassandra 数据量 本文由Jon Haddad合着. 由于现代云应用程序对正常运行时间和性能的要求不断提高,因此对Apache Cassandra数据库的兴趣激增. 那么,什么是Apache ...

  5. yelp实现mysql写Kafka_实时将Cassandra数据引流到Kafka(下)

    INTERMEDIATE阶段的Kafka流 生成的Kafka流包含对跟踪的Cassandra表的所有写入操作,由于对主键的所有更新都驻留在同一个主题分区中,因此要为每个键设置写入的顺序. 虽然不能保证 ...

  6. DDIA读书笔记 6 数据分区

    6 数据分区 6.1 数据分区与数据复制 面对海量数据集或者非常高的查询压力,只使用复制技术还不够,需要将数据分区,也称为分片 分区通常和复制结合使用 6.2 键值数据的分区 目标:将数据和查询负载均 ...

  7. ClickHouse | MergeTree引擎之数据分区

    前言 前面通过 一文了解ClickHouse  介绍过ClickHouse,特性,结构,使用场景.自己并未完全深入学习clickhouse,因为公司打算小范围使用ClickHouse,所以有必要深入学 ...

  8. pg 事务 存储过程_PgpoolII实现数据分区存储及性能分析

    李琳琪-中国PG分会志愿者 目录 1 概述 2 配置环境 3 规则定义 4 数据生成 5 分发性能测试 6 总结 概述 Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据 ...

  9. 数据密集型应用系统设计--数据分区

    数据分区与数据复制 分区的目的一般是提高可扩展性.容错性和集群吞吐,同一个分区会在多个节点中都有副本. 容错性:一个节点挂掉,则这个节点上的分区,在其他节点上都有副本,可以查询其他的节点 可扩展性:新 ...

最新文章

  1. Java 线程池(ThreadPoolExecutor)原理分析与使用
  2. java 静态变量 存储_Java学习笔记9---类静态成员变量的存储位置及JVM的内存划分...
  3. js/jquery判断浏览器的方法总结
  4. java中拼写xml
  5. mysql临时关闭索引功能_MYSQL中常用的强制性操作(例如强制索引)
  6. [实验手册]MPLS/×××分解:防止PE-CE的路由环路
  7. 深度|二代征信:人行数字解读分与征信复议
  8. Spark sample入门到精通
  9. python session模块_python requests模块session的使用建议及整个会话中的所有cookie的方法...
  10. 用于WebKit的CSS诀窍-图片版
  11. 2019仿笔趣阁小说网站源码(PC版+手机版+APP+采集器+教程)下载
  12. 神经网络中常用的误差平方和损失函数是什么
  13. BATT入局,小程序成超级APP连接一切的枢纽
  14. 中心极限定理 - 正态分布
  15. Java多线程学习(吐血超详细总结)转自博主林炳文Evankaka
  16. 玲珑学院OJ 1130 - 喵哈哈村的魔法大师╳灬兲笙疯癫°月【强连通+可相交最小路径覆盖+背包】
  17. c语言return 0和return 1的区别
  18. 英特尔AVX指令集解析
  19. 倩女幽魂次世代服务器为什么维护,8月22日停服维护公告--《倩女幽魂》手游2.0次世代全新起点...
  20. iMAX B6AC充电的时报错:BATTERY CHECK LOW VOLTAGE

热门文章

  1. 12.6日个人工作总结
  2. 【Eclipse中使用Git之一】把远程仓库的项目,clone到eclipse里面
  3. exe注册为service服务
  4. 教学思路C#之入门五 数据类型转换
  5. Windows Server 2016虚拟机克隆后修改安全标识SID
  6. spring+mybatis整合读取不了配置文件
  7. js 获取样式兼容方法
  8. G面经prepare: Reorder String to make duplicates not consecutive
  9. SSH,telnet终端中文显示乱码解决办法
  10. PHP中绘制图像的一些函数总结