0

大数据量

大数据处理的基本架构图

存储

数据库,分布式文件系统,NoSQL

比如对于社交网络数据的存储就更适合使用图数据库;对于实时响应要求高的场合使用HBase等列式数据库更好;对于海量批处理使用Hadoop(HDFS + MapReduce)

1数据分片与路由

  • 纵向扩展 Scale Up

  • 横向扩展 Scale Out

  • 分片 Shard/Partition
    将数据切分并分配到各个机器中去

  • 路由 Routing
    数据分片后,如何找到某条记录的具体位置,这个必然要解决的问题称为路由

分片与复制,保证高可用

数据复制后需要解决的问题: 并发更新时 如何 保证数据的一致性等等问题

抽象模型(数据记录->分片->机器存储)

某条记录 -》某个分片 (key - partition 映射)
某个分片 -》某个机器(partition - machine 映射)

  • 点查询 , 常见的Hash映射
  • 范围查询

Hash分片

Round Robin

哈希取模,扩展性低

虚拟桶 Virtual Bucket

数据记录 -》 虚拟桶 (hash映射)
虚拟桶 -》机器(内存表)

一致性哈希 Consistent Hashing

负载均衡
虚拟节点,兼顾机器差异

范围分片

LSM Tree

2 数据复制与一致性

CAP

《大数据日知录》读书笔记 + 回顾补充(20190716 - 2019MMdd)相关推荐

  1. 《BIG DATA大数据日知录 架构和算法》读书笔记

    2019独角兽企业重金招聘Python工程师标准>>> <BIG DATA大数据日知录 架构和算法>读书笔记 博客分类: 架构 分布式计算 1.数据分片和路由 Hash ...

  2. 《大数据日知录:架构与算法》前言

       <大数据日知录:架构与算法>前言 像移动互联网.O2O.可穿戴设备等概念一样,"大数据"从甫一提出到飓风般席卷并风靡全球,从最初的技术名词到形成渗透各行各业的社会 ...

  3. 大数据日知录:架构与算法

    大数据丛书 大数据日知录:架构与算法(大数据领域专家力作,专注大数据架构和算法,全面梳理大数据相关技术) 张俊林 著   ISBN 978-7-121-24153-6 2014年9月出版 定价:69. ...

  4. 大数据丛书 大数据日知录:架构与算法

    大数据丛书 大数据日知录:架构与算法(大数据领域专家力作,专注大数据架构和算法,全面梳理大数据相关技术) 张俊林 著   ISBN 978-7-121-24153-6 2014年9月出版 定价:69. ...

  5. 大数据日知录要点整理

    大数据日知录要点整理 第0 章 当谈论大数据时我们在谈什么 1  NOSQL选型:kv-cassandra.dynamo,列式存储-HBase,图存储-Neo4j 社交网络数据存储适合用图数据库,而实 ...

  6. 博主新书:《大数据日知录:架构与算法》目录

    <大数据日知录:架构与算法>目录 4目录编辑 第0 章 当谈论大数据时我们在谈什么................ 1 0.1 大数据是什么........................ ...

  7. 大数据日知录_腾讯T4专家精心整理:java+大数据+机器学习+数据挖掘+算法大集结...

    前言 本篇文章总共八大部分组成,包括数据挖掘:概念.模型.方法和算法:大数据日知录:架构与算法:大数据算法:数据结构与算法经典问题解析:算法基础:打开算法之门:机器学习算法大集结:Java数据结构和算 ...

  8. 好书推荐--大数据日知录(深入理解大数据的必备书籍)附电子版下载

    今天给大家推荐一本大数据领域中必读的一本书,名字叫<大数据日知录-架构与算法> 这本书正如它封面中介绍的一样,全面梳理大数据相关技术,从数据.算法.策略.应用和系统架构等多个维度进行剖析, ...

  9. 从《大数据日知录》的目录想到的学习路径

    第0 章 当谈论大数据时我们在谈什么................ 1 第1 章 数据分片与路由......................................9 第2 章 数据复制与一 ...

  10. 大数据日知录(一)数据分片与路由

    概念     目前主流的大数据存储与计算系统通常采用横向扩展(Scale Out)的方式支持系统可扩展性,即通过增加机器数目来获得水平扩展能力.对于待存储处理的海量数据,需要通过数据分片(Shard/ ...

最新文章

  1. 山沟沟里的实业路(3)
  2. 一文盘点三大顶级Python库(附代码)
  3. 用Android自带的signapk.jar + .x509.pem + .pk8签名应用程序
  4. 美国用户现在可以下载其所有Apple帐户数据,这是操作方法
  5. php asp 语法,ASP 语法
  6. window.postMessage 跨窗口,跨iframe javascript 通信
  7. 【Clickhouse】Too many partitions for single INSERT block (more than 100)
  8. Java如何封装参数_java规范(一)------方法设计---返回多参数的方法怎么封装
  9. 【redis】spring boot利用redis的Keyspace Notifications实现消息通知
  10. 2016-2017 ACM Central Region of Russia Quarterfinal Programming Contest
  11. Linux 内核 SMP 代码追踪 --- cpumask
  12. Avro, Protocol Buffers 、Thrift的联系与区别
  13. 网页设计软件html图标,网页设计Photoshop(PS)CSS切图必用工具
  14. WinCE 下鼠标键盘驱动分析
  15. 第六篇:uniapp的rpx响应式px样式
  16. 基于Java的超市积分管理系统(附:论文 源码 课件)
  17. 一定能用到的简单但实用的五种按钮样式(原生HTML+CSS步骤详解,含详细注释)
  18. python excel画图哪个好_Python excel 画图
  19. 2021-11-09祖玛游戏
  20. 莫比乌斯函数(Mobius)的求法 每日一遍,算法再见!

热门文章

  1. Two‘s Complement(二进制补码)
  2. 疫情之下,这10个技巧助你开启云面试的正确姿势
  3. 手机支付宝,微信的请求userAgent
  4. 【经验教程】支付宝怎么充值手机话费?
  5. 现代投资组合理论python实现
  6. DongDong认亲戚(字符串之间的并查集应用)
  7. selenium是python_selenium+Python(事件)
  8. 数学专项counting:LA 5846
  9. Linux系统编程 40 -open函数
  10. ORB_SLAM安装以及运行实例