HBase全网最佳学习资料汇总

摘要: HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴、百度、腾讯、京东、小米都有数千台的HBase集群,中国电信的话单、中国人寿的保单都是存储在HBase中。

前言

HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴、京东、小米都有数千台的HBase集群,中国电信的话单、中国人寿的保单都是存储在HBase中。注意大公司有数十个数百个HBase集群,此点跟Hadoop集群很不相同。另外,数据需求,很多公司是mysql+hbase+hadoop(spark),满足关系型数据库需求,满足大规模结构化存储需求,满足复杂分析的需求。如此流行的原因来源于很多方面,如:

  • 开源繁荣的生态:1. 任何公司倒闭了,开源的HBase还在 2.几乎每家公司都可以去下载源码,改进她,再反馈给社区,就如阿里已经反馈了数百个patch了。加入的人越多,引擎就越好
  • 跟HADOOP深度结合:本就同根同源,在数据存储在HBase后,如果想复杂分析,则非常方便
  • 高扩展、高容量、高性能、低成本、低延迟、稀疏宽表、动态列、TTL、多版本等最为关键,起源google论文,发扬社区及广大互联网公司,设计之初就是为存储互联网,后经过多年的改进升级,如今已经是结构化存储的事实标准

以下资料会一直更新中......请大家关注!

书籍

最好买纸质书籍,集中时间看下

  • HBase权威指南(HBase: The Definitive Guide):理论多一些
  • HBase实战:实践多一些

总结性

  • HBase2.0: HBase2.0 :预计今年会发布,hbase2.0是革命性的版本
  • HBase Phoenix:Apache Phoenix与HBase:HBase之上SQL的过去,现在和未来
  • 社区hbase博客:https://blogs.apache.org/hbase/

方法论

  • 学术界关于HBase应用场景(物联网/车联网/交通/电力等)研究大全: HBase在互联网领域有广泛的应用,比如:互联网的消息系统的存储、订单的存储、搜索原材料的存储、用户画像数据的存储等。得益于HBase海量的存储量及超高并发写入读取量。HBase在09年就开始在工业界大范围使用,在学术界,也有非常多的高校、机构在研究HBase应用于不同的行业,本文主要梳理下这些资料(主要是中文资料,有一些是硕士论文期刊),这些很多都在工业界使用了。
  • HBase使用场景和成功案例 存储互联网的初心不变
  • 一种基于物联网大数据的设备信息采集系统及方法:怎么使用HBase、sparkStreaming、redis处理物联网大数据
  • 一种基于HBase的智能电网时序大数据处理方方案:一种基于HBase的智能电网时序大数据处理方方案
  • HBase配合GeoHash算法支持经纬度:此文主要讲GeoHash算法的
  • 基于HBase的海量GIS数据分布式处理实践:设计了一种基于分布式数据库HBase的GIS数据管理系统。系统优化了栅格数据的生成和存储过程,将海量栅格数据直接写入HBase存储、索引。同时,针对矢量空间数据的存储、索引与检索,提出了一种新的rowkey设计,既考虑经纬度,又考虑空间数据类型和属性,使得在按空间位置检索矢量地理信息时,能通过HBase的rowkey迅速定位需要返回的数据。在HBase的集群环境上用真实GIS数据对上述方法进行了验证,结果表明,提出的系统具有较高的海量数据存储和检索性能,实现了海量地理信息数据的高效存储和实时高速检索。
  • 基于HBase的金融时序数据存储系统:金融类时序数据的存储方案,写的还是结合实际场景的。

各大公司的实践

基本围绕在用户画像、安全风控、订单存储、交通轨迹、物理网、监控、大数据中间存储、搜索、推荐等方面:

  • 阿里巴巴-大数据时代的结构化存储HBase在阿里的应用实践:讲述在阿里巴巴集团的实践,HBase在阿里集团已经10000台左右,主要在订单、监控、风控、消息、大数据计算等领域使用
  • 阿里巴巴搜索-Hbase在阿里巴巴搜索中的完美应用实践:讲述在搜索场景下hbase的应用及相关的改进
  • 日均采集1200亿数据点,腾讯千亿级服务器监控数据存储实践:本文将从当前存储架构存在的问题出发,介绍从尝试使用 Opentsdb 到自行设计 Hbase 存储方案来存储 TMP 服务器海量监控数据的实践历程。
  • 滴滴-HBase在滴滴出行的应用场景和最佳实践:统计结果、报表类数据、原始事实类数据、中间结果数据、线上系统的备份数据的一些应用
  • HBase在京东的实践 :跟阿里一样,京东各个业务线使用了HBase,如:风控、订单、商品评价等
  • 中国人寿基于HBase的企业级大数据平台:使用一个大跨表存储所有的保单,HBase宽表的实践
  • HBase在Hulu的使用和实践:用户画像、订单存储系统、日志存储系统的使用
  • Apache HBase at Netease:在报表、监控、日志类业务、消息类业务、推荐类业务、风控类业务有所使用,另外讲述了一些优化的点。
  • 10 Million Smart Meter Data with Apache HBase:讲述Hitachi为什么选择hbase及在HBase方面的应用
  • G7:如何用云计算链接30万车辆--EMR&Hbase 在物联网领域的实践及解决方案 讲述了怎么使用spark及hbase来满足物联网的需求

HBase资料库

  • HBase:https://pan.baidu.com/s/1jILzgns
  • 知乎HBase讨论:https://www.zhihu.com/topic/19600820/hot
  • hbase中文社区:www.hbase.group
  • csdn HBase资料库:http://lib.csdn.net/hbase/node/734

结尾

这些资料是笔者整理,以供有大规模结构化需求的用户及HBase爱好者学习交流,以使用HBase更好的解决实际的问题。

交流群

如果大家对HBase有兴趣,致力于使用HBase解决实际的问题,欢迎加入阿里云Hbase技术交流群交流.
欢迎加入阿里云云HBase技术交流群
钉钉阿里云hbase交流群

声明

以上资料来自互联网,如果侵权,请联系我删除

转载于:https://www.cnblogs.com/think90/p/8886116.html

HBase全网最佳学习资料汇总相关推荐

  1. [转]机器学习和深度学习资料汇总【01】

    本文转自:http://blog.csdn.net/sinat_34707539/article/details/52105681 <Brief History of Machine Learn ...

  2. 一份较为详细的深度学习资料汇总

    转载自:https://blog.csdn.net/Times_poem/article/details/51596233,总结的资源还挺多,也很杂,有的东西以前研究过,还是不错的,先囤着吧,以后有空 ...

  3. 【收藏清单】AI学习资料汇总——你想要的AI资源,这里都有

    本文汇总了TinyMind站内AI资料类热门文章TOP10,欢迎大家各取所需.来源:https://www.tinymind.cn/ 1.[AI入门者必看]--人工智能技术人才成长路线图 入门AI的两 ...

  4. Java 8学习资料汇总

    本文首发于InfoQ. Java 8发布已经有一段时间,它被认为是Java 5发布以来最大的一次版本升级.Java 8 为Java语言.编译器.类库.开发工具以及JVM(Java虚拟机)带来了大量新特 ...

  5. 【OpenCV】入门学习资料汇总

    opencv入门学习资料汇总页面 自制python版的正在撰写中- ?浅墨_毛星云,<OpenCV3编程入门>的作者,为初学者详细讲解了环境搭建.库.工程的配置等等头疼的问题,并有18个配 ...

  6. 前端学习资料汇总(转)

    前端学习资料汇总(转) 前端工具: can i see :http://caniuse.com/  --一个查看css及html5在各个浏览器及手机端的支持情况 前端视野:--平时可以多看看的网站了解 ...

  7. Apple Swift学习资料汇总

    [更新]Apple Swift学习资料汇总 1月16日厦门 OSC 源创会火热报名中,奖品多多哦 »   今年的苹果开发者大会(WWDC)上,公布了ios8的几个新特性,其中包括引入了群聊功能,支持第 ...

  8. 知识图谱学习资料汇总

    知识图谱学习资料汇总 持续更新中- 知识图谱介绍 (1)知识图谱入门笔记(参考王昊奋) 知乎:https://zhuanlan.zhihu.com/c_211846834 (2)Mining Know ...

  9. 【转】 计算机视觉、图像处理学习资料汇总

    计算机视觉.图像处理学习资料汇总 分类: 数字图像处理2012-07-19 09:24 2629人阅读 评论(1) 收藏 举报 图像处理processingimage微软compressionreso ...

最新文章

  1. Android之循环执行次数のHandlerRunnable
  2. c++ 递增一个指针
  3. mysql timestamp 插入null报错_读MySQL 5.7文档11.2 Date and Time Data Types总结
  4. C++泛型编程实现哈希表(开散列法)
  5. springMVC使用注解方式进行页面跳转
  6. 【python】Get与Post的区别?(面试官最想听到的答案)
  7. linux刻录win10u盘_手把手教你装系统之【制作官方win10安装U盘】
  8. java 日期只计算年月日大小_Java 计算两个日期相差多少年月日
  9. 【Elasticsearch】Meltdown对Elasticsearch性能的影响
  10. append从一个添加到另一_小米的另一妙用,制作小米锅巴,吃着嘎嘣脆,一口一个香得很...
  11. c语言uefi读写文件,UEFI简单的应用程序模块MyHelloWorld:C源文件/INF工程文件源码/简析[6]...
  12. packet captuer tool: snoop
  13. 转-Tensorflow之GPU和CPU
  14. kerastensorflow+分布式训练︱实现简易视频内容问答框架
  15. pppd详解_Linux 使用pppd和ppp程序进行3G/4G拨号
  16. 将C盘的软件已经移到了D盘,为什么C盘还是会出现变红或饱满的状态?
  17. CMake编译C++项目-简单范例-编译脚本-Linux
  18. python归一化和反归一化_python:什么是归一化以及怎么做归一化?
  19. exe文件解析_PE文件格式之重定位表
  20. 浅谈RFID资产管理-RFID资产可视化管理系统

热门文章

  1. CentOS yum的详细使用方法
  2. 【Unity】关于屏幕自适应的思路
  3. jqurey ajax 的动态添加二级联动下拉菜单
  4. 枚举、位操作 CLR学习第十二课
  5. Silverlight4Beta之与剪切板通信
  6. 关于Web面试的基础知识点--Javascript(二)
  7. Python随手记—各种方法的使用
  8. 解题报告: LeetCode Max Points on a Line
  9. 第十七篇 --ANDROID DisplayManager 服务解析一
  10. 如何建立自己的知识体系?(摘)