1. HBase概述


HBase是一个分布式存储、数据库引擎,可以支持千万的QPS、PB级别的存储,这些都已经在生产环境验证,并且在广大的公司已经验证。特别是阿里、小米、京东、滴滴内部都有数千、上万台的HBase集群。选择一个技术的首要条件是对齐大公司,大公司会投入大量的人力去维护、改进、贡献社区。

2. 关于 NewSQL 与 NoSQL 的关系


技术总是不断向前发展的,如今都在提NewSQL,其实NewSQL在笔者看来是NoSQL之上的一个封装,一个子场景。NoSQL中的大表,典型就是提供了KV1V2……Vn,其中每个V可以是1b,也可以是100MB。可以说是一个元的存在,就类似于数字世界的01,可以任意组合。在以HBase为代表的NoSQL中,HBase可以组合出任意的场景,NewSQL可以是之上加了SQL层或者更近一层添加事务的子场景。

3. 关于计算与存储分离


在云上,对于引擎最为核心的就是存储计算分离,存储可以按需计费,起码得弹性伸缩。计算则按节点存储提供。如果完全按照QPS计费,要么费用高得吓人,要么难以满足更多的场景,比如存储10M,到底算一次QPS,还是多少次。 由于HBase天生就是存储计算分离,天然比较适配云上的架构,可以说到了云上,HBase更加具有优势。

4. HBase 场景


HBase可以说是一个数据库,也可以说是一个存储。拥有双重属性的HBase天生就具备广阔的应用场景。在最近的一些版本中,引入了OffHeap降低gc影响,优化链路延迟,提供Replica等可以满足在线的需求。引入MOB,可以存储10M左右的对象,完全适应了对象存储。另外由于自身的并发能力、存储能力,可以说是具有最为竞争力的引擎

  • 对象存储:我们知道不少的头条类、新闻类的的新闻、网页、图片存储在HBase之中,一些病毒公司的病毒库也是存储在HBase之中

  • 时序数据:HBase之上有OpenTSDB模块,可以满足时序类场景的需求

  • 推荐画像:特别是用户的画像,是一个比较大的稀疏矩阵,蚂蚁的风控就是构建在HBase之上

  • 时空数据:主要是轨迹、气象网格之类,滴滴打车的轨迹数据主要存在HBase之中,另外在技术所有大一点的数据量的车联网企业,数据都是存在HBase之中

  • CubeDB OLAP:Kylin一个cube分析工具,底层的数据就是存储在HBase之中,不少客户自己基于离线计算构建cube存储在hbase之中,满足在线报表查询的需求

  • 消息/订单:在电信领域、银行领域,不少的订单查询底层的存储,另外不少通信、消息同步的应用构建在HBase之上

  • Feeds流:典型的应用就是xx朋友圈类似的应用

  • NewSQL:之上有Phoenix的插件,可以满足二级索引、SQL的需求,对接传统数据需要SQL非事务的需求

    更多的场景需要不断挖掘

5. 结尾


以上再次回顾HBase的场景,做了一个简单的分类,后续会有一些针对一些场景的实际案例

再谈 HBase 八大应用场景相关推荐

  1. 再谈全局网HBase八大应用场景

    摘要: HBase可以说是一个数据库,也可以说是一个存储.拥有双重属性的HBase天生就具备广阔的应用场景.在2.0中,引入了OffHeap降低了延迟,可以满足在线的需求.引入MOB,可以存储10M左 ...

  2. 透过数字化转型再谈数据中台(三):一文遍历大数据架构变迁史

    编者按:<透过数字化转型再谈数据中台>系列连载 6-8 篇左右,作者结合自己在数据中台领域多年实践经验,总结了数据架构知识.BI 知识,以及分享给大家一些产业互联网实施经验.本文是系列文章 ...

  3. 再谈产品体验生态 | 半兽人药剂师

    产品体验,越来越重要 今天是一个体验为王的时代,这话一点都不过分.特别是对于互联网产品来说,消费者的话语权越来越强,如果你的产品做得好,不久就会口口相传:如果你的产品做得烂,不久就会骂声一片.所有这一 ...

  4. 2022浅谈前端八大UI库

    之前在3月份的时候做过一个<浅谈前端八大UI库>的公开课,反馈还不错,当时就想着等有时间了,就把公开课讲的东西,组织成一个博客.这一等,就等了两个多月. 先说一下什么样的同学适合看这个博客 ...

  5. 再谈HTTP2性能提升之背后原理—HTTP2历史解剖

    即使千辛万苦,还是把网站升级到http2了,遇坑如<phpcms v9站http升级到https加http2遇到到坑>. 因为理论相比于 HTTP 1.x ,在同时兼容 HTTP/1.1 ...

  6. 依图又斩获10冠!AI芯片拿下创新技术大奖,朱珑再谈智能密度

    乾明 李根 发自 厦门  量子位 报道 | 公众号 QbitAI 依图的AI芯片究竟怎么样? 今天国内规格最高的技术评选给出参考. 8月9日,由工信部.公安部及网信办三部委指导主办的"中国人 ...

  7. JVM学习笔记之-垃圾回收相关概念 System.gc()的理解 内存溢出与内存泄漏 STW 垃圾回收的并行与并发 安全点与安全区域 再谈引用:强引用 软引用 弱引用 虚引用 终结器引用

    System.gc()的理解 在默认情况下,通过System.gc()或者Runtime. getRuntime ( ).gc ()的调用,会显式触发Full GC,同时对老年代和新生代进行回收,尝试 ...

  8. 数据结构与算法--再谈递归与循环(斐波那契数列)

    再谈递归与循环 在某些算法中,可能需要重复计算相同的问题,通常我们可以选择用递归或者循环两种方法.递归是一个函数内部的调用这个函数自身.循环则是通过设置计算的初始值以及终止条件,在一个范围内重复运算. ...

  9. 调用另一个cpp的变量_再谈条件变量—从入门到出家

    再谈条件变量-从入门到出家 C语言--条件变量 条件变量是在线程中以睡眠的方式等待某一条件的发生: 条件变量是利用线程间共享的全局变量进行同步的一种机制: 一个线程等待"条件变量的条件成立& ...

最新文章

  1. 解决windows文件在linux系统中显示乱码的问题
  2. 使用RMAN VALIDATE验证数据和备份
  3. Git初学札记(五)————Branch分支管理
  4. java 找不到构造函数_JAVA找不到符号构造函数
  5. 一、STM32启动文件详细解析
  6. python2.7 内置ConfigParser支持Unicode读写
  7. windows下php mongodb 安装配置使用查询
  8. Hadoop学习(2)Eclipse配置Hadoop开发环境+HDFS Java API测试+Bug解决记录
  9. 第三方登录之QQ登录(一)——QQ互联开放平台新建应用
  10. SSRF利用 Gopher 协议拓展攻击面
  11. day7-列表和元组
  12. linux 更新系统时间
  13. led屏背后线路安装图解_科普:网格屏是什么意思?LED网格屏怎么安装
  14. 电脑文档被删了怎么恢复?小方法好助手
  15. 应用场景:征信和权属管理
  16. 5GHz超频教程:技嘉Z390 AORUS MASTER主板+酷睿i9
  17. id门禁卡复制到手机_门禁卡复制到苹果手机
  18. Excel 如何让日期单元格随着某个单元格的修改而自动更新日期
  19. 网狐、6878 您所填写的推荐人不存在或者填写错误,请检查后再次注册
  20. java计算机毕业设计web智慧医疗平台设计与实现源码+mysql数据库+系统+lw文档+部署

热门文章

  1. CentOS7 SELinux阻止MongoDB启动的问题
  2. python刷取CSDN博文访问量之一
  3. 部署DNS之辅助区域
  4. (转)iOS 各种控件默认高度(图示)
  5. Silverlight C# 游戏开发:Flyer03大图裁剪,高效动画的艺术
  6. 英文论文中i.e.,e.g.,etc.的正确用法
  7. linux select 多路复用机制
  8. Scrapy-css选择器
  9. Linux驱动调试中的Debugfs的使用简介 CONFIG_DEBUG_FS 的功能与配置
  10. MyBatis的运行的核心原理解析(三)