再谈 HBase 八大应用场景
1. HBase概述
HBase是一个分布式存储、数据库引擎,可以支持千万的QPS、PB级别的存储,这些都已经在生产环境验证,并且在广大的公司已经验证。特别是阿里、小米、京东、滴滴内部都有数千、上万台的HBase集群。选择一个技术的首要条件是对齐大公司,大公司会投入大量的人力去维护、改进、贡献社区。
2. 关于 NewSQL 与 NoSQL 的关系
技术总是不断向前发展的,如今都在提NewSQL,其实NewSQL在笔者看来是NoSQL之上的一个封装,一个子场景。NoSQL中的大表,典型就是提供了KV1V2……Vn,其中每个V可以是1b,也可以是100MB。可以说是一个元的存在,就类似于数字世界的01,可以任意组合。在以HBase为代表的NoSQL中,HBase可以组合出任意的场景,NewSQL可以是之上加了SQL层或者更近一层添加事务的子场景。
3. 关于计算与存储分离
在云上,对于引擎最为核心的就是存储计算分离,存储可以按需计费,起码得弹性伸缩。计算则按节点存储提供。如果完全按照QPS计费,要么费用高得吓人,要么难以满足更多的场景,比如存储10M,到底算一次QPS,还是多少次。 由于HBase天生就是存储计算分离,天然比较适配云上的架构,可以说到了云上,HBase更加具有优势。
4. HBase 场景
HBase可以说是一个数据库,也可以说是一个存储。拥有双重属性的HBase天生就具备广阔的应用场景。在最近的一些版本中,引入了OffHeap降低gc影响,优化链路延迟,提供Replica等可以满足在线的需求。引入MOB,可以存储10M左右的对象,完全适应了对象存储。另外由于自身的并发能力、存储能力,可以说是具有最为竞争力的引擎
对象存储:我们知道不少的头条类、新闻类的的新闻、网页、图片存储在HBase之中,一些病毒公司的病毒库也是存储在HBase之中
时序数据:HBase之上有OpenTSDB模块,可以满足时序类场景的需求
推荐画像:特别是用户的画像,是一个比较大的稀疏矩阵,蚂蚁的风控就是构建在HBase之上
时空数据:主要是轨迹、气象网格之类,滴滴打车的轨迹数据主要存在HBase之中,另外在技术所有大一点的数据量的车联网企业,数据都是存在HBase之中
CubeDB OLAP:Kylin一个cube分析工具,底层的数据就是存储在HBase之中,不少客户自己基于离线计算构建cube存储在hbase之中,满足在线报表查询的需求
消息/订单:在电信领域、银行领域,不少的订单查询底层的存储,另外不少通信、消息同步的应用构建在HBase之上
Feeds流:典型的应用就是xx朋友圈类似的应用
NewSQL:之上有Phoenix的插件,可以满足二级索引、SQL的需求,对接传统数据需要SQL非事务的需求
更多的场景需要不断挖掘
5. 结尾
以上再次回顾HBase的场景,做了一个简单的分类,后续会有一些针对一些场景的实际案例
再谈 HBase 八大应用场景相关推荐
- 再谈全局网HBase八大应用场景
摘要: HBase可以说是一个数据库,也可以说是一个存储.拥有双重属性的HBase天生就具备广阔的应用场景.在2.0中,引入了OffHeap降低了延迟,可以满足在线的需求.引入MOB,可以存储10M左 ...
- 透过数字化转型再谈数据中台(三):一文遍历大数据架构变迁史
编者按:<透过数字化转型再谈数据中台>系列连载 6-8 篇左右,作者结合自己在数据中台领域多年实践经验,总结了数据架构知识.BI 知识,以及分享给大家一些产业互联网实施经验.本文是系列文章 ...
- 再谈产品体验生态 | 半兽人药剂师
产品体验,越来越重要 今天是一个体验为王的时代,这话一点都不过分.特别是对于互联网产品来说,消费者的话语权越来越强,如果你的产品做得好,不久就会口口相传:如果你的产品做得烂,不久就会骂声一片.所有这一 ...
- 2022浅谈前端八大UI库
之前在3月份的时候做过一个<浅谈前端八大UI库>的公开课,反馈还不错,当时就想着等有时间了,就把公开课讲的东西,组织成一个博客.这一等,就等了两个多月. 先说一下什么样的同学适合看这个博客 ...
- 再谈HTTP2性能提升之背后原理—HTTP2历史解剖
即使千辛万苦,还是把网站升级到http2了,遇坑如<phpcms v9站http升级到https加http2遇到到坑>. 因为理论相比于 HTTP 1.x ,在同时兼容 HTTP/1.1 ...
- 依图又斩获10冠!AI芯片拿下创新技术大奖,朱珑再谈智能密度
乾明 李根 发自 厦门 量子位 报道 | 公众号 QbitAI 依图的AI芯片究竟怎么样? 今天国内规格最高的技术评选给出参考. 8月9日,由工信部.公安部及网信办三部委指导主办的"中国人 ...
- JVM学习笔记之-垃圾回收相关概念 System.gc()的理解 内存溢出与内存泄漏 STW 垃圾回收的并行与并发 安全点与安全区域 再谈引用:强引用 软引用 弱引用 虚引用 终结器引用
System.gc()的理解 在默认情况下,通过System.gc()或者Runtime. getRuntime ( ).gc ()的调用,会显式触发Full GC,同时对老年代和新生代进行回收,尝试 ...
- 数据结构与算法--再谈递归与循环(斐波那契数列)
再谈递归与循环 在某些算法中,可能需要重复计算相同的问题,通常我们可以选择用递归或者循环两种方法.递归是一个函数内部的调用这个函数自身.循环则是通过设置计算的初始值以及终止条件,在一个范围内重复运算. ...
- 调用另一个cpp的变量_再谈条件变量—从入门到出家
再谈条件变量-从入门到出家 C语言--条件变量 条件变量是在线程中以睡眠的方式等待某一条件的发生: 条件变量是利用线程间共享的全局变量进行同步的一种机制: 一个线程等待"条件变量的条件成立& ...
最新文章
- 解决windows文件在linux系统中显示乱码的问题
- 使用RMAN VALIDATE验证数据和备份
- Git初学札记(五)————Branch分支管理
- java 找不到构造函数_JAVA找不到符号构造函数
- 一、STM32启动文件详细解析
- python2.7 内置ConfigParser支持Unicode读写
- windows下php mongodb 安装配置使用查询
- Hadoop学习(2)Eclipse配置Hadoop开发环境+HDFS Java API测试+Bug解决记录
- 第三方登录之QQ登录(一)——QQ互联开放平台新建应用
- SSRF利用 Gopher 协议拓展攻击面
- day7-列表和元组
- linux 更新系统时间
- led屏背后线路安装图解_科普:网格屏是什么意思?LED网格屏怎么安装
- 电脑文档被删了怎么恢复?小方法好助手
- 应用场景:征信和权属管理
- 5GHz超频教程:技嘉Z390 AORUS MASTER主板+酷睿i9
- id门禁卡复制到手机_门禁卡复制到苹果手机
- Excel 如何让日期单元格随着某个单元格的修改而自动更新日期
- 网狐、6878 您所填写的推荐人不存在或者填写错误,请检查后再次注册
- java计算机毕业设计web智慧医疗平台设计与实现源码+mysql数据库+系统+lw文档+部署
热门文章
- CentOS7 SELinux阻止MongoDB启动的问题
- python刷取CSDN博文访问量之一
- 部署DNS之辅助区域
- (转)iOS 各种控件默认高度(图示)
- Silverlight C# 游戏开发:Flyer03大图裁剪,高效动画的艺术
- 英文论文中i.e.,e.g.,etc.的正确用法
- linux select 多路复用机制
- Scrapy-css选择器
- Linux驱动调试中的Debugfs的使用简介 CONFIG_DEBUG_FS 的功能与配置
- MyBatis的运行的核心原理解析(三)