摘要: HBase可以说是一个数据库,也可以说是一个存储。拥有双重属性的HBase天生就具备广阔的应用场景。在2.0中,引入了OffHeap降低了延迟,可以满足在线的需求。引入MOB,可以存储10M左右的对象,完全适应了对象存储。另外由于自身的并发能力、存储能力,可以说是具有最为竞争力的引擎

HBase概述

HBase是一个分布式存储、数据库引擎,可以支持千万的QPS、PB级别的存储,这些都已经在生产环境验证,并且在广大的公司已经验证。特别是阿里、小米、京东、滴滴内部都有数千、上万台的HBase集群。选择一个技术的首要条件是对齐大公司,大公司会投入大量的人力去维护、改进、贡献社区。

关于NewSQL与NoSQL的关系

技术总是不断向前发展的,如今都在提NewSQL,其实NewSQL在笔者看来是NoSQL之上的一个封装,一个子场景。NoSQL中的大表,典型就是提供了KV1V2……Vn,其中每个V可以是1b,也可以是100MB。可以说是一个元的存在,就类似于数字世界的01,可以任意组合。在以HBase为代表的NoSQL中,HBase可以组合出任意的场景,NewSQL可以是之上加了SQL层或者更近一层添加事务的子场景。

关于计算与存储分离

在云上,对于引擎最为核心的就是存储计算分离,存储可以按需计费,起码得弹性伸缩。计算则按节点存储提供,完全按照QPS计费,要么费用高得吓人,要么难以满足更多的场景。比如存储10M,到底算一次QPS,还是多少次。 由于HBase天生就是存储计算分离,天然比较适配云上的架构,可以说到了云上,HBase更加具有优势。

HBase场景

HBase可以说是一个数据库,也可以说是一个存储。拥有双重属性的HBase天生就具备广阔的应用场景。在2.0中,引入了OffHeap降低了延迟,可以满足在线的需求。引入MOB,可以存储10M左右的对象,完全适应了对象存储。另外由于自身的并发能力、存储能力,可以说是具有最为竞争力的引擎

  • 对象存储:我们知道不少的头条类、新闻类的的新闻、网页、图片存储在HBase之中,一些病毒公司的病毒库也是存储在HBase之中
  • 时序数据:HBase之上有OpenTSDB模块,可以满足时序类场景的需求
  • 推荐画像:特别是用户的画像,是一个比较大的稀疏矩阵,蚂蚁的风控就是构建在HBase之上
  • 时空数据:主要是轨迹、气象网格之类,滴滴打车的轨迹数据主要存在HBase之中,另外在技术所有大一点的数据量的车联网企业,数据都是存在HBase之中
  • CubeDB OLAP:Kylin一个cube分析工具,底层的数据就是存储在HBase之中,不少客户自己基于离线计算构建cube存储在hbase之中,满足在线报表查询的需求
  • 消息/订单:在电信领域、银行领域,不少的订单查询底层的存储,另外不少通信、消息同步的应用构建在HBase之上
  • Feeds流:典型的应用就是xx朋友圈类似的应用
  • NewSQL:之上有Phoenix的插件,可以满足二级索引、SQL的需求,对接传统数据需要SQL非事务的需求

原文链接

干货好文,请关注扫描以下二维码:

再谈全局网HBase八大应用场景相关推荐

  1. 再谈 HBase 八大应用场景

    1. HBase概述 HBase是一个分布式存储.数据库引擎,可以支持千万的QPS.PB级别的存储,这些都已经在生产环境验证,并且在广大的公司已经验证.特别是阿里.小米.京东.滴滴内部都有数千.上万台 ...

  2. 再谈Docker,微服务的场景化应用

    看过<超能陆战队>的朋友可能仍然对于电影中的男主角介绍和演示自己发明的微型机器人的场景记忆犹新. "它"看起来只是一跟带有磁性的小小的金属部件.但是它是一个独立的个体, ...

  3. 再谈 宝洁经典八大问

    1. Describe an instance where you set your sights on a high/demanding goal and saw it through comple ...

  4. 定义并调用函数输出 fibonacci 序列_科学网—Zmn-0351 薛问天:再谈数学概念的定义,评新华先生《0345》...

    Zmn-0351 薛问天:再谈数学概念的定义,评新华先生<0345> [编者按.下面是薛问天先生发来的文章.是对<Zmn-0345>新华先生文章的评论.现在发布如下,供网友们共 ...

  5. 冯诺曼伊体系 计算机五大逻辑,科学网—再谈冯·诺伊曼结构 - 姜咏江的博文

    再谈冯·诺伊曼结构 姜咏江 为了说明问题简单,我引用一段百度百科当中的文字和图: 冯.诺依曼体系结构是现代计算机的基础,现在大多计算机仍是冯.诺依曼计算机的组织结构,只是作了一些改进而已,并没有从根本 ...

  6. 再谈SQL注入入侵动网SQL版

    再谈SQL注入入侵动网SQL版  编辑前言: 这个文章我没有测试,但前提条件还是很多,比如一定要有别的程序存在,而且也要用同一个SQLSERVER库,还得假设有注入漏洞.说到底和动网没有什么关系,但因 ...

  7. nproc是什么意思_科学网—再谈USPEX - 叶小球的博文

    关注: 1)对缺乏实验数据对比的.有争议的体系,有必要采用不同的预测方法预测,对比结果 2)USPEX工作流程 1. 参数准备: 建立需预测结构目录,拷贝USPEX脚步进入该目录,在USPEX文件夹下 ...

  8. 再谈产品体验生态 | 半兽人药剂师

    产品体验,越来越重要 今天是一个体验为王的时代,这话一点都不过分.特别是对于互联网产品来说,消费者的话语权越来越强,如果你的产品做得好,不久就会口口相传:如果你的产品做得烂,不久就会骂声一片.所有这一 ...

  9. 再谈HTTP2性能提升之背后原理—HTTP2历史解剖

    即使千辛万苦,还是把网站升级到http2了,遇坑如<phpcms v9站http升级到https加http2遇到到坑>. 因为理论相比于 HTTP 1.x ,在同时兼容 HTTP/1.1 ...

最新文章

  1. IoC容器Autofac(1) -- 什么是IoC以及理解为什么要使用Ioc
  2. 定制CE系统随笔-续1
  3. 《深入浅出Ext JS》改版意见有奖征集活动!
  4. C#验证:正则表达式 验证类和界面处理(手机号码,邮箱,IP地址)
  5. struts的国际化
  6. 移动端https抓包那些事--初级篇
  7. P3705-[SDOI2017]新生舞会【0/1分数规划,费用流】
  8. Windows上pip install kenlm报错解决
  9. C语言文本文件与二进制文件转换
  10. 【离散数学】二元运算的性质
  11. CSS3 移动端开发技巧
  12. .NET_.NET 部署问题
  13. [转]对当前自然语言处理方法论中的一个疑惑
  14. java bitset xor_java中的BitSet
  15. C语言实训心得体会(精选4篇)
  16. Kaggle无法出现人机验证的解决办法
  17. html的table 菜鸟,HTML table 标签 | 菜鸟教程
  18. android media player实现一个可手势滑动控制 + 可以调节分辨率|字幕|倍速的视频播放器(MediaPlayer + ExoPlayer实现)
  19. 算法偏见是什么_处理人工智能的偏见如何使算法公平公正
  20. 反应式编程框架设计:如何使得程序调用不阻塞等待

热门文章

  1. mysql 递归查找父节点_MYSQL递归查询所有父节点
  2. php弹幕技术轮询,PHP+Ajax实现在线聊天长轮询
  3. java社区活跃度_Java并发编程-活跃度问题
  4. 祝融号火星车亮相,每小时仅移动40米,为何比乌龟还慢?
  5. 为什么C++永不过时?
  6. 国家自然科学基金2020年预算减少22亿元
  7. 2名数学家或发现史上最快超大乘法运算法,欲破解困扰人类近半个世纪的问题...
  8. 如何才能成为超级人类,驯服人工智能?
  9. NSA-LDL论文修改建议20211116(R-T Bai)
  10. mysql 回退查询_MySQL数据库:第十章:分页查询