摘要:

早在2010年开始,阿里巴巴集团开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储,HBase在几代阿里专家的不懈努力下,已经表现得运行更稳定、性能更高效,内部HBase集群超过万台的规模,单集群超过千台,是集团核心数据库产品之一,也是国内甚至国际上绝对的HBase大户。

阿里云HBase 2.0成长手记,含着金汤匙出身

HBase本身是一个分布式存储、数据库引擎,可以支持千万的QPS、PB级别的存储,这些都已经在生产环境验证,并且在阿里得以验证。

早在2010年开始,阿里巴巴集团开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储,HBase在几代阿里专家的不懈努力下,已经表现得运行更稳定、性能更高效,内部HBase集群超过万台的规模,单集群超过千台,是集团核心数据库产品之一,也是国内甚至国际上绝对的HBase大户。

为什么HBase会受到大客户的青睐。首先在这个上云的时代,在云上,对于引擎最为核心的就是存储计算分离,存储可以按需计费,起码得弹性伸缩。计算则按节点存储提供,完全按照QPS计费,要么费用高得吓人,要么难以满足更多的场景。

比如存储10M,到底算一次QPS,还是多少次。 由于HBase天生就是存储计算分离,天然比较适配云上的架构,可以说到了云上,HBase更加具有优势。

所以国内大型互联网企业内部都有大量的HBase集群,尤其阿里更甚。自2012年诞生第一位“东八区” HBase committer,到今天,阿里巴巴已经拥有3个PMC,6个committer,是中国拥有最多HBase committer的公司,其中HBase内核中超过200+重要的feature是阿里贡献。除了拥有强大的内核团队和内核能力,HBase在内部经过双十一等超级业务的千锤百炼,锻炼出一系列的完善的产品形态和企业级能力。

潜心修炼八年,终成HBase2.0

基于阿里长达8年和超万台实践经验和技术积累的延伸,ApsaraDB for HBase在基于社区的HBase的基础上,推出了云HBase服务。建立在阿里云庞大生态体系下,根据云环境生态和HBase存储系统的特点,推出适合企业严苛要求的云HBase存储系统。
HBase 2.0在性能,稳定性上做了一系列内核架构级别优化。这次阿里云基于社区HBase 2.0稳定版本基础上,进行了进一步一系列性能和稳定性优化和测试验证。

此次首发云HBase 2.0云服务,让用户可以第一时间体验到阿里技术加持的HBase 2.0新版本。

首先是针对企业不同的使用环境,不同的SLA诉求,云HBase一共提供3个版本,分别满足开发环境,在线业务,以及金融级业务的诉求。单节点版本,低廉的价格用于开发测试场景,集群版本,99.9%可用,满足企业在线业务诉求,支持最高5000万的QPS和10P的数据。还有支持金融级高可用的双活版本。所有版本都支持11个9的数据可靠性,无需担心数据丢失。

除了完善的产品形态,针对企业应用中成本、安全、稳定性、易用性等诸多诉求,阿里云HBase提供了强大的能力,例如存储计算分离,按需弹性能力; 数据备份恢复能力;数据冷热分离和分级存储能力;SQL接口和强大的二级索引和倒排索引能力;多层次安全能力等等。

细数ApsaraDB HBase典型场景
云HBase已经通过阿里云的公共云、专有云及混合云的形态对外服务,用户覆盖社交、金融、车联网、物流、零售、电商、共享出行等数十个行业,帮助用户顶住千万级QPS的业务压力,以及PB级数据高效存储和处理。

HBase2.0支持多region replicas服务,充分利用集群资源支持更高并发随机读。进一步加强了HBase高并发多读能力,因此非常适合车联网等物联网场景。

除了在物联网场景的应用,我们知道不少的头条类、新闻类的的新闻、网页、图片存储在HBase之中。HBase2.0支持中等对象存储,兼容原生api读写访问以及bulkload等,合适企业存储一些附件文档、图片数据,而不需要企业另选其它对象存储系统,大大简化企业后台数据架构。在存储上支持各类数据,包括日志、订单、交易数据、消息等,在线实时写入,实时查询。

通过对读写全链路优化,rpc改进等,比随机读写延时更低。同时满足了金融级分控,推荐等核心场景的极致时延和稳定性要求。

小结
历经近8年的技术沉淀,阿里巴巴大数据NoSQL数据库处理技术的精华沉淀在HBase上,后者成功支撑了成功支撑了阿里经济体中最大的NoSQL业务体量,是阿里大数据处理技术的核心组成部分,当前将这项技术应用到广大企业中,助力企业发现数据价值。

八年技术加持,性能提升10倍,阿里云HBase 2.0首发商用相关推荐

  1. 比GPU性能提升5倍阿里云含光800云服务器正式商用

    含光800云服务器,配备阿里平头哥自研神经网络加速芯片含光800,提供全球最高单芯片AI推理性能,有着同类处理器的数十倍性能:并针对业务场景做了深度优化,广泛适用于图像搜索.场景识别.视频内容识别.自 ...

  2. Web 应用性能提升 10 倍的 10 个建议

    Web 应用性能提升 10 倍的 10 个建议 提升 Web 应用的性能变得越来越重要.线上经济活动的份额持续增长,当前发达世界中 5 % 的经济发生在互联网上(查看下面资源的统计信息). 我们现在所 ...

  3. 重磅官宣:Nacos2.0性能提升10倍

    简介:​Nacos2.0 作为一个跨代版本,彻底解决了 Nacos1.X 的性能问题,将性能提升了 10 倍. 作者:席翁 继 Nacos 1.0 发布以来,Nacos 迅速被成千上万家企业采用,并构 ...

  4. 重磅官宣:Nacos2.0发布,性能提升10倍

    简介: ​Nacos2.0 作为一个跨代版本,彻底解决了 Nacos1.X 的性能问题,将性能提升了 10 倍. 作者:席翁 继 Nacos 1.0 发布以来,Nacos 迅速被成千上万家企业采用,并 ...

  5. SQLite性能提升10倍的Web数据库

    作者 | James Long 译者 | 弯月 出品 | CSDN(ID:CSDNnews) 最近我开发了一款名为absurd-sql的SQLite后端.在这款工具的帮助下,你无需将整个数据库加载到内 ...

  6. 英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM...

    Pine 发自 凹非寺 量子位 | 公众号 QbitAI "AI的iPhone时刻已至",英伟达或成最大赢家. 在GTC2023大会上,黄仁勋接连放出大招: 不仅发布了ChatGP ...

  7. 性能提升10倍以上:阿里达摩院成功研发新型存算一体芯片

    清华大数据软件团队官方微信公众号来源:机器之心 本文约1700字,建议阅读5分钟 人脑的特性就是存算一体,神经元在处理任务时具有极高的并行度,并且功耗极低. 近期,阿里巴巴达摩院宣布成功研发新型存算一 ...

  8. 天下武功唯快不破:TiDB 在线 DDL 性能提升 10 倍

    作者: TiDB社区小助手 原文来源: https://tidb.net/blog/4f85e64a 导读 随着业务规模和单表容量的增大,DDL 变更耗时越来越长,给 DBA.研发.业务同学带来了越来 ...

  9. 干货 | Elasticsearch Reindex性能提升10倍+实战

    Elasticsearch 最少必要知识实战教程直播回放 #1.reindex的速率极慢,是否有办法改善? 以下问题来自社区:https://elasticsearch.cn/question/378 ...

最新文章

  1. ubuntu编译并调试OpenJDK8源码实践
  2. node.js 搭建http调取 mysql数据库中的值
  3. JavaScript 获取浏览器版本
  4. 从零开始学Pytorch(十三)之梯度下降
  5. 你还在为查询滑动窗口最大值发愁吗?点开看最高效率解法!
  6. 计算机专业学不学ps,慎重!不建议你报的院校专业,是因为真的考不上!
  7. 条件查询(where)——MySQL
  8. 秦汉考场科目三路线图_易通驾校百科:秦汉科目三考场考试攻略,附考场路线图...
  9. 内存压力测试工具Memtester
  10. @ResponseBody详解
  11. php繁体转为简体的函数,繁体中文转换为简体中文的PHP函数_php
  12. Mybatis如果存在该条数据则修改,否则新增
  13. 数学三次危机(三)“希帕索斯悖论”或“毕达哥拉斯悖论”
  14. 玩转电机驱动——A4950闭环驱动直流减速电机(Arduino)
  15. 【秃头系列】-【本科生毕设论文格式Word】自动生成页面布局
  16. 分享一个前两天写的自动监控blocking 的脚本(基于12C)
  17. 大概率思维《The House Advantage》
  18. flv格式的视频怎么转mp4?
  19. 2021年计算机保研经历:人大信院、南大软院、华师数据院、厦大软件、湖大信院【7000字详细介绍】
  20. 南京欧拉信息科技有限公司

热门文章

  1. 怎么查询linux中的组密码,linux查看用户组中的用户
  2. python抓取数据库数据封装成json_用Python将mysql数据导出成json的方法
  3. @autowired注解原理_相见恨晚,一个架构师也不会用的Lombok注解
  4. 由于采用分时技术 用户可以独占计算机资源,计算机操作系统第1章练习题
  5. 图像的泊松(Poisson)编辑、泊松融合完全详解
  6. 【杂谈】当前知识蒸馏与迁移学习有哪些可用的开源工具?
  7. 【每周CV论文推荐】 初学深度学习图像分割必须要读的文章
  8. 中国镍氢电池行业产销状况及竞争格局咨询报告2021-2027年版
  9. 全球及中国皮肤癌药物行业深度研究及项目可行性调研报告2022-2027年
  10. 全球及中国皮肤晒黑喷雾行业销售模式及动态盈利分析报告2021年版