阿里云HBase携X-Pack再进化,重新赋能轻量级大数据平台
一、八年双十一,造就国内最大最专业HBase技术团队
阿里巴巴集团早在2010开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储。持续8年的投入,历经8年双十一锻炼。4个PMC,6个committer,造就了国内最大最专业的HBase技术团队,其中HBase内核中超过200+重要的feature是阿里贡献。集团内部超过万台的规模,单集群超过千台,全球领先。
二、HBase技术团队重磅发布X-Pack,NoSQL数据库再上新台阶
阿里云自从17年8月提供HBase云服务以来,到18年12月累计服务了上千大B客户,已经有上千个在线的集群。是阿里云增长最为快速的数据库服务,也是大B客户比例最高的云服务之一。并于6月6日全球第一个推出HBase 2.0,是HBase领域当之无愧的排头兵。
为了满足客户对数据库更丰富业务处理需求、更易用、强大功能的需求,我们重磅发布 X-Pack :支持SQL、时序、时空、图、全文检索能力、及复杂分析。阿里云HBase从KV为主数据库再上新台阶。
全部能力计划12月底全部上线。
三、深度解读X-Pack,云HBase平台能力再上新台阶
通常一个大企业里面,数据和业务存在天然的多样性。真正称得上平台级的数据库,要至少要满足客户不同三个及以上层次的诉求,才能称的上平台级。
阿里云HBase从成本最优化、运维便利性、业务敏捷度三个方面将HBase的能力全面提升一个高度。
3.1 轻量级,满足CXO成本最优化的诉求
1)起步成本低,整体成本低,扩展性强。
云HBase针对企业不同的使用环境,不同的SLA诉求,云HBase一共提供3个版本,分别满足开发环境,在线业务,以及金融级业务的诉求。单节点版本,低廉的价格用于开发测试场景,集群版本,99.9%可用,满足企业在线业务诉求,支持最高5000万的QPS和10P的数据。还有支持金融级高可用的双活版本。所有版本都支持11个9的数据可靠性,无需担心数据丢失。
2)支持冷存储,助你不改代码,1/3成本轻松搞定冷数据处理
客户系统中,存储成本占比往往是大头,把存储成本降下来,整体成本才能下降。
一般随着业务的发展,HBase中存储的数据量会逐渐变大。在这些数据中,业务最关心的,最常访问的,往往是某些特定范围的数据,比如说最近7天的数据,业务对这类数据访问频次高,延迟要求高,即所谓的热数据。而其他的数据,一般访问量极少,性能要求不高, 但这类数据往往数据量大,即冷数据。如果能把冷热数据分离开,把热数据存储在性能更好的介质中,而把庞大的冷数据放到成本更低的介质中,从而实现把更多优质资源用来提高热数据的读写性能,同时节省存储成本的目的。
阿里云HBase针对冷数据存储的场景,提供一种新的冷存储介质,其存储成本仅为高效云盘的1/3,写入性能与云盘相当,并能保证数据随时可读。冷存储的使用非常简单,用户可以在购买云HBase实例时选择冷存储作为一个附加的存储空间,并通过建表语句指定将冷数据存放在冷存储介质上面,从而降低存储成本,基本不用改代码就获得了低成本存储能力,助力企业降低整体成本。
3.2 全托管,全面解放运维,为业务稳定保驾护航
数据是企业最宝贵的资产,业务是企业赖以生存的基础。因此高可用和高可靠是最基本诉求。云HBase提供的全托管服务相比其他的半托管服务以及自建存在天然的优势。
依托持续8年在内核和管控平台的研究,以及大量配套的监控工具、跨可用区,跨域容灾多活方案,云HBase提供目前业界最高的4个9的可用性(双集群),11个9的可靠性的高SLA的支持,满足众多企业客户对平台高可用、稳定性的诉求。
云HBase服务定位为全托管服务,后台自动代维和保持服务稳定性,极大的降低了客户使用门槛,让无论是SME,还是巨头都能享受到HBase技术红利。选择云HBase就是选择了高可用、高可靠服务!
3.3 全面能力提升,源头解决业务敏捷度,真正释放数据和业务的价值
1)100%兼容原生接口和能力,开发简单,容易上手。
云HBase百分百兼容开源接口,并提供一系列配套开发,数据搬迁,监控工具,全面帮助用户提高开发和管理效率。
2)独家跨Region/AZ双活
阿里云是云HBase首家推出跨Region/AZ双活,在一个集群出现故障的时候,迅速地将业务切换至另外一个集群从而避免故障。HBase主备之间数据的同步基于异步链路实现,遵循最终一致性协议,典型的主备同步延迟在200ms左右。满足金融、社交、电商、人工智能等关键领域对高可用的诉求。
3)备份恢复量级提升百倍以上,数据库领域最大
我们经常会听到“某某某DBA误操作把整张表删了”,“某某磁盘故障,造成数据库的某个库的数据全部损坏了”。这种由于外在和内在的原因造成的数据不可靠,最终会给用户带来毁灭性的灾难。
所以一个企业级数据库,全量备份、全量恢复、增量备份、增量恢复,是基础能力。传统数据库备份恢复的能力都是TB级别,这在交易等场景下面是足够的,但是面向NoSQL场景就捉襟见肘了。云HBase通过垂直整合高压缩、内核级优化,分布式处理等能力,将备份恢复的量级成功推高百倍以上,做到百TB级别甚至更高,让客户无后顾之忧。
4)支持融合多模型和融合多负载、提供开箱即用的能力
云HBase在KV的基础上,同时支持时序、时空、图、文档等多种数据模型,内置丰富处理能力,让业务开发效率提升百倍。
在线能力的基础上,融合流处理、批处理、OLAP,OLTP、高速对象存储,全文检索等能力,提供客户融合业务开箱即用的能力。
四、展望未来,持续优化服务,不负重托,成就客户
历经近8年的技术沉淀,阿里巴巴NoSQL数据库处理技术的精华沉淀在HBase上,后者成功支撑了成功支撑了阿里经济体中最大的NoSQL业务体量。当前将这项技术应用到广大企业中,助力企业发现数据价值。
短短1年间,就覆盖了社交、金融、政企、车联网、交通、物流、零售、电商等数十个个行业,帮单用户顶住千万级QPS的业务压力,以及百PB级数据高效存储和处理。
展望未来,云HBase团队定不负客户重托,持续围绕客户业务,成本,运维各个方面优化服务,成就客户!
原文链接
本文为云栖社区原创内容,未经允许不得转载。
阿里云HBase携X-Pack再进化,重新赋能轻量级大数据平台相关推荐
- 阿里云HBase全新发布X-Pack 赋能轻量级大数据平台
2019独角兽企业重金招聘Python工程师标准>>> 一.八年双十一,造就国内最大最专业HBase技术团队 阿里巴巴集团早在2010开始研究并把HBase投入生产环境使用,从最初的 ...
- 阿里云CDN的双11再进化
从2009年11月11日开始,双11从最初的淘宝商城到后来的天猫商城购物促销活动,到后来演变成为中国各大购物网站全国性的购物狂坏,成为广大顾客购物的盛大节日.双11的成交额也从最初的不到1亿,呈指数上 ...
- 阿里云助力合作伙伴帮助政府、企业体验云计算大数据魅力!
2015年12月8日,由陕西省咸阳市彬县县政府举办,陕西畅通网络科技有限公司协办"阿里云+蚂蚁金服中小企业扶持大会"是合作伙伴事业部规划合作伙伴用户沙龙第一场会议,合作伙伴团队表示 ...
- 阿里云数字乡村建设解决方案,乡村环境、设施、大数据综合管理系统
阿里云云南一级经销商.阿里云服务器返折扣代购服务.云南天成科技-吴经理:13698746778 QQ:463592055 一.数字乡村引来最重要的战略机遇 数字乡村是伴随网络化.信息化和数字化在农业农 ...
- 车纷享:基于阿里云HBase构建车联网平台实践
摘要: 1. 业务介绍 车纷享是国内首家进行汽车共享开发和运营的公司.旗下共享汽车平台采用新能源汽车作为运营工具以B2C+C2C汽车共享作为商业运营模式采用车联网技术作为运营管理技术目前已与国内多个城 ...
- 独家解读!阿里首次披露自研飞天大数据平台技术架构
9 月 26 日,阿里云飞天大数据平台在云栖大会第二天主论坛上正式对外发布,这也是阿里首次对外披露飞天大数据平台的整体架构. 据介绍,飞天大数据平台由阿里自主研发,可扩展至 10 万台计算集群,是目前 ...
- 开源大数据平台HBase对接OBS操作指南
1 背景介绍 华为云对象存储服务可以与HBase大数据生态进行对接,为用户提供计算存储分离的大数据解决方案.该方案具备高性能.低成本的优势,且无扩容问题. 本操作指导书旨在帮助华为云用户在开 ...
- 昨日黄花Hadoop 方兴未艾云原生——传统大数据平台的云原生化改造
本文6539字,阅读时间约20分钟 以Hadoop为中心的大数据生态系统从2006年开源以来,一直是大部分公司构建大数据平台的选择,但这种传统选择随着人们深入地使用,出现越来越多的问题,比如:数据开发 ...
- Hadoop势微,云原生上位——传统大数据平台的云原生化改造
以Hadoop为中心的大数据生态系统从2006年开源以来,一直是大部分公司构建大数据平台的选择,但这种传统选择随着人们深入地使用,出现越来越多的问题,比如:数据开发迭代速度不够快,集群资源利用效率过低 ...
最新文章
- Gmail进程信息转储分析工具pdgmail
- 详解数据库引擎与SQL语句增删改查(非常详细,带例)
- 5月5日——更改手机状态栏的背景颜色
- 2个通用js树型导航
- kubernetes 启动_如何启动和组织Kubernetes聚会
- 原 CSS3中的过渡,css3之过渡
- Seeing this, many people find it incredible
- 《算法导论》读书笔记之第3章 函数的增长
- Android 学习JNI,用JAVA调用C
- python multiprocessing dummy Pool 使用
- 微软bi报表服务器,什么是 Power BI 报表服务器?
- 广义表的概念及其存储结构
- 用夜神安卓模拟器做Android开发
- 运维工程师必备的认证【红帽liunx-RHCE 8】
- 我的2020年度总结 “既往不恋,纵情向前”
- 扫地机器人自动回充原理
- 如何编写测试用例及用例的意义
- 大学生必备的十大网站有哪些?
- python字母频率统计
- 卧龙修图插件之面部精修教程
热门文章
- c位边上还有什么位_c位是什么意思?C位说法的由来是什么?c位旁边二个位置叫什么?...
- java2组随机数的共通数_java随机数产生-指数分布 正态分布 等
- python将文本文件加密后输出_Python:将Casear密码和柱状转置密码的加密输出写入.txt文件...
- 吸血鬼 java_吸血鬼数
- 回调java 简书_Java接口回调机制详解【转】
- c++ 获取文件夹创建时间_手把手教学免费创建个人网站
- linux tcp cork,在此用例中,TCP_CORK和TCP_NODELAY是否有显着差异?
- 只引入部分elementui_腾讯动漫确定引入假面骑士亚极陀和甲斗王 四仔:是不是玩不起...
- 波利亚对教师日常工作的看法:〈教师十诫〉
- 英特尔的务实创新之路:实在做技术,赋能开发者 | InfoQ推荐