HTAP数据库,即交易分析混合负载型DB,已经成为一种流行的新型数据库。不仅概念很火,并且也在逐渐成为除OLTP、OLAP之外,越来越多数据库用户新的选型规范。然而,同时又存在一些现象:一是一夜之间,所有的数据库都变成了HTAP数据库;二是除了“能同时承载交易与分析SQL”这一极易模糊的理解之外,基本没有清晰明确的界定;自然而然,对HTAP的应用场景,也是八仙过海,各式各样,并不清晰的。这些,都导致HTAP有成为一种噱头的趋势。

1. HTAP的界定

这里认为,HTAP既然要成为一种新的标准与规范,就必须有尽量明确界定。而达此目的的最基本原则,就是它在技术上必须有不同于过去经典数据库的能力(不应该只是分布式),并且必须对客户的数字化进程带来创新与升级,这同时包括业务架构、应用架构、数据架构与技术架构等层面。面向这一原则,其定义与界定可以持续探讨,而本文仅提出如下几点以供参考:

(1)HTAP在技术架构与设计目标上不应该等同于经典Oracle与MySQL,或分布式后的类Oracle与MySQL,因为如果经典Oracle与MySQL也算是HTAP的话(用“能同时承载交易与分析SQL”来衡量,那肯定是),HTAP的定义,就毫无意义;

(2)HTAP数据库的交易与分析任务的执行,应该能做到用户透明使用且有互不影响的基础,而不应该是AP多了大幅影响TP,TP多了大幅影响AP,经典Oracle与MySQL正是如此;

(3)HTAP不应该面向数仓类纯OLAP的需求。也就是说,其对企业数据架构的提升,现阶段不应该以摒弃数据仓库体系为目标;

(4)现代的HTAP数据库,应该是分布式数据库。

2. HTAP应用场景

前面说过,HTAP带来的,应该是业务与架构的创新与提升,而不仅仅是替换或者性能的提高。由此出发,本文认为HTAP的应用场景主要集中如下两个方面:

(1)分析能力内嵌的业务系统(Analytic-Embeded OLTP)

有了HTAP的能力,未来的交易型业务系统,都应该在业务交易侧,就天生拥有分析的能力,并且不影响交易的性能与数据的一致性。如风控、营销或者其它原来需要在后台数据平台端通过数据迁移与同步才能完成的能力,相当一部分,可以迁移到业务系统侧实时完成,成为业务系统内在的功能,使其本身就能完成一定程度的业务闭环,这必然是技术驱动现代业务发展的重要方向。

未来的业务系统应该以此标准来设计,这对现代交易系统的业务能力改造与升级有很大的意义。

(2) 以“用”为核的数据服务超市(Data SuperStore)

大多数的数据仓库(Data Warehouse)体系,都是为“管”而生的,应用很难享受到数据的红利。绝大多数的企业,在花大量精力建立了数据仓库(Data Warehouse)体系后,业务系统与人员大多只能通过“请求技术人员协助完成”及“把数据导到业务系统来”两种方式来使用数据,这种应用与数据分隔的现象是大多数企业过去很长一段时间及至今都极为关注的痛点。

面向数据消费,在现有数据平台之上,建立以“用”为核,以“管”为基的数据服务平台,即数据中台这一概念的正确解释,已经成为很多企业规划与实施的重点创新与升级应用之一。它不同于Data WareHouse是为了存与管,而是为了让全企业的用户能将数据(准确讲是面向业务整理后的数据资产,因不是本文重点,这里不作赘述)当作超市的商品一样自由选择与消费,从而让全企业享受到数据的红利,因此,这里认为称之为数据服务超市(Data SuperStore)更为恰当。然而,抛开数据资产体系建立等架构与模型层面的内容不说,应该用什么样的数据库来承载这个SuperStore呢?

面向数据消费的 SuperStore,即要承载来自全企业的大量、高并发的服务型查询需求(QPS的TP型),也要承载大量探索型的统计分析需求(AP型),这种要求显然不是纯OLAP数据库,也不是纯OLTP数据库能满足的,显然又必须是弹性分布式的。因此,过去相当多的数据服务平台,都是采用多种类型数据库,组合满足不同需求来设计的。那么,HTAP数据库,就应该是该场景的最佳选择。

HTAP数据库及应用场景简析相关推荐

  1. TiDB HTAP特性的应用场景简析

    作者:何朝洋 原文来源: https://tidb.net/blog/da6fe78a TiDB是一种典型的HTAP数据库,即交易分析混合负载型DB,目前已经成为一种流行的新型数据库代表,具有隔离性. ...

  2. Style Report中报表组件的使用场景简析

    报表组件,英文称呼为report bean.在诸多报表中,可以看到很多报表元素,特别是报表Bean.报表Bean是报表中的一个元素,是报表的组件:创建好的报表Bean,可以作为备用,以供其他的报表可以 ...

  3. HTAP数据库 PostgreSQL 场景与性能测试之 28 - (OLTP) 高并发点更新

    标签 PostgreSQL , HTAP , OLTP , OLAP , 场景与性能测试 背景 PostgreSQL是一个历史悠久的数据库,历史可以追溯到1973年,最早由2014计算机图灵奖得主,关 ...

  4. HTAP数据库 PostgreSQL 场景与性能测试之 1 - (OLTP) 点查

    标签 PostgreSQL , HTAP , OLTP , OLAP , 场景与性能测试 背景 PostgreSQL是一个历史悠久的数据库,历史可以追溯到1973年,最早由2014计算机图灵奖得主,关 ...

  5. HTAP数据库:Hubble实时计算场景的最优选择

    实时流式计算适用场最大的特点就是及时,试想以下场景,如果没有流式计算系统,公司会损失多少MONEY: 需要实时异常检测的欺诈/风控等系统 需要实时查看交易额的交易系统 需要实时计算点击/计算分成的广告 ...

  6. HTAP数据库 PostgreSQL 场景与性能测试之 6 - (OLTP) 空间应用 - KNN查询(搜索附近对象,由近到远排序输出)...

    标签 PostgreSQL , HTAP , OLTP , OLAP , 场景与性能测试 背景 PostgreSQL是一个历史悠久的数据库,历史可以追溯到1973年,最早由2014计算机图灵奖得主,关 ...

  7. 不同直播场景的CDN技术简析

    随着直播行业的兴起,各种直播应用.平台和产品万花齐放,直播场景也越来越多元化,这就对视频技术的发展提出了"日新月异"的需求.那么,目前视频直播的场景主要有哪些?不同类型的直播场景对 ...

  8. Android Jetpack组件App Startup简析

    1.前言 最近简单看了下google推出的框架Jetpack,感觉此框架的内容可以对平时的开发有很大的帮助,也可以解决很多开发中的问题,对代码的逻辑和UI界面实现深层解耦,打造数据驱动型UI界面. A ...

  9. Unity3d资源反编译. AssetBundle格式简析+简单应用+爬坑

    ===================  Unity3d资源反编译工具 DisUnity ================ 源码:https://github.com/ata4/disunity 需要 ...

最新文章

  1. 2.Java中String,StringBuilder以及StringBuffer的关系与区别
  2. dBm与Vpp相互转换公式
  3. css中padding和magin的区别
  4. 如何判断一个类是否是线程安全(可重入)的?
  5. 函数的返回值-交换两个变量的值
  6. Online Object Tracking Benchmark(OTB)目标跟踪系统评估方式
  7. 架构设计 | 分布式体系下,服务分层监控策略
  8. hdu 4006 The kth great number (优先队列)
  9. 1. webpack 复制文件
  10. hbase 2.0.5的下载及安装
  11. hp DV4 声卡驱动 IDT声卡补丁1.1
  12. 国内有哪些顶级技术团队的博客值得推荐?
  13. 桥梁工程智慧工地管理系统,实现工程项目的精细化管理
  14. 经典算法研究系列:五、红黑树算法的实现与剖析
  15. 树莓使用CUPS服务搭建打印机服务器
  16. 模糊测试框架 Sulley 使用手记 (一)
  17. xshell免费版本下载
  18. openLayers6系列理论基础——Layer数据源source篇
  19. 一个好的PS笔刷(笔触)下载论坛
  20. 厉害了!那个用文言文编程的小哥,竟从28万行唐诗中找出了对称矩阵

热门文章

  1. java基础知识--(常用类)String类
  2. python pandas操作excel表
  3. Gmail、Orkut和Wallop的不限量,不限时邀请
  4. 动态规划算法---求最长公共子序列
  5. 沪深A股分析数据机构持股信息API接口(JSON标准格式,Get请求方式)
  6. 九马画山数命运, 一身伴君不羡仙! 与代码不离不弃!
  7. 【数量技术宅|金融数据分析系列分享】为什么中证500(IC)是最适合长期做多的指数
  8. 最熟悉的路,莫过于归途
  9. 本地唯一985,要去省会了!
  10. win7服务器只显示4g内存,安装win7 64位系统后8G内存只显示4G可用解决方法