一、Kylin

Apache Kylin 是一个开源的分布式分析引擎,提供 Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据。它能在亚秒内查询巨大的 Hive 表,可以做到在 TB 级的数据量上实现亚秒级的查询响应。

核心思想
Apache Kylin的核心思想是利用空间换时间,它主要是通过预计算的方式将用户设定的多维立方体缓存到HBase中(目前还仅支持hbase),同时由于Apache Kylin在查询方面制定了多种灵活的策略,进一步提高空间的利用率,使得这样的平衡策略在应用中值得采用。
kylin主要是对hive中的数据进行预计算,利用hadoop的mapreduce框架实现。
kylin的出现就是为了解决大数据系统中TB级别数据的数据分析需求,而对于关系数据库中的数据分析进行预计算可能有点不合适了。

1、Kylin优点

Kylin 的主要特点包括支持 SQL 接口、支持超大规模数据集、亚秒级响应、可伸缩性、高吞吐率、BI 工具集成等。

  1. 标准 SQL 接口:Kylin 是以标准的 SQL 作为对外服务的接口。
  2. 支持超大数据集:Kylin 对于大数据的支撑能力可能是目前所有技术中最为领先的。早在 2015 年 eBay 的生产环境中就能支持百亿记录的秒级查询,之后在移动的应用场景中又有了千亿记录秒级查询的案例。
  3. 亚秒级响应:Kylin 拥有优异的查询相应速度,这点得益于预计算,很多复杂的计算,比如连接、聚合,在离线的预计算过程中就已经完成,这大大降低了查询时刻所需的计算量,提高了响应速度。
  4. 可伸缩性和高吞吐率&#x

数仓OLAP(一)--即席查询 Kylin相关推荐

  1. 数据仓库之电商数仓-- 5、即席查询Kylin

    目录 一.Kylin 1.1 Kylin简介 1.1.1 Kylin定义 1.1.2 Kylin相关术语 1.1.3Kylin架构 1.1.4 Kylin特点 1.2 Kylin安装 1.2.1 Ky ...

  2. 离线数仓搭建_18_PrestoKylin即席查询

    文章目录 19.0 即席查询 1.1.1 Presto概念 1.1.2 Presto架构 1.1.3 Presto优缺点 1.1.4 Presto.mpala性能比较 1.2 Presto0安装 1. ...

  3. OLTP、OLAP、即席查询(ad hoc query)区别与联系

    对于目前来讲,对数据的处理主要集中在两个方面,一种是联机事务处理 OLTP(on-line transaction processing),另一种是联机分析处理 OLAP(On-Line Analyt ...

  4. 尚硅谷大数据项目之电商数仓(4即席查询数据仓库)

    尚硅谷大数据项目之电商数仓(即席查询) (作者:尚硅谷大数据研发部) 版本:V4.0 第1章 Presto 1.1 Presto简介 1.1.1 Presto概念 1.1.2 Presto架构 1.1 ...

  5. 聊聊数仓中TPCD-DSTPC-H与查询性能的那些事儿

    本文分享自华为云社区<GaussDB(DWS) <DWS之TPCD-DS&TPC-H与查询性能的那些事儿>>,作者: 一剑战八荒 . 1 综述 本文目标在于,详细讲述使 ...

  6. 漫谈数仓『OLAP』

    一 概念 1.1 什么是OLAP? OLAP(OnLine Analytical Processing),即联机分析处理.OLAP对业务数据执行多维分析,并提供复杂计算,趋势分析和复杂数据建模的能力. ...

  7. 从数仓到数据中台,谈技术选型最优解

    本文根据颜博老师在[Deeplus直播第218期]线上分享演讲内容整理而成. 颜博 马蜂窝数仓研发总监 现任马蜂窝数据仓库团队负责人,曾供职于京东.IBM.亚信等公司. 数据行业老兵一名,历经传统数据 ...

  8. 系列 | 漫谈数仓第四篇NO.4 『数据应用』(BIOLAP)

    点击上方蓝色字体,置顶/星标哦 目前10000+人已关注加入我们 本文目录CONTENTS ☞ 01.可视化BI工具 [ 开源BI,商业BI,传统BI ] ☞ 02.OLAP科普 [ ROLAP  M ...

  9. 大数据演进简史:从数仓到数据中台,谈技术选型最优解

    大家好,今天分享的议题主要包括几大内容: 带大家回顾一下大数据在国内的发展,从传统数仓到当前数据中台的演进过程: 我个人认为数据中台的核心组成,以及一些技术选型参考: 数据研发是数据中台很重要的一环, ...

  10. Data_Warehouse(DW 数仓(一))

    什么是数仓?和数据库有什么区别 数据库是按照结构来组织存储数据的仓库,用户可以对其中的数据进行增删改查操作,数据库主要是面向事务处理任务.数据库的数据多是面向业务的,对企业战略决策信息作用有限.原因大 ...

最新文章

  1. 打开深度神经网络黑箱:竟是模块化的?图聚类算法解密权重结构 | ICML 2020
  2. sklearn中knn的各种用法总结
  3. python处理nc文件并输出_利用python如何处理nc数据详解
  4. IOS UIPageController
  5. python课程索引-0222
  6. RabbitMQ和Kafka的显著差异(2)
  7. Style Lessons in Clarity and Grace (11th Edition)中文翻译
  8. 矩池云上使用nohup和让任务后台运行
  9. 浅谈C#中的延“.NET研究”迟加载(2)——善用virtual
  10. C#--打包安装项目
  11. SQL SERVER对象名无效/执行成功但有错误(初学者易犯错误)
  12. 降钙素(Cys(Acm)²·⁷)-α-CGRP (human)、125448-83-1
  13. Openpose 配置pose,pose+ face,pose+face+hand的方法
  14. linux scp 排除文件夹,scp复制文件时排除指定文件
  15. AI就是闭上眼想要一份凉皮,睁开眼就会有一份凉皮摆在眼前
  16. 一文读懂GPU服务器
  17. 服务器操作系统密码忘记,服务器操作系统密码忘记了
  18. 出现`webpack-dev-server --inline --progress --config build/webpack.dev.conf.js`报错
  19. 解决 iOS 上 transform rotate 兼容问题
  20. python 欧氏距离(Euclidean Distance) 曼和顿距离等距离

热门文章

  1. ShuffleNet神经网络
  2. 模长,方向余弦,方向角、单位向量和方向导数的计算
  3. 小米路由器设置无线中继模式
  4. 飞鸟尽,良弓藏;狡兔死,走狗烹。
  5. 2017CS231n李飞飞深度视觉识别笔记(八)——深度学习 软件
  6. python操作word实现小学拼音本功能
  7. python库itchat介绍(自动登录微信,自动回复消息)
  8. Python微信库:itchat的用法详解
  9. 逻辑回归算法深度思考-优点和缺点
  10. 做自媒体原创视频多平台分发,视频一键发布多平台方法教程