http://www.apache-druid.cn

Druid是什么?

Druid是一个实时多维OLAP分析的数据处理系统。它出生于MetaMarkets公司,孵化于Apache。
Druid走ROLAP路线,实时摄取数据,实时出结果。不像Kylin一样有一个显式的预计算过程。

Druid能做什么?

列式存储,好处是查询的时候可以只返回指定的列的数据。
可扩展的分布式架构,可以达到上百台的规模。
并行计算,查询可以并行计算。
数据摄入支持实时和批量。这里实时的意思是输入即可查询。典型的lambda架构。
运维友好。
云原生架构,高容错性。
支持索引,便于快速查询。
基于时间的分区自动聚合。

Druid的适用场景

快速聚合的OLAP分析,实时分析,大数据量,高可用容忍单点故障。
优点:
        1)知识流式和批量数据导入
        2)lambda架构,将实时数据和历史数据结合
        3)高并发亚秒级查询
        4)内置查询缓存
        5)存储优化,bitmap索引,压缩,字典编码
        6)完善的监控
        7)支持数据导入上卷。支持灵活的数据存储用于查询时间粒度的配置。

缺点:
        1)时间序列数据
        2)有限的join能力
        3)SQL语法支持不全
        4)不支持多时间维度,所有的维度为string类型
        5)查询语法不友好,有一定的学习成本

Druid的原理和架构

Druid的设计参考了Google的dremel,powerdrill。
Druid的主要角色进程如下
        Coordinator        管理数据可用性
        overload                控制分配数据ingestion的workload
        broker                处理客户端的查询请求
        router                负责将请求路由到broker,coordinator,和overloads
        historical                负责存储可被查询的数据
        middlemanager        负责ingest数据

Druid进程可被任意部署,但是为了理解与部署组织方便,这些进程分为三类
    Master:coordinator,overload负责数据可用和ingest
    Query:broker and router,负责处理外部请求
    Data:historical and middlemanager, 负责实际的ingest负载与数据存储

Druid的局限

Druid简介(可视化)相关推荐

  1. 【Druid】Druid简介

    1. Druid简介 Druid首先是一个数据库连接池.Druid是目前最好的数据库连接池,在功能.性能.扩展性方面,都超过其他数据库连接池,包括DBCP.C3P0.BoneCP.Proxool.JB ...

  2. 1.MNIST(简介可视化)

    1.简介 MNIST 数据集来自美国国家标准与技术研究所, 是NIST(National Institute of Standards and Technology)的缩小版,训练集 (trainin ...

  3. 数据层优化-jdbc连接池简述、druid简介

    终于回到既定轨道上了,这一篇讲讲数据库连接池的相关知识,线程池以后有机会再结合项目单独写篇文章(自己给自己挖坑,不知道什么时候能填上),从这一篇文章开始到本阶段结束的文章都会围绕数据库和dao层的优化 ...

  4. Druid 简介,架构,部署,python连接,hue链接druid

    架构 什么是Druid Druid是一个高效的数据查询系统,主要解决的是对于大量的基于时序的数据进行聚合查询.数据可以实时摄入,进入到Druid后立即可查,同时数据是几乎是不可变.通常是基于时序的事实 ...

  5. Druid简介及常用查询操作

    目录 一.druid主要功能介绍 二.druid使用场景 1.适用于如下场景 2.不适用于如下场景 三.常见查询操作 1.timeseries时间序列 2.TopN 3.GroupBy分组查询 4.s ...

  6. cifar10和cifar100(简介可视化)

    cifar CIFAR数据集是 Visual Dictionary (Teaching computers to recognize objects) 的子集,由三个教授收集,主要来自google和各 ...

  7. OLAP引擎:基于Druid组件进行数据统计分析

    一.Druid概述 1.Druid简介 Druid是一款基于分布式架构的OLAP引擎,支持数据写入.低延时.高性能的数据分析,具有优秀的数据聚合能力与实时查询能力.在大数据分析.实时计算.监控等领域都 ...

  8. centos7 搭建apache druid

    Apache Druid简介 Apache Druid是一个实时分析型数据库,旨在对大型数据集进行快速的查询分析("OLAP"查询).Druid最常被当做数据库来用以支持实时摄取. ...

  9. 如何使用 Cloud Insight SDK 实现 Druid 监控?

    Druid 简介与用途 首先说明,这里所说的 Druid 并不是阿里巴巴的数据库连接池项目,而是 Eric Tschetter 创立的一个开源的分布式实时处理系统,希望为烧钱的大数据处理,提供一种更廉 ...

最新文章

  1. mysql+存储过程+删除重复数据_mysql 存储过程 删除重复
  2. 如何使用 CODING 实践 DevOps 全流程
  3. 《dojo 边学边用》(01), 初识dojo,dojo简介和框架概览
  4. java 转换int类型数值到对应的金额大写
  5. 小师妹学JavaIO之:用Selector来发好人卡
  6. python提取文章中的中文数字
  7. 如何获取元素在父级div里的位置_关于元素的浮动你了解多少
  8. Java项目课程05:系统设计
  9. Pytest之skip、skipif、xfail
  10. 别熬夜加班了,Facebook 开源了一款代码推荐神器!| 程序员硬核评测
  11. 从零开始写个编译器吧 - 程序流控制
  12. LR接口测试---Java Vuser之增删改查
  13. D92-02-ASEMI低压降快恢复二极管TO247封装
  14. 女生叫你哥和大哥区别_大哥正望着你
  15. java deprecated 注释_@Deprecated注解的使用
  16. 模糊图像处理系统的功能
  17. D38| DP理论基础 509. 斐波那契数 70. 爬楼梯 746. 使用最小花费爬楼梯
  18. ccs工程文件类型和作用
  19. 使用section.key的形式读取ini配置项
  20. MATLAB设计控制系统仿真实验,基于MATLAB的自动控制原理实验仿真系统的设计

热门文章

  1. 最新Sublime Text3 注册码激活码,持续更新!
  2. ajax应用如何做好seo
  3. 期货公司速度哪家强? 期货业掀起装备竞赛
  4. Hive(2):Apache Hive 安装部署
  5. 八一钢铁:宝钢入主,中报业绩大幅增长
  6. pyhton爬取爱豆(李易峰)微博评论
  7. 提升金融写作效率:金融校对软件的优势与应用
  8. zzuli生化危机(dfs)
  9. The “path“ argument must be of type string. Received undefined
  10. 关于mysql注入说法正确的是_1. 在 Spring中,下列关于 依赖注入 的 说法 , 正确的是( ) 。_学小易找答案...