Druid简介(可视化)
http://www.apache-druid.cn
Druid是什么?
Druid是一个实时多维OLAP分析的数据处理系统。它出生于MetaMarkets公司,孵化于Apache。
Druid走ROLAP路线,实时摄取数据,实时出结果。不像Kylin一样有一个显式的预计算过程。
Druid能做什么?
列式存储,好处是查询的时候可以只返回指定的列的数据。
可扩展的分布式架构,可以达到上百台的规模。
并行计算,查询可以并行计算。
数据摄入支持实时和批量。这里实时的意思是输入即可查询。典型的lambda架构。
运维友好。
云原生架构,高容错性。
支持索引,便于快速查询。
基于时间的分区自动聚合。
Druid的适用场景
快速聚合的OLAP分析,实时分析,大数据量,高可用容忍单点故障。
优点:
1)知识流式和批量数据导入
2)lambda架构,将实时数据和历史数据结合
3)高并发亚秒级查询
4)内置查询缓存
5)存储优化,bitmap索引,压缩,字典编码
6)完善的监控
7)支持数据导入上卷。支持灵活的数据存储用于查询时间粒度的配置。
缺点:
1)时间序列数据
2)有限的join能力
3)SQL语法支持不全
4)不支持多时间维度,所有的维度为string类型
5)查询语法不友好,有一定的学习成本
Druid的原理和架构
Druid的设计参考了Google的dremel,powerdrill。
Druid的主要角色进程如下
Coordinator 管理数据可用性
overload 控制分配数据ingestion的workload
broker 处理客户端的查询请求
router 负责将请求路由到broker,coordinator,和overloads
historical 负责存储可被查询的数据
middlemanager 负责ingest数据
Druid进程可被任意部署,但是为了理解与部署组织方便,这些进程分为三类
Master:coordinator,overload负责数据可用和ingest
Query:broker and router,负责处理外部请求
Data:historical and middlemanager, 负责实际的ingest负载与数据存储
Druid的局限
Druid简介(可视化)相关推荐
- 【Druid】Druid简介
1. Druid简介 Druid首先是一个数据库连接池.Druid是目前最好的数据库连接池,在功能.性能.扩展性方面,都超过其他数据库连接池,包括DBCP.C3P0.BoneCP.Proxool.JB ...
- 1.MNIST(简介可视化)
1.简介 MNIST 数据集来自美国国家标准与技术研究所, 是NIST(National Institute of Standards and Technology)的缩小版,训练集 (trainin ...
- 数据层优化-jdbc连接池简述、druid简介
终于回到既定轨道上了,这一篇讲讲数据库连接池的相关知识,线程池以后有机会再结合项目单独写篇文章(自己给自己挖坑,不知道什么时候能填上),从这一篇文章开始到本阶段结束的文章都会围绕数据库和dao层的优化 ...
- Druid 简介,架构,部署,python连接,hue链接druid
架构 什么是Druid Druid是一个高效的数据查询系统,主要解决的是对于大量的基于时序的数据进行聚合查询.数据可以实时摄入,进入到Druid后立即可查,同时数据是几乎是不可变.通常是基于时序的事实 ...
- Druid简介及常用查询操作
目录 一.druid主要功能介绍 二.druid使用场景 1.适用于如下场景 2.不适用于如下场景 三.常见查询操作 1.timeseries时间序列 2.TopN 3.GroupBy分组查询 4.s ...
- cifar10和cifar100(简介可视化)
cifar CIFAR数据集是 Visual Dictionary (Teaching computers to recognize objects) 的子集,由三个教授收集,主要来自google和各 ...
- OLAP引擎:基于Druid组件进行数据统计分析
一.Druid概述 1.Druid简介 Druid是一款基于分布式架构的OLAP引擎,支持数据写入.低延时.高性能的数据分析,具有优秀的数据聚合能力与实时查询能力.在大数据分析.实时计算.监控等领域都 ...
- centos7 搭建apache druid
Apache Druid简介 Apache Druid是一个实时分析型数据库,旨在对大型数据集进行快速的查询分析("OLAP"查询).Druid最常被当做数据库来用以支持实时摄取. ...
- 如何使用 Cloud Insight SDK 实现 Druid 监控?
Druid 简介与用途 首先说明,这里所说的 Druid 并不是阿里巴巴的数据库连接池项目,而是 Eric Tschetter 创立的一个开源的分布式实时处理系统,希望为烧钱的大数据处理,提供一种更廉 ...
最新文章
- mysql+存储过程+删除重复数据_mysql 存储过程 删除重复
- 如何使用 CODING 实践 DevOps 全流程
- 《dojo 边学边用》(01), 初识dojo,dojo简介和框架概览
- java 转换int类型数值到对应的金额大写
- 小师妹学JavaIO之:用Selector来发好人卡
- python提取文章中的中文数字
- 如何获取元素在父级div里的位置_关于元素的浮动你了解多少
- Java项目课程05:系统设计
- Pytest之skip、skipif、xfail
- 别熬夜加班了,Facebook 开源了一款代码推荐神器!| 程序员硬核评测
- 从零开始写个编译器吧 - 程序流控制
- LR接口测试---Java Vuser之增删改查
- D92-02-ASEMI低压降快恢复二极管TO247封装
- 女生叫你哥和大哥区别_大哥正望着你
- java deprecated 注释_@Deprecated注解的使用
- 模糊图像处理系统的功能
- D38| DP理论基础 509. 斐波那契数 70. 爬楼梯 746. 使用最小花费爬楼梯
- ccs工程文件类型和作用
- 使用section.key的形式读取ini配置项
- MATLAB设计控制系统仿真实验,基于MATLAB的自动控制原理实验仿真系统的设计
热门文章
- 最新Sublime Text3 注册码激活码,持续更新!
- ajax应用如何做好seo
- 期货公司速度哪家强? 期货业掀起装备竞赛
- Hive(2):Apache Hive 安装部署
- 八一钢铁:宝钢入主,中报业绩大幅增长
- pyhton爬取爱豆(李易峰)微博评论
- 提升金融写作效率:金融校对软件的优势与应用
- zzuli生化危机(dfs)
- The “path“ argument must be of type string. Received undefined
- 关于mysql注入说法正确的是_1. 在 Spring中,下列关于 依赖注入 的 说法 , 正确的是( ) 。_学小易找答案...