文章目录

  • 1、活跃度对比
  • 2、安装难易度
    • 2.1 Superset
    • 2.2 Redash
    • 2.3 Metabase
  • 3、使用体验
    • 3.1 Superset
    • 3.2 Redash
    • 3.3 Metabase
  • 4、结论

开源BI框架,我是从 数据可视化的开源方案: Superset vs Redash vs Metabase 了解到主流的三家Superset-Redash-Metabase。并且文章里面也有介绍对应的框架选择、图表丰富度等介绍。但是,时间过去一年多,redash已经投入databricks的怀抱,个人感觉它是要把大数据BI这一端给完全抢占了;另外有一些情况的变化我也会重新做一下对比,需要说明,我这边仅是从使用角度选择,不包括二次开发。如果是二次开发,那就看技术栈和框架选择,结合Redash并入databricks,毫无疑问选Redash。
下面是三家的一些网址:

Superset
https://github.com/apache/incubator-superset/pulse/monthly
http://superset.apache.org/Redash
https://github.com/getredash/redash/pulse/monthly
https://redash.io/Metabse
https://github.com/metabase/metabase/pulse/monthly
https://www.metabase.com/

1、活跃度对比

以下顺序为Superset-Redash-Metabase,毫无疑问,Superset碾压,后面两个基本打平,Metabase略优。


2、安装难易度

2.1 Superset

总体来说,安装难度不大:

创建一个python虚拟环境
virtualenv --no-site-packages superset
source superset/bin/activate
安装依赖,非常多,一定要用 requirements.txt,而且还会有漏网之鱼。
pip install superset -i https://pypi.douban.com/simple

superset db upgrade
导入示例数据
superset load_examples
创建admin账户
superset fab create-admin
superset init
superset run
需要注意,默认是127.0.0.1地址,我直接将环境下flask的cli.py改成了0.0.0.0。

2.2 Redash

看起来最容易的就是docker安装,但是镜像下载比较蛋疼,虽然我已经设置了国内源。docker部署说明
实际操作因为集群npm太久了,但是没有权限,没有装成功,只能用已有的镜像安装。下面是4个容器启动的 docker-compose.yml文件,注意 先docker-compose up -d,后 docker-compose run --rm server create_db,不知为何,先创建数据库,或导致 postgres不能开启端口。
还要注意 windows docker 默认端口问题,http://192.168.99.100:5000/。

version: '2'
services:server:image: redash/redash:8.0.0.b32245command: serverdepends_on:- postgres- redisports:- "5000:5000"environment:PYTHONUNBUFFERED: 0REDASH_LOG_LEVEL: "INFO"REDASH_REDIS_URL: "redis://redis:6379/0"REDASH_DATABASE_URL: "postgresql://postgres@postgres/postgres"REDASH_RATELIMIT_ENABLED: "false"restart: alwaysworker:image: redash/redash:8.0.0.b32245command: schedulerenvironment:PYTHONUNBUFFERED: 0REDASH_LOG_LEVEL: "INFO"REDASH_REDIS_URL: "redis://redis:6379/0"REDASH_DATABASE_URL: "postgresql://postgres@postgres/postgres"QUEUES: "queries,scheduled_queries,celery"WORKERS_COUNT: 2restart: alwaysredis:image: redis:3-alpinerestart: alwayspostgres:image: postgres:11ports:- "5432:5432"command: "postgres -c fsync=off -c full_page_writes=off -c synchronous_commit=OFF"restart: alwaysenvironment:POSTGRES_HOST_AUTH_METHOD: "trust"

2.3 Metabase

最简单,因为是基于JVM的语言写的,所以就一个jar包。
首先要安装java,这个一般都有。然后下载jar包,就直接命令启动了。
java -jar metabase.jar

3、使用体验

使用测试数据都是某个项目的DW/DM层数据。

3.1 Superset

1、目标用户肯定不是技术人员,基本操作逻辑就是客户探索数据,按照预定义的图表逻辑制作对应图表。说实话,功能挺丰富和全面,没有SQL照样可以做出不错的图表。另外,它的图表确实很炫酷,Demo很漂亮,对地理空间数据支持度很高。

2、使用起来感觉就是不得要领,还有稍微繁琐:首先我要创建数据源、然后注册一个数据表、之后就可以创建一张图了、最后汇总到一张仪表盘。
不得要领是最主要的问题,因为所有图表都是按产品逻辑预定义好的,与我的想法不一样,我也没心情去找说明(说明文档没有相关内容)或者慢慢学习。
比如柱状图的,默认就是统计总数,另外我想做时间序列的图时,由于我将时间格式转为字符串,然后这个就没有办法了。(以下是失败案例。。。)

3、汉化:部分汉化,有语言选择,但是汉化比例不高,另外数据会乱码。
4、总的来说,就是适合非技术人员直接对原数据的探索与BI制作,但是首先需要一定学习成本,对每一种图的逻辑都需要有所了解。另外使用起来有点延时。

3.2 Redash

1、目标用户技术人员,或者起码要会SQL。产品使用逻辑就很简单,总共3个功能:查询、仪表盘、预警。基本操作是创建一个查询,由这个查询选择字段创建图表,可以有多个。仪表盘就是插入一个个图表或文字。另外还有一个功能,预警,就是定时监测某个值,设定阈值,发邮件。

下面图片为查询:

预警:

2、最大优势就是支持数据源多,46种。另外看起来前端图表做个UI美化,比之前版本好多了;对图表的操作也比较丰富,可以移位、放大、缩小、框选、套索选择等。下图展示的是框选。

3、汉化:没有。
4、总的来说,就是专注做一件事,适合技术人员直接对原数据的进行查询制作图表,使用起来也又比较顺畅。另外是单页面应用,

3.3 Metabase

Metabase 感觉是个旗舰产品。
1、目标用户基本是想涵盖所有想用BI的用户。
2、产品页面设计非常简洁而且符合逻辑和习惯。
下图中,右上角就是两大模块,浏览数据就像dba工具一样,当然不懂SQL也可以操作,也可以使用SQL。


创建问题就是图表制作,左侧图表设置,右侧数据筛选、聚合,中间按钮随时切换 图表/原数据,产品设计非常好,而且整体使用非常流畅。

非常轻松用同样的数据制作图表,格式为字符的字段在superset无能为力,这里自动转了时间。

3、汉化:全部汉化。
4、总的来说,产品制作精良,追求卓越,适合所有BI参与者。

4、结论


虽然Superset最热,但是我最不看好它。如果是给客户使用,那么最好选Metabase,因为汉化和交互良好。如果是数据技术团队使用,那么就用Redash,特别是大数据。

开源BI框架对比选择 Superset-Redash-Metabase相关推荐

  1. 开源中文bi_主流开源 BI 产品对比

    现在市场上开源 BI 产品比较多,各个产品的侧重点不同,有的以报表为主.有的以可视化为主.有的以查询分析为主.这里我们选取了一些主流的开源 BI 产品,从产品功能.可视化能力.数据源支持以及使用文档等 ...

  2. 量化实盘框架对比选择

    简介 搞各种回测,最后还是为了实盘赚钱.实盘国内券商支持的比较多的是ptrade和QMT,港美股券商一般会自己提供交易api,可以直接使用,也可以用第三方框架来调用. 实盘框架选择 下面是一些实盘框架 ...

  3. python数据库框架_Python数据库及ORM框架对比选择

    使用Python进行MySQL的库主要有三个: Python-MySQL(更熟悉的名字可能是MySQLdb), PyMySQL SQLAlchemy. Python-MySQL: 资格最老,核心由C语 ...

  4. Python数据库及ORM框架对比选择

    之前学习java,java中对数据库的操作很多,如Spring Data JPA,Hibernate和mybatisJdbc Template都能够连接上mysql数据库.那么python一定也有方法 ...

  5. 开源BI平台软件特性对比

    原文转载地址: 头条号 IT思维 前提 数据时代来临,随着更多的社会资源进行网络化和数据化改造,数据所能承载的价值也必将不断提到提高.于此同时数据正在成为企业重要的生产材料之一,企业可以通过数据来完成 ...

  6. struts框架的原理和应用_分布式开源调度框架TBSchedule原理与应用

    主要内容: 第一部分 TBSchedule基本概念及原理 1. 概念介绍 2. 工作原理 3. 源码分析 4. 与其他开源调度框架对比 第二部分 TBSchedule分布式调度示例 1. TBSche ...

  7. superset、metabase、redash三个开源BI工具的个人使用心得及分析

    数据可视化也是大数据领域里极为关键的一环,通过计算引擎算出来的数据往往需要以合适又美观的图表形式展示给产品经理和决策者,一开始笔者的部门用的是SpringBoot+ECharts的经典组合来做可视化的 ...

  8. 可视化工具BI(superset,redash)

    文章最前: 我是Octopus,这个名字来源于我的中文名--章鱼:我热爱编程.热爱算法.热爱开源.所有源码在我的个人github :这博客是记录我学习的点点滴滴,如果您对 Python.Java.AI ...

  9. 开源BI报表工具Metabase初体验

    概述 一款开源BI工具,后端是用clojure开发的.官网,GitHub. 安装 安装非常简单,以metabase.jar包(后文简称jar包)方式分发.在GitHub Release页面下载最新版即 ...

  10. rf框架的缺点_2017热门开源自动化测试框架优缺点对比

    原标题:2017热门开源自动化测试框架优缺点对比 时间一晃已来到 2017 年的最后一个季度,TestProject 对比了在今年比较热门的 7 款开源 自动化测试框架的优缺点,以帮助你选择适合自己的 ...

最新文章

  1. Java注解---通俗易懂
  2. linux查看msf安装目录,linux系统安装msf的过程详解
  3. JEE6 CDI 扩展实现 MVC (四) 实现多模板引擎支持,并提供扩展接口
  4. 用Apache Server配置php,cgi服务器
  5. 推荐计算机与通信领域SCI期刊,因子稳中看升,对中国作者友好,毕业优选!
  6. Java基础知识回顾之七 ----- 总结篇
  7. c++string替换指定位置字符_Lua 字符串
  8. windows下命令行修改系统时间;修改系统时间的软件
  9. 利用memcached实现CAS单点登录集群部署
  10. NET 4.0 System.Threading.Tasks学习笔记
  11. MOOS学习笔记1——HelloWorld
  12. html设置json请求头,当我想在zf2客户端代码中使用“application/json”时,接受请求标头是“text/html,application/xhtm ...(etc)”...
  13. 解读知识蒸馏模型TinyBert
  14. 虚拟仿真引擎消息机制
  15. 服务器修改文件句柄数,请问如何修改文件最大句柄数?
  16. groupadd命令详解(实例)
  17. Linux内核等待队列wait_queue学习
  18. Java核心技术卷1:基础知识(原书第10版)
  19. Detours学习之七:Detours示例程序构建
  20. Monkey常见面试问题

热门文章

  1. WES7@IIC-China
  2. OpenWRT LEDE固件安装
  3. postman 生成html测试报告
  4. 超市不同时段人流量统计分析
  5. Java Web实战详细教程(二)第一个Java Web项目+JSP模板设置
  6. JSP学习——Eclipse自定义JSP模板(修改默认JSP文件)
  7. linux反编译lua工具,lua脚本编译及反编译工具下载
  8. 智能车制作1——编码器
  9. Charles 弱网测试
  10. 非极大值抑制(PyTorch-YOLOv3代码解析一)