四个开源商业智能平台比较(五)

lumi 问JPivot能否单独使用,不能,根据其主页上的描述, JPivot is a JSP custom tag library that renders an OLAP table and let users perform typical OLAP navigations like slice and dice, drill down and roll up. It uses Mondrian as its OLAP Server. JPivot also supports XMLA datasource access.
换句话说,它必须使用一个OLAP的服务器做后台,大多数选择Mondrian,当然,JPivot也支持XMLA的数据源,我不太清楚除了SQLServer外还有谁是的。
要使用JPivot就必须使用多维数据表,我想你们公司应该是普通OLTP的数据表,那么就需要ETL工具了,工作量恐怕也非常之大。

JPivot在展示向上钻取和向下钻取的功能需求时是否比较方便?
是的,非常的方便,JPivot是一个JSP custom tag,你要需要指定数据源和写一个xml的描述文件就可以了,它本身是很简单,问题是前面的步骤。

你 说你们的SQL有40M我一点也不惊讶,我们公司小的也差不多有10多M,从20多个表取数据,如果什么都选的话,会有50多M,顺便问一句,你计算出有 40多M是用的P6SPY吗?我是用这计算的,用TOAD格式化的时候没有死机,其实这个大小很平常的,不过速度倒是差到了不行,最近我当了回DBA把 oracle优化了一下,硬盘空间只给我30G,没空间你叫我怎么做优化,我们公司developer用的机器是512M内存跑oracle, eclipse ,tomcat,toad,这种配置的确让我很无奈。不过报表最后速度还算可以接受,大概1分钟不到可以Run出一个Excel的报表6 worksheet,每个worksheet数据大概在6K到2W左右,哦,对了,我们还使用了线程,run  excel的时候,是弹出一个单独的窗口来run的。
普通的报表跟BI的报表是完全不一样的,所以不知道还有什么能帮你的,希望你早日脱离苦海,也祝我自己早日脱离苦海。阿弥陀佛

这次要比较的是四个平台的体系结构,
首先看openI的体系结构:

RDL是Report Define Language
openI具有一个BI应有的大部分特性了,
report :  jasperreport ,JFreeChart
olap :   mondrian +  JPivot
data mining:   weka
它的各层衔接的非常的紧,好像用了eigenbase做数据管理,不是很清楚这部分,openI在做数据挖掘的时候它没有调度器,它的Portlet Interface 主要是指在用JPivot的时候JPivot可以到处使用
openI没有自己的开发专属工具,入门门槛也相对较低。

JasperSoft

JasperSoft最重要的就是它的报表,但是它支持输出的格式很多,管理的方式也很多,也用了eigenbase做数据管理。
有比较完善的权限控制,用的acegi,
支持多种数据源,只要有JDBC驱动。
它的产品已经形成了一个产品线,最著名当然还是它的JasperReport。
你可以看到它为了更好的管理各种报表和数据,有自己专属的展现平台JasperServer,这个平台是 06/26/2006才创建的,完全是JasperSoft为了实现BI而迈出的重要一步。jasper没有数据挖掘。
有任务调度器,用了quartz。
有自己专属的ETL: JasperETL
它有自己的OLAP SERVER : jasperAnalysis
展示层用到了AJAX和applet, 也有DashBoard。
查询语句支持SQL, Hibernate (HQL), XPath (XML), EJBQL, MDX(多维查询语言,OLAP专用,SQLSERVER用的是XMLA)

SpagoBI

spagoBI平台厉害很多,也复杂了很多。
它的各个组件之间模块化很好,Plugin加载,来看一下它的各个组件:
report : BirtReportDriver ,  BirtReportEngine , JasperReportDriver ,JasperReportEngine
GEO :  GeoDriver , GeoEngine(用地图显示数据和查询的)
OLAP : JPivotDriver , JPivotEngine
QBE  :  QbeDriver, QbeEngine   (以前学Hibernat的时候记得总是说QBE功能很弱,不知道这个这么说 )
Data Mining : WekaDriver  ,  WekaEngine
Security :  ExoPortalSecurityProvider
Booklet (小册子) : BookletsComponent: it is a component for booklets generation.主要包括文件上传,工作流,OpenOffice支持。

它还有文档管理,用的是apache的JackRabbit,有搜索功能,用的lucene.不愧是做cms,portlet,workflow出身的,技术就是牛。

spagoBI的使用的工具也比较多:
Report :  Bird  ,   JasperReport
ETL :   Octupus  和  talend   (talend是官方合作伙伴,顺便说一句,官方主页好像打不开,www.talend.com ,我是直接在sf.net上搜索然后下载下来的)
OLAP :  Mondrian  和  JPivot
Data Mining   : Weka
Portal   : eXoPortal

它 的展现层也使用了AJAX特性,另外它在DashBoard也使用了openlaszlo,(一个用Java code 生成Flash的框架,主页是http://www.openlaszlo.org/。新版的4.0好像也要支持生成DHTML) 所以spagoBI的DashBoard看上去很爽.
spagoBI的ETL是非常之牛的。你可以看到它下面的数据处理层是单独分出来的,至于为什么牛,我在后面ETL部分会专门提到的。
还有一些很细节的东西,想BIPortlet,BIMessage , Notify ,Schedule , Workflow ,Rule Engine ,Profiling ,Analytical Document 我会在后面尽量把我知道的说一下。

pentaho

pentaho的体系结构跟spagoBI非常相像,我甚至都没看出来有上面很大的区别,
不过pentaho喜欢把自己的东西称作solution,以下引用自pentaho的whitepaper:
pentaho BI 平台不同于传统的BI产品。它是一个以流程为中心的,面向解决方案的(Solution)的框架,具有商业智能(BI)组件,使得公司可以开发商业智能问题的完整解决方案
pentaho一样把数据处理层看的很重要,多种数据显示方式,甚至有RSS输出。
pentaho是有各种开源组件组成的。
ETL :  Kettle  (界面上显示的是pentaho Data Integration ,previously Kettle)
Report : Pentaho Report (它也支持Birt 和  JasperReport 的集成 ,还有专门的文档)
OLAP  : Mondrian 和  JPivot  (Mondrian已经加入了pentaho , 估计pentaho跟JPivot有仇,双方互看对方不爽,所以JPivot没有加入pentaho,呵呵,看玩笑)
Platform : Pentaho Planform
Data Mining: Weka  (Weka也加入了pentaho)

四个开源商业智能平台比较相关推荐

  1. [转]四大开源商业智能平台大比拼[http://database.ctocio.com.cn/analysis/289/7610289.shtml]

    本文从对方面对四大开源商业智能平台进行了比较-- 首先看一下它们各自的网站 openI openI的 站点就是属于典型的开源站点,简洁,不像是一个商业公司的站点.但有一件很有意思的地方,看到左上角的图 ...

  2. 高文院士:为什么中国的AI发展必须要有开源开放平台?

    出品 | AI科技大本营(ID:rgznai100) 10 月 31 日,由北京智源人工智能研究院主办的 2019 北京智源大会在国家会议中心开幕,本次大会围绕人工智能基础研究现状及面临的机遇和挑战. ...

  3. 16个免费和开源商业智能工具

    公司需要分析他们收集的所有数据 - 这就是数据科学和商业智能工具的用武之地. 随着企业处理越来越多有关其运营和客户的信息,实时分析变得越来越重要.仅举一个例子,Gartner预测,在三年内,普通人每天 ...

  4. Apache Spark 技术团队开源机器学习平台 MLflow

    开发四年只会写业务代码,分布式高并发都不会还做程序员?   近日,来自 Databricks 的 Matei Zaharia 宣布推出开源机器学习平台 MLflow .Matei Zaharia 是 ...

  5. 如何商业智能平台BI的成本

    如果在选择商业智能平台时只考虑购买价格,那么这一决策是缺少全局观念的.人们通常说的总拥有成本(TCO),涵盖了购买软件和基础设施.部署和集成以及支持和维护等等方面,您在选择商业智能平台时,至少要考虑到 ...

  6. 开源任务管理平台TaskManager介绍

    很早之前准备写Quartz系列文章,现在终于能够实现了.从本篇开始将带你实现一款自己的任务管理平台.在工作中你曾经需要应用执行一个任务吗?这个任务每天或每周星期二晚上11:30,或许仅仅每个月的最后一 ...

  7. 开源托管平台GitHub和git分支

    目录 文章目录 1.开源的相关概念 1.1.常用的git命令及作用 2.GitHub 2.1.远程仓库的两种访问方式 2.2.HTTPS将本地仓库上传到GitHub 2.3.SSH Key 2.3.1 ...

  8. 阿里巴巴、腾讯、百度和京东金融落户雄安新区 | 亚马逊加入FB与微软阵营,共同支持开源AI平台ONNX

    每一个企业级的人  都置顶了 中国软件网 中国软件网  为你带来最新鲜的行业干货 小编点评 最近贾跃亭比较水逆 先是被列入失信被执行人 飞机都坐不了 最近又爆出法拉第未来发不出工资的消息 看来老贾这次 ...

  9. 开源物联网平台推荐介绍

    开源物联网平台调研 文章目录 开源物联网平台调研 一. 调研推荐开源物联网平台及背景介绍 二.社区支持度与技术栈角度优缺点对比 三.开源项目地址及中文教程地址 四.部署要求 五.功能截图 六.个人总结 ...

最新文章

  1. python怎么打开文档_python打开怎么运行
  2. 一个需要原创精神的年代
  3. hdu5387(模拟)
  4. CodeForces - 859C Pie Rules(dp+博弈)
  5. [EDA] 第1章 EDA技术概述-潘松版
  6. Java 调用EXE
  7. 黑魔法(method-swizzling)解决第三方库引发的问题
  8. 【转】Linux内核报文收发
  9. linux 让暂停的进程恢复,Linux 下进程的挂起和恢复命令
  10. java图片色差_java – JPEG图像的颜色错误
  11. 怎样学好c语言程序设计这门,初学C语言程序设计的基本方法和技巧
  12. visual studio code安装
  13. shell脚本中变量的赋值
  14. 常用脚本语言Perl,Python,Ruby,Javascript一 Perl,Python,Ruby,Javascript
  15. SpringBoot配置文件实现数据库连接
  16. 软考高级 真题 2011年上半年 信息系统项目管理师 案例分析
  17. 推荐两款个人深度使用的笔记软件
  18. Hi3516CV500_SDK_V2.0.1.1 编译osdrv目录
  19. Junit新语法assertThat
  20. Hive连接Spark报错java.sql.SQLException: null, message from server: Host 'datanode03' is blocked becaus

热门文章

  1. UE4控件蓝图的UI,无法在人物的头顶显示,解决办法
  2. win10系统下使用onnxruntime部署yolov5模型
  3. 鱿鱼串 [转自 Tk's Blog]
  4. 用理科思想看文科[进阶版] V1.0.0.0.1
  5. CNN中的混合域注意力机制CBAM
  6. 2684亿!双十一背后的技术
  7. javaScript中函数以及自执行函数详解
  8. javascript自执行函数
  9. 这些育儿经,80%的父母不知道!
  10. linux中键盘按键键值修改