前言

这个从上至下都在强调数字化转型的时代,越来越多公司重视数据,也越来越多的企业有数据建设的需求。

企业无论做任何数据工作,必然要有一定的信息化基础,也要有数据化建设的基础,少不了数据平台、数据应用工具,数据管理工具等

关于企业数据建设这块,本人从事了近7年,从技术到项目管理,做过乙方也做过甲方,也有多年和各乙方厂商打交道的经验,遂来分享选型“内幕”。

涉及到的产品有:数仓、大数据平台、报表、BI、数据中台、数据治理等。

数仓

数据仓库算是一个解决方案,视企业需求有不同架构(传统数仓、数据集市、大数据平台等),架构下有很多分层和组件,比起工具更需要架构师能力,具体原理就不讲了。关于数仓的选型主要涉及:数据存储方案、ETL、还有前端应用

底层的数据仓库服务器通常是一个关系数据库系统,常用的方案有Oracle、db2、还有greenplum、teredata等数据仓库专业解决方案。

传统的关系型数据库有:oracle、mysql、DB2。

大规模并行处理数据库:Vertica、Teradata(商业)、Greenplum (开源)。

Teradata老江湖了,银行业使用较多,但成本也是真的贵,目前我们做项目较多的是用Greenplum,算是业界最快和最高性价比的高端数据仓库解决方案,Greenplum是基于PostgreSQL的,于2015年开源。我知道的国内四大行有3家在用,5大物流公司有4家在用,不少公司在从Teradata迁移到GP。

大数据平台主流的是:Hadoop+Hive。这套方案有多通用不用多说了,后面说到的大数据平台厂商也大多基于这个来设计平台产品。

ETL工具,kettle、Tablend和Penthao用的较多。

Talend:基于Eclipse,具有很好的扩展性、稳定性以及可定制化(可以自己开发eclipse插件),并且服从Eclipse标准(如文件目录结构都是程序员熟悉的结构)。Talend具有很好的嵌入性,因为它生成的是Java代码,这些代码可以很好的和其他系统结合在一起,这就要求使用者会java。

Penthao是一个老牌工具,2001年就发布了第一个版本,Kettle是Penthao整个解决方案的一个组件,用来进行数据集成。它也是基于java开发的,但是它不要求用户会java,将底层实现细节都隐藏了。主要的缺点是和talend相比,它的扩展性较差。由于它很难扩展,所以在社区中可用的组件就比较少。

前端应用工具主要就是报表、BI和数据挖掘,前两者的选型后面会细讲。

大数据平台

2013年左右,Hadoop体系的不断完善,标志着大数据应用场景可以被满足了。这时候就有前沿的一些企业开始做大数据平台,厂商特别多,主流的就说3个吧,华为、星环还有新华三。

这几年这些厂商也开始往“数据中台”的概念上走。但是毕竟是传统软件厂商,有点搞不太懂互联网公司提的“数据中台”到底是啥,貌似跟他们做的大数据平台没啥区别。

其实所有大数据平台都已经具备了“数据中台”的基础能力,你拿大数据平台和数据中台的产品对一下,其实各种底层架构和功能大体都一样,对于大部分企业来讲,中台那一套还是适合互联网运营商银行的“有钱主”,“数据巨无霸”,真的中台更强调数据服务化,但普通企业有几家真的达到这个痛点,还是老老实实做好数据化管理吧。

如果你的公司有庞杂的业务系统,数据量达到PB级,海量数据的存储、计算的需求,三个里面选型吧,对比下方案。

报表

现在还在做报表的厂商已经很少了,国内主流的就帆软finereport和润乾,起初很火的水晶报表最近也见的少了,还有开源的工具jaspereport也用的挺多。

选型方面,普通小公司,1~2个数据工作者,建议采购一个报表平台就行了,不用急着上BI。

帆软finereport功能齐全,生态和服务很好,招报表工程师也比较好招,价格比其他厂商略贵,品牌和服务溢价也能理解,毕竟国内top1。

润乾已被帆软打压的走低价,号称一套万把块钱,应该还会按并发抬价,还不算服务和项目实施,乙方可以考虑。

BI平台

BI在零几年的时候都是国外市场的天下,BO、Brio、Cognos、MSTR等,都是老牌BI厂商,我做纯技术的时候就大量使用他们的产品。东西都不便宜,而且是按产品+用户双重收费,不太划算。架构也是真的复杂,上手难度对比现在互联网时代产品的使用风格,也是确实难。

早期国内市场只有报表,但凡BI相关的大单都被国外厂商垄断,但是后面BI的需求越来越明显,就和当初信息化产业发展类似,中小型企业的需求逐渐显露。于是国内也就开始发展BI了,比如帆软BI、BDP等。东西也不差,价格比国外的美丽多了,而且基本都只是限定服务器,不限定用户数,怎么用都OK。再到后来,tableau、powerBI这俩工具型产品火了起来,有很多拥护的个人使用者,上手确实好用,但是在企业级应用场景,要看性能和并发成本,就见仁见智了。

不过用BI,就不是2、3个人的事情了,必须得建数仓,然后再做各种可视化、多维分析等。所以就得有数仓工程师、ETL工程师、BI工程师等岗位。当然,你要是牛,一个人全兼了也没问题,很多单位招人也确实要兼做。

中大型公司,有好几个业务系统的,建议采购BI系统,什么数仓、指标体系、固定报表、多维分析、数据可视化就都有了。建设期得多几个人,建好之后就很舒服了,业务固定的话,留两个人维护就OK了。

数据中台

“中台”的概念就是阿里推广开的。阿里从SuperCell学过来这一套,然后化为阿里内功后,再向外推广。“数据中台”也是那时候一起推广出来的。所以主要的厂商都是阿里系的人出来创业的公司。

袋鼠云、数澜、奇点云都是阿里的P9出来创办的公司,技术都差不多。

袋鼠云是阿里DBA团队出来的,比较鸡贼,牢牢的跟阿里绑死,阿里接单,袋鼠云干活,跟在阿里后面。

数澜是阿里产品团队出来的,产品设计的比较ok,宣传的也很不错,业务开展的风生水起。

奇点云是阿里数仓和数加团队出来的,貌似宣传的没上面两个强,接触不多。(数加是阿里自己的产品)

如果你们公司业务复杂,数据量巨大,关键是业务方面有多个客户应用场景,数据交互效率低,需要大量的客户数据价值发现,需求也很紧迫,那可以考虑研究下中台方案。

最后总结

1、报表平台解决固定报表、自动化报表,支持打印和计算等大批量批处理作业,公司有需求直接用帆软一类的平台解决,配1、2个报表工程师就能搞定了。

2、BI平台是在报表平台上增加解决多维分析、自助查询报表的能力,需要数仓团队做底层数据支撑,需要BI工程师设定各种度量、维度,做多维分析报表;不用一张张的做固定报表了;

3、大数据平台是在BI平台基础上,解决大数据量的存储、计算、实时计算的问题;无需关注底层的海量数据存储、计算、实时计算等问题;需要增加大数据工程师进行集群的维护,基于大数据平台的各种开发工作。

4、数据中台是在大数据平台基础上,提供ID打通、统一模型、统一服务的能力,附加标签工厂、用户分析等偏互联网属性的功能。人员需要增加数据中台产品经理,其他的工作还是由大数据工程师、大数据分析师等完成。

5、数据治理能力是从BI平台就开始有了,在大数据平台和数据中台中不断被强化。所以BI平台、大数据平台、数据中台中都有数据治理的能力。在数据中台中还增加了数据资产和计费的概念和能力。

帆软报表在已经搭载服务器上开发_史上最全企业数据产品选型对比(含数仓、报表、BI、中台、数据治理)...相关推荐

  1. 史上最全企业数据产品选型对比(含数仓、报表、BI、中台、数据治理)

    前言 这个从上至下都在强调数字化转型的时代,越来越多公司重视数据,也越来越多的企业有数据建设的需求. 企业无论做任何数据工作,必然要有一定的信息化基础,也要有数据化建设的基础,少不了数据平台.数据应用 ...

  2. 千字搞定数据产品选型!报表、BI、大数据平台、中台都在这了

    来吧,废话不多说,直接上干货! 到现在还在做报表的,已经很少了.上面三家都是中国主流报表厂商.不过在国外BI厂商的市场压力面前,也都做了BI套件.主流的就帆软,水晶报表最近见的少了. 普通小厂,1.2 ...

  3. 彻底搞定数据产品选型-报表平台、BI平台、大数据平台、数据中台一网打尽

    这是我的第47篇原创 来吧,废话不多说,直接上干货! 报表平台 到现在还在做报表的,已经很少了.上面三家都是中国主流报表厂商.不过在国外BI厂商的市场压力面前,也都做了BI套件.主流的就帆软和润乾,水 ...

  4. ant react 上传_React实战之Ant Design—Upload上传_附件上传

    React实战之Ant Design-Upload上传_附件上传 Upload组件大家都在官方文档中看过了,但写的时候还是会遇到许多问题,一些新手看了文档后感觉无从下手,本文过多的简绍就不说了,直接看 ...

  5. 【SQL开发实战技巧】系列(三十七):数仓报表场景☞从表内始终只有近两年的数据,要求用两列分别显示其中一年的数据聊行转列隐含信息的重要性

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

  6. 帆软报表在已经搭载服务器上开发_SpringBoot集成帆软报表(一)

    一.官网下载 帆软官网 文档地址:http://help.finereport.com/ 二.SpringBoot2.1整合finereport10 (一)导入jar到Maven C:\FineRep ...

  7. 帆软报表在已经搭载服务器上开发_报表案例_数据报表开发_做报表的步骤_报表开发流程-帆软...

    都说数据人很苦,可业务人也苦.不得已,我投诉了数据团队. 案例1:做一张报表,换了5个BI 背景:A负责的业务,以前业务指标单独计算.考核,不纳入公司整体业务. 后来业务体量大到足以影响公司大盘业务量 ...

  8. 十一年的帆软成长史,一群年轻人的事业,不忘初心,坚持做好产品

    感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答.求职一站式搞定! 背景介绍:这是一家由平均年龄不到 27 岁 ...

  9. 帆软10.0基于Mysql考勤模块开发

    需求:1.个人考勤明细表 2.考勤汇总表 筛选条件:可以根据时间和部门进行考勤筛选 前提:1.新建一张日历表关联,可标注节假日 2.将请假.外出.出差日期格式化为每天一条记录及请假天数 开发环境:my ...

最新文章

  1. Ubuntu16.04安装qt
  2. 5大典型模型测试单机训练速度超对标框架,飞桨如何做到?
  3. 天才也勤奋!DeepMind哈萨比斯自述:领导400名博士向前,每天工作至凌晨4点
  4. java通过对.class文件字节码加密,不被轻易反编译出源代码,分析及其实现。
  5. 虽然有索引,但没有用上
  6. SqlServer 的IDENTITY_INSERT设置为OFF问题
  7. maven处理和java平级的资源文件
  8. 消息队列属性及常见消息队列介绍
  9. 这样的极客大会千万别停!如今中国太需要为技术传道、为极客正名
  10. g++编译支持c++11
  11. 转mysql_「转」MySQL不为人知的主键与唯一索引约束
  12. 服务机器人语音对话的实现
  13. win10开机无响应 无服务器,win10开机假死-状态栏和开始菜单无响应
  14. [iOS]Size Class不同尺寸适配的是什么样的机型(实验向)
  15. 旋转卡壳凸包(不用一下子就学完所有)
  16. enjoy 问候相关
  17. javascript制作PPT
  18. 分布式之数据库和缓存双写一致性方案解析
  19. java memcached清除,需要清除memcach缓存方能解决的几个报错
  20. 世峰与深圳供电局就电力发展历史虚拟现实培训系统项目展开合作

热门文章

  1. SelectedNode与e.node的区别
  2. VS2010 工具箱组件添加重复
  3. 为防盗装自动门 不想也会影响生活
  4. 小程序获取用户手机号_借助云开发5行代码获取小程序用户的手机号
  5. php 入库乱码,php 中文字符入库或显示乱码问题的解决方法_PHP教程
  6. Win10系统配置Python3.6+OpenGL环境详细步骤
  7. java定时任务_java:springBoot使用@Scheduled注解配置定时任务
  8. grpc python异步实现_在grpcpython中处理异步流请求
  9. 界面放大_Beachtek推出RED摄影机低噪前置放大器DXA-RED
  10. 494. 目标和(JavaScript)