大数据根基于互联网,数据仓库、数据挖掘、云计算等互联网技术的发展为大数据应用奠定基础。对于任何一个大数据的从业者、初接触者,或者都会有个共同的感触:大数据很有用!那么大数据分析平台如何构建成了时下研究的热点。

  大数据并不是一场市场炒作。对于许多跨多个垂直的组织而言,大数据是真实存在的,而且它正在改变数据中心的架构。随着数据量、数据处理速度和数据类型的复杂度以远超标准前端和后台处理能力的速度增长,大数据在不断增长,这迫使企业需要搭建符合大数据发展的最新分析平台。

  大数据分析处理平台就是整合当前主流的各种具有不同侧重点的大数据处理分析框架和工具,实现对数据的挖掘和分析。一个大数据分析平台涉及到的组件众多,如何将其有机地结合起来,完成海量数据的挖掘是一项复杂的工作。在搭建大数据分析平台之前,要先明确业务需求场景以及用户的需求,通过大数据分析平台,想要得到哪些有价值的信息,需要接入的数据有哪些,明确基于场景业务需求的大数据平台要具备的基本功能,来决定平台搭建过程中使用的大数据处理工具和框架。

  大数据分析平台自下而上一般分为三个部分,分别为:数据层、大数据采集与存储、数据分析及展示。

  (1)数据层,针对不同系统进行分析,制定系统数据采集范围与目标,收集各个业务系统产生的各类数据,将各种结构化和非结构化数据进行整合,为大数据的分析提供支撑。

  (2)大数据采集与存储旨在为各类异构数据研制适配接口,与其他各系统对接,并为数据提供适配、转换、存储等基本管理功能,基本步骤包括:

  数据抽取:针对大数据分析平台需要采集的各类数据,分别有针对性地研制适配接口。对于已有的信息系统,研发对应的接口模块与各信息系统对接,不能实现数据共享接口的系统通过ETL工具进行数据采集,支持多种类型数据库,按照相应规范对数据进行清洗转换,从而实现数据的统一存储管理。

  数据预处理:为使大数据分析平台能更方便对数据进行处理,同时为了使得数据的存储机制扩展性、容错性更好,需要把数据按照相应关联性进行组合,并将数据转化为文本格式,作为文件存储下来。

  数据存储:为了提升数据存储的扩展性和容错性,采用主流的大数据框架对各类数据统一进行文本化存储,数据按相应规则存储,实现每日保存一套完整数据文件集,形成数据仓库。

  (3)数据分析和展示是核心业务层,通过数据报表工具,根据需求制定多样的,针对性的数据报表。针对存储的数据进行数据处理、算法运行、结果转换操作,将结果保存为报表文件,每日形成的报表文件集。报表展现系统将生成的报表文件以可视化方式进行展现。

  系统架构应高安全性、易扩展性,能够支持各类主流开发语言,并提供丰富的接口。同时能够支持结构化和非结构化数据的存储和应用。通过建立物联网应用,实现对物品、人员、安全等各方面管理的强大支撑,提升管理质量的同时积累大量管理数据和行为数据。

  大数据分析平台是企业一体化的大数据分析与应用平台,为企业提供大数据分析与决策。建设大数据分析平台以安全、可扩展、灵活性为原则,把某些有业务联系的单图组织成一个数据可视化的模块,用来反映业务各方面的数据情况,它从多种数据源获取数据,实现支持多维度筛选的交互式界面。

如何构造大数据分析平台相关推荐

  1. 10万字城市大脑一网统管大数据分析平台及大数据展示平台建设方案

    导读:原文<10万字城市大脑一网统管大数据分析平台及大数据展示平台建设方案>word(获取来源见文尾),本文精选其中精华及架构部分,逻辑清晰.内容完整,为快速形成售前方案提供参考. 目   ...

  2. 工业大数据分析平台的应用价值探讨

    大数据经过多年的潜心发展,在当今可以说是进入到了一个快速发展期.各种围绕大数据的应用开发也迅速火热起来了.政务大数据解决方案.企业级大数据解决方案.智慧城市停车大数据解决方案等已经开始被应用.5月份一 ...

  3. mmTrix大数据分析平台构建实录--转

    在数据分析中,有超过90%数据都是来自于非结构化数据,其中大部分的是日志,如运维.安全审计.用户访问数据以及业务数据等,但随着互联网快速的发展,数据规模也是水涨船高,从早前的GB级到现在的TB级,甚至 ...

  4. 阿里大数据分析与应用(part3)--常用的大数据分析平台

    学习笔记,仅供参考,有错必纠 文章目录 常用的大数据分析平台 什么是大数据分析平台 基于Hadoop的大数据分析平台 阿里云大数据平台 典型阿里云大数据平台架构 MaxCompute MaxCompu ...

  5. 【转】使用Apache Kylin搭建企业级开源大数据分析平台

    http://www.thebigdata.cn/JieJueFangAn/30143.html 本篇文章整理自史少锋4月23日在『1024大数据技术峰会』上的分享实录:使用Apache Kylin搭 ...

  6. canoco5冗余分析步骤_打造高性能的大数据分析平台

    大数据时代,大数据的应用与挖掘,大数据的分析和决策,大数据在经济社会的运行轨道上发挥着愈来愈重要的作用.对于大数据分析,现在好多互联网金融公司和传统的商业银行.证券基金公司都非常看重.个个都想在大数据 ...

  7. 超详攻略!Databricks 数据洞察 - 企业级全托管 Spark 大数据分析平台及案例分析

    简介: 5分钟读懂 Databricks 数据洞察 ~ 更多详细信息可登录 Databricks 数据洞察 产品链接:https://www.aliyun.com/product/bigdata/sp ...

  8. Splunk企业级运维智能大数据分析平台新手入门视频课程上线

    Splunk企业级运维智能&大数据分析平台新手入门视频课程上线 http://edu.51cto.com/course/course_id-6696.html 2016年8月2日到5日,移动端 ...

  9. Axure高保真智慧消防远程监管系统数据可视化大屏看板+web端高保真大数据分析平台看板+大数据交换配置管理平台大屏动态可视化看板

    作品介绍:Axure高保真智慧消防远程监管系统数据可视化大屏看板+web端高保真大数据分析平台看板+大数据交换配置管理平台大屏动态可视化看板 原型交互及下载链接:https://www.pmdaniu ...

最新文章

  1. 分水岭算法及相应处理
  2. 例子:倒计时按钮可用
  3. C#——继承[模拟Server类]初始化过程顺序DMEO
  4. CentOS 6.5 64位 安装zabbix-2.2.0
  5. python︱处理与使用json格式的数据(json/UltraJSON/Demjson)、pickle模块、yaml模块
  6. python对csv文件中的数据进行分类_python 数据处理 对csv文件进行数据处理
  7. Oracle 11.2.0.4.0 Dataguard部署和日常维护(6)-Active Dataguard篇
  8. 多功能雨伞项目计划书_多功能的雨伞创业项目计划书
  9. springboot利用拦截器和过滤器获取post请求参数
  10. 如何自定义Mac锁屏界面消息?
  11. MySQL中怎么对varchar类型排序问题(数字字符串和汉字拼音的顺序)
  12. win10系统启动wifi服务器,windows10系统下开启wifi共享的两种方法
  13. TIA博途_数据的保持型与初始化的具体方法和相关问题汇总
  14. Unity 水波纹Shader
  15. xshell个人免费版
  16. JAVA访问HDFS(满满干货!基础操作入门)
  17. Visustin(自动生成流程图)使用说明
  18. java c语言与人工智能_C语言与LISP语言的区别
  19. Error running 'PY201': Cannot run program C:\Users\GJ\AppData\Local\Programs\Python\Python37\python
  20. python实现键盘监听

热门文章

  1. Mac osx 技巧
  2. 侧栏广告 image flash
  3. 【打印代码+好好理解+子串问题】LeetCode 76. Minimum Window Substring
  4. Python的切片操作
  5. 二维联合分布的密度函数计算
  6. latex 论文绘图: 图像文字重叠
  7. 手写一些js方法收集:
  8. 2018.12.27|区块链技术头条
  9. Dubbo即将毕业,晋升为Apache顶级项目?
  10. vue2+vuex+vue-router 快速入门(三) vue 实例介绍