大数据在近几年受到越来越多的关注,如何将大数据快速落地于生产实践,产生相应的经济价值一直是一个值得关注的问题。当谈到大数据,人们首先想到的是,是不是的linux,是不是的学习java,这给大数据技术的应用带来一定的困难。如果,有一款通用的大数据平台,只需要针对具体的业务系统修改数据库和算法即可快速使用,那就会加速大数据技术的普及。而且很多的爱好者,均有兴趣开发一套大数据分析平台,那么对于初学者如何开发一套简易的数据分析平台呢?

首先,通过分析网上大量的大数据平台框架,可以对其进行简单的抽象,都包含数据采集层,存储层,数据分析层和业务展现层,网上找的大数据系统架构都差不多,如下所示:(侵删)

也就是说,如果想开发一套大数据系统,就得包含这些“层”,通过对这些“层”所包含的技术进行分解,并总结就可以得到开发大数据系统的技术体系。

数据采集层

数据的获得是大数据的基础,如果有现成的数据库,需要存入HDFS中,那么就需要用到Sqoop,如果是需要对系统的日志进行收集,则需要使用Flume与Kafka,如果是来此一些传感器的数据,则需要使用一些通信协议,将数据传输至数据库中。建议熟悉使用MYSQL

存储层

存储的话需要掌握的是HDFS的几条命令,还有Hbase,hive的安装与使用,数据的存储方式则是一个需要重点研究的对象,因为数据可能具有多源异构特性,时间差异。存储的时候则需要考虑需要用何种方式对其存储,个人觉得基于元数据的存储数个不错的选择,看项目特性吧,有业务针对性的解决问题最重要。

数据分析层

对于一个简单的数据分析平台,分析是关键的一步,可以使用Spark Sql ,进行数据的抽取与统计,同时对于建模分析来说,可以使用Spark的mllib.当然还有很多的机器学习库可以使用

业务展现层

业务展现层,我认为是产品沟通用户的关键一步,因此,需要搭建一个用于交互的服务器。搭建这个服务器的话一般采用的是C/S架构,也就是传统的web开发,如果用java做,那么就会用到传说中的三大框架,如果用python做的话,那么flask和Django是个不错的选择。搭建好服务器之后,显示界面就需要进行考虑,首先需要掌握的就是基本的HTML,CSS,js知识,了解如何搭建一个页面,当然,现在很多的开源框架可供我们使用,仅需要根据需要进行百度就可以找到答案。

总结下学习的顺序

做大数据首先的学会搭建大数据平台,将多台计算机组成一个集群,因此
1.集群搭建(HADOOP,SPARK及相关开发工具的搭建)
2.熟悉大数据生态系统的相关操作组件,并从wordcount开始学习大数据
3.了解相应的java开发和scala基础语言
4.联系sparksql的写法,以及熟悉mllib的示例程序
5.对需要解决的业务问题进行详细了解,并制定对应的交互措施
6.学习三大框架或者是一种服务器,建议是flask(简单,快速)
7.根据设计的需要编写对应的静态页面(html,css,js)
8.对于可视化部分(D3.js,Echart..),需要制定相应的协议,统一格式
9系统的调试
10对系统的扩展

总结

开发数据分析平台是一个很有意思的事情,需要解决各种问题。欢迎coder进行交流

初学者如何快速开发大数据分析平台相关推荐

  1. 智慧平安社区系统开发解决方案,智慧小区大数据分析平台建设

    智慧平安社区系统开发解决方案,智慧小区大数据分析平台建设 智慧平安社区系统开发解决方案实现了对小区"人.地.车.物.事"的动态掌控,提升了社区的安全性,方便居民出行,为有特殊需要的 ...

  2. 重点人员动态管控系统开发,智慧公安大数据分析平台建设

    重点人员动态管控系统开发,智慧公安大数据分析平台建设 重点人员动态管控系统以公安七类人员为基础,以智能预警.组合战法.精确管控为目的,综合利用各类数据资源,进行大数据深层挖掘和智能研判,实现对重点人员 ...

  3. 智慧警务大数据分析平台开发动态重点人员管控平台开发

    智慧警务大数据分析平台开发动态重点人员管控平台开发 在当前整个信息社会背景下,警务战场的实时态势信息.警务领导与指挥命令.治安监控传感器信息等,都是以数据形式存在并传输的.公安大数据已经成为构成公安战 ...

  4. 工业大数据分析平台的应用价值探讨

    大数据经过多年的潜心发展,在当今可以说是进入到了一个快速发展期.各种围绕大数据的应用开发也迅速火热起来了.政务大数据解决方案.企业级大数据解决方案.智慧城市停车大数据解决方案等已经开始被应用.5月份一 ...

  5. mmTrix大数据分析平台构建实录--转

    在数据分析中,有超过90%数据都是来自于非结构化数据,其中大部分的是日志,如运维.安全审计.用户访问数据以及业务数据等,但随着互联网快速的发展,数据规模也是水涨船高,从早前的GB级到现在的TB级,甚至 ...

  6. 【转】使用Apache Kylin搭建企业级开源大数据分析平台

    http://www.thebigdata.cn/JieJueFangAn/30143.html 本篇文章整理自史少锋4月23日在『1024大数据技术峰会』上的分享实录:使用Apache Kylin搭 ...

  7. 大数据分析平台的作用有什么

    大数据分析平台的主要目标是为大数据技术研发和应用项目实施提供高效完备的开发与运行环境.为此,大数据分析平台的总体功能包括以下主要方面: (1)云计算环境:整个平台基于云计算环境,主要包括:云存储.云资 ...

  8. 工业大数据分析平台有哪些价值

    工业大数据分析平台是利用大数据技术开发搭建的为工业企业服务的一体化信息平台.我们国家世界工厂,仅仅成为制造大国是不行的.这些年国家高新技术产业的快速发展,我们应该可以深刻感受到我们正在从制造大国向制造 ...

  9. 企业如何实现大数据分析平台

    搭建大数据分析平台的工作是循序渐进的,不同公司要根据自身所处阶段选择合适的平台形态,没有必要过分追求平台的分析深度和服务属性,关键是能解决当下的问题. 大数据分析平台是对大数据时代的数据分析产品(或称 ...

最新文章

  1. iOS Block实现探究
  2. 湘潭大学网络编程_湘潭大学计算机学院网络空间安全学院“湘韵”研究生论坛成功举行...
  3. html如何用v-for遍历,v-for循环遍历
  4. HashSet源码分析 jdk1.6
  5. 【组原】广州大学计算机组成原理考试部分题+复习资料(2020-2021)
  6. python相关性分析的散点图怎么做_Python:matplotlib 和 Seaborn 之散点图和相关性 (三十二)...
  7. 一种基于游戏引擎的AR模式探讨(下)
  8. Linux第一条指令地址,arm-linux 启动代码分析——stage1 (1)
  9. JS node 后端签名前端文件直传ali-oss解决方案
  10. 操作系统课设之简单 shell 命令行解释器的设计与实现
  11. 使用DOM生成XML文件(转)
  12. 超级好用的坐标转换软件
  13. cisco packet tracer实验案例-重置路由器ENABLE特权密码
  14. RTSP流媒体播放分析-转
  15. php模拟登录其他网站,PHP利用Curl模拟登录并获取数据例子
  16. 《软件设计精要与模式》书评
  17. 《中國姓氏大全》【带拼音】
  18. 微型计算机原理与接口技术
  19. 苹果腕表应用上架 开发要求_苹果手表系列6首发
  20. 一文搞定Nginx的安装与高可用配置

热门文章

  1. java.util.list源码_关于fest-util源码包Collections集合工具类过滤、判空、格式化及复制克隆处理...
  2. Silicon Labs EFR32 RF射频测试-RAILTEST
  3. 我的世界服务器物品属性,[娱乐|机械]Item Lore Stats —— 自定义你的物品属性[自带强化][1.10及以上]...
  4. 戒不掉的温柔 (残月
  5. 51单片机实例学习四 128X64 液晶显示器、PS/2与单片机通信、密码锁
  6. SecureCRT sftp上传文件报错:put: failed to upload xxx 拒绝访问
  7. App渠道打包的最佳攻略,一次解决打包难题
  8. QuickHit项目
  9. 叉包舍 - PPPoE之常见拨号错误代码及处理
  10. CSS3中的关键帧@keyframes 和 动画animation