应用华为大数据平台配置大数据项目①

  • 概述
  • 框架
  • 详述
    • 关于log4j

概述

智慧交通项目,由车载硬件设备发送GPS等数据,经过简单处理后经大数据平台计算返回结果,实时处理使用Spark2X,离线批处理使用Hive的MapReduce,作为历史数据存入Oracle,本文主要记录关于华为大数据平台使用FLume,Kafka,HDFS,Spark2X,等组件配置,使用过程中遇到的一些问题(踩过的坑),总结经验,记录自己的成长.

框架

本人是第一次设计大数据项目架构,欢迎大家提问,指正,我看到留言和私信都会回复的,下面附上低配版架构图

详述

数据源是从Rabbitmq中获取,在JAVA服务中做一些简单的数据清洗,通过log4j的appender发送给flume,因为公司都是SSM架构,后期有机会可以改造成SpringCloud.从flume开始,后面的所有组件都是安装在由华为大数据平台所管理的集群上面,华为提供一个组件叫做FusionInsightManager,此组件是一个图形化界面,方便监控整个集群的运行状态,和所有安装的组件(如Flume,Kafka)的运行状态,具体请参见华为官方文档.
flume接到数据后配置两个sink,一个发送给hdfs,落地成文件,由hive创建外部表关联,做离线批处理.作为历史数据ETL到oracle数据库.
另外一个sink给到另一个节点的flume服务端(华为定义的),因为直接给到Kafka接不到数据,所以多了一步配置,具体后面的文章会讲.然后由这个flume服务端把数据给到Kafka,再由Spark2X消费Kafka的数据,做实时计算后,返回需要的结果.

关于log4j

这里log4j有一个地方需要注意,如果用普通的maven项目搭建发送给Flume,根据依赖的log4j版本可以使用.properties配置,如果用的是springboot项目,默认是使用log4j2,这里是不支持.properties配置的,如果过非要使用.properties配置,请依赖2.6以上的版本,详情参见官方文档,可以使用xml作为配置文件,log4j2所有版本都适用,下面贴上测试成功的部分截图:
maven项目使用log4j的依赖:

样例代码:

log4j配置文件:

log4j的配置文件一定要放在resources下,不然找不到

下面是springboot的项目:
pom依赖:
一定要先排除掉springboot自带的log

下面添加log4j的依赖

flume依赖


下面是样例代码:

下面是log4j2的xml配置



注意:xml配置文件的名字必须是log4j2-spring.xml,不然会找不到而使用log4j2的默认配置

有不足之处还请多多指点!
未完待续!!

应用华为大数据平台配置大数据项目①相关推荐

  1. 大数据平台搭建_一文读懂数据平台、大数据平台、数据中台

    作者 | June 来源 | 智领云科技(ID:LinkTimeCloud) 造概念,在 IT 行业可不是一件陌生的事儿,中文博大精深,新名词.新概念往往简单准确,既可以被大众接受,又可以被专家把玩, ...

  2. 一文读懂数据平台、大数据平台、数据中台

    作者 | June 来源 | 智领云科技(ID:LinkTimeCloud) 造概念,在 IT 行业可不是一件陌生的事儿,中文博大精深,新名词.新概念往往简单准确,既可以被大众接受,又可以被专家把玩, ...

  3. 10万字城市大脑一网统管大数据分析平台及大数据展示平台建设方案

    导读:原文<10万字城市大脑一网统管大数据分析平台及大数据展示平台建设方案>word(获取来源见文尾),本文精选其中精华及架构部分,逻辑清晰.内容完整,为快速形成售前方案提供参考. 目   ...

  4. 数据平台、大数据平台、数据中台……傻傻分不清?这次终于有人讲明白了!

    来源 | 智领云科技 造概念,在IT行业可不是一件陌生的事儿,中文博大精深,新名词.新概念往往简单准确,既可以被大众接受,又可以被专家把玩,真正做到雅俗共赏.各有趣味.近年来,数据中台之火爆,什么数据 ...

  5. 数据平台、大数据平台、数据中台……还分的清不?

    造概念,在IT行业可不是一件陌生的事儿,中文博大精深,新名词.新概念往往简单准确,既可以被大众接受,又可以被专家把玩,真正做到雅俗共赏.各有趣味.近年来,数据中台之火爆,什么数据平台.数据中台.数据湖 ...

  6. Axure高保真智慧消防远程监管系统数据可视化大屏看板+web端高保真大数据分析平台看板+大数据交换配置管理平台大屏动态可视化看板

    作品介绍:Axure高保真智慧消防远程监管系统数据可视化大屏看板+web端高保真大数据分析平台看板+大数据交换配置管理平台大屏动态可视化看板 原型交互及下载链接:https://www.pmdaniu ...

  7. 政府大数据平台标准规范-数据接入

    搞政府大数据平台的,标准规范是一个绕不过去的内容,而且政府项目对标准规范貌似都特别看重,这是与做企业项目很大的不同.政府大数据平台的标准规范可以从以下几个方面制订: 数据接入,包括结构化.非结构化数据 ...

  8. 大数据平台下的数据治理

    文章目录 什么是数据治理 难题 大数据平台下的数据生命周期 数据治理关键场景 数据治理面临的挑战 数据治理关键问题 1. 海量系统规模 2. 复杂存储 3. 复杂采集 数据治理目标 数据治理平台与周边 ...

  9. 大数据平台架构:数据平台建设的几种方案

    随着大数据在越来越多的企业当中落地,企业要开展大数据相关的业务,那么首先要搭建起自身的数据平台.而企业搭建大数据平台,往往需要结合成本.业务.人员等各方面的因素,来规划数据平台建设方案.今天我们就来聊 ...

  10. 基础数据平台迁移大数据平台的一些参考

    背景 1.基础数据平台能力诉求:业务迅速增长,业务数据量不断膨胀,重要业务场景越来越多,对于基础数据平台的服务和支持能力提出了更高的要求. 2.数据时效诉求:业务部门经营分析.决策支持对数据时效要求越 ...

最新文章

  1. 基于点云的3D深度学习主干网络进展综述
  2. 水利水电工程管理与实务电子版习题_水利水电工程管理与实务复习题集.pdf
  3. 5 网络层----IP协议相关技术
  4. 瞬间几千次的重复提交,我用 Spring Boot + Redis 扛住了!
  5. delphi base64 java_Base64以及delphi、Java实现[转]
  6. Android7.0 PowerManagerService(3) 核心函数updatePowerStateLocked的主要流程
  7. python开发系列
  8. css3 - 语言伪类选择器
  9. 【转】系统缓存全解析二:动态缓存(4)-第三方分布式缓存解决方案 Memcache(2)...
  10. java年月日时分秒格式_Java 日期时间 LocalDate LocalTime LocalDateTime类
  11. PHP上传文件到项目public路径接口
  12. 排序算法(天勤数据结构高分笔记)
  13. Pr入门系列之十一:基本图形(上)
  14. Linux进程间通信信号量
  15. Silverlight 2教程(四):Chiron.exe:Silverlight 2打包和动态语言部署工具
  16. python爬取路况信息_高德实时路况数据获取
  17. 【win10专业版】新建账户激活 Office 2019
  18. 基于目标检测的海上舰船图像超分辨率研究
  19. 子网掩码 与同一网段
  20. BLDC反电动势的一些知识点

热门文章

  1. win7下修改php.ini的配置路径
  2. 安卓手机管理器_安卓平台上功能最全面强大的文件管理器!
  3. Matlab论文插图绘制模板第60期—瀑布图(Waterfall)
  4. csgo服务器正在维护中,csgo社区服务器进不去解决方法
  5. Node.js Kubernetes Graceful Shutdown
  6. MindSpore21天实战营(2):基于BERT实现中文新闻分类实战
  7. 微信视频文件保存在服务器吗,如何发送大的视频文件给朋友和家人
  8. Matlab如何在一个窗口绘制多张子图
  9. python关联分析库_使用Python进行数据关联分析
  10. 关于共享单车违规乱停治理方案拟定(畅想共享单车未来五年的战略方向)