【摘要】 在物联网时代,数量庞大的“物”会产生海量数据,本文为您介绍两种基于物联网平台进行大数据分析的方法-实时分析和离线分析。

在物联网时代,数量庞大的“物”会产生PB级的海量数据,传统的数据处理服务的处理速度已无法跟上数据产生的速度。如果没法及时分析与利用这庞大的物联网设备数据,就无法将数据的价值最大化,大数据分析能力的建设对物联网企业来说又成为了一个新的挑战。针对这种情况,大数据处理服务应运而生。服务提供商提供大数据处理平台,为企业消除了大数据处理的效率问题和可靠性问题,让企业能够专注于物联网数据的分析与利用。

方案总览

物联网大数据根据数据类型的不同,分析方式也不同。

实时数据

有些数据的实时性很强,如果没有及时分析处理就会失去价值,甚至可能造成损失,我们称之为实时数据。典型的实时数据包括设备位置信息、设备实时状态等,应用于实时监控、实时告警等场景,例如,车辆实时上报位置数据,实时分析后呈现到交通监控中心的大屏上,交通专家根据实时数据下达各种交通控制决策,如红绿灯时间调整等。为了实现高实时性,我们可以采用实时流分析方案,从物联网平台对外的数据通道中实时提取流动数据,分析和处理之后再输出至数据通道继续流转,保证呈现的数据永远是最“新鲜”的。

时序数据

有些数据实时性没那么强,但是和时间顺序强相关,分析后的数据需要分类后按时序储存,并提供按时序浏览、查询数据的能力,我们称之为时序数据。典型的时序数据包括设备移动轨迹、股票价格曲线等,应用于行为分析、趋势预测等场景,例如,基于物联网的公路监控系统保存了近期所有车辆的行驶轨迹,警方可随时从中提取指定嫌疑人车辆的形式的轨迹,推测出嫌疑人的目的地,从而进行包抄逮捕。时序数据的分析一般依赖于时序数据库,数据保存至时序数据库进行分类与排序,再由其他应用或服务从数据库中获取进行进一步处理。

离线数据

还有一些数据,对于实时性和有序性的要求都没那么强,分析时数据已经固化,我们称之为离线数据。典型的离线数据包括产品销量数据、景点游客数据等,应用于统计分析,总结盘点等场景,例如,物联网平台将自动售货机上报的销售数据汇总后保存,然后定期使用大数据分析平台分析销售数据,以报表形式呈现给厂家,协助厂家进行销售策略的调整。离线分析的挑战主要在于庞大的数据量,一般会采用分布式处理的方案来提升海量数据分析的效率。

在本文中,我们将为您重点介绍实时分析和离线分析两种方案,时序分析方案我们下次再分享(具有物联网时序分析能力的华为云数据分析服务后续也将上线,敬请期待)。

实时分析方案

首先,让我们了解一下这个方案使用的服务。

  • 设备接入服务:设备接入是华为OceanConnect物联网平台对海量设备进行联接、数据采集/转发、远程控制的云服务。可实现海量设备与云端之间双向通信连接、设备数据采集上云,支持上层应用通过调用API远程控制设备,还提供了与华为云其他云服务无缝对接的规则引擎,可应用于各种物联网场景。设备接入服务还可以搭配设备管理服务使用,可实现产品模型定义、设备生命周期可视化管理,提供强大的面向行业应用开放能力,帮助企业快速构建创新的物联网业务。

  • 数据接入服务(DIS):数据接入服务(Data Ingestion Service)为处理或分析流数据的自定义应用程序构建数据流管道,主要解决云服务外的数据实时传输到云服务内的问题。数据接入服务每小时可从数十万种数据源(如IoT数据采集、日志和定位追踪事件、网站点击流、社交媒体源等)中连续捕获、传送和存储数TB数据。

  • 实时流计算服务(CS):实时流计算服务(Cloud Stream Service),是运行在公有云上的实时流式大数据分析服务,全托管的方式用户无需感知计算集群,只需聚焦于Stream SQL业务,即时执行作业。

  • 对象存储服务:对象存储服务(Object Storage Service,OBS)是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力,包括:创建、修改、删除桶,上传、下载、删除对象等。其中对象是OBS中数据存储的基本单位,用户上传至OBS的数据都以对象的形式保存在桶中,而桶是是OBS中存储对象的容器。

  • 数据仓库服务(DWS):数据仓库服务(Data Warehouse Service)是一种基于公有云基础架构和平台的在线数据处理数据库,提供即开即用、可扩展且完全托管的分析型数据库服务。DWS是基于华为融合数据仓库GaussDB产品的云原生服务,兼容标准ANSI SQL 99和SQL 2003,同时兼容PostgreSQL/Oracle数据库生态,为各行业PB级海量大数据分析提供有竞争力的解决方案。

  • 数据可视化服务(DLV):数据可视化服务(Data Lake Visualization)是一站式数据可视化平台,适配云上云下多种数据源,提供丰富多样的2D、3D可视化组件,采用拖拽式自由布局,旨在帮助您快速定制和应用属于您自己的数据大屏。

该方案的数据流向如下:

  1. 物联网平台将设备上报的数据通过规则引擎功能转发至数据接入服务(DIS)。

  2. 实时流计算服务(CS)从DIS的通道中获取实时数据,通过SQL语句分析并处理后,再写入另一个DIS通道。

  3. DIS以对象存储服务(OBS)为中介将分析结果转储至数据仓库服务(DWS)。

  4. 数据可视化服务(DLV)读取分析结果呈现为可视化报表。

实现该方案,您需要进行以下操作:

  1. 在DWS中创建一个集群并完成基本配置。

  2. 创建两条DIS通道,我们分别称之为输入通道和输出通道,然后为输出通道创建一个转储任务,将数据转储至DWS的集群。转储时会使用OBS桶临时存储转储数据,若没有OBS桶请创建一个。

  3. 在设备接入服务中创建一条规则,将设备上报数据转发至DIS的输入通道。

  4. 在CS中创建一个作业,实现从DIS输入通道中获取数据,分析处理后输出至DIS输出通道的功能。

  5. 在DLV中创建数据连接从DWS中获取数据,再创建数据大屏将数据可视化展示。

  6. 将上报数据的设备接入物联网平台(设备接入服务),并控制其上报数据。

详细操作指导请参考各个服务的帮助文档,本文不再赘述。

离线分析方案

首先,让我们了解一下这个方案使用的服务,前面已经介绍过的服务此处不再重复介绍。

MapReduce服务:MapReduce服务(MRS)是一个在华为云上部署和管理Hadoop系统的服务,一键即可部署Hadoop集群。MRS提供租户完全可控的企业级大数据集群云服务,轻松运行Hadoop、Spark、HBase、Kafka、Storm等大数据组件,并具备在后续根据业务需要进行定制开发的能力。

该方案的数据流向如下:

  1. 物联网平台将设备上报的数据通过规则引擎功能转发至数据接入服务(DIS)。

  2. DIS使用对象存储服务(OBS)作为中介,再将数据转储至MapReduce服务(MRS)。

  3. MRS从OBS获取用户定制的分析程序包,运行程序分析数据,并保存分析结果(可写入持久化数据库或写成文件)。

  4. 数据可视化服务(DLV)读取分析结果呈现为可视化报表。

实现该方案,您需要进行以下操作:

  1. 在MRS中创建一个Hadoop分析集群。

  2. 参考MRS的开发指南开发一个大数据分析程序,实现读取JSON格式的数据分析并处理,然后写入本地数据库或者写成文件存到OBS。程序开发完成后需打包成JAR文件并上传至OBS桶,若您没有OBS桶请创建一个。

  3. 创建一条DIS通道,然后为该通道创建一个转储任务,将数据转储至MRS的集群。

  4. 在设备接入服务中创建一条规则,将设备上报数据转发至DIS的通道。

  5. 将上报数据的设备接入物联网平台(设备接入服务),并控制其上报数据。

  6. 在MRS中创建一个作业,执行OBS桶中的大数据分析程序。

  7. 在DLV中创建数据连接从MRS数据库或OBS中读取数据,再创建数据大屏将数据可视化展示。

详细操作指导请参考各个服务的帮助文档,本文不再赘述,但针对这个方案中的其中一种场景,我们提供了包含详细操作步骤和代码样例的物联网微认证,若您感兴趣,可购买微认证快速体验物联网大数据分析流程。

>>点我访问微认证页面

作者:我是卤蛋

往期文章精选

如果让你手写个栈和队列,你还会写吗?

挑战10个最难的Java面试题(附答案)【上】

javascript基础修炼(13)——记一道有趣的JS脑洞练习题

【我的物联网成长记3】如何开发物联网应用?

【HC资料合集】2019华为全联接大会主题资料一站式汇总,免费下载!

对你没有看错!不到 10 行代码完成抖音热门视频的爬取!

Python面试的一些心得,与Python练习题分享

【我的物联网成长记5】如何进行物联网大数据分析?相关推荐

  1. 【我的物联网成长记12】当物联网遇上边缘计算

    [摘要] 针对设备直联云端方案的痛点,将边缘计算概念引入物联网解决方案的IoT边缘服务应运而生.本文将会为您介绍IoT边缘的能力与价值. 边缘,指实体或逻辑概念中离中心较远,靠近边界的部分.在数据处理 ...

  2. 【我的物联网成长记7】物联网主流通信协议解读【华为云分享】

    [摘要] 当今物联网的主流通信协议是CoAP/LWM2M协议和MQTT协议,本文将会为您分别解读这些协议的工作方式,了解它们的特点,助您选择最适合您的设备的通信协议. 通信协议又称为传输协议,用于定义 ...

  3. 【我的物联网成长记3】如何开发物联网应用?

    [摘要] 物联网应用是设备管理.故障监测.数据分析的重要工具.本文介绍如何基于物联网平台开发应用,包括API.SDK和图形化开发三种方式. -------------------整体方案------- ...

  4. 【我的物联网成长记2】设备如何进行选型?

    [摘要] 在设备集成开发过程中,主要涉及三类用户: 模组厂商:提供Wifi.NB-IoT.2/3/4G等通信模组的厂商.设备厂商可以利用模组提供的能力接入到华为IoT平台. 设备厂商:开发并销售最终设 ...

  5. 【我的物联网成长记6】由浅入深了解NB-IoT

    [摘要] 什么是NB-IoT?NB-IoT有什么优势?NB-IoT能做什么?本文将会从NB-IoT技术的发展历程,技术特点,通信协议,应用场景等方面为您全方面解读NB-IoT技术,了解NB-IoT的独 ...

  6. 【我的物联网成长记13】物联网卡能否携号转网?

    [摘要] 物联网设备也会用到SIM卡,那物联网卡能否携号转网呢?本文将带您一探究竟. 2019年12月1日,携号转网业务正式在全国范围内推出,相关新闻也不断刷屏. 相信各位物联网爱好者都很好奇,物联网 ...

  7. 【我的物联网成长记11】8招带你玩转规则引擎

    [摘要] 华为云物联网平台提供的规则引擎包括数据转发和设备联动等多种能力,这些能力都要怎么使用?本文教您8招最常用的用法,带您玩转规则引擎. 规则引擎是华为云物联网平台提供的一种能力,用户对接入平台的 ...

  8. 【我的物联网成长记9】物联网平台安全如何破?

    [摘要] 很多朋友都很关心华为物联网云平台的安全能力,今天它来了.安全的设备接入,稳定放心:安全的数据传输,可靠不怕泄露:安全的数据处理,保护用户隐私.今天我们就将围绕端.管.云和应用的安全能力为大家 ...

  9. 【我的物联网成长记1】如何进行端到端开发?

    [摘要] 自从华为物联网平台推出以来,很多开发者都在后台咨询小编设备如何上云等问题,小编我忍不住了,花了两天两夜,整理出"如何进行端到端开发",帮助您快速了解设备上云全流程. 全文 ...

最新文章

  1. android程序退出 语句,android开发中continue,break、return的区别与使用
  2. webapi随机调用_BeetleX之webapi验证插件JWT集成
  3. 苹果申请新专利 未来的Siri或许能分析用户面部表情
  4. 26留数及其应用(二)
  5. Zabbix 使用微信接收报警信息
  6. 循序渐进之Spring AOP(4) - Introduction
  7. 基于springboot+vue的医院预约系统(前后端分离)
  8. WIN32汇编对话框的使用
  9. 解决Python包下载慢问题
  10. leapftp 3.0.1使用教程,leapftp 3.0.1使用教程图解
  11. mac MAMP pro安装和破解
  12. 纽约Airbnb房源数据挖掘与房价预测评估模型
  13. R语言 按照行名称取行
  14. 异构网络互联;路由与转发;SDN基本概念;拥塞控制
  15. 小米是否真的可以干翻华为?
  16. C语言程序设计课程设计(服装销售管理系统)
  17. 阿里巴巴:今年营收 5000 亿,明年GMV要再增一万亿
  18. 全国计算机一级考试用什么版本,计算机等级考试用的是那个版本的office?
  19. hue数据导出到hdfs_如何将智能灯泡迁移到新的Philips Hue Bridge
  20. 2.4G蓝牙双模方案xii5168 超高性价比

热门文章

  1. ruhe anzjhuang mysql_Mysql配置安装过程
  2. 前端关系图谱插件_智游告诉你,前端开发应该学什么?
  3. python中str转unicode_python将unicode和str互相转化的实现
  4. . mybatis指定配置文件的根元素_MyBatis框架
  5. 【Python3爬虫】快就完事了--使用Celery加速你的爬虫
  6. 关系模式候选键求取的算法
  7. UVa 3349 Snowflake Snow Snowflakes(Hash)
  8. eclipse和myeclipse的差别问题
  9. 《Programming with Objective-C》第四章 Encapsulating Data
  10. WS-*协议栈及相关概念