本文的主要研究主要是基于一批历史的气象数据来挖掘不同天气形势下的关联性,对空气质量的管控和分析提供合理的指导意见,技术是通用性的,问题是具体业务场景里面的,最初接触到这个任务的时候着实没有特别清晰的实现思路,就我以往的实践经验来水,数据之间的关联性往往会借助于关联规则挖掘算法来实现固有关联规则或者是潜在关联规则的挖掘,数据之间的相似性往往会借助于相似度算法来完成计算,在前者的任务场景里面,参与计算的必然是离散性的数据项集合,后者的任务场景里面大多是连续性的数值向量。

对于当前的问题来说,矛盾点在于:问题的场景比较契合于关联规则挖掘算法的应用场景,但是由于气象数据属于连续性的数据又不能直接使用关联规则挖掘算法,这就需要我们想办法将连续性地数据转化为离散性的数据,本文主要是采用差分分级的离散化思想完成气象数据的离散化处理,之后编写关联规则挖掘算法来实现关联模式的挖掘。

差分分级算法可能是我自己这么称呼的,也可能之前就有这样的叫法了,这个方法是我在本科毕业论文里面第一次使用到的,也是用来处理连续性地数据的,效果很不错,所以这里的任务场景我觉得使用差分分级算法也是行之有效的,简单的背景介绍就到这里,下面我们进入正题。

下面是我从之前的毕业论文里面截取的一部分内容:

基于差分分级和关联规则挖掘的气象数据关联性分析实战相关推荐

  1. 利用weka进行数据挖掘——基于Apriori算法的关联规则挖掘实例

    文章目录 1. weka安装 2. 先分析一个Apriori算法的关联规则挖掘实例 3. 利用weka进行数据挖掘 3.1 将数据转为ARFF格式 3.2 利用weka进行分析 4. 参考文章 首先, ...

  2. R语言关联规则挖掘数据集预览、分析、筛选:项目数的分布形态(分位数、密度图)、itemFrequency函数统计每一项目在所有事务中出现的次数、最常发生的项目、数据筛选(交易的集合项目大于1)

    R语言关联规则挖掘数据集预览.分析.筛选:项目数的分布形态(分位数.密度图).itemFrequency函数统计每一项目在所有事务中出现的次数.最常发生的项目.数据筛选(交易的集合项目大于1) 目录

  3. 基于云上分布式NoSQL的海量气象数据存储和查询方案

    前言 气象数据是一类典型的大数据,具有数据量大.时效性高.数据种类丰富等特点.气象数据中大量的数据是时空数据,记录了时间和空间范围内各个点的各个物理量的观测量或者模拟量,每天产生的数据量常在几十TB到 ...

  4. 基于Neo4j中医方剂药材知识图谱大数据可视化分析系统的设计与开发

    基于Neo4j中医方剂药材知识图谱大数据可视化分析系统的设计与开发 设计背景 这个系统的开发初衷是笔者希望通过这个系统来学习一下Neo4j的相关技术,包括与python.java的对接.可视化等方面, ...

  5. 基于hadoop实现的关联规则挖掘的图书数据分析推荐系统

    资源下载地址:https://download.csdn.net/download/sheziqiong/86763735 资源下载地址:https://download.csdn.net/downl ...

  6. 啤酒与尿布?挖掘商品之间的关联性分析(1):机器学习之Apriori算法

    从这个贸易战看:强权即是真理,没有所谓的自由贸易和平等.中国之大已容不下一个安静的键盘.不过是又一次鸦片战争.除了愤怒还是愤怒,除了一心想为崛起而澎湃还是一心想为崛起而澎湃.中华文明三四千年的历史都是 ...

  7. OpenStreetMap数据Qt5分析实战(基于2020数据)

    openstreetmap是一种完全开放的地理信息系统,数据由个人.公司免费捐赠.维护.本文在2019年的基础上,利用新的数据样本,展示Qt5作为棒哒哒的C++重量级框架的强悍.OpenStreetM ...

  8. sklearn 读取csv_气象数据再分析数据的读取方式(GRIB格式为例)

    在对全球环境进行研究中,我们总会遇到欧洲中期预报中(European Centre for Medium-Range Weather Forecasts)等发布的气象再分析数据,例如,我在ESA官网上 ...

  9. 【预测模型】基于差分进化算法优化BP神经网络实现数据预测matlab源码

    1 算法介绍 2 部分代码 %% 差分进化算法应用于优化BP神经网络的初始权值和阈值%% 清空环境变量 clear all; clc; warning off load v357; load y357 ...

  10. 手把手教你使用R语言爬虫在气象网站抓取气象数据并分析绘制热力日历图(1)

    我们做临床研究常见的烦恼为没有好的数据,目前气象网站上有很多关于气象因素和空气质量数据,但是没有系统的整理和格式等问题,我们使用起来非常不方便,而且很费时间,我们可以使用R语言爬虫工具对网站上的数据进 ...

最新文章

  1. python物联网通信_物联网通信RESTDemo示例程序(Python版本)
  2. python后端服务器_毕设里配合Python后端使用的所谓”CGI服务器“
  3. 奇安信cdn配置教程_PicGo+jsDelivr+GitHub搭建免费cdn加速的图床
  4. 2018-2019-1 20165219 实验三 实时系统
  5. 写给初学者的话---linux使用说明
  6. android系统app打开蓝牙+设置可见性
  7. [C#][Quartz]帮助类
  8. 传统KTV打入冷宫,全民K歌和唱吧谁是“K歌之王”?
  9. OpenCVSharp Mat.Set<T>修改像素颜色
  10. 快手往事:得老铁者,失天下
  11. ~囍~ 将欢乐进行到底篇
  12. 【统计学】用Stata做时间序列分析
  13. vivo手机拍照有什么技巧,如何拍出精美照片?
  14. 18款 jQuery UI框架
  15. 《三国演义》统帅对比
  16. 垃圾回收器ZGC应用分析总结
  17. 【我的第一个目标检测课题】2、薅一把Google的羊毛!使用Colaboratory链接谷歌云盘在线进行网络训练
  18. Xcode使用OpenCV访问Mac摄像头权限问题
  19. IS-IS 邻居关系建立的过程(2-way 3-way)
  20. 戴维营教育ios笔试题一

热门文章

  1. 《树莓派Python编程入门与实战(第2版)》——2.2 使用Raspbian命令行
  2. Dockerfile 中的命令
  3. Form 表单提交参数
  4. 简单聊聊网页的资源加载优化
  5. 学科前沿技术专题第九章
  6. 证明华为模拟器Wvrp5.2a的二三层可以通信的trunk实验
  7. python 函数篇(2)
  8. shell 之while两种写法
  9. ie6中margin失效问题
  10. Memcached总结四:用ava程序连接memcached进行操作