研究煤矿隐患数据的挖掘以实现海量隐患数据的有效利用,在分析矿山数据挖掘枝术和煤矿隐患数据特点的基础上,提出煤矿隐患数据挖掘是矿山数字化的重要组成部分,给出煤矿隐患数据挖掘的概念,设计了煤矿隐患数据挖掘模型,并进一步分析了适用于煤矿隐患数据的挖掘算法。

最近我们被客户要求撰写关于煤矿隐患管理的研究报告,包括一些图形和统计输出。

以关联算法为例,对隐患数据进行多维关联规则挖掘,分析挖掘结果表明隐患多维数据之间存在紧密关联性,能够为煤矿安全决策提供支持。

视频:R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

关联规则模型、Apriori算法及R语言挖掘杂货店交易数据与交互可视化

,时长07:03

以下以R语言为例为大家介绍关联规则在煤矿隐患管理的应用


dat1=read.csv("安全隐患数据FP-Growth.csv",header=T ,stringsAsFactors=T)read datahead(dat1)have a look at data隐患日期 隐患单位 隐患条数       汇报人     隐患地点 隐患地点.11 2009/1/2   综采队      5条       张立新   1106工作面     工作面2 2009/1/2   综采队            赵军孙旭光   1106工作面     工作面3 2009/1/2   综采队          郎志俊赵建军   1106工作面     工作面4 2009/1/2 机电二队      4条 宋慧刚李思光 一采区胶带巷     胶带巷5 2009/1/2 机电二队      4条 宋慧刚李思光 一采区胶带巷     胶带巷6 2009/1/2 机电二队      4条 宋慧刚李思光 一采区胶带巷     胶带巷处理措施 处理时间 负责人                                    隐患描述1       处理 2009/1/3 赵海根                     1、有两组支架高压胶管破2 处理开水幕 2009/1/3 陈小旦               1、皮带机头硬架尾部压柱不吃劲3   调整管理 2009/1/3 陈小旦            2、60-66架煤墙松软,有片帮现象4       整改 2009/1/3 崔庆忠 1、主皮带上坡处第一道挡车器有一个肖未插到位5       整改 2009/1/3 崔庆忠                 2、主皮带机头消防水管未码放6       整改 2009/1/3 崔庆忠             4、主皮带机头有一盏灯一头未吊挂隐患主题 隐患时间1   支架问题 第一季度2 皮带机问题 第一季度3   片帮问题 第一季度4 皮带机问题 第一季度5   火灾问题 第一季度6 皮带机问题 第一季度隐患主题、隐患时间、隐患地点和隐患单位
dat1=as(dat1[c("隐患主题","隐患时间","隐患地点.1","隐患单位")], "transactions")inspect(frequentsets[1:10]) 察看求得的频繁项集 review frequent setsitems                                 support   [1]  {隐患主题=片帮问题,隐患地点.1=工作面} 0.05084388[2]  {隐患地点.1=排水巷,隐患单位=综掘二队} 0.05327004[3]  {隐患主题=支架问题,隐患地点.1=工作面} 0.06329114[4]  {隐患时间=第二季度,隐患地点.1=猴车巷} 0.05126582[5]  {隐患地点.1=猴车巷,隐患单位=综掘三队} 0.08829114[6]  {隐患时间=第二季度,隐患单位=综掘一队} 0.05000000[7]  {隐患地点.1=风巷,隐患单位=综掘一队}   0.08164557[8]  {隐患时间=第二季度,隐患单位=综掘二队} 0.05527426[9]  {隐患时间=第二季度,隐患单位=综掘三队} 0.05991561[10] {隐患地点.1=工作面,隐患单位=综采队}   0.13491561根据支持度对求得的频繁项集排序并察看(等价于inspect(sort(frequentsets)[1:10])items                               support  [1]  {隐患时间=第二季度}                 0.3750000[2]  {隐患地点.1=工作面}                 0.2995781[3]  {隐患时间=第一季度}                 0.2668776[4]  {隐患时间=第三季度}                 0.1997890[5]  {隐患单位=综安队}                   0.1775316[6]  {隐患地点.1=风巷}                   0.1585443[7]  {隐患地点.1=工作面,隐患单位=综安队} 0.1521097[8]  {隐患主题=锚杆问题}                 0.1464135[9]  {隐患时间=第四季度}                 0.1437764[10] {隐患主题=皮带机问题}               0.1431435

fp growth tree Mine association rules


fptree=function (data, parameter = NULL, appearance = NULL, control = NULL)
{data appearance <- as(c(appearance, list(labels = itemLabels(data))), "APappearance")validObject(result@lhs@data)validObject(result@rhs@data)}else {validObject(result@items@data)}result
}rules=fptree(dat1,parameter=list(support=0.06,confidence=0.1,minlen=2)) 求关联规则summary(rules)Inspect transactionsset of 25 rulesrule length distribution (lhs + rhs):sizes2  3 22  3 Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 2.00    2.00    2.00    2.12    2.00    3.00 summary of quality measures:support          confidence          lift       Min.   :0.06276   Min.   :0.1868   Min.   :0.9775  1st Qu.:0.06456   1st Qu.:0.2928   1st Qu.:1.0806  Median :0.07078   Median :0.4244   Median :1.3247  Mean   :0.08642   Mean   :0.4940   Mean   :2.5253  3rd Qu.:0.08829   3rd Qu.:0.6643   3rd Qu.:3.2100  Max.   :0.15211   Max.   :0.9676   Max.   :7.2803  mining info:data ntransactions support confidencedat1          9480    0.06        0.1inspect(head(rules))lhs                    rhs                 support    confidence[1] {隐患主题=支架问题} => {隐患地点.1=工作面} 0.06329114 0.9600000 [2] {隐患地点.1=工作面} => {隐患主题=支架问题} 0.06329114 0.2112676 [3] {隐患地点.1=猴车巷} => {隐患单位=综掘三队} 0.08829114 0.9676301 [4] {隐患单位=综掘三队} => {隐患地点.1=猴车巷} 0.08829114 0.6642857 [5] {隐患单位=综掘一队} => {隐患地点.1=风巷}   0.08164557 0.7267606 [6] {隐患地点.1=风巷}   => {隐患单位=综掘一队} 0.08164557 0.5149701 lift    [1] 3.204507[2] 3.204507[3] 7.280264[4] 7.280264[5] 4.583959[6] 4.583959quality(head(rules))support confidence     lift1 0.06329114  0.9600000 3.2045072 0.06329114  0.2112676 3.2045073 0.08829114  0.9676301 7.2802644 0.08829114  0.6642857 7.2802645 0.08164557  0.7267606 4.5839596 0.08164557  0.5149701 4.583959rules <- sort(rules, by="support")
inspect(head(rules, n=40))Look at rules with highest supportlhs                                      rhs                [1]  {隐患单位=综安队}                     => {隐患地点.1=工作面}[2]  {隐患地点.1=工作面}                   => {隐患单位=综安队}  [3]  {隐患单位=综采队}                     => {隐患地点.1=工作面}[4]  {隐患地点.1=工作面}                   => {隐患单位=综采队}  [5]  {隐患地点.1=工作面}                   => {隐患时间=第二季度}[6]  {隐患时间=第二季度}                   => {隐患地点.1=工作面}[7]  {隐患地点.1=猴车巷}                   => {隐患单位=综掘三队}[8]  {隐患单位=综掘三队}                   => {隐患地点.1=猴车巷}[9]  {隐患时间=第一季度}                   => {隐患地点.1=工作面}[10] {隐患地点.1=工作面}                   => {隐患时间=第一季度}[11] {隐患单位=综掘一队}                   => {隐患地点.1=风巷}  [12] {隐患地点.1=风巷}                     => {隐患单位=综掘一队}[13] {隐患单位=综安队}                     => {隐患时间=第二季度}[14] {隐患时间=第二季度}                   => {隐患单位=综安队}  [15] {隐患地点.1=风巷}                     => {隐患时间=第二季度}[16] {隐患时间=第二季度}                   => {隐患地点.1=风巷}  [17] {隐患地点.1=工作面,隐患单位=综安队}   => {隐患时间=第二季度}[18] {隐患时间=第二季度,隐患单位=综安队}   => {隐患地点.1=工作面}[19] {隐患时间=第二季度,隐患地点.1=工作面} => {隐患单位=综安队}  [20] {隐患时间=第三季度}                   => {隐患地点.1=工作面}[21] {隐患地点.1=工作面}                   => {隐患时间=第三季度}[22] {隐患主题=支架问题}                   => {隐患地点.1=工作面}[23] {隐患地点.1=工作面}                   => {隐患主题=支架问题}[24] {隐患单位=综安队}                     => {隐患时间=第一季度}[25] {隐患时间=第一季度}                   => {隐患单位=综安队}  support    confidence lift     [1]  0.15210970 0.8568033  2.8600336[2]  0.15210970 0.5077465  2.8600336[3]  0.13491561 0.9616541  3.2100286[4]  0.13491561 0.4503521  3.2100286[5]  0.10981013 0.3665493  0.9774648[6]  0.10981013 0.2928270  0.9774648[7]  0.08829114 0.9676301  7.2802642[8]  0.08829114 0.6642857  7.2802642[9]  0.08639241 0.3237154  1.0805712[10] 0.08639241 0.2883803  1.0805712[11] 0.08164557 0.7267606  4.5839588[12] 0.08164557 0.5149701  4.5839588[13] 0.07078059 0.3986928  1.0631808[14] 0.07078059 0.1887482  1.0631808[15] 0.07004219 0.4417831  1.1780883[16] 0.07004219 0.1867792  1.1780883[17] 0.06455696 0.4244105  1.1317614[18] 0.06455696 0.9120715  3.0445205[19] 0.06455696 0.5878963  3.3115012[20] 0.06339662 0.3173178  1.0592159[21] 0.06339662 0.2116197  1.0592159[22] 0.06329114 0.9600000  3.2045070[23] 0.06329114 0.2112676  3.2045070[24] 0.06276371 0.3535354  1.3247095[25] 0.06276371 0.2351779  1.3247095Look at rules with highest supportlhs                                      rhs                [1]  {隐患地点.1=猴车巷}                   => {隐患单位=综掘三队}[2]  {隐患单位=综采队}                     => {隐患地点.1=工作面}[3]  {隐患主题=支架问题}                   => {隐患地点.1=工作面}[4]  {隐患时间=第二季度,隐患单位=综安队}   => {隐患地点.1=工作面}[5]  {隐患单位=综安队}                     => {隐患地点.1=工作面}[6]  {隐患单位=综掘一队}                   => {隐患地点.1=风巷}  [7]  {隐患单位=综掘三队}                   => {隐患地点.1=猴车巷}[8]  {隐患时间=第二季度,隐患地点.1=工作面} => {隐患单位=综安队}  [9]  {隐患地点.1=风巷}                     => {隐患单位=综掘一队}[10] {隐患地点.1=工作面}                   => {隐患单位=综安队}  [11] {隐患地点.1=工作面}                   => {隐患单位=综采队}  [12] {隐患地点.1=风巷}                     => {隐患时间=第二季度}[13] {隐患地点.1=工作面,隐患单位=综安队}   => {隐患时间=第二季度}[14] {隐患单位=综安队}                     => {隐患时间=第二季度}[15] {隐患地点.1=工作面}                   => {隐患时间=第二季度}[16] {隐患单位=综安队}                     => {隐患时间=第一季度}[17] {隐患时间=第一季度}                   => {隐患地点.1=工作面}[18] {隐患时间=第三季度}                   => {隐患地点.1=工作面}[19] {隐患时间=第二季度}                   => {隐患地点.1=工作面}[20] {隐患地点.1=工作面}                   => {隐患时间=第一季度}[21] {隐患时间=第一季度}                   => {隐患单位=综安队}  [22] {隐患地点.1=工作面}                   => {隐患时间=第三季度}[23] {隐患地点.1=工作面}                   => {隐患主题=支架问题}[24] {隐患时间=第二季度}                   => {隐患单位=综安队}  [25] {隐患时间=第二季度}                   => {隐患地点.1=风巷}  support    confidence lift     [1]  0.08829114 0.9676301  7.2802642[2]  0.13491561 0.9616541  3.2100286[3]  0.06329114 0.9600000  3.2045070[4]  0.06455696 0.9120715  3.0445205[5]  0.15210970 0.8568033  2.8600336[6]  0.08164557 0.7267606  4.5839588[7]  0.08829114 0.6642857  7.2802642[8]  0.06455696 0.5878963  3.3115012[9]  0.08164557 0.5149701  4.5839588[10] 0.15210970 0.5077465  2.8600336[11] 0.13491561 0.4503521  3.2100286[12] 0.07004219 0.4417831  1.1780883[13] 0.06455696 0.4244105  1.1317614[14] 0.07078059 0.3986928  1.0631808[15] 0.10981013 0.3665493  0.9774648[16] 0.06276371 0.3535354  1.3247095[17] 0.08639241 0.3237154  1.0805712[18] 0.06339662 0.3173178  1.0592159[19] 0.10981013 0.2928270  0.9774648[20] 0.08639241 0.2883803  1.0805712[21] 0.06276371 0.2351779  1.3247095[22] 0.06339662 0.2116197  1.0592159[23] 0.06329114 0.2112676  3.2045070[24] 0.07078059 0.1887482  1.0631808[25] 0.07004219 0.1867792  1.1780883Look at rules with highest liftlhs                                      rhs                [1]  {隐患地点.1=猴车巷}                   => {隐患单位=综掘三队}[2]  {隐患单位=综掘三队}                   => {隐患地点.1=猴车巷}[3]  {隐患单位=综掘一队}                   => {隐患地点.1=风巷}  [4]  {隐患地点.1=风巷}                     => {隐患单位=综掘一队}[5]  {隐患时间=第二季度,隐患地点.1=工作面} => {隐患单位=综安队}  [6]  {隐患单位=综采队}                     => {隐患地点.1=工作面}[7]  {隐患地点.1=工作面}                   => {隐患单位=综采队}  [8]  {隐患地点.1=工作面}                   => {隐患主题=支架问题}[9]  {隐患主题=支架问题}                   => {隐患地点.1=工作面}[10] {隐患时间=第二季度,隐患单位=综安队}   => {隐患地点.1=工作面}[11] {隐患单位=综安队}                     => {隐患地点.1=工作面}[12] {隐患地点.1=工作面}                   => {隐患单位=综安队}  [13] {隐患单位=综安队}                     => {隐患时间=第一季度}[14] {隐患时间=第一季度}                   => {隐患单位=综安队}  [15] {隐患地点.1=风巷}                     => {隐患时间=第二季度}[16] {隐患时间=第二季度}                   => {隐患地点.1=风巷}  [17] {隐患地点.1=工作面,隐患单位=综安队}   => {隐患时间=第二季度}[18] {隐患时间=第一季度}                   => {隐患地点.1=工作面}[19] {隐患地点.1=工作面}                   => {隐患时间=第一季度}[20] {隐患单位=综安队}                     => {隐患时间=第二季度}[21] {隐患时间=第二季度}                   => {隐患单位=综安队}  [22] {隐患时间=第三季度}                   => {隐患地点.1=工作面}[23] {隐患地点.1=工作面}                   => {隐患时间=第三季度}[24] {隐患地点.1=工作面}                   => {隐患时间=第二季度}[25] {隐患时间=第二季度}                   => {隐患地点.1=工作面}support    confidence lift     [1]  0.08829114 0.9676301  7.2802642[2]  0.08829114 0.6642857  7.2802642[3]  0.08164557 0.7267606  4.5839588[4]  0.08164557 0.5149701  4.5839588[5]  0.06455696 0.5878963  3.3115012[6]  0.13491561 0.9616541  3.2100286[7]  0.13491561 0.4503521  3.2100286[8]  0.06329114 0.2112676  3.2045070[9]  0.06329114 0.9600000  3.2045070[10] 0.06455696 0.9120715  3.0445205[11] 0.15210970 0.8568033  2.8600336[12] 0.15210970 0.5077465  2.8600336[13] 0.06276371 0.3535354  1.3247095[14] 0.06276371 0.2351779  1.3247095[15] 0.07004219 0.4417831  1.1780883[16] 0.07004219 0.1867792  1.1780883[17] 0.06455696 0.4244105  1.1317614[18] 0.08639241 0.3237154  1.0805712[19] 0.08639241 0.2883803  1.0805712[20] 0.07078059 0.3986928  1.0631808[21] 0.07078059 0.1887482  1.0631808[22] 0.06339662 0.3173178  1.0592159[23] 0.06339662 0.2116197  1.0592159[24] 0.10981013 0.3665493  0.9774648[25] 0.10981013 0.2928270  0.9774648

 

基于R的FP树fp growth 关联数据挖掘技术在煤矿隐患管理相关推荐

  1. 基于R语言的Copula变量相关性分析及应用

    在工程.水文和金融等各学科的研究中,总是会遇到很多变量,研究这些相互纠缠的变量间的相关关系是各学科的研究的重点.虽然皮尔逊相关.秩相关等相关系数提供了变量间相关关系的粗略结果,但这些系数都存在着无法克 ...

  2. 基于R语言极值统计学及其在相关领域中的应用

    受到气候变化.温室效应以及人类活动等因素的影响,自然界中极端高温.极端环境污染.大洪水和大暴雨等现象的发生日益频繁:在人类社会中,股市崩溃.金融危机等极端情况也时有发生:今年的新冠疫情就是非常典型的极 ...

  3. 基于R语言的代理模型(高斯过程、贝叶斯优化、敏感性分析、异方差性等)高级技术应用

    基于R语言的代理模型(高斯过程.贝叶斯优化.敏感性分析.异方差性等)高级技术应用 直播时间:10月30日-10月31日.11月6日-7日(4天+1周辅导练习) (上午9:30-12:00  下午14: ...

  4. A-Priori算法及其优化(FP树)

    引子 在本文中,我们将通过示例先了解A-Priori算法,其基本思路是:若一个集合的子集不是频繁项集,那么该集合也不可能是频繁项集.基于此,该算法可以通过检查小集合而去掉大部分不合格的大集合. 接着, ...

  5. Python实现FP树

    目录 FP树的基础知识 疑问与数据构建的想法 Python代码 FP树是用来挖掘最大频繁k项集的一种数据结构,相对来说难度较大,因为在前辈们的博客中,对于FP树的实现讲的是比较清楚了,但是对于FP的编 ...

  6. 基于R树索引的点面关系判断以及效率优化统计

    文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1.背景 在之前的博客中,我分别介绍了基于网格的空间索引(http:// ...

  7. FP-growth:FP树的构建

    前言 FP-growth是一个非常好的频繁项集发现算法,广泛应用于搜索引擎中(找出经常在一起出现的词对)相对于Apriori算法,FP-growth算法只用对数据库进行两次扫描,因此更适用于处理大数据 ...

  8. FP-growth算法发现频繁项集(一)——构建FP树

    常见的挖掘频繁项集算法有两类,一类是Apriori算法,另一类是FP-growth.Apriori通过不断的构造候选集.筛选候选集挖掘出频繁项集,需要多次扫描原始数据,当原始数据较大时,磁盘I/O次数 ...

  9. fp算法例题_Kmeans算法找相似商品、FP树找频繁项集

    第一题:用Kmeans处理数据集 数据集下载地址 运行环境 python3.7.PyCharm 2018.2.4 (Community Edition) 思路 根据所给数据集及其说明可以看出数据集共有 ...

最新文章

  1. dos环境下mysql的访问_MYSQL dos环境下使用
  2. 苹果应用上架审核规则介绍
  3. TabSpec与TabHost
  4. 总在说 Spring Boot 内置了 Tomcat 启动,那它的原理你说的清楚吗?
  5. Boost:异步操作,需要boost :: asio :: async_initiate函数的测试程序
  6. 浅析MySQL JDBC连接配置上的两个误区
  7. SPSS制作三线表【SPSS 013期】
  8. CocoStudio 骨骼动画制作过程
  9. 视频教程-CCNA魔鬼训练营-思科认证
  10. sqlserver数据库替换字段的部分字符串
  11. java/php/net/python毕业生就业管理系统
  12. 阿拉伯数字 0、1、2、3、4、5、6、7、8、9 书写规范
  13. 正则表达式测试工具 java,正则表达式测试工具RegexTester
  14. windows双系统--WSL 安装使用
  15. 图论应用 floyd(弗洛伊德)算法、dijkstra(迪杰斯特拉)算法
  16. 固态硬盘数据恢复商家梳理
  17. 京东数科前端岗位面历
  18. GRBL-1:平台搭建
  19. STM32单片机控制A1333角度传感器磁编码器
  20. 程序框图计算机算法语言应用,第3讲 程序框图与算法语句

热门文章

  1. vue+springboot 制作属于自己的个人网站 ① vue前端部署
  2. 董明珠的权力危机:半年两位元老出局,格力进入动荡时刻
  3. ssi 指令 php,SSI使用详解(一)_php
  4. 天龙八部OL登录器编写之创建快捷方式
  5. IDEA 使用Spring Boot框架实现hello world
  6. [非线性控制理论]6_滑模控制 (sliding mode control)
  7. 常见音视频的编码方式和封装格式
  8. 汽车MEMS传感器应用及发展
  9. linux中c语言结构体详解,Linux C语言结构体-学习笔记
  10. 我的世界正版服务器开服,MC服务器开服方法