基于R的FP树fp growth 关联数据挖掘技术在煤矿隐患管理
研究煤矿隐患数据的挖掘以实现海量隐患数据的有效利用,在分析矿山数据挖掘枝术和煤矿隐患数据特点的基础上,提出煤矿隐患数据挖掘是矿山数字化的重要组成部分,给出煤矿隐患数据挖掘的概念,设计了煤矿隐患数据挖掘模型,并进一步分析了适用于煤矿隐患数据的挖掘算法。
最近我们被客户要求撰写关于煤矿隐患管理的研究报告,包括一些图形和统计输出。
以关联算法为例,对隐患数据进行多维关联规则挖掘,分析挖掘结果表明隐患多维数据之间存在紧密关联性,能够为煤矿安全决策提供支持。
视频:R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化
关联规则模型、Apriori算法及R语言挖掘杂货店交易数据与交互可视化
,时长07:03
以下以R语言为例为大家介绍关联规则在煤矿隐患管理的应用
dat1=read.csv("安全隐患数据FP-Growth.csv",header=T ,stringsAsFactors=T)read datahead(dat1)have a look at data隐患日期 隐患单位 隐患条数 汇报人 隐患地点 隐患地点.11 2009/1/2 综采队 5条 张立新 1106工作面 工作面2 2009/1/2 综采队 赵军孙旭光 1106工作面 工作面3 2009/1/2 综采队 郎志俊赵建军 1106工作面 工作面4 2009/1/2 机电二队 4条 宋慧刚李思光 一采区胶带巷 胶带巷5 2009/1/2 机电二队 4条 宋慧刚李思光 一采区胶带巷 胶带巷6 2009/1/2 机电二队 4条 宋慧刚李思光 一采区胶带巷 胶带巷处理措施 处理时间 负责人 隐患描述1 处理 2009/1/3 赵海根 1、有两组支架高压胶管破2 处理开水幕 2009/1/3 陈小旦 1、皮带机头硬架尾部压柱不吃劲3 调整管理 2009/1/3 陈小旦 2、60-66架煤墙松软,有片帮现象4 整改 2009/1/3 崔庆忠 1、主皮带上坡处第一道挡车器有一个肖未插到位5 整改 2009/1/3 崔庆忠 2、主皮带机头消防水管未码放6 整改 2009/1/3 崔庆忠 4、主皮带机头有一盏灯一头未吊挂隐患主题 隐患时间1 支架问题 第一季度2 皮带机问题 第一季度3 片帮问题 第一季度4 皮带机问题 第一季度5 火灾问题 第一季度6 皮带机问题 第一季度隐患主题、隐患时间、隐患地点和隐患单位
dat1=as(dat1[c("隐患主题","隐患时间","隐患地点.1","隐患单位")], "transactions")inspect(frequentsets[1:10]) 察看求得的频繁项集 review frequent setsitems support [1] {隐患主题=片帮问题,隐患地点.1=工作面} 0.05084388[2] {隐患地点.1=排水巷,隐患单位=综掘二队} 0.05327004[3] {隐患主题=支架问题,隐患地点.1=工作面} 0.06329114[4] {隐患时间=第二季度,隐患地点.1=猴车巷} 0.05126582[5] {隐患地点.1=猴车巷,隐患单位=综掘三队} 0.08829114[6] {隐患时间=第二季度,隐患单位=综掘一队} 0.05000000[7] {隐患地点.1=风巷,隐患单位=综掘一队} 0.08164557[8] {隐患时间=第二季度,隐患单位=综掘二队} 0.05527426[9] {隐患时间=第二季度,隐患单位=综掘三队} 0.05991561[10] {隐患地点.1=工作面,隐患单位=综采队} 0.13491561根据支持度对求得的频繁项集排序并察看(等价于inspect(sort(frequentsets)[1:10])items support [1] {隐患时间=第二季度} 0.3750000[2] {隐患地点.1=工作面} 0.2995781[3] {隐患时间=第一季度} 0.2668776[4] {隐患时间=第三季度} 0.1997890[5] {隐患单位=综安队} 0.1775316[6] {隐患地点.1=风巷} 0.1585443[7] {隐患地点.1=工作面,隐患单位=综安队} 0.1521097[8] {隐患主题=锚杆问题} 0.1464135[9] {隐患时间=第四季度} 0.1437764[10] {隐患主题=皮带机问题} 0.1431435
fp growth tree Mine association rules
fptree=function (data, parameter = NULL, appearance = NULL, control = NULL)
{data appearance <- as(c(appearance, list(labels = itemLabels(data))), "APappearance")validObject(result@lhs@data)validObject(result@rhs@data)}else {validObject(result@items@data)}result
}rules=fptree(dat1,parameter=list(support=0.06,confidence=0.1,minlen=2)) 求关联规则summary(rules)Inspect transactionsset of 25 rulesrule length distribution (lhs + rhs):sizes2 3 22 3 Min. 1st Qu. Median Mean 3rd Qu. Max. 2.00 2.00 2.00 2.12 2.00 3.00 summary of quality measures:support confidence lift Min. :0.06276 Min. :0.1868 Min. :0.9775 1st Qu.:0.06456 1st Qu.:0.2928 1st Qu.:1.0806 Median :0.07078 Median :0.4244 Median :1.3247 Mean :0.08642 Mean :0.4940 Mean :2.5253 3rd Qu.:0.08829 3rd Qu.:0.6643 3rd Qu.:3.2100 Max. :0.15211 Max. :0.9676 Max. :7.2803 mining info:data ntransactions support confidencedat1 9480 0.06 0.1inspect(head(rules))lhs rhs support confidence[1] {隐患主题=支架问题} => {隐患地点.1=工作面} 0.06329114 0.9600000 [2] {隐患地点.1=工作面} => {隐患主题=支架问题} 0.06329114 0.2112676 [3] {隐患地点.1=猴车巷} => {隐患单位=综掘三队} 0.08829114 0.9676301 [4] {隐患单位=综掘三队} => {隐患地点.1=猴车巷} 0.08829114 0.6642857 [5] {隐患单位=综掘一队} => {隐患地点.1=风巷} 0.08164557 0.7267606 [6] {隐患地点.1=风巷} => {隐患单位=综掘一队} 0.08164557 0.5149701 lift [1] 3.204507[2] 3.204507[3] 7.280264[4] 7.280264[5] 4.583959[6] 4.583959quality(head(rules))support confidence lift1 0.06329114 0.9600000 3.2045072 0.06329114 0.2112676 3.2045073 0.08829114 0.9676301 7.2802644 0.08829114 0.6642857 7.2802645 0.08164557 0.7267606 4.5839596 0.08164557 0.5149701 4.583959rules <- sort(rules, by="support")
inspect(head(rules, n=40))Look at rules with highest supportlhs rhs [1] {隐患单位=综安队} => {隐患地点.1=工作面}[2] {隐患地点.1=工作面} => {隐患单位=综安队} [3] {隐患单位=综采队} => {隐患地点.1=工作面}[4] {隐患地点.1=工作面} => {隐患单位=综采队} [5] {隐患地点.1=工作面} => {隐患时间=第二季度}[6] {隐患时间=第二季度} => {隐患地点.1=工作面}[7] {隐患地点.1=猴车巷} => {隐患单位=综掘三队}[8] {隐患单位=综掘三队} => {隐患地点.1=猴车巷}[9] {隐患时间=第一季度} => {隐患地点.1=工作面}[10] {隐患地点.1=工作面} => {隐患时间=第一季度}[11] {隐患单位=综掘一队} => {隐患地点.1=风巷} [12] {隐患地点.1=风巷} => {隐患单位=综掘一队}[13] {隐患单位=综安队} => {隐患时间=第二季度}[14] {隐患时间=第二季度} => {隐患单位=综安队} [15] {隐患地点.1=风巷} => {隐患时间=第二季度}[16] {隐患时间=第二季度} => {隐患地点.1=风巷} [17] {隐患地点.1=工作面,隐患单位=综安队} => {隐患时间=第二季度}[18] {隐患时间=第二季度,隐患单位=综安队} => {隐患地点.1=工作面}[19] {隐患时间=第二季度,隐患地点.1=工作面} => {隐患单位=综安队} [20] {隐患时间=第三季度} => {隐患地点.1=工作面}[21] {隐患地点.1=工作面} => {隐患时间=第三季度}[22] {隐患主题=支架问题} => {隐患地点.1=工作面}[23] {隐患地点.1=工作面} => {隐患主题=支架问题}[24] {隐患单位=综安队} => {隐患时间=第一季度}[25] {隐患时间=第一季度} => {隐患单位=综安队} support confidence lift [1] 0.15210970 0.8568033 2.8600336[2] 0.15210970 0.5077465 2.8600336[3] 0.13491561 0.9616541 3.2100286[4] 0.13491561 0.4503521 3.2100286[5] 0.10981013 0.3665493 0.9774648[6] 0.10981013 0.2928270 0.9774648[7] 0.08829114 0.9676301 7.2802642[8] 0.08829114 0.6642857 7.2802642[9] 0.08639241 0.3237154 1.0805712[10] 0.08639241 0.2883803 1.0805712[11] 0.08164557 0.7267606 4.5839588[12] 0.08164557 0.5149701 4.5839588[13] 0.07078059 0.3986928 1.0631808[14] 0.07078059 0.1887482 1.0631808[15] 0.07004219 0.4417831 1.1780883[16] 0.07004219 0.1867792 1.1780883[17] 0.06455696 0.4244105 1.1317614[18] 0.06455696 0.9120715 3.0445205[19] 0.06455696 0.5878963 3.3115012[20] 0.06339662 0.3173178 1.0592159[21] 0.06339662 0.2116197 1.0592159[22] 0.06329114 0.9600000 3.2045070[23] 0.06329114 0.2112676 3.2045070[24] 0.06276371 0.3535354 1.3247095[25] 0.06276371 0.2351779 1.3247095Look at rules with highest supportlhs rhs [1] {隐患地点.1=猴车巷} => {隐患单位=综掘三队}[2] {隐患单位=综采队} => {隐患地点.1=工作面}[3] {隐患主题=支架问题} => {隐患地点.1=工作面}[4] {隐患时间=第二季度,隐患单位=综安队} => {隐患地点.1=工作面}[5] {隐患单位=综安队} => {隐患地点.1=工作面}[6] {隐患单位=综掘一队} => {隐患地点.1=风巷} [7] {隐患单位=综掘三队} => {隐患地点.1=猴车巷}[8] {隐患时间=第二季度,隐患地点.1=工作面} => {隐患单位=综安队} [9] {隐患地点.1=风巷} => {隐患单位=综掘一队}[10] {隐患地点.1=工作面} => {隐患单位=综安队} [11] {隐患地点.1=工作面} => {隐患单位=综采队} [12] {隐患地点.1=风巷} => {隐患时间=第二季度}[13] {隐患地点.1=工作面,隐患单位=综安队} => {隐患时间=第二季度}[14] {隐患单位=综安队} => {隐患时间=第二季度}[15] {隐患地点.1=工作面} => {隐患时间=第二季度}[16] {隐患单位=综安队} => {隐患时间=第一季度}[17] {隐患时间=第一季度} => {隐患地点.1=工作面}[18] {隐患时间=第三季度} => {隐患地点.1=工作面}[19] {隐患时间=第二季度} => {隐患地点.1=工作面}[20] {隐患地点.1=工作面} => {隐患时间=第一季度}[21] {隐患时间=第一季度} => {隐患单位=综安队} [22] {隐患地点.1=工作面} => {隐患时间=第三季度}[23] {隐患地点.1=工作面} => {隐患主题=支架问题}[24] {隐患时间=第二季度} => {隐患单位=综安队} [25] {隐患时间=第二季度} => {隐患地点.1=风巷} support confidence lift [1] 0.08829114 0.9676301 7.2802642[2] 0.13491561 0.9616541 3.2100286[3] 0.06329114 0.9600000 3.2045070[4] 0.06455696 0.9120715 3.0445205[5] 0.15210970 0.8568033 2.8600336[6] 0.08164557 0.7267606 4.5839588[7] 0.08829114 0.6642857 7.2802642[8] 0.06455696 0.5878963 3.3115012[9] 0.08164557 0.5149701 4.5839588[10] 0.15210970 0.5077465 2.8600336[11] 0.13491561 0.4503521 3.2100286[12] 0.07004219 0.4417831 1.1780883[13] 0.06455696 0.4244105 1.1317614[14] 0.07078059 0.3986928 1.0631808[15] 0.10981013 0.3665493 0.9774648[16] 0.06276371 0.3535354 1.3247095[17] 0.08639241 0.3237154 1.0805712[18] 0.06339662 0.3173178 1.0592159[19] 0.10981013 0.2928270 0.9774648[20] 0.08639241 0.2883803 1.0805712[21] 0.06276371 0.2351779 1.3247095[22] 0.06339662 0.2116197 1.0592159[23] 0.06329114 0.2112676 3.2045070[24] 0.07078059 0.1887482 1.0631808[25] 0.07004219 0.1867792 1.1780883Look at rules with highest liftlhs rhs [1] {隐患地点.1=猴车巷} => {隐患单位=综掘三队}[2] {隐患单位=综掘三队} => {隐患地点.1=猴车巷}[3] {隐患单位=综掘一队} => {隐患地点.1=风巷} [4] {隐患地点.1=风巷} => {隐患单位=综掘一队}[5] {隐患时间=第二季度,隐患地点.1=工作面} => {隐患单位=综安队} [6] {隐患单位=综采队} => {隐患地点.1=工作面}[7] {隐患地点.1=工作面} => {隐患单位=综采队} [8] {隐患地点.1=工作面} => {隐患主题=支架问题}[9] {隐患主题=支架问题} => {隐患地点.1=工作面}[10] {隐患时间=第二季度,隐患单位=综安队} => {隐患地点.1=工作面}[11] {隐患单位=综安队} => {隐患地点.1=工作面}[12] {隐患地点.1=工作面} => {隐患单位=综安队} [13] {隐患单位=综安队} => {隐患时间=第一季度}[14] {隐患时间=第一季度} => {隐患单位=综安队} [15] {隐患地点.1=风巷} => {隐患时间=第二季度}[16] {隐患时间=第二季度} => {隐患地点.1=风巷} [17] {隐患地点.1=工作面,隐患单位=综安队} => {隐患时间=第二季度}[18] {隐患时间=第一季度} => {隐患地点.1=工作面}[19] {隐患地点.1=工作面} => {隐患时间=第一季度}[20] {隐患单位=综安队} => {隐患时间=第二季度}[21] {隐患时间=第二季度} => {隐患单位=综安队} [22] {隐患时间=第三季度} => {隐患地点.1=工作面}[23] {隐患地点.1=工作面} => {隐患时间=第三季度}[24] {隐患地点.1=工作面} => {隐患时间=第二季度}[25] {隐患时间=第二季度} => {隐患地点.1=工作面}support confidence lift [1] 0.08829114 0.9676301 7.2802642[2] 0.08829114 0.6642857 7.2802642[3] 0.08164557 0.7267606 4.5839588[4] 0.08164557 0.5149701 4.5839588[5] 0.06455696 0.5878963 3.3115012[6] 0.13491561 0.9616541 3.2100286[7] 0.13491561 0.4503521 3.2100286[8] 0.06329114 0.2112676 3.2045070[9] 0.06329114 0.9600000 3.2045070[10] 0.06455696 0.9120715 3.0445205[11] 0.15210970 0.8568033 2.8600336[12] 0.15210970 0.5077465 2.8600336[13] 0.06276371 0.3535354 1.3247095[14] 0.06276371 0.2351779 1.3247095[15] 0.07004219 0.4417831 1.1780883[16] 0.07004219 0.1867792 1.1780883[17] 0.06455696 0.4244105 1.1317614[18] 0.08639241 0.3237154 1.0805712[19] 0.08639241 0.2883803 1.0805712[20] 0.07078059 0.3986928 1.0631808[21] 0.07078059 0.1887482 1.0631808[22] 0.06339662 0.3173178 1.0592159[23] 0.06339662 0.2116197 1.0592159[24] 0.10981013 0.3665493 0.9774648[25] 0.10981013 0.2928270 0.9774648
基于R的FP树fp growth 关联数据挖掘技术在煤矿隐患管理相关推荐
- 基于R语言的Copula变量相关性分析及应用
在工程.水文和金融等各学科的研究中,总是会遇到很多变量,研究这些相互纠缠的变量间的相关关系是各学科的研究的重点.虽然皮尔逊相关.秩相关等相关系数提供了变量间相关关系的粗略结果,但这些系数都存在着无法克 ...
- 基于R语言极值统计学及其在相关领域中的应用
受到气候变化.温室效应以及人类活动等因素的影响,自然界中极端高温.极端环境污染.大洪水和大暴雨等现象的发生日益频繁:在人类社会中,股市崩溃.金融危机等极端情况也时有发生:今年的新冠疫情就是非常典型的极 ...
- 基于R语言的代理模型(高斯过程、贝叶斯优化、敏感性分析、异方差性等)高级技术应用
基于R语言的代理模型(高斯过程.贝叶斯优化.敏感性分析.异方差性等)高级技术应用 直播时间:10月30日-10月31日.11月6日-7日(4天+1周辅导练习) (上午9:30-12:00 下午14: ...
- A-Priori算法及其优化(FP树)
引子 在本文中,我们将通过示例先了解A-Priori算法,其基本思路是:若一个集合的子集不是频繁项集,那么该集合也不可能是频繁项集.基于此,该算法可以通过检查小集合而去掉大部分不合格的大集合. 接着, ...
- Python实现FP树
目录 FP树的基础知识 疑问与数据构建的想法 Python代码 FP树是用来挖掘最大频繁k项集的一种数据结构,相对来说难度较大,因为在前辈们的博客中,对于FP树的实现讲的是比较清楚了,但是对于FP的编 ...
- 基于R树索引的点面关系判断以及效率优化统计
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1.背景 在之前的博客中,我分别介绍了基于网格的空间索引(http:// ...
- FP-growth:FP树的构建
前言 FP-growth是一个非常好的频繁项集发现算法,广泛应用于搜索引擎中(找出经常在一起出现的词对)相对于Apriori算法,FP-growth算法只用对数据库进行两次扫描,因此更适用于处理大数据 ...
- FP-growth算法发现频繁项集(一)——构建FP树
常见的挖掘频繁项集算法有两类,一类是Apriori算法,另一类是FP-growth.Apriori通过不断的构造候选集.筛选候选集挖掘出频繁项集,需要多次扫描原始数据,当原始数据较大时,磁盘I/O次数 ...
- fp算法例题_Kmeans算法找相似商品、FP树找频繁项集
第一题:用Kmeans处理数据集 数据集下载地址 运行环境 python3.7.PyCharm 2018.2.4 (Community Edition) 思路 根据所给数据集及其说明可以看出数据集共有 ...
最新文章
- dos环境下mysql的访问_MYSQL dos环境下使用
- 苹果应用上架审核规则介绍
- TabSpec与TabHost
- 总在说 Spring Boot 内置了 Tomcat 启动,那它的原理你说的清楚吗?
- Boost:异步操作,需要boost :: asio :: async_initiate函数的测试程序
- 浅析MySQL JDBC连接配置上的两个误区
- SPSS制作三线表【SPSS 013期】
- CocoStudio 骨骼动画制作过程
- 视频教程-CCNA魔鬼训练营-思科认证
- sqlserver数据库替换字段的部分字符串
- java/php/net/python毕业生就业管理系统
- 阿拉伯数字 0、1、2、3、4、5、6、7、8、9 书写规范
- 正则表达式测试工具 java,正则表达式测试工具RegexTester
- windows双系统--WSL 安装使用
- 图论应用 floyd(弗洛伊德)算法、dijkstra(迪杰斯特拉)算法
- 固态硬盘数据恢复商家梳理
- 京东数科前端岗位面历
- GRBL-1:平台搭建
- STM32单片机控制A1333角度传感器磁编码器
- 程序框图计算机算法语言应用,第3讲 程序框图与算法语句
热门文章
- vue+springboot 制作属于自己的个人网站 ① vue前端部署
- 董明珠的权力危机:半年两位元老出局,格力进入动荡时刻
- ssi 指令 php,SSI使用详解(一)_php
- 天龙八部OL登录器编写之创建快捷方式
- IDEA 使用Spring Boot框架实现hello world
- [非线性控制理论]6_滑模控制 (sliding mode control)
- 常见音视频的编码方式和封装格式
- 汽车MEMS传感器应用及发展
- linux中c语言结构体详解,Linux C语言结构体-学习笔记
- 我的世界正版服务器开服,MC服务器开服方法