加权关联规则挖掘(以apriori和fp-tree算法为例)的权值计算。

以下面的数据为例来进行说明,表2中的交易权重和归一化权重只是截图结果,这里的具体数值可不要考虑。

加权支持度的计算为Sup(B)=count(B)*W(B)/总数;Sup(BD)=count(BD)*W(BD)/总数。

这里就是讨论W(BD)有几种计算方法及其优劣。

根据表1和表2可以很容易计算出单个项目的支持度,如Sup(B)=5*1/6=0.83

若要计算多个项目的支持度,如Sup(BD),Sup(BDA)那么项集BD或BDA的权值应该如何选取,即计算交易权重的方法,有以下几种:

1、取每条交易记录的最大值,如BDAC中权值最大的那个作为权值

2、取平均值,表2的交易权重即为该方法计算得出,这样计算不能突出重点项目

3、归一化值:Wi''=Wi/(W1+W2+……+Wk) ;W=(W1''+W2''+……+Wk'')/n,权值可能很小

4、

5、该方法的权值可能大于1

6、W(AB)=W(A)*W(B)/(W(A)+W(B))

7、若数据有两个维度,即X,Y分别属于不同维度,如X表示所购买的商品,Y表示购买的位置,则权值可以这样计算:W(X)*W(Y)

若权值大于1,可以进行归一化处理。

总之,权值的计算还有很多方法,计算时要根据自己数据的特点来选定。但是要注意关联规则挖掘的频繁及向下封闭的特性,即如果{AB}或{C}不频繁,则{ABC}也不频繁。如上述方法1、2就不可保证该特性,会造成数据的流失。这时候需要对关联规则算法进行改进,来适应权值的需要。

转载本文请联系原作者获取授权,同时请注明本文来自叶文菁科学网博客。

链接地址:http://blog.sciencenet.cn/blog-882768-742786.html

上一篇:weka进行关联规则挖掘Apriori篇

下一篇:带背景word如何转成pdf格式(2010)及提取背景图片

关联规则算法php,科学网—加权关联规则权值的计算 - 叶文菁的博文相关推荐

  1. matlab 更换坐标轴_科学网—【Matlab】坐标轴的设置 - 叶瑞杰的博文

    使用matlab的绘图函数plot绘图时系统默认设置了一些属性,例如坐标轴字号大小等并根据情况自动设置坐标轴显示的上下限,这些属性可以通过函数灵活改动,此处总结一小部分. figure; %设置坐标轴 ...

  2. 有向图算法 PHP,科学网—一种可用于脑神经网络分析的有向图分解算法 第六稿 - 谢勤的博文...

    摘要:文献[1-9]提出了血液循环在大脑处理信息的过程中具有时序控制作用,并用量化模型结合结构风险最小化相关理论说明时序控制作用的意义.文献[10-24]汇总介绍量化模型中的一些细节.本文介绍我们开发 ...

  3. 归并有效排序算法matlab,科学网—[用MATLAB写算法]之排序算法2)归并排序merge sort - 徐勇刚的博文...

    归并排序(merge sort)是一种利用分治策略(divide and conquer)进行排序的算法,算法复杂度为 $\Theta (nlog_{2}n)$ . filename: merge_s ...

  4. umap算法_科学网—[转载]【源码】均匀流形近似与投影(UMAP)算法仿真 - 刘春静的博文...

    UMAP算法是Leland McInnes.John Healy和James Melville的发明. The UMAP algorithm is the invention of Leland Mc ...

  5. umap算法_科学网-[转载]【源码】均匀流形近似与投影(UMAP)算法仿真-刘春静的博文...

    UMAP算法是Leland McInnes.John Healy和James Melville的发明. The UMAP algorithm is the invention of Leland Mc ...

  6. python 读grid 数据_科学网—Python_机器学习_总结14:Grid search - 李军的博文

    机器学习中存在两类参数:通过训练数据学习得到的参数:---可认为是辨识得到的参数,例如模型系数: 在学习算法中单独需要优化的参数--超参.调优参数:---算法自身的系数,例如决策树的深度参数: Gri ...

  7. bam文件读取_科学网—Pacbio Sequel两种bam文件解析 - 卢锐的博文

    pacbio目前有两种主流的测序平台,RSII和Sequel,后者是前者的升级版. pacbio sequel下机是bam格式的reads文件,它和reads比对到参考基因组上生成的bam文件,内容有 ...

  8. matlab程序算天气,科学网-站点气温数据的积温计算(含Matlab程序实现)-朱永超的博文...

    活动温度总和(简称积温)是某一段时间内逐日平均气温≥10℃持续期间日平均气温的总和.是研究温度与生物有机体发育速度之间关系的一种指标,从强度和作用时间两个方面表示温度对生物有机体生长发育的影响.一般以 ...

  9. matlab程序算天气,科学网—站点气温数据的积温计算(含Matlab程序实现) - 朱永超的博文...

    活动温度总和(简称积温)是某一段时间内逐日平均气温≥10℃持续期间日平均气温的总和.是研究温度与生物有机体发育速度之间关系的一种指标,从强度和作用时间两个方面表示温度对生物有机体生长发育的影响.一般以 ...

最新文章

  1. 重磅盘点:过去8年中深度学习最重要的想法
  2. axios的简单封装和http请求实践
  3. mysql 导入单个表_MySQL 备份恢复(导入导出)单个 innodb表
  4. UDP接收端和发送端_Socket编程
  5. tft lcd驱动参数详解_LED拼接屏和LCD拼接屏的区别
  6. 用行为树的方式思考问题
  7. nosql----redis数据恢复方案
  8. 如何修改layui数据表格绑定的开关事件?
  9. 关于BSTR数据类型
  10. 计算机并口地址定义,电脑并口(LPT)引脚定义
  11. GitBash和GitGui右键失效解决方法
  12. python14张图下载_Python网络爬虫入门(三)—— 做个简陋的pixabay 图片下载器 (附源码)...
  13. 别踩白块游戏用html如何制作,纯用JavaScript 实现网页上《别踩白块儿》小游戏
  14. 什么样的视频号内容更容易火?视频号怎么做推送上热门
  15. 网上银行频失窃 银监会要各银行实施双重身份认证
  16. 听课记录(09/22)
  17. 基于多智能体模型的街道步行空间量化研究
  18. 下一代互联网:三网融合下的美丽画卷
  19. 规则引擎Drools详细介绍
  20. SpringJDBC之RowMapper通用类

热门文章

  1. 【笔记】windows10安装linux(ubuntu)双系统教程(可能是现今最简单方法)
  2. 线程运行程序c语言,理解线程1 C语言示例的程序
  3. 编译arm平台的ethtool
  4. 对Java单例模式 volatile关键字作用的理解
  5. Redis适用于高并发的递增、递减功能
  6. CocoaPosd使用详解
  7. 谷歌杀手Wolfram Alpha搜索引擎上线测试
  8. cxGRID能否对模板进行保存
  9. PAT甲级1012 The Best Rank :[C++题解]4个成绩取排名最低:排序、二分(好题)
  10. PAT甲级1006 Sign In and Sign Out:[C++题解]字符串处理