最近在读《Introduction to Data Mining 》这本书,发现课后答案只有英文版,于是打算结合自己的理解将答案翻译一下,其中难免有错误,欢迎大家指正和讨论。侵删。

第六章




(a)Se = 8/10 = 0.8
Sbd = 2/10 = 0.2
Sbde = 2/10 = 0.2

(b)Cbd→e = 0.2/0.2 = 1
Ce→bd = 0.2/0.8 = 0.25

(c)Se = 4/5 = 0.8
Sbd = 5/5 = 1
Sbde = 4/5 = 0.8

(d)Cbd→e = 0.8/1 = 0.8
Ce→bd = 0.8/0.8 = 1

(e)没有明显的关系


(a)
CØ→A = SØ→A
CA→Ø = 100%
(b)

显然 c1 ≥ c2 ,c3 ≥c2
c2具有最低的置信度
(c)更正:假设B中的规则都有相同的支持度。
则c1 = c2 ≤ c3
c3具有最高的置信度
(d)举个反例:

设minconf = 50%
cA→B = 66% > minconf
cB→C = 71% > minconf
cA→C = 22% < minconf

(a)是反单调的。



因为 s ( A , B , C ) ≤ s ( A , B ) 且 max ( s(A) , s(B) , s( C ) ) ≥ max ( s(A) , s(B) )
因此

(b)



因为 s ( A , B , C ) ≤ s ( A , B ) 且 max ( s(A , B) , s(A , C) , s(B , C) ) ≤ max ( s(A) , s(B) )
因此是不单调的。
(c)




因为 s ( A , B , C ) ≤ s ( A , B ) 且 min ( s(A) , s(B) , s( C ) ) ≤ min ( s(A) , s(B) )
因此是不单调的。




因为 s ( A , B , C ) ≤ s ( A , B ) 且 min ( s(A , B) , s(A , C) , s(B , C) ) ≤ min ( s(A) , s(B) , s( C ) ) ≤ min ( s(A) , s(B) )
因此是不单调的。

(a)

R = 37 - 28 + 1 = 602
(b)4
(c)C36 = 20
(d){ 面包,黄油 }
(e){ 啤酒,饼干 } ,{ 面包,黄油 }


(a)
{1,2,3,4}、{1,2,3,5}、{1,2,4,5}、{1,3,4,5}、{2,3,4,5}
(b)
{1,2,3,4}、{1,2,3,5}、{1,2,4,5}、{2,3,4,5}
(c)
{1,2,3,4}



(a)

(b)16/32 = 50%
(c)11/32 = 34.4%
(d)5/32 = 15.6%


(a) L1 L3 L5 L9 L11
(b){ 1 4 5 } ,{ 1 5 8 } ,{ 4 5 8 }

(a)

(b)5个叶结点和4个内部结点
(c)L1 L2 L3 L4,产生{ 1 2 3 } ,{ 1 2 6 }



解:



(a)

(b)
i.

ii.

iii.

iv.

v.

vi.




(a)e
(b)d不产生任何频繁项集
(c)a
(d)b
(e)e

(a)范围为0到1,当P ( B | A ) = 1 时取最大值,当 P ( B | A ) = P ( B ) 时取最小值
(b)M又可以写成:

因此M也增加
(c)M减小
(d)M减小
(e)不对称
(f)0
(g)不是
(h)会变
(i)不对称

(a)c = 0.2/0.25 = 0.8
因此是有趣的
(b)I = 0.2 / ( 0.25 × 0.9 ) = 0.889
两项之间联系不大
(c)有高置信度的规则不一定有趣

(a)
c = 0 : ( 0 - 1/4 × 1/4 ) / ( 1/4 × 1/4 × 3/4 × 3/4 )0.5 = -1/3
c = 1 : ( 1/4 - 1/4 × 1/4 ) / ( 1/4 × 1/4 × 3/4 × 3/4 )0.5 = 1
c = 0或1 : ( 1/16 - 1/4 × 1/4 ) / ( 1/4 × 1/4 × 3/4 × 3/4 )0.5 = 0
(b)如果不考虑分类因素的话某些有趣的结果会消失



(a)
s(A) = 0.1 , s(B) = 0.9 , s(A , B) = 0.09
I ( A , B ) = 9 , Φ( A , B ) = 0.89 , c(A→B) = 0.9 , c(B→A) = 0.9
(b)
s(A) = 0.9 , s(B) = 0.9 , s(A , B) = 0.89
I ( A , B ) = 1.09 , Φ( A , B ) = 0.89 , c(A→B) = 0.98 , c(B→A) = 0.98
(c)
在反演操作下,只有Φ不变



(a)
6.19 : α = ( 99 × 66 ) / ( 81 × 54 ) = 1.4938
6.20 : 大学生:α = ( 1 × 30 ) / ( 4 × 9 ) = 0.8333 在职人员:α = ( 98 × 36 ) / ( 72 × 50 ) = 0.98
(b)
6.19 : Φ = ( 300 × 99 - 180 × 153 ) / ( 153 × 147 × 180 × 120 )0.5 = 0.0980
6.20 : 大学生 : Φ = ( 44 × 1 - 10 × 5 ) / ( 10 × 5 × 39 × 34 )0.5 = -0.0233
在职人员 : Φ = ( 256 × 98 - 170 × 148 ) / ( 170 × 86 × 148 × 108 )0.5 = -0.0047
(c)
6.19 : I = ( 300 × 99 ) / ( 180 × 153 ) = 1.0784
6.20 : 大学生 : I = ( 44 × 1 ) / ( 10 × 5 ) = 0.88
在职人员 : I = ( 256 × 98 ) / ( 148 × 170 ) = 0.9971

数据挖掘导论课后习题答案-第六章相关推荐

  1. 【第1章】数据挖掘导论课后习题答案

    中文(翻译) 1.讨论下列每项活动是否是数据挖掘任务. 答案 (a)否. 这是一种简单的数据库查询. (b)否.这是一个会计计算,然后应用一个阈值.然而,预测一个新客户的盈利能力是数据挖掘. (c)否 ...

  2. 微型计算机原理与接口技术 (周荷琴 冯焕清)第六版 课后习题答案 第六章(部分答案)

    第六章 2. 什么叫 I/O 端口?一般的接口电路中可以设置哪些端口?计算机对 I/O 端口寻址时可采 用哪两种方法?在8086/8088CPU 中一般采用哪种编制方法? (1)端口:在接口电路中,存 ...

  3. 数据挖掘导论课后习题答案-第一章

    最近在读<Introduction to Data Mining >这本书,发现课后答案只有英文版,于是打算结合自己的理解将答案翻译一下,其中难免有错误,欢迎大家指正和讨论.侵删. 第一章 ...

  4. 数据挖掘导论课后习题答案第九章

    最近在读<Introduction to Data Mining >这本书,发现课后答案只有英文版,于是打算结合自己的理解将答案翻译一下,其中难免有错误,欢迎大家指正和讨论.侵删. 第九章 ...

  5. 数据挖掘导论课后习题答案-第八章(下)

    最近在读<Introduction to Data Mining >这本书,发现课后答案只有英文版,于是打算结合自己的理解将答案翻译一下,其中难免有错误,欢迎大家指正和讨论.侵删. 第八章 ...

  6. 数据挖掘导论课后习题答案-第八章(上)

    最近在读<Introduction to Data Mining >这本书,发现课后答案只有英文版,于是打算结合自己的理解将答案翻译一下,其中难免有错误,欢迎大家指正和讨论.侵删. 第八章 ...

  7. 面向对象程序设计c++版董正言张聪课本课后习题答案第六章

    6.5雇员信息 #include<iostream> using namespace std; class employee {public:void setname(char* na); ...

  8. 计算机网络谢希仁第七版课后习题答案(第六章)

    6-01 因特网的域名结构是怎么样的?它与目前的电话网的号码结构有何异同之处? 答:(1)域名的结构由标号序列组成,各标号之间用点隔开: - . 三级域名 . 二级域名 . 顶级域名 各标号分别代表不 ...

  9. 【考研复习】《操作系统原理》孟庆昌等编著课后习题+答案——第七章

    CSDN话题挑战赛第2期 参赛话题:学习笔记 前言 此书在最后的附录 B 中,有给出部分重难点部分的参考答案.如果想要此书习题答案,可点以下链接:为一个压缩包,以图片形式,习题图片按章节排序,答案图片 ...

  10. 【考研复习】《操作系统原理》孟庆昌等编著课后习题+答案——第三章

    前言 此书在最后的附录B中,有给出部分重难点部分的参考答案.会在最后放上图片.如果想要此书习题答案,可点以下链接:为一个压缩包,以图片形式,习题图片按章节排序,答案图片按书页排序. <操作系统原 ...

最新文章

  1. html5 呼吸灯效果,jQuery仿地铁线路指示灯效果
  2. array_map常用技巧
  3. [Python学习] 专题五.列表基础知识 二维list排序、获取下标和处理txt文本实例
  4. 6*6行列式相加的c语言,求行列式的值,用C语言怎么写啊?
  5. C#生成JSON数据格式的函数
  6. linux查看lammps版本,lammps linux
  7. 微信api接口调用-微信群管理
  8. vc red.msi matlab,vc red.msi x64+x32位版下载
  9. Python实现微信自动发送消息
  10. 后端开发面试自我介绍_前端开发面试自我介绍
  11. 卸载删除gitlab
  12. 手机号码变成空号导致亚马逊账号登陆两步验证失败的恢复网址及方法
  13. java tld文件配置_如何在JavaWeb程序中使用tld文件
  14. C语言中的a = b = c ? d : e;
  15. 【MapSqlParameterSource】映射数据源官方API介绍
  16. html help文档制作,HTML Help Workshop(文件制作工具)
  17. 浙大ZOJ 1005 Jugs问题解决
  18. spark读写clickhouse
  19. 【vscode 配置c++环境 win10】
  20. 如何检测是否安装了.NET 2.0和.NET 3.0

热门文章

  1. Halcon学习笔记之OCR系列-喷码字体识别
  2. keil注册机激活的方法
  3. AD09导出光绘文件(Gerber)
  4. 计算机凭证打印格式设置,金蝶软件套打如何设置用KP-J103凭证纸打印凭证
  5. Mac系统下安装svn环境方法
  6. ghostscript处理PDF/拆分/压缩/合并/转换
  7. 华为NP课程笔记25-SDN简介
  8. 《深入浅出通信原理》学习(1-8)
  9. DIY激光雕刻机-结构设计
  10. 解决CAJ阅读器读取学位论文卡到爆炸的问题