记得2008年初,当我刚接触到数据挖掘的时候,看过一篇文章,介绍了数据挖掘方面有三本经典书籍:
(1) J. Han and M. Kamber, Data Mining: Concepts and Techniques.
  本书从数据库角度看待数据挖掘,强调效率(Efficiency)。按照本书观点,数据挖掘是从存储在数据库、数据仓库或者其他信息库中的大量数据中发现知识的过程。
(2) I.H. Written and E.Frank. Data Mining: Practical Machine Learnings and Techniques.
  本书从机器学习角度看待数据挖掘,强调有效(Effectiveness)。按照这本书的观点,数据挖掘是从数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
(3) D. Hand, H.Mannila and P. Smith, Principle of Data Mining.
  本书从统计学的角度看待数据挖掘,因为统计学是一门数学,所以本书强调数学上的正确性(Validity)。按照本书观点,数据挖掘是分析(往往是大量的)数据集以找到未曾预料的关系,并以可理解又有用的新颖方式呈现给数据用户的过程。
    这几年实际做数据挖掘,补充基础知识时也主要以这几本书为指导。然后最后自己用来研读的书却是以下这本:
(4)Pang-Ning Tan, Vipin Kumar etc. Introduction to Data Mining
 (http://book.douban.com/subject/1465939/)。
    国内目前有翻译版(http://book.douban.com/subject/1786120/),这是我现在觉得最好的数据挖掘教材。关于分类、关联规则、聚类每一主题都分两章来讲述:第一章讲基本部分,第二章讲高级部分,让人由浅入深。另有单独的一章介绍异常检测。本书的第一作者是物理背景出身,所以讲解很重视对于算法的理解(优缺点与适用范围等)。本书能找到PDF版完整的习题答案,非常适合于自学。
    若要从以上三本书再推荐另一本入门书,我会推荐I.H. Written的那本,这本书第I部分以输入、输出、算法、评估的脉络来讲解数据挖掘;第II部分介绍Weka软件使用。读这本书的好处读了之后马上可以用Weka来实验各种数据挖掘算法。
    其次推荐的是David Hand的《数据挖掘原理》(http://book.douban.com/subject/1103515/),本书作者是一名统计学家,所以里面会涉及到数据挖掘相对于统计的独特之处的内容,非常有价值;另外,本书以约化主义的观点来看待数据挖掘算法,认为有了数据集与明确的数据挖掘任务,数据挖掘算法可以看成是{模型结构、评分函数、搜索方法、数据管理技术}的四元组,然后逐一来讲解每一数据挖掘算法组件,让人觉得清楚明了。本书的第二章“测量与数据”也是很有价值的,因为我们虽然通过数据来做推断,但是数据是通过测量理论与事实(Reality)相联系的。
      最不怎么推荐的是《数据挖掘:概念与技术》,虽然我是从这本书的第一版最初得知数据挖掘这一概念。2005年10月份,我在海淀图书城逛,想看看有什么好书可以带到南极去看,当时发觉了这本书的第一版。看了看前言,就买了下来,因为原来只接触过数据库的我,数据挖掘这一概念太吸引自己了。虽然在南极期间自己只是将这本书盖了两个南极的纪念章,而没有真正看,但毕竟它在自己心中播种下了“数据挖掘”的种子。07年底转行做计算机的时候,虽然最初不是申请的数据挖掘的职位,当公司让我当“数据挖掘工程师”时,我还是很高兴地接受了。这五年来,我见证了数据挖掘这一行业的如火如荼的发展,也很庆幸自己入对了行,也要很感激这本书的作者与翻译者吧。从书的内容看,这本书将数据挖掘看成是数据库技术的自然演化,所以第2章讲的是数据仓库与OLAP,但是这部分内容对于怎样建数据仓库其实没有太大的帮助。数据挖掘作为一门交叉学科,一般认为其最重要的三门学科基础是机器学习、统计学与数据库技术。但是个人认为随着大数据时代的来临,传统数据库技术所起的作用在减弱,因为很多进行的数据挖掘的数据根本不会先被放到数据库中,而是直接通过文件来存储。本书的第二版中虽然增加了时间序列挖掘、图挖掘、社交网络分析、多媒体挖掘等新的内容,但这只是增加了广度,而没有让我们对数据挖掘的核心部分有更深的理解。

数据挖掘经典书籍推荐相关推荐

  1. 数据挖掘的好书_大数据挖掘分析经典书籍推荐

    互动出版网数据分析书籍专区.为您推荐关于大数据时代数据挖掘经典书籍,让你在浩瀚的数据海洋中洞察焦点,看出不一样的数据世界. 一.<大数据> 作者:(美)拉贾拉曼(anand rajaram ...

  2. python经典好书-新手Python入门经典书籍推荐

    随着人工智能和大数据时代的来临,开始学习Python的朋友是越来越多了.近来就连房地产大亨潘石屹也在微博上表示,自己开始学Python了.确实在当下,无论是不是做程序员,还是在各个行业像是数据分析.运 ...

  3. Linux经典书籍推荐-转

    Linux经典书籍推荐 入门篇  <LINUX权威指南>书不错,写的很全面也比较广,涉及的不深,做为入门书籍不错,可以比较全面的了解linux .另外比较热门的也可以看看<鸟哥的私房 ...

  4. Linux 好书、经典书籍推荐

    转载:http://blog.csdn.net/leonzhouwei/article/details/9053201 Linux 好书.经典书籍推荐 作者:http://www.ituring.co ...

  5. 经济金融经典书籍推荐(中文版)——转自豆瓣

    经济金融经典书籍推荐(中文版)--转自豆瓣 转载自mikko: <宏观经济学>曼昆 人民大学出版社(衔接性系统性欠缺) 曼昆的这本<宏观经济学>我认为优于其<经济学原理& ...

  6. 自我管理的经典书籍推荐:《自我管理必读12篇》

    自我管理的经典书籍推荐:<自我管理必读12篇> 什么是自我管理? 相信每一个追求高效的职场人士对这人词汇都不会感到陌生. 自我管理通常是指对自己时间.精力.情绪及心态等的管理.自我管理的最 ...

  7. 新手Python入门经典书籍推荐

    随着人工智能和大数据时代的来临,开始学习Python的朋友是越来越多了.近来就连房地产大亨潘石屹也在微博上表示,自己开始学Python了.确实在当下,无论是不是做程序员,还是在各个行业像是数据分析.运 ...

  8. 营销学入门书籍及市场营销经典书籍推荐

    营销入门书籍的话比较推荐大家看下<营销管理必读12篇>,这本书可能是最经典的市场营销书籍了.很多圈内大佬都有推荐,当然如果你有一定的经济基础和时间,还是比较建议你看下12Reads全系列的 ...

  9. 电子通信领域经典书籍推荐

    电子通信领域经典书籍推荐 [书名]:光同步数字传输网 http://bbs.cnttr.com/viewthread.php?tid=71513&extra=page%3D2 [语言]:中文 ...

最新文章

  1. 让植物“张嘴说话”!新加坡“植物机器人”可成为环境探测器促进农业生产...
  2. 第6节 三个败家子(6)——很黄很暴力的刘禅
  3. android环境搭建出错,androidstudio配置环境遇到的各种错误(持续更新中)
  4. WildFly Kubernetes exec探针
  5. C#LeetCode刷题之#409-最长回文串(Longest Palindrome)
  6. 归并排序 c++_数据结构:排序(4)||有序表的归并(归并排序)、基数排序
  7. HDU1012 Calculate e
  8. linux Enterprise5 添加删除程序无法正常使用 解决
  9. javaee字符缓冲输出流
  10. 网站左边栏制作的小技巧
  11. jlabel 不能连续两次set_关于JLabel的setText在监听器中不刷新有关问题(2)
  12. linux机顶盒线刷工具,机顶盒刷机包通用版|PhoenixSuitpacket一键刷机工具 V1.10 官方最新版 下载_当下软件园_软件下载...
  13. 软件过程模型(详解)
  14. PR曲线以及ROC曲线的简单理解
  15. Guns二次开发目录
  16. 使用较广泛的安全测试工具有哪些?
  17. 北京最新城市总体规划草案
  18. 淘宝客订单查询API参数说明
  19. R语言做面板模型的豪斯曼检验
  20. php发送消息给telegram,PHP对接telegram

热门文章

  1. 如何设置电脑锁屏后程序仍在运行
  2. Linux下C程序调用库函数实现重启
  3. python七巧板三角形_canvas基础入门(二)绘制线条、三角形、七巧板
  4. 云计算时代催生下一代网络变革-软件定义的网络之技术架构篇
  5. Unity3d:The requested item has been unloaded
  6. RAVDESS语音情感分类数据集的介绍
  7. HTTP 500 - Internal Server Error 服务器内部错误
  8. 项目经理的经营和运营意识—— 来自项目管理群的讨论
  9. 如何成为java架构师?2023版Java架构师学习路线总结完成,真实系统有效,一切尽在其中
  10. JavaScript小练习-计算银行卡余额案例