来源:专知本文多图,建议阅读5分钟这本书奠定了数据分析、模式挖掘、聚类、分类和回归的基础,集中在算法和潜在的代数、几何和概率概念上。

数据挖掘和机器学习的基本算法构成了数据科学的基础,利用自动化方法分析各种数据的模式和模型,应用范围从科学发现到商业分析。本教材面向本科和研究生课程,全面深入地介绍了数据挖掘、机器学习和统计学,为学生、研究人员和实践者提供了坚实的指导。这本书奠定了数据分析、模式挖掘、聚类、分类和回归的基础,集中在算法和潜在的代数、几何和概率概念上。新的第二版是一个完整的部分致力于回归方法,包括神经网络和深度学习。

  • 涵盖核心方法和前沿研究,包括深度学习

  • 提供了一种基于开源实现的算法方法

  • 包含了经过类测试的例子和练习,允许课程设计的灵活性和现成的参考

数据挖掘和机器学习使人能够从数据中获得基本的见解和知识。它们允许发现深刻的、有趣的和新颖的模式,以及从大规模数据中描述的、可理解的和可预测的模型。在这个领域有几本好书,但其中很多不是太高级就是太高级。这本书是一个介绍性的文本,奠定了机器学习和数据挖掘的基本概念和算法的基础。重要的概念在第一次遇到时就会被解释,并附有详细的步骤和推导。本书的主要目标是通过对数据和方法的几何、(线性)代数和概率解释的相互作用,建立公式背后的直觉。这第二版在回归上增加了一个完整的新部分,包括线性和逻辑回归,神经网络,和深度学习。其他章节的内容也进行了更新,已知的勘误表也得到了修正。本书的主要部分包括数据分析基础、频繁模式挖掘、聚类、分类和回归。这些课程涵盖了核心方法以及尖端主题,如深度学习、核方法、高维数据分析和图分析。

深度学习,核方法,高维数据分析,图分析。这本书包括许多例子来说明概念和算法。它也有结束语练习,在课堂上使用过。书中所有的算法都是由作者实现的。为了帮助实际理解,我们建议读者自己实现这些算法(例如,使用Python或R)。如幻灯片、数据集和视频等补充资源可以在该书的同伴站点在线获得:

http://dataminingbook.info

目录内容:

  • Front Matter

  • Contents

  • Preface

  • PART I. DATA ANALYSIS FOUNDATIONS

    • 1 Data Mining and Analysis

    • 2 Numeric Attributes

    • 3 Categorical Attributes

    • 4 Graph Data

    • 5 Kernel Methods

    • 6 High-dimensional Data

    • 7 Dimensionality Reduction

  • PART II. FREQUENT PATTERN MINING

    • 8 Itemset Mining

    • 9 Summarizing Itemsets

    • 10 Sequence Mining

    • 11 Graph Pattern Mining

    • 12 Pattern and Rule Assessment

  • PART III. CLUSTERING

    • 13 Representative-based Clustering

    • 14 Hierarchical Clustering

    • 15 Density-based Clustering

    • 16 Spectral and Graph Clustering

    • 17 Clustering Validation

  • PART IV. CLASSIFICATION

    • 18 Probabilistic Classification

    • 19 Decision Tree Classifier

    • 20 Linear Discriminant Analysis

    • 21 Support Vector Machines

    • 22 Classification Assessment

  • PART V. REGRESSION

    • 23 Linear Regression

    • 24 Logistic Regression

    • 25 Neural Networks

    • 26 Deep Learning

    • 27 Regression Evaluation

  • Index

Slides:

PART I. DATA ANALYSIS FOUNDATIONS

  • 1 Data Mining and Analysis: Chap1 PDF, Chap1 PPT

  • 2 Numeric Attributes: Chap2 PDF, Chap2 PPT

  • 3 Categorical Attributes: Chap3 PDF, Chap3 PPT

  • 4 Graph Data: Chap4 PDF, Chap4 PPT

  • 5 Kernel Methods: Chap5 PDF, Chap5 PPT

  • 6 High-dimensional Data: Chap6 PDF, Chap6 PPT

  • 7 Dimensionality Reduction: Chap7 PDF, Chap7 PPT

PART II. FREQUENT PATTERN MINING

  • 8 Itemset Mining: Chap8 PDF, Chap8 PPT

  • 9 Summarizing Itemsets: Chap9 PDF, Chap9 PPT

  • 10 Sequence Mining: Chap10 PDF, Chap10 PPT

  • 11 Graph Pattern Mining: Chap11 PDF, Chap11 PPT

  • 12 Pattern and Rule Assessment: Chap12 PDF, Chap12 PPT

PART III. CLUSTERING

  • 13 Representative-based Clustering: Chap13 PDF, Chap13 PPT

  • 14 Hierarchical Clustering: Chap14 PDF, Chap14 PPT

  • 15 Density-based Clustering: Chap15 PDF, Chap15 PPT

  • 16 Spectral and Graph Clustering: Chap16 PDF, Chap16 PPT

  • 17 Clustering Validation: Chap17 PDF, Chap17 PPT

PART IV. CLASSIFICATION

  • 18 Probabilistic Classification: Chap18 PDF, Chap18 PPT

  • 19 Decision Tree Classifier: Chap19 PDF, Chap19 PPT

  • 20 Linear Discriminant Analysis: Chap20 PDF, Chap20 PPT

  • 21 Support Vector Machines: Chap21 PDF, Chap21 PPT

  • 22 Classification Assessment: Chap22 PDF, Chap22 PPT

PART V. REGRESSION

  • 23 Linear Regression: Chap23 PDF, Chap23 PPT

  • 24 Logistic Regression: Chap24 PDF, Chap24 PPT

  • 25 Neural Networks: Chap25 PDF, Chap25 PPT

  • 26 Deep Learning: Chap26 PDF, Chap26 PPT

  • 27 Regression Evaluation: Chap27 PDF, Chap27 PPT

编辑:文婧

数据挖掘和机器学习:基本概念和算法(附电子书PPT)相关推荐

  1. 数据挖掘与机器学习的十大算法

    机器学习与数据挖掘中的十大经典算法 背景: top10算法的前期背景是吴教授在香港做了一个关于数据挖掘top10挑战的一个报告,会后有一名内地的教授提出了一个类似的想法.吴教授觉得非常好,开始着手解决 ...

  2. 如何快速学习数据挖掘、机器学习、人工智能?(附资料包)

    如果说,人工智能是技术圈行业薪酬最高的方向,应该没有人会反驳. 画外音:18K发了一个算法校招offer,被拒绝了,是我们out了么? 很多同学经常在留言里问我: 想学习数据挖掘和机器学习,如何上手? ...

  3. 80页笔记看遍机器学习基本概念、算法、模型,帮新手少走弯路

    来源:机器之心 本文约1000字,建议阅读6分钟. 这份学习笔记帮你及时回顾机器学习概念,带你快速上手. [ 导读 ]目前有关机器学习的资料可谓层出不穷,其中既有书籍.课程视频资料,也有很多算法模型的 ...

  4. 机器学习从入门到创业手记-1.2 机器学习的概念

    坐在公司宽敞的会议室里,面前是一杯现煮的咖啡,公司的CEO 站在大的投影屏幕前意气风发,举手投足间透露出成功人士的魅力. "首先欢迎各位加入爱视达智能科技有限公司,我是公司的联合创始人 Da ...

  5. python神经网络算法pdf_高清图解:神经网络、机器学习、数据科学一网打尽|附PDF...

    原标题:高清图解:神经网络.机器学习.数据科学一网打尽|附PDF [导读]完全图解人工智能.NLP.机器学习.深度学习.大数据!这份备忘单涵盖了上述领域几乎全部的知识点,并使用信息图.脑图等多种可视化 ...

  6. 数据挖掘与机器学习基本算法总结

    第一次写学习总结,主要是现在自己所学的东西,知识更新速度之快,自己的遗忘速度也是非常之恐怖.遂决定,压着自己的头皮,写一写总结,也算是给自己这么多年的学习有个交代和梳理. 数据挖掘与数据分析好书推荐: ...

  7. 带你入门Python数据挖掘与机器学习(附代码、实例)

    作者:韦玮 来源:Python爱好者社区 本文共7800字,建议阅读10+分钟. 本文结合代码实例待你上手python数据挖掘和机器学习技术. 本文包含了五个知识点: 1. 数据挖掘与机器学习技术简介 ...

  8. louvian算法 缺点 优化_机器学习中的优化算法(1)-优化算法重要性,SGD,Momentum(附Python示例)...

    本系列文章已转至 机器学习的优化器​zhuanlan.zhihu.com 优化算法在机器学习中扮演着至关重要的角色,了解常用的优化算法对于机器学习爱好者和从业者有着重要的意义. 这系列文章先讲述优化算 ...

  9. Python数据挖掘与机器学习,快速掌握聚类算法和关联分析

    摘要:前文数据挖掘与机器学习技术入门实战与大家分享了分类算法,在本文中将为大家介绍聚类算法和关联分析问题.分类算法与聚类到底有何区别?聚类方法应在怎样的场景下使用?如何使用关联分析算法解决个性化推荐问 ...

最新文章

  1. U平方Net:深入使用嵌套的U型结构进行显著目标检测
  2. python使用手册-python(自用手册)
  3. jboss7 加载module过程
  4. ASP.NET MVC 4 (六) 帮助函数
  5. php dlt645,RT-Thread-Mirror
  6. 李洪强iOS开发之后使用XIB实现横向滚动的UIScrollView
  7. 存储过程循环遍历一个月的每一天的函数_3.3 循环
  8. spring boot缓存excel临时文件后再操作
  9. qpython3怎么安装库_如何在安装pip3以及第三方python库
  10. 易康(eCognition)对象几何特征--1:几何(Geometry)_范围(Extent)
  11. k210应用8-使用DMAC实现存储器与存储器之间的高速数据传输
  12. 24点计算机游戏规则,24点游戏规则和解题方法
  13. 《仿美团》项目研发总结
  14. 03 HTML_网页中的表格
  15. 微信小程序开发01 双线程模型:为什么小程序不用浏览器的线程模型?
  16. MATLAB中表示点形状、颜色的常见符号
  17. 用计算机打青春不打烊,彩色的青春不打烊
  18. 体会大师们的智慧-折半查找二分查找)
  19. mysql数据库的语句
  20. 如何判断一个整型数字是不是对称数字

热门文章

  1. 【c语言】蓝桥杯2020校内模拟赛c组
  2. 微信小程序爬虫python_爬虫爬取微信小程序
  3. spyder安装_windows10 Anaconda3安装教程
  4. Confluence 6 开始使用
  5. Delphi基础必记-快捷键
  6. JS --正则表达式
  7. C#获取当前日期时间(转)
  8. Javascript框架的自定义事件(转)
  9. 基于xfire发布web Service简单实例
  10. linux虚拟机镜像_无树莓派硬件体验:虚拟机安装 Raspberry Pi Desktop 操作系统