1. 内容提要

本书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效可复用的 Python 代码阐 释如何处理统计数据,进行数据分析及可视化。读者可从中学到一些核心的机器学习算法,并将其运用于某些策略性任务中,如分类、预测及推荐等。本书适合机器学习相关研究人员及互联网从业人员学习参考。

本书没有从理论角度来揭示机器学习算法背后的数学原理,而是通过“原理简述+问题实例+实际代码+运行效果”来介绍每一个算法。这本书的最大好处就是边学边用,非常适合于急需迈进机器学习领域的人员学习。实际上,即使对于那些对机器学习有所了解的人来说,通过代码实现也能进一步加深对机器学习算法的理解。本书的代码采用Python语言编写。Python代码简单优雅、易于上手,科学计算软件包众多,已经成为不少大学和研究机构进行计算机教学和科学计算的语言。相信Python编写的机器学习代码也能让读者尽快领略到这门学科的精妙之处。

2. 本书结构

本书由四大部分15章和4个附录组成。

第一部分 分类

本书并没有按照“数据挖掘十大算法”的次序来介绍机器学习算法。第一部分首先介绍了机器学习的基础知识,然后讨论如何使用机器学习算法进行分类。第2章介绍了基本的机器学习算法:k-近邻算法;第3章是本书第一次讲述决策树;第4章讨论如何使用概率分布算法进行分类以及朴素贝叶斯算法;第5章介绍的Logistic回归算法虽然不在排名前十的列表中,但是引入了算法优化的主题,也是非常重要的,这一章最后还讨论了如何处理数据集合中的缺失值;第6章讨论了强大而流行的支持向量机;第7章讨论AdaBoost集成方法,它也是本书讨论分类机器学习算法的最后一章,这一章还讨论了训练样本非均匀分布时所引发的非均衡分类问题。

第二部分 利用回归预测数值型数据

第二部分包含两章,讨论连续型数值的回归预测问题。第8章主要讨论了回归、去噪和局部加权线性回归,此外还讨论了机器学习算法必须考虑的偏差方差折中问题。第9章讨论了基于树的回归算法和分类回归树(CART)算法。

第三部分 无监督学习

前两部分讨论的监督学习需要用户知道目标值,简单地说就是知道在数据中寻找什么。而第三部分开始讨论的无监督学习则无需用户知道搜寻的目标,只需要从算法程序中得到这些数据的共同特征。第10章讨论的无监督学习算法是K-均值聚类算法;第11章研究用于关联分析的Apriori算法;第12章讨论如何使用FPGrowth算法改进关联分析。

第四部分 其他工具

本书的第四部分介绍机器学习算法使用到的附属工具。第13章和第14章引入的两个数学运算工具用于消除数据噪声,分别是主成分分析和奇异值分解。一旦机器学习算法处理的数据集扩张到无法在一台计算机上完全处理时,就必须引入分布式计算的概念,本书最后一章将介绍MapReduce架构。

示例

本书的许多示例演示了如何在现实世界中使用机器学习算法,通常我们按照下面的步骤保证算法应用的正确性:

(1) 确保算法应用可以正确处理简单的数据;

(2) 将现实世界中得到的数据格式化为算法可以处理的格式;

(3) 将步骤2得到的数据输入到步骤1的算法中,检验算法的运行结果。

此外,本书在实现算法的过程中,记录了很多注意事项,将有助于读者深入了解机器学习算法。

3. 目录

5. 代码示例

def classify0(inX, dataSet, labels, k):    dataSetSize = dataSet.shape[0]    diffMat = tile(inX, (dataSetSize,1)) - dataSet    sqDiffMat = diffMat**2    sqDistances = sqDiffMat.sum(axis=1)    distances = sqDistances**0.5   sortedDistIndicies = distances.argsort()     classCount={}    for i in range(k): voteIlabel = labels[sortedDistIndicies[i]] classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1 sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True) return sortedClassCount[0][0]

扫描下方二维码,关注机器学习AI工场公众号,获取本文下载链接,请后台回复:机器学习实战

机器学习实战+源代码相关推荐

  1. 机器学习实战--局部加权线性回归(LWR)

    一 概述 通常情况下的线性拟合不能很好地预测所有的值,因为它容易导致欠拟合(under fitting),比如数据集是 一个钟形的曲线.而多项式拟合能拟合所有数据,但是在预测新样本的时候又会变得很糟糕 ...

  2. 《机器学习实战》学习笔记之第四章朴素贝叶斯进行文档分类

    朴素贝叶斯有两个假设: 1."朴素":特征之间相互独立,单词出现的概率相同,当然这个假设不合理 2."权重相同":每个特征等同重要,这个假设也不太合理 尽管如此 ...

  3. 机器学习实战_09_树回归_源代码错误修正

    <机器学习实战>第9章的树回归运行时频繁出错,这里主要有两点: 1. TypeError: unhashable type: 'matrix' 出错的代码行是: for splitVal ...

  4. 机器学习实战:TypeError: unhashable type: 'matrix'

    在<机器学习实战>的第9章树回归中的源代码错误: 既是: TypeError: unhashable type: 'matrix' matrix类型不能被hash 解决过程: In [22 ...

  5. 这本《Python+TensorFlow机器学习实战》给你送到家!

    小伙伴们,本公众号很久没用送书啦,是不是很是期待呀?放心啦,这次每个大佬送5本书,一共25本!包邮到你家楼下,哈哈! 怎么送书呢? 方法当然是很简单啦,关注下面公众号,后台回复「抽奖」,弹出小程序二维 ...

  6. apriori算法代码_资源 | 《机器学习实战》及代码(基于Python3)

    〇.<机器学习实战> 今天推荐给大家的是<机器学习实战>这本书. 机器学习作为人工智能研究领域中一个极其重要的研究方向(一文章看懂人工智能.机器学习和深度学习),在当下极其热门 ...

  7. 机器学习实战 梯度上升 数学推导_机器学习全路线经典书籍

    ❝ 前情提要:为了让大家学好机器学习,我问了几个大佬学长并找了些资料,整理了一些学习路上必看的书籍,从数学基础.算法基础,到入门,再到进阶实战,都是精选的经典书籍,并给出了图片和简要介绍(还附带 Gi ...

  8. 《机器学习实战》第二章学习笔记:K-近邻算法(代码详解)

    <机器学习实战>数据资料以及总代码可以去GitHub中下载: GitHub代码地址:https://github.com/yangshangqi/Machine-Learning-in-A ...

  9. 机器学习实战 支持向量机SVM 代码解析

    机器学习实战 支持向量机SVM 代码解析 <机器学习实战>用代码实现了算法,理解源代码更有助于我们掌握算法,但是比较适合有一定基础的小伙伴.svm这章代码看起来风轻云淡,实则对于新手来说有 ...

  10. 【机器学习实战】KNN算法

    机器学习作为人工智能的重要分支,同时也是数据挖掘中不可或缺的算法支撑.本人接触时间不短,但研究尚浅.我计划用python来实现机器学习中较为常见的算法. 看透了自己,便无须小看别人. (老舍) 机器学 ...

最新文章

  1. 【颠覆认知】为什么YouTube广告只看五秒更赚钱,微博商业产品经理深度剖析。...
  2. import javax.servlet.http.HttpServletRequest 提示错误
  3. 2019年用于自动化的5个最佳Java测试框架
  4. EasyUI加zTree使用解析 easyui修改操作的表单回显方法 验证框提交表单前验证 datagrid的load方法
  5. Coding Interview Guide -- 向有序的环形单链表中插入新节点
  6. 论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理
  7. 麦克纳姆轮全向移动机器人速度分解
  8. 计算机论文目录大全,毕业论文目录范文
  9. 制作网站需要什么技术呢?
  10. 凯悦宣布旗下凯悦悠选品牌首次进入亚太地区;格林酒店发布2021年三季报 | 全球旅报...
  11. 达人评测 联想YOGA Duet 2021
  12. Kubernetes 节点调度原理及调度策略
  13. 基于翻译模型(Trans系列)的知识表示学习
  14. Linux基础第一课——基础知识了解
  15. 初中计算机教案模板,初中计算机教案模板
  16. easyExcel实现单sheet多子表,并结合动态表头,复杂表头
  17. lect02_project
  18. java基础:日志框架
  19. 可以借助Studio Display 实现旧款Macbook上的“Hey Siri”功能
  20. HTML 导航栏标签切换

热门文章

  1. 基于手写数字识别的FGSM
  2. 如何高效解决PCBA高精密电阻开尔文测试选针问题?
  3. 基于MATLAB实现四阶龙格库塔法求解一、二阶微分方程实例
  4. python自动打开网页_python 自动批量打开网页的示例
  5. k2p拆机ttl刷breed_【1.10】k2p A版 22.10.3.42;22.10.3.38;拆机TTL刷BREED;B版 21.6.25.20刷机 图文教程...
  6. eeupdate 更新MAC地址
  7. jrtplib 编译安装配置
  8. java下载m3u8视频,解密并合并ts(一)
  9. 高等代数葵花宝典—白皮书
  10. 现金支票打印模板excel_施工表格填写不规范?500套最全施工资料表格模板,可直接套用|面层|分项...