Python之机器学习第一弹。
Python被称为最简单好上手的语言之一,基于其极强的关联性,对各种库的引用,和资源的关联,使其实现功能非常容易。一些底层逻辑不需过多过深的理解。

机器学习是Python发展中应用广泛的一个领域。
本篇将简要介绍:
1.机器学习概念
2.sklearn库初步介绍(标准数据集及基本功能)
3.一些相关书籍及课程推荐

一、机器学习的目标

1.机器学习简介及其分类

(1)机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习,改善具体算法的性能。
(2)特点
①多领域交叉,涉及概率论、统计学,算法复杂度理论等多门学科
②广泛应用于网络搜索、垃圾邮件过滤、推荐系统、广告投放、信用评价、欺诈检测、股票交易和医疗诊断等应用

(3)分类
①监督学习(Supervised Learning)
②无监督学习(Unsupervised Learning)
③强化学习(Reinforcement Learning,增强学习)
④半监督学习(Semi-supervised Learning )
⑤深度学习(Deep Learning)

2.Python Scikit-learn(一组简单有效的机器学习工具集)

①依赖Python的NumPy,SciPy和matplotlib库
②开源、可复用
③常用函数

3.相关书籍及课程推荐

①图书-《机器学习》-周志华(西瓜书)
出版社:清华大学出版社
主页:http://t.cn/RXvpCKB

②图书-《PRML》- Bishop
出版社:Springer
主页:http://t.cn/RXv0YVz
此书为机器学习贝叶斯学派的经典书籍,广度深度,可读性及可用性兼顾

③课程-《Machine Learning 》 - Andrew Ng
Coursera版:前百度首席科学家斯坦福教授吴恩达老师(Coursera创始人)录制的在线课程
课程主页:http://t.cn/RJZQbV2 Stanford手书版
在线观看:http://t.cn/RwUWKMS
课程主页:http://cs229.stanford.edu/
此课程讲解机器学习的原理和算法知识

④课程-《CS231n》 - Fei-Fei Li(斯坦福大学)
课程主页:http://cs231n.stanford.edu/
在线观看:http://t.cn/RqRNasR
主要介绍深度学习在计算机视觉领域的应用

⑤课程-《Reinforcement Learning》- David Silver
课程主页;http://t.cn/Rw0rwtU
在线观看:http://t.cn/RIAfRUt
由AlphaGo的主要开发者团队讲解的,有关强化学习和深度强化学习原理及其应用技术

二、Sklearn库的安装

1.sklearn库

①sklearn是scikit-learn的简称,是一个基于Python的第三方模块。
②sklearn库集成了一些常用的机器学习方法,在进行机器学习任务时,并不需要实现算法,只需要简单的调用sklearn库中提供的模块就能完成大多数的机器学习任务。

③sklearn库是在Numpy、Scipy和matplotlib的基础上开发而成的,因此在介绍sklearn的安装前,需要先安装这些依赖库。

2.sklearn库的基础库

①Numpy (Numerical Python的缩写)是一个开源的Python科学计算库。
②Scipy库是sklearn库的基础,它是基于Numpy的一个集成了多种数学算法和函数的Python模块。
③matplotlib是基于Numpy的一套Python工具包,它提供了大量的数据绘图工具。

3.安装顺序

三、sklearn库中的标准数据集及基本功能

1.数据集总览

注:小数据集可以直接使用,大数据集要在调用时程序自动下载(一次即可)
这里举几个例子

2.波士顿房价数据集

①波士顿房价数据集包含506组数据,每条数据包含房屋以及房屋周围的详细信息。
②其中包括城镇犯罪率、一氧化氮浓度、住宅平均房间数、到中心区域的加权距离以及自住房平均房价等。
③因此,波士顿房价数据集能够应用到回归问题上。
④部分数据

⑤使用sklearn.datasets.load boston即可加载相关数据集
⑥重要参数:
return_X_y:表示是否返回target(即价格),默认为False,只返回data(即属性)。

3.鸢尾花数据集

①鸢尾花数据集采集的是鸢尾花的测量数据以及其所属的类别。
②测量数据包括:尊片长度、尊片宽度、花瓣长度、花瓣宽度。
③类别共分为三类:Iris Setosa,Iris Versicolour,Iris Virginica。可用于多分类问题。
④使用sklearn.datasets.load iris即可加载相关数据集

⑤参数:
return_X_y:若为True,则以(data,target)形式返回数据;默认为False,表示以字典形式返回数据全部信息(包括data和target)。

4.手写数字数据集

①手写数字数据集包括1797个0-9的手写数字数据,每个数字由8*8大小的矩阵构成,矩阵中值的范围是0-16,代表颜色的深度。
②数字0的样本

③使用sklearn.datasets.load digits即可加载相关数据集

④参数
return_X_y:若为True,则以(data, target)形式返回数据;默认为False,表示以字典形式返回数据全部信息(包括data和target)。

⑤n_ class(特别的属性):表示返回数据的类别数,如:n_class=5,则返回0到4的数据样本。

5.sklearn库的基本功能

①sklearn库的共分为6大部分,分别用于完成分类任务、回归任务、聚类任务、降维任务、模型选择以及数据的预处理。
②分类任务

③回归任务

④聚类任务

⑤降维任务

总结

本篇干货不多,这里只是简单概述,之后会以实例对这些算法的使用方式进行具体介绍。
将分为无监督学习,有监督学习,强化学习进行具体介绍
下一篇介绍:机器学习之无监督学习,将结合实例及代码详述聚类、降维、基于聚类的整图分割实例

如有错误,欢迎指正!

机器学习应用——导学part相关推荐

  1. 机器学习毕设题目有哪些_2020-2021毕设导学课01丨环艺景观毕业设计都可以选哪些题目呢?...

    又开学了,毕业季临近,又有一批同学们要开始筹备毕业设计.因为从事工作的便利,可以给大家分享一波毕业设计的经验.这期就先说说毕业设计我们到底应该怎么选题呢? 今天来说说景观方向的,后面的文章也会说室内方 ...

  2. Python学习---入门导学篇

    Python学习---入门导学篇 Python的特点 Python受人喜欢的原因 Python的缺点 Python能做什么? Python基础语法 Python的特点 1.Python是一门编程语言, ...

  3. 零基础入门进阶python导学(初识python)-01

    文章目录 python导学 python版本 基础语法 面向对象 python特点 pythonic 易于学习 万金油 1.爬虫 2.大数据与数据分析(Spark) 3.自动化运维.自动化测试 4.W ...

  4. 《c++语言导学》——1.7 常量

    本节书摘来自华章计算机<c++语言导学>一书中的第1章,第1.7节,[美] 本贾尼·斯特劳斯特卢普 更多章节内容可以访问云栖社区"华章计算机"公众号查看. 1.7 常量 ...

  5. 上标3下标6算法_插入排序算法导学案

    本文为"选考VB算法专题系列讲座9插入排序算法"视频配套的导学案,请同学们先完成导学案再收看视频.明天将推送"选考VB算法专题系列讲座9插入排序算法"视频,敬请 ...

  6. 写给大家看的机器学习书【Part1】什么是机器学习?机器学到的到底是什么?

     写给大家看的机器学习书[Part1]什么是机器学习?机器学到的到底是什么? 机器学习 深度学习 神经网络 人工智能 阅读1390

  7. (一)导学(前端框架面试-聚焦Vue/React/Webpack)

    导学 全面 高效 学习前提 前端常见面试流程 知识点介绍 Vue框架部分 React框架部分 工具部分 项目设计 讲解方式 注意事项 全面 全面的知识体系 大量的面试真题 完整的技术面试流程 高效 直 ...

  8. (一)导学(Javascript设计模式系统讲解与应用)

    导学 论工程师的设计能力 前端学习设计模式的困惑 课程概述 知识点介绍 课程安排 面向对象 设计原则 设计模式 综合示例 讲解方式 课程收获 学习前提 重点提示 论工程师的设计能力 3年工作经验,面试 ...

  9. 《c++语言导学》——3.5 建议

    本节书摘来自华章计算机<c++语言导学>一书中的第3章,第3.5节,[美] 本贾尼·斯特劳斯特卢普 更多章节内容可以访问云栖社区"华章计算机"公众号查看. 3.5 建议 ...

  10. web前端开发技术期末考试_智慧树来我校开展WEB前端开发微专业导学

    11月17日,在6号教学楼6102阶梯教室,智慧树工作人员带来了WEB前端开发微专业导学.根据前期长青联盟微专业的报名情况及学生学习情况,为进一步提高学生学习微专业的质量,学院联系了微专业教学平台的专 ...

最新文章

  1. Mysql性能优化方案
  2. 利用计算机技术教学图片,教育教学论文 科学学科如何利用计算机技术提高教学效率.doc...
  3. 怎么在html中设置按键,网页设计中如何设计按钮
  4. Android --- View.inflate()的详细介绍
  5. c语言中的void指针,C程序中void指针的概念
  6. oracle自治事务的写法_Oracle的自治事务
  7. 在Linux系统中,使用useradd命令新建用户后,登录该用户时shell开头为$,不显示用户名和路径,如下:...
  8. 用户微信好友关系属于个人隐私吗?深圳南山法院说不属于...
  9. indy9 indy10 MD5 实现方法
  10. ld: symbol(s) not found for architecture arm64
  11. Win7中如何删除访问共享时所保存的用户名和密码
  12. Cocos2d-x 3.0 动作
  13. pythonlog数组_Numpy掩码式数组详解
  14. 在线光纤网速测试软件,光纤网速测试,宽带测试
  15. ajax性能测试脚本,mqtt性能测试工具
  16. 省市区json最新数据
  17. One More Check: Making “Fake Background” Be Tracked Again
  18. 机器学习者面试,看这10个建议
  19. 如何实现今日头条跳转到微信?
  20. 传输门为什么是P/N双MOS结构

热门文章

  1. C#创建文件,覆盖文件,读取文件
  2. Stata:调节中介效应检验
  3. 带宽与响应速度的关系
  4. 能完成加减乘除以及开根号的Java计算器
  5. 让Ubuntu 10.04完美支持Thinkpad小红点Trackpoint
  6. Python 数据分析微专业课程--项目实战09 房价影响因素挖掘
  7. 彩虹的七种颜色CMYK和RGB的值是什么
  8. 服务器电源ic芯片,8种常见电源管理IC芯片介绍
  9. 【数据分析认知课(一):数据分析思维观】——读后感
  10. 如何做好数据分析的数据采集工作?