机器学习是使计算机无需显式编程即可学习的行为。 这是通过将数据提供给计算机并将其转换为决策模型,然后将其用于未来的预测来完成的。

在本教程中,我们将讨论机器学习以及开始机器学习所需的一些基本概念。 我们还将设计一些Python示例来预测某些元素或事件。

机器学习导论

机器学习是一种旨在从经验中学习的技术。 例如,作为一个人,您可以通过观察其他人下棋来学习如何下棋。 以相同的方式,通过为计算机提供从中学习的数据,然后能够预测未来的要素或条件来对计算机进行编程。

例如,假设您要编写一个程序,该程序可以判断某种类型的水果是橙色还是柠檬。 您可能会发现编写这样的程序很容易,并且会给出所需的结果,但是您可能还会发现该程序对于大型数据集无法有效运行。 这就是机器学习发挥作用的地方。

机器学习涉及多个步骤:

  1. 资料收集
  2. 数据过滤
  3. 数据分析
  4. 算法训练
  5. 算法测试
  6. 使用算法进行未来预测

机器学习使用不同种类的算法来查找模式,这些算法分为两类:

  • 监督学习
  • 无监督学习

监督学习

监督学习是训练计算机通过提供样本数据来识别元素的科学。 然后,计算机从中学习,并能够根据学习到的数据预测未来的数据集。

例如,您可以训练计算机以根据过去的信息过滤掉垃圾邮件。

监督学习已在许多应用程序(例如Facebook)中使用,以基于特定描述搜索图像。 现在,您可以使用描述照片内容的文字在Facebook上搜索图像。 由于该社交网站已经具有字幕图像的数据库,因此它能够以某种程度的准确性搜索描述并将其与照片中的特征进行匹配。

监督学习仅涉及两个步骤:

  • 训练
  • 测试

一些监督学习算法包括:

  • 决策树
  • 支持向量机
  • 朴素的贝叶斯
  • k最近邻居
  • 线性回归

我们将编写一个简单的程序来演示使用Sklearn库和Python语言进行监督学习的方式。 Sklearn是适用于Python编程语言的机器学习库,具有多种功能,例如多重分析,回归和聚类算法。

Sklearn还可以与NumPy和SciPy库良好地互操作。

安装Sklearn

Sklearn安装指南为在多个平台上的安装提供了一种非常简单的方法。 它需要几个依赖项:

  • Python(> = 2.7或> = 3.3),
  • NumPy(> = 1.82)
  • 科学(> = 0.13.3)

如果已经具有这些依赖项,则可以像下面这样简单地安装Sklearn:

pip install -U scikit-learn

一个简单的方法是简单地安装Anaconda。 这将处理所有依赖项,因此您不必担心一一安装。

要测试Sklearn是否正常运行,只需按如下所示从Python解释器导入它即可:

import sklearn

如果没有错误发生,那您就很好了。

现在我们已经完成了安装,让我们回到问题所在。 我们希望能够区分不同的动物。 因此,我们将设计一种算法,该算法可以具体分辨给定的动物是马还是鸡。

我们首先需要从每种动物中收集一些样本数据。 下表中显示了一些示例数据。

身高(英寸) 重量(公斤) 温度(摄氏度) 标签
7 0.6 40 鸡(0)
7 0.6 41 鸡(0)
37 0.8 37 马(1)
37 0.8 38 马(1)

我们获得的样本数据给出了两只动物的一些共同特征以及两只动物的数据。 样本数据越大,结果越准确,偏差也越小。

利用这种类型的数据,我们可以对算法进行编码,然后根据训练后的值对算法进行训练,以识别出动物,然后将其分类为马还是鸡。 现在,我们将继续编写完成任务的算法。

首先,从Sklearn导入树模块。

from sklearn import tree

定义要用于对动物进行分类的特征。

features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]

定义每个分类器将给出的输出。 鸡用0表示,而马用1表示。

#labels = [chicken, chicken, horse, horse]
# we use 0 to represent a chicken and 1 to represent a horse
labels = [0, 0, 1, 1]

然后,我们定义将基于决策树的分类器。

classifier = tree.DecisionTreeClassifier()

将数据输入或适合分类器。

classifier.fit(features, labels)

该算法的完整代码如下所示。

from sklearn import tree
features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]
#labels = [chicken, chicken, horse, horse]
labels = [0, 0, 1, 1]
classif = tree.DecisionTreeClassifier()
classif.fit(features, labels)

现在我们可以预测给定的数据集。 以下是预测身高7英寸,体重0.6千克,温度41的动物的方法:

from sklearn import tree
features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]
#labels = [chicken, chicken, horse, horse]
labels = [0, 0, 1, 1]
classif = tree.DecisionTreeClassifier()
classif.fit(features, labels)print classif.predict([[7, 0.6, 41]])#output
# [0]  or a Chicken

以下是预测身高38英寸,体重600公斤,温度37.5的动物的方法:

from sklearn import tree
features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]
#labels = [chicken, chicken, horse, horse]
labels = [0, 0, 1, 1]
classif = tree.DecisionTreeClassifier()
classif.fit(features, labels)print classif.predict([[38, 600, 37.5]])# output
# [1]  or a Horse

从上面可以看到,您已经训练了算法来学习动物的所有特征和名称,并且这些数据的知识用于测试新动物。

无监督学习

无监督学习是指您仅用一组输入来训练机器。 然后,机器将能够找到输入数据与您可能希望预测的任何其他数据之间的关系。 与有监督学习不同,在无监督学习中,您向机器展示了一些要训练的数据,无监督学习的目的是使计算机查找不同数据集之间的模式或关系。

无监督学习可以进一步细分为:

  • 聚类
  • 协会

聚类 :聚类是指固有地对数据进行分组。 例如,您可以根据消费者的购买习惯和购物习惯将其作为目标消费者,从而对消费者的购物习惯进行分类并将其用于广告。

关联 :关联是您在其中标识描述大量数据的规则的地方。 这种类型的学习可以应用于基于作者或类别的书籍,无论是动机书籍,虚构书籍还是教育书籍。

一些流行的无监督学习算法包括:

  • k均值聚类
  • 层次聚类

在不久的将来,无监督学习将成为一项重要技术。 这是由于存在许多尚未过滤的数据尚未数字化的事实。

结论

我希望本教程可以帮助您入门机器学习。 这只是一个介绍-机器学习有很多内容要介绍,而这仅仅是机器学习可以做的一小部分。

此外,不要犹豫,看看我们在Envato市场上有哪些可供出售和研究的物品 ,也不要犹豫,使用下面的提要来问任何问题并提供宝贵的反馈意见。

您决定使用监督还是无监督机器学习算法将取决于各种因素,例如数据的结构和大小。

机器学习可以应用于我们生活的几乎所有领域,例如,预防欺诈,在社交媒体网站中个性化新闻源以适应用户的喜好,电子邮件和恶意软件过滤,天气预报,甚至在电子商务领域以预测消费者购物习惯。

翻译自: https://code.tutsplus.com/tutorials/introduction-to-machine-learning-in-python--cms-30623

Python机器学习简介相关推荐

  1. 基于sklearn进行蝴蝶花分类案例(Python机器学习笔记)

    本文背景   原有在网易云课堂学习课程Python机器学习简介,只不过好久没看.现想回顾一下,巩固所学内容. 数据集简介   Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理. ...

  2. python机器学习——主成分分析理论简介

    主成分分析理论简介 一.特征降维 1.1什么是特征降维? 1.2为什么要进行特征降维? 1.3特征选择和特征抽取 二.主成分分析(PCA)理论 2.1 算法描述 2.2 PCA 在图像识别的应用 2. ...

  3. Python机器学习与实践——简介篇

    周四晚上胡哥给大家简单培训了一下nlp的一些算法,感觉受益匪浅.回去之后反省了一下,有段时间没看机器学习的东西了,nlp要抓,机器学习也要学.开个坑,记录和分享一下学习内容(书籍为<python ...

  4. Python机器学习(scikit-learn):scikit-learn 简介

    原文链接:https://xiets.blog.csdn.net/article/details/130957394 版权声明:原创文章禁止转载 专栏目录:scikit-learn 专栏(总目录) s ...

  5. 《Python机器学习与可视化分析实战》简介

    #好书推荐##好书奇遇季#<Python机器学习与可视化分析实战>,京东当当天猫都有发售.定价69元.Python机器学习与可视化入门书,配套示例源码.PPT课件.作者答疑. 本书带给你的 ...

  6. python机器学习可视化工具Yellowbrick介绍及平行坐标图实战示例

    python机器学习可视化工具Yellowbrick介绍及平行坐标图实战示例 目录 python机器学习可视化工具Yellowbrick介绍及平行坐标图实战示例 yellowbrick简介及安装

  7. 标星 6.1K!《Python 机器学习在线指南》分享

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送 本文将给大家介绍如何使用 Python 进行机器学习的全面而简单的课程. 机器学习是一门 ...

  8. 免费教材丨第55期:Python机器学习实践指南、Tensorflow 实战Google深度学习框架

    小编说  时间过的好快啊,小伙伴们是不是都快进入寒假啦?但是学习可不要落下哦!  本期教材  本期为大家发放的教材为:<Python机器学习实践指南>.<Tensorflow 实战G ...

  9. python教学视频下载-Python机器学习入门教程全套视频下载【传智播客】

    Python机器学习入门教程 初级共3天课 本套教程是机器学习的入门课程,主要介绍一些经典的传统机器学习算法,如分类算法:KNN算法,朴素贝叶斯算法,逻辑回归,决策树算法以及随机森林;回归算法:线性回 ...

  10. 只需十四步:从零开始掌握 Python 机器学习(附资源)

    分享一篇来自机器之心的文章.关于机器学习的起步,讲的还是很清楚的.原文链接在:只需十四步:从零开始掌握Python机器学习(附资源) Python 可以说是现在最流行的机器学习语言,而且你也能在网上找 ...

最新文章

  1. python 原始数据输出函数 repr
  2. mysql centos7 默认密码忘记_centos7 mysql忘记密码解决办法
  3. MATLAB信号处理工具箱函数列表分类
  4. 《Scikit-Learn与TensorFlow机器学习实用指南》 第01章 机器学习概览
  5. 敏捷冲刺每日报告——Day5
  6. Python之日志处理(logging模块)详解
  7. dns服务器v6解析 windows_04:缓存DNS、Split分离解析、电子邮件通信、Web服务器项目实战...
  8. php设计的意义,PHP设计模式
  9. 零基础入门Python:基本命令、函数、数据结构
  10. Pytorch各种损失函数
  11. i3wm nm-applet每次开机都要输入wifi密码的解决办法
  12. VBScript详解(一)
  13. 基于腾讯云播放器封装的Flutter Video Player插件
  14. html 自动打开超链接,JS、html打开超链接的几种形式
  15. 微服务中的Spring Cloud和Spring Cloud Alibaba分别有哪些组件和作用,众多组件中如何做技术选型?
  16. 可爱的狮子(lion)
  17. 软件设计师中级-数据库设计
  18. Lab1实验过程及心得体会
  19. context 简介
  20. 2021江苏地区高考成绩排名查询,江苏高考成绩排名查询系统,江苏高考位次排名查询...

热门文章

  1. usercontrol控件生成后,左边工具栏不会出现工具的问题解法
  2. JAVA视频全套在线学习
  3. 软件nginx 0.8.16
  4. tensorboard的安装与使用
  5. python writelines_详解详解Python中writelines()方法的使用
  6. 图解python CGI(通用网关接口 )
  7. SVG 图标和sketch 模版免费网站
  8. ubuntu 卸载NVIDIA 驱动
  9. centos服务器之间copy文件夹命令,Centos下如何拷贝整个目录命令?Centos下拷贝目录命令的方法...
  10. lodop 小票排版_Lodop打印小票