一、前言

近年来,人工智能一词频繁出现在我们的视野。从深蓝到阿法狗,人工智能已经成为未来趋势。而机器学习又是人工智能的一大重要分支,所以学习机器学习也是一个很好的选择。本系列文章将使用通俗的语言讲解机器学习,并使用scikit-learn模块实现常用的机器学习算法。

二、机器学习

机器学习是从数据中提取知识的科目,它是计算机技术与概率论、统计学等数学理论的结合。简单来说,机器学习就是寻找一个函数。我们给定一个输入,它就可以输出我们想要的内容。我们可以看几个实际的例子。

现在人脸识别、语音识别、自动驾驶等技术都比较热门,我们可以分别看看这三种技术的输入、函数、输出是什么。

对于人脸识别,输入是人脸的图像,输出是这个人的姓名或者其它标识,而函数我们好像无法描述;对于语音识别,输入是声音信号,输出是文字,函数我们同样无法描述;对于自动驾驶,输入是各种传感器的数据,四周的图像等,输出是下一步操作(转方向盘、踩油门、刹车),函数我们依旧无法描述。


可以发现,机器学习通常要找的函数是非常复杂的,这些函数很难描述,也正因为人难以描述,所以需要机器学习。

三、监督学习和非监督学习

3.1、学习方式

我们需要大量的历史数据来驱动寻找函数的过程。根据数据的的不同,我们通常有两种不同的学习方式。分别是监督学习和非监督学习。

对于监督学习,数据需要包含特征值和目标值两个部分。 而对于非监督学习,目标值的存在不是必要的。下面我们用两个例子区分一下监督学习和非监督学习。

3.2、监督学习

假如有一个射箭任务,我们的目标就是命中靶心,经过多次有效练习,我们可以很精准命中靶心。我们可以把这个任务理解为监督学习。

3.3、非监督学习

现在有另外一个任务,有一堆重量分别是10kg、20kg、30kg,单大小一样的铁球混合在一起,让你胡乱用力丢,最后我们可以看到下图的效果:

图中绿色为10kg、蓝色为20kg、黄色为30kg,为了区分

可以发现绿色集中在外圈,蓝色集中在中间,而黄色则离人最近。虽然我们通过肉眼无法知道球的重量,但是通过抛球后的圈,我们可以猜测各个球的重量。

四、机器学习算法

4.1、函数集(function set)

在上面我们提到,机器学习是要寻找一个函数。但是光说寻找一个函数如同大海捞针,无从下手。为了有更明确的目标,我们可以把函数的范围进一步缩小,比如我们假定我们要找的函数形式如下:
y=wx+by = wx + b y=wx+b
其中x是输入,y是输出,w和b是我们函数的参数。因为不同的w和b可以确定不同函数,所以我们把上面有未知w和b的函数叫函数集。

在确定好函数集后,我们就可以在函数集寻找一个最优的函数(最优的一组w和b)。具体寻找方式会在后面讲解。

4.2、算法

机器学习算法在机器学习中起到了非常重要的作用,在我们确定了使用的算法时,就相当于确定了函数集。之后只需要在函数集中找到最优的函数即可。

各个算法有各自的优点 ,适用不同的任务。因此我们只有熟悉各个算法的特点,才能很好的运用各个算法。

下面是我们会学到的几个算法:

  1. k近邻
  2. 决策树
  3. 随机森林
  4. 朴素贝叶斯
  5. 线性回归
  6. 逻辑回归
  7. 支持向量机
  8. 神经网络
  9. 聚类

这里没有全部列出,后续会详细介绍。今天的内容就分享到这,更多内容可以关注“新建文件夹X”。

【Python机器学习】01_机器学习概述相关推荐

  1. 【深度学习】基于Torch的Python开源机器学习库PyTorch概述

    [深度学习]基于Torch的Python开源机器学习库PyTorch概述 文章目录 1 PyTorch简介 2 环境搭建 3 Hello world!3.1 Tensors (张量)3.2 操作 4 ...

  2. python数据挖掘课程设计,利用Python进行机器学习和数据挖掘概述

    利用Python数据挖掘和机器学习的概述 前言: 本文主要描述了使用Python进行数据挖掘业务的优势并介绍了相关的数据处理工具包pandas和机器学习算法库scikit-learn. 为什么使用py ...

  3. 如何在 Python 中开始机器学习?(小白必看)

    其实学习机器学习的最好方法是设计和完成小项目. Python 是一种流行且功能强大的解释型语言.与 R 不同,Python 是一种完整的语言和平台,可用于研究和开发以及开发生产系统. 还有很多模块和库 ...

  4. 跟着迪哥学python 经管之家_跟着迪哥学Python数据分析与机器学习实战

    本书结合了机器学习.数据分析和Python语言,通过案例以通俗易懂的方式讲解了如何将算法应用到实际任务. 全书共20章,大致分为4个部分.第一部分介绍了Python的工具包,包括科学计算库Numpy. ...

  5. Python AI和机器学习库

    目录 介绍 NLTK OpenCV Keras TensorFlow PyTorch scikit-learn NumPy和SciPy Matplotlib Pandas 选择什么? 下一步 介绍 这 ...

  6. Python 数据挖掘与机器学习基础-韦玮-专题视频课程

    Python 数据挖掘与机器学习基础-252人已学习 课程介绍         Python 数据挖掘与机器学习基础 课程收益     Python全栈工程师 讲师介绍     韦玮 更多讲师课程   ...

  7. 基于python的数据建模与分析案例_基于案例详解Python数据分析与机器学习

    课程概述: 使用数据领域最主流语言Python及其分析与建模库作为核心武器.对于机器学习经典算法给出完整的原理推导并基于实例进行讲解,基于案例演示如何应用机器学习算法解决实际问题. 课程特色: 通俗易 ...

  8. python手动将机器学习模型保存为json文件

    python手动将机器学习模型保存为json文件 # 导入需要的包和库: # Import Required packages #-------------------------# Import t ...

  9. 数据科学+python+R+数据库+机器学习+(速查表)cheat sheets大全

    数据科学+python+R+数据库+机器学习+(速查表)cheat sheets大全 Learn, compete, hack and get hired! 学习.竞争.精进.996. 东西永远学不完 ...

  10. 带你入门Python数据挖掘与机器学习(附代码、实例)

    作者:韦玮 来源:Python爱好者社区 本文共7800字,建议阅读10+分钟. 本文结合代码实例待你上手python数据挖掘和机器学习技术. 本文包含了五个知识点: 1. 数据挖掘与机器学习技术简介 ...

最新文章

  1. ISE安装和FLASH烧录
  2. weidingma参考文献
  3. 使用putty上传文件
  4. git clone 获取指定分支的指定commit版本
  5. Mybatis openSession.commit()手动提交数据和openSession.commit(true)自动动提交数据
  6. py函数两个返回值_Python 函数为什么会默认返回 None?
  7. linux分区_如何扩展Linux系统根分区
  8. vb 修改sql数据库服务器,vb连接服务器sql数据库
  9. sigmoid画图_博弈画图软件(Window版和MAC版)
  10. STM8L中断线和中断端口使用方法
  11. 同步京东、抖音、淘宝等多处订单到本地商城,这里只举例京东同步
  12. L2TP连接尝试失败,因为安全层在初始化与远程计算机的协商时遇到了一个处理错误
  13. IDEA之Translation翻译插件-TKK: 更新 TKK 失败
  14. java微信分享demo
  15. 2019 MySQL 8 安全安装避坑指南
  16. 【牛客刷题】SQL专项错题记录三
  17. 自动打开html链接,微信中打开链接,自动打开外部浏览器打开指定URL页面
  18. 系统资源不足 无法完成请求的服务
  19. 20.flowable 任务签收 反签收
  20. 从量化度诉常的术标底不赚

热门文章

  1. 如何选择python培训
  2. Arduino实现数码管动态显示
  3. 美国北亚利桑那大学计算机专业排名,北亚利桑那大学排名 综合排名和专业排名介绍...
  4. Kafka - Zookeeper 服务器安装
  5. webrtc入门:8.coturn流程
  6. html实现文字移动的特效
  7. 如何学好C语言,一个成功人士的心得!
  8. python余数不等于的符号_有乐 这些符号如此重要,不知道就等于“白练琴”
  9. ios kb转m_超圣iOS下载
  10. Linux 命令 htop 的使用