机器学习概述

人工智能、机器学习、深度学习之间的关系

机器学习框架

Pytorch
Caffe2
theano
Chainer
Scikit-learn

语言支持

机器学习书籍

《面向机器智能 TensorFlow实践》
《MACHINE LEARNING 机器学习》,周志华
《TensorFlow技术解析与实践》

什么是机器学习

机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测

应用案例

案例1

案例2

为什么需要机器学习

机器学习应用场景

1、自然语言处理
2、无人驾驶
3、计算机视觉
4、推荐系统

数据来源与类型

1、数据来源

  • 企业日益积累的大量数据(互联网公司更为显著)
  • 政府掌握的各种数据
  • 科研机构的实验数据

2、数据类型

  • 离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所有这些数据全部都是整数,而且不能再也不能进一步提高他们的精确度。
  • 连续型数据:变量可以在某个范围内取任一数,即变量的取值可以是连续的,如,长度、时间、质量值等,这类整数通常是非整数,含有小数部分。

注:只要记住一点,离散型是区间内不可分,连续型是区间内可分

数据类型的不用应用

数据的类型将是机器学习模型不同问题不同处理的依据?

3、可用的数据集

常用数据集数据的结构组成

结构:特征值 + 目标值

例如:

注:有些数据集可以没有目标值

数据的特征工程

1、特征工程是什么

特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性

案例:
将下面的文本转换为数字类型的过程。

再如,将一个numpy的数组按照一定规则转成另外一个

2、特征工程的意义

直接影响模型的预测结果

3、scikit-learn库介绍

  • Python语言的机器学习工具
  • Scikit-learn包括许多知名的机器学习算法的实现。
  • Scikit-learn文档完善,容易上手,丰富的API,使其在学术界颇受欢迎。

安装参考:https://blog.csdn.net/tototuzuoquan/article/details/105290465

4、数据的特征抽取

阅读:https://blog.csdn.net/tototuzuoquan/article/details/105424709

5、数值的特征处理

阅读:https://blog.csdn.net/tototuzuoquan/article/details/105440244

6、机器学习模型是什么

定义:通过一种映射关系将输入值到输出值

7、机器学习算法分类

机器学习开发流程

监督学习

1、分类 : k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络
2、回归:线性回归、岭回归
3、标注:隐马尔可夫模型(不做要求)

无监督学习

1、聚类:k-means

8、监督学习

监督学习 (英语:Supervised learning),可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是由
输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)

无监督学习(英语:Supervised learning),可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是
由输入特征值所组成。

分类问题

概念:分类是监督学习的一个核心问题,在监督学习中,当输出变量取有限个离散值时,预测问题变成为分类问题。最基础的便是二分类问题,即判断是非,从两个类别中选择一个作为预测结果;

分类问题的应用

分类在于根据其特性将数据“分门别类”,所以在许多领域都有广泛的应用:1、在银行业务中,构建一个客户分类模型,按客户按照贷款风险的大小进行分类2、 图像处理中,分类可以用来检测图像中是否有人脸出现,动物类别等3、手写识别中,分类可以用于识别手写的数字4、文本分类,这里的文本可以是新闻报道、网页、电子邮件、学术论文…
回归问题:

概念:回归是监督学习的另一个重要问题。回归用于预测输入变量和输出变量之间的关系,输出是连续型的值

回归在多领域也有广泛的应用1、房价预测,根据某地历史房价数据,进行一个预测2、金融信息,每日股票走向
…

04_机器学习概述,什么是机器学习,应用场景,数据来源与类型,网上可用的数据集、常用数据集数据的结构组成、特征工程是什么、意义、特征抽取、sklearn特征抽取API、文本特征抽取(学习笔记)相关推荐

  1. 富文本编辑器 —— 学习笔记

    富文本编辑器 -- 学习笔记 文章目录 富文本编辑器 -- 学习笔记 一.wangEditor 1.内容处理--获取/设置 JSON 一.wangEditor 1.内容处理--获取/设置 JSON 使 ...

  2. 微信小程序-常用API开发技巧学习笔记

    常用API开发技巧学习笔记 第一章 认识微信小程序 前后端分离的开发方式 小程序的特点 小程序对开发者的影响 学习小程序需要的基础 第二章 小程序环境搭建与开发工具介绍 小程序开发环境 没有小程序号对 ...

  3. OpenCV 3 Tracking API目标跟踪学习笔记——定义、物体跟踪常用算法、demo

    今天开始接触目标跟踪 本文翻译自https://www.learnopencv.com/object-tracking-using-opencv-cpp-python/#opencv-tracking ...

  4. 阿里云Apsara Clouder专项技能认证:实现调用API接口(学习笔记及证书)

    文章目录 课程学习笔记的思维导图 认证证书示意 课程学习笔记的思维导图 (点击可放大查看) 认证证书示意 通过阿里云Apsara Clouder专项技能认证的学习及考试后,会得到一张阿里云给的认证证书 ...

  5. 文本检测学习笔记——边界聚类,笔画分割,语句段落分类

    搬以前写的博客[2014-02-28 10:24] 2.21 ~2.27  这一周在阅读一篇比较长的文献 Localizing Text in Scene Images by Boundary Clu ...

  6. css 盒子有内容 盒子往下掉_css盒子模型与文本溢出学习笔记

    02第一章笔记 11盒子模型 1. border-style:solid(实线)/dashed(虚线)/dotted(点划线)/double(双线) 2. padding 内容区域距离边框 3. pa ...

  7. ArcGIS API for Silverlight 学习笔记(1)

    学习ArGIS API for Silverlight时间不久,希望记录下自己的心得. ArcGIS API for Microsoft Silverlight在今年三月份发布了1.2版本,它的最新版 ...

  8. RESTful API 简介(学习笔记)

    RESTful接口的命名规范与语义格式 RESTful是一种网络应用程序的设计风格和开发方式,可以使用xml方式来定义或者json格式来定义.RESTful适用于移动互联网厂商作为业务接口的场景,实现 ...

  9. Focusing Attention Network(FAN)自然图像文本识别 学习笔记

    Focusing Attention: Towards Accurate Text Recognition in Natural Images Author: Zhanzhan Cheng,Fan B ...

最新文章

  1. 解决iIntelliJ IDEA导入jstl后,jsp中taglib指令无法自动添加uri地址
  2. Python进阶之路:namedtuple
  3. python找出矩阵中的马鞍点_矩阵的马鞍点
  4. redis在java中的方法_redis在java中的使用方法
  5. 原创 | 为什么阿里巴巴建议开发者谨慎使用继承?
  6. web页面的回流,认识与避免
  7. Shell编程—【03】数学运算expr与bc浮点数运算
  8. 【终于等到你】微信转发语音的方法 - 语音信息转发
  9. 算法——排序——插入排序图解动画
  10. 美国通货膨胀持续引发市场关注,国际黄金价格还有上涨机会吗?
  11. 职场人士必学的10种Excel打印技巧【特别实用,赶紧收藏】
  12. 计算机复制方法有,电脑复制粘贴怎么用(6种电脑复制粘贴方法)
  13. 【通識:人生哲學與幸福】青年心理學 Part2 成熟
  14. stata面板数据聚类及数据导入处理、虚拟变量等
  15. 怎样来实现数据接口的加密?
  16. python用turtle库画正方形_Python也可以这么“文雅”,用turtle库画一幅高傲的梅花...
  17. 浅谈学术论文rebuttal
  18. 定制XP的启动界面更换背景图和windows字样
  19. 未来教育计算机二级c语言jd,逻辑思维训练地址_未来教育中心
  20. Visual Studio2013使用Microsoft Office Document Imaging(MODI)的方法

热门文章

  1. 你真的了解Python吗?这篇文章可以让你了解90%
  2. leetcode贪心算法题集锦(持续更新中)
  3. VTK:椭圆圆柱用法实战
  4. wxWidgets:HtmlLbox wxWidgets 示例
  5. wxWidgets:wxDialUpManager类用法
  6. boost::mpl模块实现push_front相关的测试程序
  7. boost::mp11::mp_set_push_back相关用法的测试程序
  8. Boost:具有bind和weak_ptr的function_equal扥测试程序
  9. DCMTK:使用RLE传输语法压缩DICOM文件
  10. C语言创建map,遍历map