文章目录

  • 前言
  • 一、什么是机器学习
  • 二、机器学习的一些应用场景
  • 三、学习机器学习的过程
  • 四、有监督学习和无监督学习
  • 五、分类和回归
  • 六、模型的泛化、过拟合与欠拟合

前言

《深入浅出Python机器学习》读书笔记,第一章概述


提示:以下是本篇文章正文内容

一、什么是机器学习

本意是指一种让计算机不经过明显编程的情况下,对数据进行学习,并且做出预测的方法,数据计算机科学领域的一个子集。

二、机器学习的一些应用场景

  1. 智能推荐。例如淘宝的商品推荐,网易云音乐的歌曲推荐
  2. 社交网络中的效果广告。给用户推送合适的广告
  3. 互联网金融中的风控系统。根据过往数据,判断当前订单是否
    是欺诈订单
  4. 新闻资讯中的内容审查。判断新闻是否是虚假新闻,或者内容
    是否违反国家 法律
  5. 其他领域。如医疗中根据病史症状和化验结果找到病因;
    智能物流、智能家居、无人驾驶等领域。
  6. AlphaGo

三、学习机器学习的过程

  1. 掌握一门语言
  2. 学习机器学习的基本概念
  3. 了解常见的算法
  4. 掌握数据处理的技巧
  5. 优化模型
  6. 动手

四、有监督学习和无监督学习

  1. 有监督学习是通过现有数据集进行建模,再用模型对新的数据样本进行分类或者回归分析的机器学习方法。有监督学习中,训练数据集一般包含样本特征变量及分类标签,机器学习使用不同的算法通过这些数据推断出分类的方法,并用在新的样本中。

  2. 无监督学习是在没有训练数据集的情况下,对没有标签的数据分析并建立合适的模型,一遍给出解决方案的方法。在无监督学习中,场景的两种任务类型是数据转换和聚类分析。数据转换的目的是把复杂数据通过非监督算法进行简化。常见的转换方法是数据降维:通过对数据集进行分析,将无关紧要的维度去除,保留关键特征。聚类是把相似特征的数据分到不同的组。

五、分类和回归

  1. 分类是对样本的类标签进行预测,判断样本属于哪个类别。通常分类是离散
    的数值。

  2. 回归分析是要预测一个连续的数值或范围。

六、模型的泛化、过拟合与欠拟合

  1. 模型的泛化是指模型用来预测新数据时的好坏,如果对新数据预测依然准
    确,说明泛化的准确度较好。

  2. 过拟合是指拟合训练数据集时拟合很好,拟合测试数据集市很差的情况

  3. 欠拟合指模型连训练数据集都拟合不好,测试数据集也很差的情况

下一篇:基于Python语言的环境配置

《深入浅出Python机器学习》读书笔记 第一章 概述相关推荐

  1. 《MAC OS X 技术内幕》读书笔记第一章:MAC OS X的起源

    <MAC OS X 技术内幕>读书笔记第一章:MAC OS X的起源 前言 1 System x.x系列 1.1System 1.0(1984年1月24日) 1.2System 2.x(1 ...

  2. Android群英传神兵利器读书笔记——第一章:程序员小窝——搭建高效的开发环境

    Android群英传神兵利器读书笔记--第一章:程序员小窝--搭建高效的开发环境 目录 1.1 搭建高效的开发环境之操作系统 1.2 搭建开发环境之高效配置 基本环境配置 基本开发工具 1.3 搭建程 ...

  3. 《Abaqus GUI程序开发指南(Python语言)》——第一章 概述1.1 简单插件实例——创建带孔板有限元模型...

    本节书摘来自异步社区<Abaqus GUI程序开发指南(Python语言)>一书中的第1章,第1.1节,作者: 贾利勇 , 富琛阳子 , 贺高 , 周正光 更多章节内容可以访问云栖社区&q ...

  4. 用Python进行自然语言处理 读书笔记 第一章

    用Python进行自然语言处理(第一章) 搜索文本 text1.concordance("monstrous")#搜索文章中的词语text3.concordance("l ...

  5. 流畅的python读书笔记-第一章Python 数据模型

    第一章 python数据类型 1 隐式方法 利用collections.namedtuple 快速生成类 import collectionsCard = collections.namedtuple ...

  6. 蜥蜴书(Hands on Machine Learning)读书笔记-第一章 机器学习landscape

    A. Geron, Hands on Machine Learning with Scikit-learn and TensorFlow. 第一章 机器学习Landscape 机器学习 机器学习就是从 ...

  7. linux鸟叔私房菜读后感,鸟叔的Linux私房菜 读书笔记 第一章

    目录dom 硬盘数学 第一章 计算机概论 知识点总结 计算机的定义为:接受使用者输入指令与资料,经由中央处理器的数学与逻辑单元运算处理后,以产生或储存成有用的资讯:程序 电脑的五大单元包括:输入单元. ...

  8. Android进阶之光读书笔记——第一章:Android新特性

    第一章 Android新特性 主要讲了一些Android 5.0.6.0.7.0新特性 1.1 Android 5.0新特性 Android 5.0 Lollipop是2014年10月发布的,那时候我 ...

  9. 《MongoDB权威指南》读书笔记 第一章 简介

    第一章 1.面向文档的数据库,不是关系形数据库 2.面向文档的数据模型可使数据在多台服务器之间分割,平衡集群的数据和负载 3.具有的功能:索引.聚合.固定集合.文件存储 4.卓越的性能,把逻辑尽量交给 ...

  10. 深入理解计算机系统第四版_《深入理解计算机系统》读书笔记 —— 第一章 计算机系统漫游...

    本书第一章沿着一个程序的生命周期,简要地介绍一些逐步出现的关键概念.专业术语和组成部分. 一.信息就是位+上下文 在计算机系统中所有的信息都由一串比特来表示. 一串相同的比特(或者几个相同的字节)可以 ...

最新文章

  1. 移动Web开发图片自适应两种常见情况解决方案
  2. html 超链接 ppt,HTML超链接要点.ppt
  3. 如何解决linux的ssh连接自动断开的问题
  4. 可以分屏的软件_Mac上的分屏功能,让你办公更高效
  5. web项目开发的基本流程
  6. SPSS16 视频教程 共17章全
  7. 盲目的相信——写在购买陆谷孙先生主编的《英汉大词典》之后
  8. 如何在Apple Watch上查看实时照片
  9. [低级错误]an attribute defined in * line * hides this method pylint (method-hidden)
  10. 十一.TensorFlow之可视化好帮手B
  11. 实战三:手把手教你实现物体识别
  12. 图片上传_RuoYi
  13. 通过流量分析,通过xposed hook#2
  14. A001-185-2521-李子泓
  15. 三极管 场效应管(MOS管) 引脚
  16. oppoR11S安装应用一直失败
  17. 华南X79主板刷黑后恢复一例
  18. 如何将string的日期转换为date的通用方法,包含正则表达处理(一)
  19. 证明与计算(2): 离散对数问题(Discrete logarithm Problem, DLP)
  20. 看聊天记录都学不会C语言?太菜了吧》(17)5分钟搞懂指针与多重指针

热门文章

  1. 个性化推荐系统实践应用
  2. 101/103/104规约应用典型问题例举
  3. 阿里中间件首席架构师钟华:《企业IT架构转型之道:阿里巴巴中台战略思想与架构实战》新书出版(含试读PDF)!...
  4. 记录蚂蚁笔记服务端的搭建过程
  5. Qt Creator使用clang-format格式化代码
  6. Django省市区三级联动
  7. UE4官方文档学习笔记材质篇——彩色半透明阴影
  8. python计算器外壳模板
  9. 树莓派4B-Python-控制L298N
  10. lwip协议栈实现服务器端主动发送,lwip协议栈源码详解说明 - 全文