机器学习基础

目录
  • 机器学习的简单概述
  • 机器学习的主要任务
  • 算法选择与开发步骤
  • Python语言的优势
一、机器学习的简单概述

机器学习应用领域十分广泛,如人脸识别、推荐系统、手写数字辨识及垃圾邮件过滤等。那何谓“机器学习”?

简单的说“机器学习”就是将无序的数据转换成有用的信息。
如:垃圾邮件过滤,一篇邮件中的某个单词不能代表该邮件的性质,但当某几个特定单词出现,再综合其他因素即可判断是否为垃圾邮件。(机器学习实战P3)

其实更官方的定义:计算机程序从经验E中学习解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。

机器学习的迅速发展得益于海量数据,下面举个书上的例子来说明机器学习过程:
场景描述:构建鸟类分类系统
任务:分类
特征:体重、翼展、脚蹼及后背颜色。(假设这四个特征就可识别一只鸟)
训练集:已收集的样本,每个样本都应包含以上四个特征,并标明是何种鸟类。
测试集:同样具备四个特征,但未标明是何种鸟类。

二、机器学习的主要任务

机器学习包括两大任务:分类和回归
分类:即找一个函数判断输入数据所属的类别,可以是二类别问题(是/不是),也可以是多类别问题(在多个类别中判断输入数据具体属于哪一个类别)。与回归问题(regression)相比,分类问题的输出不再是连续值,而是离散值,用来指定其属于哪个类别。分类问题在现实中应用非常广泛,比如垃圾邮件识别,手写数字识别,人脸识别,语音识别等。

回归:机器学习中的回归问题属于有监督学习的范畴。回归问题的目标是给定D维输入变量x,并且每一个输入矢量x都有对应的值y,要求对于新来的数据预测它对应的连续的目标值t

三、算法选择及开发步骤

如何选择合适的算法?
1.使用机器学习算法的目的,想要完成何种任务
2.需要分析或收集的数据是什么

开发步骤

  • 收集数据(爬虫、设备实测数据、公开数据等等)
  • 准备输入数据(主要是整理数据格式问题)
  • 分析输入数据(主要确保数据集 没有垃圾数据)
  • 训练算法
  • 测试算法
  • 使用算法
四、Python语言的优势

嗯、Python用起来确实蛮爽的…
推荐用Jupyter notebook、PyCharm也行啦,前者你可以像写博客那样来撸代码。

机器学习实战——笔记(第一章)相关推荐

  1. 机器学习实战:第一章

    根据方教授的建议和要求,在暑假里简单自学<机器学习实战>,记录学习过程和代码. 记 第一章是对机器学习的一些概念介绍,定义了若干专业术语.列举了很多机器学习的各类实例.给出了一个" ...

  2. 机器学习实战(MachineLearinginAction) 第一章

    机器学习包括了计算机科学,工程技术和统计学等多个学科. attributes(属性) features(特征) 特征可以是数值型,二值型(真,假),枚举型 训练集(training set) 测试集( ...

  3. 吴恩达机器学习学习笔记第一章:绪论初识机器学习

    一.   什么是机器学习(Machine Learning)?   首先学习的对象是电脑 学习指的其实就是算法 机器学习就是基于数据基于算法从数据中去提炼对事物的认知和规律 掌握了这些特征和规律后就可 ...

  4. python爬虫从入门到实战笔记——第一章爬虫原理和数据爬取

    爬虫原理和数据抓取 1.1 通用爬虫和聚焦爬虫 通用爬虫 聚焦爬虫 1.2 HTTP和HTTPS HTTP的请求与响应 浏览器发送HTTP请求的过程: 客户端HTTP请求 请求方法 常用的请求报头 服 ...

  5. 机器学习实战笔记 第二章(1)

    KNN 工作原理 有一个训练样本及,样本集中,每个数据都存在标签 我们知道样本集中每个数据与其所属分类的对应关系 输入(没有标签的)新数据后,将新数据的每个特征与样本集中(每个)属于对应的特征进行比较 ...

  6. 小吴的《机器学习 周志华》学习笔记 第一章 绪论

    小吴的<机器学习 周志华>学习笔记 第一章 绪论 近一年时间接触到不少机器学习的知识,虽然断断续续学了一些,总感觉还没有入门(只学会了疯狂调包).因此,最近开始系统学习Machine Le ...

  7. 学习《深入浅出python量化交易交易实战》第一章(笔记)

    1.学习<深入浅出python量化交易交易实战>第一章 记录学习过程中的代码和一些坑 1.1 基础(名词解释) 1.1.1 CAPM (Capital Asset Pricing Moda ...

  8. R语言实战笔记--第九章 方差分析

    R语言实战笔记–第九章 方差分析 标签(空格分隔): R语言 方差分析 术语 组间因子,组内因子,水平:组间因子和组同因子的区别是,组间因子对所有测试对象进行分组,而组内因子则把所有测试对象归为同一组 ...

  9. 深入理解 C 指针阅读笔记 -- 第一章

    上周末,我在图书馆看到了这本很薄的书 -- <深入理解 C 指针>       这本书中写的内容,个人感觉适合一个初学者,内容不是很难.我也读了下,对每一章都做了笔记,笔记都是用代码的形式 ...

  10. 机器学习实战笔记(Python实现)-04-Logistic回归

    转自:机器学习实战笔记(Python实现)-04-Logistic回归 转自:简单多元线性回归(梯度下降算法与矩阵法) 转自:人工神经网络(从原理到代码) Step 01 感知器 梯度下降

最新文章

  1. Usage and Idioms——Categories
  2. Spring学习(五)——Spring注解(一)
  3. android第一天
  4. Paper:关于人工智能的所有国际顶级学术会简介(IJCAI、ICLR、AAAI 、COLT、CVPR、ICCV 等)之详细攻略(持续更新,建议收藏!)
  5. 5 table滑动固定_内滑动钢套钢蒸汽直埋保温钢管
  6. CentOS 6.3系统安装配置KVM虚拟机
  7. html常用标签(form标签)
  8. 接口管理平台YApi
  9. OSS在线迁移服务剖析
  10. 字典排序什么意思_字典排序问题
  11. html 网页主题设置吗,如何使用css样式对html页面进行背景设置呢?
  12. 计算机视觉基础——图像处理(彩色空间互转)cpp+python
  13. 允许Sublime编辑器在Ubuntu上输入中文
  14. Flash游戏开发技术分析(上)
  15. linux dropbox自动同步,Linux免dropbox客户端备份脚本
  16. mysql主从skip1677_mysql主从复制部署
  17. qt 3d迷宫游戏_玩游戏找不到路是如何成为常态的?游戏视角选择的得与失
  18. 怎样使网页页面变黑白
  19. Eclipse安装最新SVN插件
  20. 关于亚信安全防毒墙网络版客户端的退出与卸载(2020年亲测有效,经验分享)

热门文章

  1. JSP页面%@ ...%是 什么意思
  2. 装机必备(二)---用Win10系统盘,装Win10系统(内含:如何分盘)
  3. 下载旧版本docker镜像
  4. 基于JAVA的公交调度系统
  5. C语言C程序的构成,C语言程序的构成.doc
  6. 麒麟安装tomcat
  7. Hive--时间函数大全
  8. 【Android 四大组件之Activity】一文吃透Activity 生命周期
  9. 微信号,QQ号,手机号 正则校验
  10. toxssin:一款功能强大的XSS漏洞扫描利用和Payload生成工具