学习目标

机器学习实战第一章


学习内容

1. 什么是机器学习?

答:简单地说,机器学习就是把无序的数据转换成有用的信息。

2. 数据来源?

从互联网上可以获取大量的人为数据,比如某用户的购物记录,刷过的短视频记录,这占了很大一部分比例;但是另一部分非人为数据也变得越来越重要,比如传感器数据,尤其是移动手机的封装的各种小传感器数据。如何从移动计算和传感器产生的海量数据中抽取有价值的信息是一个很重要的研究课题。

3. 机器学习的主要任务?

监督学习:分类、回归;无监督学习:聚类、密度估计、特征降维。

4. 如何选择合适的算法?

  1. 首先考虑目的。如果要预测目标的值,则选择监督学习,反之,选择无监督学习。进一步来说,在选择监督学习后,如果目标变量是离散的,选择分类方法,如果是连续的,选择回归方法;在选择无监督学习后,如果进一步需要将数据划分为组别,可以选择聚类算法,如果还需要估计数据与每个组别的相似程度,则选择密度估计算法。
  2. 其次是考虑数据。数据是离散还是连续,特征值是否存在缺失、数据中是否存在异常值、某些特征出现的频率等等。
  3. 上述考虑只是缩小选择范围,并不一定是最好的,还需要考虑最后的效果。

5. 机器学习开发的步骤?

  1. 收集数据。如网络爬虫、物联网设备数据、使用公开源数据。
  2. 数据预处理。主要是为了保证得到的数据格式符合算法的输入。
  3. 分析输入数据。主要是为了保证数据集中没有垃圾数据。人工分析得到的数据是否有异常值(如空值、特别大或小的值)、能否看出规律以识别出模式、特征维度等。
  4. 训练算法。对于监督学习,利用训练集,抽取知识和信息,得到计算机可以处理的格式,方便后续使用;对于无监督学习,不需要此步。
  5. 测试算法。对于监督学习,从第四步得到知识信息,进行测试评估算法的效果;对于无监督学习,使用其他评测手段来检验算法的有效性。效果不好,可以回炉重造。
  6. 使用算法。将效果达到需求的算法转换成应用,执行实际任务。

6. 开发语言?

  1. 虽然个人认为python一点都不好用,但是大家都在用,那就勉为其难地接受它吧哈哈哈哈哈。
  2. 书中提到Python比java和C好理解(本人也不这样认为),但是python的性能并不是很好(比Java和C低),于是想出来了用python调用C代码,可谓是天秀。
  3. 让本人接受的点倒是有,比如python的矩阵运算清晰简练、有很多的第三方库比如NumPy,方便机器学习算法的实现。

认识机器学习 机器学习实战第一章相关推荐

  1. 李弘毅机器学习笔记:第一章

    李弘毅机器学习笔记:第一章 机器学习介绍 机器学习相关的技术 监督学习 半监督学习 迁移学习 无监督学习 监督学习中的结构化学习 强化学习 小贴士 机器学习介绍 这门课,我们预期可以学到什么呢?我想多 ...

  2. 【机器学习课程】第一章机器学习概述 2.机器学习

    走出狭隘的自我,生活才真正开始.-爱因斯坦 2.1什么是机器学习 机器学习的初步认识 机器学习这个术语是1959年IMB公司的亚瑟·赛缪尔提出的:教会计算机学习它需要了解的关于世界的一切,以及如何为自 ...

  3. TensorFlow 2.0深度学习算法实战 第一章 人工智能绪论

    第一章 人工智能绪论 1.1 人工智能 1.1.1 人工智能 1.1.2 机器学习 1.1.3 神经网络与深度学习 1.2 神经网络发展简史 1.2.1 浅层神经网络 1.2.2 深度学习 1.3 深 ...

  4. Android 资讯类App项目实战 第一章 滑动顶部导航栏

    前言: 正在做一个资讯类app,打算一边做一边整理,供自己学习与巩固.用到的知识复杂度不高,仅适于新手.经验不多,如果写出来的代码有不好的地方欢迎讨论. 该系列的其他文章 第二章 retrofit获取 ...

  5. python应用开发实战第一章 兽人之袭0.0.1

    第一章:采用面向对象编程实现兽人之袭文本游戏 1.采用面向对象编程实现 # python应用开发实战 #兽人之袭v1.0.面向对象编程 ''' 需求分析: 1.获得所有木屋击败木屋里的所有敌人 2.可 ...

  6. 跟老齐学python Django实战第一章错误解决

    我使用的是 Django 2.0 版本,在按第一章所说的做,出现了三个大问题,并找了答案,现在贴上来,希望能给大家小小帮助: 1) 写 models.py 的时候,执行"python man ...

  7. Kali Linux渗透测试实战 第一章

    玄魂 · 2013/12/26 16:23 作者博客:www.xuanhun521.com/ 1.1 Kali Linux简介 如果您之前使用过或者了解BackTrack系列Linux的话,那么我只需 ...

  8. [完]机器学习实战 第一章 机器学习基础(Maching Learning Foundation)

    训练集:为算法输入大量已分类数据作为算法的训练集. 目标变量:是机器学习算法的预测结果,在分类算法中目标变量的类型通常是标称型.离散型的,而在回归算法中通常是连续型的. 分类(Classificati ...

  9. 机器学习总结之第一章绪论

    [第1章 绪论] [一.知识点归纳] 1.1 引言 学习算法:机器学习所研究的主要内容,是关于在计算机上从数据中产生"模型"的算法,即"学习算法". 学习算法的 ...

最新文章

  1. 结构方程模型_简单易懂,结构方程模型思路总结
  2. intel服务器修复两个漏洞,游戏厂商:修复Intel处理器漏洞后 服务器超卡
  3. 关于c++ template的branching和Recursion的一段很好的描述
  4. c windows控制台输出颜色文字
  5. 2020Alibaba数学竞赛预选赛第二轮参考答案
  6. mysql备份到带库_RMAN备份恢复——备份到带库的性能
  7. 在linux中写php语言吗,将PHP作为Shell脚本语言使用
  8. 时间序列模型之——prophet
  9. dos命令行设置网络优先级_实用批处理:不用下软件就能 批量改名,修复网络,删除小文件...
  10. 夏昕的3部开发手册.- -
  11. python GPS解析,坐标转换,两经纬度直线距离,方位角
  12. 一文详解宏基因组组装工具Megahit安装及应用
  13. 二进制转八进制和十六进制
  14. 屏幕录像专家2014 v0318 免费版
  15. 杨辉三角形【找规律】
  16. 一个仿微博TextView 筛选,直接使用的工具类
  17. 英特尔oneAPI——异构计算学习总结
  18. 配置和安装PIA过程中的常见问题
  19. Hough transform
  20. matlab逆变器仿真程序,PWM逆变器Matlab仿真

热门文章

  1. android后台获取view,如何获取AdapterView中当前显示的项目?
  2. Java Applet基础
  3. 根据经纬度求遥感影像行列号 IDL 编程
  4. Linux 进程优先级 NICE、PRI
  5. VMware-Ubuntu安装bochs
  6. 华为(huawei)USG6000的CLI命令行综合配置之Ensp真机连接 USG6000防火墙
  7. QDir 类 -属性详解
  8. 浅谈高校实验室安全管理系统重要性
  9. PLSQL如何查看建表语句
  10. 5分钟理解CFG上下文无关文法的解析算法