每学完一章都来写一篇博客,用来总结回顾和反思。

一、机器学习的一些简单应用

我们可以利用计算机实现基础的功能:例如计算A到B的最短路径。

但是 网页搜索、垃圾邮件的过滤、图片识别 等功能需要应用机器学习的技术,总体来说分成五个方面

1、数据挖掘,例如分析用户的点击量来分析用户习惯,更好的了解用户

2、对于某些无法直接编写代码的场景,例如无人机自动驾驶

3、NLP 自然语言处理

4、个性推荐

5、AI,像人的大脑一样

二、什么是机器学习

Arthur Samuel对机器学习的定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域(有些陈旧,不正确)。

Tom Mitchell:计算机程序从经验E中学习解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。

    机器学习算法分类:

1. 监督学习:我们教计算机做某件事情

2. 无监督学习:我们让计算机自己学习

3. 强化学习

4. 推荐系统

三、监督学习(supervised learning)

监督学习:就是我们给算法一个数据集,其中包含了正确答案。也就是说我们给它一个房价数据集,在这个数据集中的每个样本,我们都给出正确的价格即这个房子实际卖价,算法的目的就是给出更多的正确答案,例如为你朋友想要卖掉的这所新房子给出估价。

回归问题:结果是线性的(我们设法预测出一个连续值的结果)。

分类问题:结果是离散的(我们设法预测出一个离散值得结果)。

四、无监督学习(unsupervised learning)

无监督学习:就是我们已知的数据,不同于监督学习的数据一样,无监督学习中是没有任何标签的。针对数据集,无监督学习就可能判断出数据有两个不同的聚集簇。这是一个,这是另外一个,二者不同。这就叫聚类算法。

聚类应用的一个例子就是在谷歌新闻中。如果你以前从来没见过它,你可以到这个 URL 网址 news.google.com 去看看。谷歌新闻每天都在收集非常多非常多的网络的新闻内容。 它再将这些新闻分组,组成有关联的新闻。所以谷歌新闻做的就是搜索非常多的新闻事件, 自动地把它们聚类到一起。所以,这些新闻事件全是同一主题的,并会显示到一起。

所以这个就是无监督学习,因为我们没有提前告知算法一些信息。我们只是说,是的,这是有一堆数据。我不知道这些数据是什么。我不知道谁是什么类型。我甚至不知道有哪些不同的类型,你能自动地找到数据中的结构吗?就是说你要自动地聚类那些个体到各个类,我没法提前知道哪些是哪些。因为我们没有给算法正确答案来回应数据集中的数据,所以这就是无监督学习。

聚类和分类的区别:
分类:已知数据的类型,即在没有输入的时候,就知道输出的结果(如:肿瘤良性还是恶性)。
聚类:不知道数据的类型,只给数据一些特征,机器根据特征,将数据分开。

无监督学习或者聚类的一些应用:

1、它用于组织大型计算机集群。我有些朋友在大数据中心工作,那里有大型的计算机集群,他们想解决什么样的机器易于协同地工作,如果你能够让那些机器协同工作,你就能让你的数据中心工作得更高效。

2、第二种应用就是社交网络的分析。所以已知你朋友的信息,比如你经常发 email 的,或是你 Facebook 的朋友、谷歌+圈子的朋友,我们能否自动地给出朋友的分组呢?即每组里的人们彼此都熟识,认识组里的所有人?

3、还有市场分割。许多公司有大型的数据库,存储消费者信息。所以,你能检索这些顾客数据集,自动地发现市场分类,并自动地把顾客划分到不同的细分市场中,你才能自动并更有效地销售或不同的细分市场一起进行销售。这也是无监督学习,因为我们拥有所有的顾客数据,但我们没有提前知道是什么的细分市场,以及分别有哪些我们数据集中的顾客。我们不知道谁是在一号细分市场,谁在二号市场,等等。那我们就必须让算法从数据中发现这一切。

4、最后,无监督学习也可用于天文数据分析,这些聚类算法给出了令人惊讶、有趣、有用的理论,解释了星系是如何诞生的。

这些都是聚类的例子,但是聚类只是无监督学习中的一种。

Fighting!!!

吴恩达机器学习笔记——第一章相关推荐

  1. 吴恩达机器学习笔记第一周

    第一周 吴恩达机器学习笔记第一周 一. 引言(Introduction) 1.1 欢迎 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学习 二.单变量线性回归(Linear Regress ...

  2. 吴恩达机器学习(第一章)——初识机器学习

    第一章 初识机器学习 文章目录 第一章 初识机器学习 前言 机器学习定义 机器学习算法 监督学习 无监督学习 学习工具 前言 Machine Learning: Grewout of work in ...

  3. 【Nan‘s 吴恩达机器学习笔记】第八、九章 神经网络

    [Nan's 吴恩达机器学习笔记]第八.九章 神经网络 神经网络(Neural Networks) 8.1 非线性假设 8.2 模型表示 前向传播算法(Forward Propagation) 8.3 ...

  4. 吴恩达机器学习笔记整理(Week6-Week11)

    1. Week 6 1.1 应用机器学习的建议(Advice for Applying Machine Learning) 1.1.1 决定下一步做什么 到目前为止,我们已经介绍了许多不同的学习算法, ...

  5. 【经典】吴恩达——机器学习笔记001

    [经典]吴恩达--机器学习笔记001 机器学习(Machine Learning)笔记001 学习地址:[中英字幕]吴恩达机器学习系列课程 文字版参考及PPT来源:Coursera-ML-Andrew ...

  6. 吴恩达机器学习笔记整理(Week1-Week5)

    吴恩达机器学习笔记整理 1. Week1 1.1 什么是机器学习(What is Machine Learning) 1.2机器学习算法分类 1.3 单变量线性回归(Linear Regression ...

  7. 吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection)

    吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection) 对于异常检测算法,使用特征是至关重要的,下面谈谈 ...

  8. 吴恩达机器学习笔记:(四)矩阵、多元梯度下降

    吴恩达机器学习笔记 矩阵基础知识 矩阵逆运算 矩阵的转置 实践乘法 多元梯度下降 特征缩放 学习率α 矩阵基础知识 矩阵逆运算 矩阵的转置 实践乘法 多元梯度下降 特征缩放 学习率α 学习率的选择:

  9. 吴恩达机器学习笔记:(一)机器学习方法简介

    吴恩达机器学习笔记 Supervised Learning(监督学习) Unsupervised Learning(无监督学习) clustering 聚类算法 market segments 市场细 ...

最新文章

  1. ubuntu18.04上安装ffmpeg
  2. 问题(待完成):微服务,失败回滚?保持事务的原子性?多步骤调用,如何来实现...
  3. JavaScript实现graphBridges图桥算法(附完整源码)
  4. 2022.2.13java学习笔记
  5. git 创建webpack项目_webpack项目的搭建及环境构建
  6. Project Chameleon Work In Progress 12
  7. db2嵌套查询效率_详解oracle嵌套循环及实例说明
  8. 使用PowerDesigner进行面向对象分析与UML建模(转)
  9. COCO数据集合解析
  10. 攻防世界--logmein
  11. 网站打开速度优化:如何提高网页加载速度,提升网页打开速度
  12. android P-sensor (Proximity Sensor)
  13. 安全算力护航数字中国|知道创宇亮相CNCERT中国网络安全年会
  14. 机器学习算法(二十五):KD树详解及KD树最近邻算法
  15. 天猫首创“服务360”平台 赋能商家提升用户体验
  16. 单选框radio赋值 js 及Ajax,layui radio性别单选框赋值方法
  17. 太酷了!滴滴的这个黑科技,面世了!!!
  18. linux+gedit+编辑文件,GEDIT + GMATE = 实用的编辑器
  19. python下载torch库
  20. Enbean Ebean ORM JDBC Suport

热门文章

  1. 手机端设置https访问代理(windows)
  2. Oracle PL SQL 精萃pdf
  3. Android 计算Bitmap大小
  4. Pig安装与配置教程
  5. μC/OS Ⅱ之任务就绪表的操作_2012.5.31
  6. 纯Python包发布setup脚本编写示例
  7. C++静态库与动态库
  8. 转:Python Shell 清屏方法
  9. C++十进制转二进制
  10. SVM 透彻理解与分析