吴恩达机器学习笔记——第一章
每学完一章都来写一篇博客,用来总结回顾和反思。
一、机器学习的一些简单应用
我们可以利用计算机实现基础的功能:例如计算A到B的最短路径。
但是 网页搜索、垃圾邮件的过滤、图片识别 等功能需要应用机器学习的技术,总体来说分成五个方面
1、数据挖掘,例如分析用户的点击量来分析用户习惯,更好的了解用户
2、对于某些无法直接编写代码的场景,例如无人机自动驾驶
3、NLP 自然语言处理
4、个性推荐
5、AI,像人的大脑一样
二、什么是机器学习
Arthur Samuel对机器学习的定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域(有些陈旧,不正确)。
Tom Mitchell:计算机程序从经验E中学习解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
机器学习算法分类:
1. 监督学习:我们教计算机做某件事情
2. 无监督学习:我们让计算机自己学习
3. 强化学习
4. 推荐系统
三、监督学习(supervised learning)
监督学习:就是我们给算法一个数据集,其中包含了正确答案。也就是说我们给它一个房价数据集,在这个数据集中的每个样本,我们都给出正确的价格即这个房子实际卖价,算法的目的就是给出更多的正确答案,例如为你朋友想要卖掉的这所新房子给出估价。
回归问题:结果是线性的(我们设法预测出一个连续值的结果)。
分类问题:结果是离散的(我们设法预测出一个离散值得结果)。
四、无监督学习(unsupervised learning)
无监督学习:就是我们已知的数据,不同于监督学习的数据一样,无监督学习中是没有任何标签的。针对数据集,无监督学习就可能判断出数据有两个不同的聚集簇。这是一个,这是另外一个,二者不同。这就叫聚类算法。
聚类应用的一个例子就是在谷歌新闻中。如果你以前从来没见过它,你可以到这个 URL 网址 news.google.com 去看看。谷歌新闻每天都在收集非常多非常多的网络的新闻内容。 它再将这些新闻分组,组成有关联的新闻。所以谷歌新闻做的就是搜索非常多的新闻事件, 自动地把它们聚类到一起。所以,这些新闻事件全是同一主题的,并会显示到一起。
所以这个就是无监督学习,因为我们没有提前告知算法一些信息。我们只是说,是的,这是有一堆数据。我不知道这些数据是什么。我不知道谁是什么类型。我甚至不知道有哪些不同的类型,你能自动地找到数据中的结构吗?就是说你要自动地聚类那些个体到各个类,我没法提前知道哪些是哪些。因为我们没有给算法正确答案来回应数据集中的数据,所以这就是无监督学习。
聚类和分类的区别:
分类:已知数据的类型,即在没有输入的时候,就知道输出的结果(如:肿瘤良性还是恶性)。
聚类:不知道数据的类型,只给数据一些特征,机器根据特征,将数据分开。
无监督学习或者聚类的一些应用:
1、它用于组织大型计算机集群。我有些朋友在大数据中心工作,那里有大型的计算机集群,他们想解决什么样的机器易于协同地工作,如果你能够让那些机器协同工作,你就能让你的数据中心工作得更高效。
2、第二种应用就是社交网络的分析。所以已知你朋友的信息,比如你经常发 email 的,或是你 Facebook 的朋友、谷歌+圈子的朋友,我们能否自动地给出朋友的分组呢?即每组里的人们彼此都熟识,认识组里的所有人?
3、还有市场分割。许多公司有大型的数据库,存储消费者信息。所以,你能检索这些顾客数据集,自动地发现市场分类,并自动地把顾客划分到不同的细分市场中,你才能自动并更有效地销售或不同的细分市场一起进行销售。这也是无监督学习,因为我们拥有所有的顾客数据,但我们没有提前知道是什么的细分市场,以及分别有哪些我们数据集中的顾客。我们不知道谁是在一号细分市场,谁在二号市场,等等。那我们就必须让算法从数据中发现这一切。
4、最后,无监督学习也可用于天文数据分析,这些聚类算法给出了令人惊讶、有趣、有用的理论,解释了星系是如何诞生的。
这些都是聚类的例子,但是聚类只是无监督学习中的一种。
Fighting!!!
吴恩达机器学习笔记——第一章相关推荐
- 吴恩达机器学习笔记第一周
第一周 吴恩达机器学习笔记第一周 一. 引言(Introduction) 1.1 欢迎 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学习 二.单变量线性回归(Linear Regress ...
- 吴恩达机器学习(第一章)——初识机器学习
第一章 初识机器学习 文章目录 第一章 初识机器学习 前言 机器学习定义 机器学习算法 监督学习 无监督学习 学习工具 前言 Machine Learning: Grewout of work in ...
- 【Nan‘s 吴恩达机器学习笔记】第八、九章 神经网络
[Nan's 吴恩达机器学习笔记]第八.九章 神经网络 神经网络(Neural Networks) 8.1 非线性假设 8.2 模型表示 前向传播算法(Forward Propagation) 8.3 ...
- 吴恩达机器学习笔记整理(Week6-Week11)
1. Week 6 1.1 应用机器学习的建议(Advice for Applying Machine Learning) 1.1.1 决定下一步做什么 到目前为止,我们已经介绍了许多不同的学习算法, ...
- 【经典】吴恩达——机器学习笔记001
[经典]吴恩达--机器学习笔记001 机器学习(Machine Learning)笔记001 学习地址:[中英字幕]吴恩达机器学习系列课程 文字版参考及PPT来源:Coursera-ML-Andrew ...
- 吴恩达机器学习笔记整理(Week1-Week5)
吴恩达机器学习笔记整理 1. Week1 1.1 什么是机器学习(What is Machine Learning) 1.2机器学习算法分类 1.3 单变量线性回归(Linear Regression ...
- 吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection)
吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection) 对于异常检测算法,使用特征是至关重要的,下面谈谈 ...
- 吴恩达机器学习笔记:(四)矩阵、多元梯度下降
吴恩达机器学习笔记 矩阵基础知识 矩阵逆运算 矩阵的转置 实践乘法 多元梯度下降 特征缩放 学习率α 矩阵基础知识 矩阵逆运算 矩阵的转置 实践乘法 多元梯度下降 特征缩放 学习率α 学习率的选择:
- 吴恩达机器学习笔记:(一)机器学习方法简介
吴恩达机器学习笔记 Supervised Learning(监督学习) Unsupervised Learning(无监督学习) clustering 聚类算法 market segments 市场细 ...
最新文章
- ubuntu18.04上安装ffmpeg
- 问题(待完成):微服务,失败回滚?保持事务的原子性?多步骤调用,如何来实现...
- JavaScript实现graphBridges图桥算法(附完整源码)
- 2022.2.13java学习笔记
- git 创建webpack项目_webpack项目的搭建及环境构建
- Project Chameleon Work In Progress 12
- db2嵌套查询效率_详解oracle嵌套循环及实例说明
- 使用PowerDesigner进行面向对象分析与UML建模(转)
- COCO数据集合解析
- 攻防世界--logmein
- 网站打开速度优化:如何提高网页加载速度,提升网页打开速度
- android P-sensor (Proximity Sensor)
- 安全算力护航数字中国|知道创宇亮相CNCERT中国网络安全年会
- 机器学习算法(二十五):KD树详解及KD树最近邻算法
- 天猫首创“服务360”平台 赋能商家提升用户体验
- 单选框radio赋值 js 及Ajax,layui radio性别单选框赋值方法
- 太酷了!滴滴的这个黑科技,面世了!!!
- linux+gedit+编辑文件,GEDIT + GMATE = 实用的编辑器
- python下载torch库
- Enbean Ebean ORM JDBC Suport