斯坦福大学机器学习第一课“引言(Introduction)”
斯坦福大学机器学习第一课“引言(Introduction)”
1)机器学习定义:机器学习是人工智能的一个分支,目标是赋予机器一种新的能力。机器学习的应用很广泛,例如大规模的数据挖掘(网页点击数据,医疗记录等),无人驾驶飞机、汽车,手写手别,大多数的自然语言处理任务,计算机视觉,推荐系统等。 机器学习有很多定义,广为人知的有如下两条:
Arthur Samuel (1959): Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.
注:Arthur Lee Samuel (1901–1990) 教授是美国人工智能领域的先驱,他设计了一些下棋程序,可以通过不断的下棋来学习,从而达到很高的下棋水平。
Tom Mitchell (1998) : Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
例子:对于一个垃圾邮件识别的问题,将邮件分类为垃圾邮件或非垃圾邮件是任务T,查看哪些邮件被标记为垃圾邮件哪些被标记为非垃圾邮件是经验E,正确识别的垃圾邮件或非垃圾邮件的数量或比率是评测指标P。
2)机器学习算法的类型
1、有监督学习(Supervised learning):通过生成一个函数将输入映射为一个合适的输出(通常也称为标记,多数情况下训练集都是有人工专家标注生成的)。例如分类问题,分类器 根据输入向量和输出的分类标记模拟了一个函数,对于新的输入向量,得到它的分类结果。
2、无监督学习(Unsupervised learning):与有监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类。
3、半监督学习: 介于监督学习与无监督学习之间。
4、强化学习(Reinforcement learning): 通过观察来学习如何做出动作,每个动作都会对环境有所影响,而环境的反馈又可以引导该学习算法。
其他的类型包括推荐系统,Transduction,Learning to learn等。
3)有监督学习详解
有监督学习主要会提供一些标注样本,分为两大问题:回归和分类
房屋价格预测-回归(Regression): 预测连续的输出值(价格)
乳腺癌(良性,恶性)预测问题-分类(Classification): 预测离散的输出值(0, 1)
例子: Google News, 基因序列分析,社会网络分析,市场切分等…
特别的例子:鸡尾酒会问题(Cocktail party problem)
“ 鸡尾酒会问题”(cocktail party problem)是在计算机语音识别领域的一个问题,当前语音识别技术已经可以以较高精度识别一个人所讲的话,但是当说话的人数为两人或者多人时,语音识别率就会极大的降低,这一难题被称为鸡尾酒会问题。
鸡尾酒会问题算法(一行代码):
[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x’);
一些参考资料:
解决方法ICA demo: http://research.ics.tkk.fi/ica/cocktail/cocktail_en.cgi
http://www.vislab.uq.edu.au/education/sc3/2001/johan/johan.pdf
http://www.physorg.com/news75477497.html
http://en.wikipedia.org/wiki/Cocktail_party_effect
http://www.scientificamerican.com/article.cfm?id=solving-the-cocktail-party-problem
斯坦福大学机器学习第一课“引言(Introduction)”相关推荐
- Coursera公开课笔记: 斯坦福大学机器学习第一课“引言(Introduction)”
Coursera公开课笔记: 斯坦福大学机器学习第一课"引言(Introduction)" 注:这是我在"我爱公开课"上做的学习笔记,会在52opencours ...
- Coursera公开课笔记: 斯坦福大学机器学习第二课“单变量线性回归(Linear regression with one variable)”
Coursera公开课笔记: 斯坦福大学机器学习第二课"单变量线性回归(Linear regression with one variable)" 发表于 2012年05月6号 由 ...
- 斯坦福大学机器学习第二课 “单变量线性回归”
斯坦福大学机器学习第二课"单变量线性回归(Linear regression with one variable)" 发表于 2012年05月6号 由 52nlp 斯坦福大学机器学 ...
- 斯坦福大学机器学习第八课“神经网络的表示(Neural Networks: Representation)”
斯坦福大学机器学习第八课"神经网络的表示(Neural Networks: Representation)" 斯坦福大学机器学习第八课"神经网络的表示(Neural Ne ...
- Coursera公开课笔记: 斯坦福大学机器学习第六课“逻辑回归(Logistic Regression)”
Coursera公开课笔记: 斯坦福大学机器学习第六课"逻辑回归(Logistic Regression)" 斯坦福大学机器学习第六课"逻辑回归"学习笔记,本次 ...
- 斯坦福大学机器学习第六课“神经网络的表示(Neural Networks: Representation)”
斯坦福大学机器学习第六课"神经网络的表示(Neural Networks: Representation)" 本次课程主要包括7部分: 1) Non-linear hypothe ...
- 斯坦福大学机器学习第四课“逻辑回归(Logistic Regression)”
斯坦福大学机器学习第四课"逻辑回归(Logistic Regression)" 本次课程主要包括7部分: 1) Classification(分类) 2) Hypothesis R ...
- Coursera公开课笔记: 斯坦福大学机器学习第七课“正则化(Regularization)”
Coursera公开课笔记: 斯坦福大学机器学习第七课"正则化(Regularization)" +13投票 斯坦福大学机器学习第七课"正则化"学习笔记, ...
- Coursera公开课笔记: 斯坦福大学机器学习第十一课“机器学习系统设计(Machine learning system design)”
Coursera公开课笔记: 斯坦福大学机器学习第十一课"机器学习系统设计(Machine learning system design)" 斯坦福大学机器学习斯坦福大学机器学习第 ...
最新文章
- python同步赋值原理,Python直接赋值及深浅拷贝原理详解
- 女儿情:对于一段音乐进行频率频谱分析
- 往写好的html插入标签,写一个可插入自定义标签的 Textarea 组件
- Java 8 新特性:扩展注解(类型注解和重复注解)
- python2.7 end=号报错_python2 post 上传压缩文件编码报错
- PHP中4个包含文件方法的差异
- easydatasource能删除吗_面试官:能跟我说一下rm删除文件之后,空间都发生了什么吗?
- Centos7 完全卸载mysql5.7
- 分组卷积和空洞卷积总结
- linux 查看、关闭、后台程序 【进程】
- 一文述说人工智能(AI)发展史,几经沉浮!
- 百度地图点击出现圆圈
- ClickHouse S3 外表调研
- pdf转换成jpg python_【PyMuPDF和pdf2image】Python将PDF转成图片PNG和JPG
- Android Wi-Fi CMD汇总(基于Android 6.0-7.1)
- 酷派大观4 8970 刷android 4.4,极速达百兆! 移动4G版酷派大观4网络体验
- C/C++ 各类型int、long、double、char、long long取值范围(基本类型的最大最小值)
- 为什么大部分公司的数据库系统仍然要使用oracle?
- python小课离线版_全民编程——Python小短课,不做无头苍蝇
- 实时监控网站内容更新,微信来提醒
热门文章
- CG-CTF-Web-层层递进
- XCTF_Web_新手练习区:weak_auth
- Mac node管理器nvm
- WEB前端学习一 JS预解释
- Git 命令大全整理
- 在python中下列代码的运行结果是print abc_python与数学
- react招聘项目——使用cookie实现项目自动登录功能
- acid四大特性_深入理解MySQL的ACID四大特性原理
- 网页中的宽高度(网页视口宽高度,网页滚动宽高度,网页宽高度........)
- 微信小程序 保存持久化cookie