说到机器学习总绕不过几个鼎鼎大名的人物,他们都创造了不少的机器学习资料,斯坦福吴恩达Andrew Ng的公开课CS229;Google李飞飞的CS231、周志华的、李航的《统计学习方法》、林轩田的《机器学习基石》、Peter Harringtond 的《机器学习实战》、周志华的《机器学习》(西瓜书,书中都是拿西瓜举例子)。

CS229的官方网站是http://cs229.stanford.edu/,网易公开课视频地址是http://open.163.com/special/opencourse/machinelearning.html,可以同时下载打包的课件,b站也可以看https://www.bilibili.com/video/av9909092/index_25.html。知乎大神CycleUser翻译了笔记,托管在github上https://github.com/Kivy-CN/Stanford-CS-229-CN/,还上传了百度云:https://pan.baidu.com/s/1kV4vDEv#list/path=%2F。百度文库也有一份个人笔记:https://wenku.baidu.com/view/99b86f70650e52ea54189862.html。知乎上面有人对机器学习的资源进行了整理<em>机器学习</em>该怎么入门? - 张松阳的回答 - 知乎https://www.zhihu.com/question/20691338/answer/53910077,但我觉得还是不要图多,好好钻研才重要。

本课程主要介绍机器学习和统计模式识别。主题包括:监督学习(生成/鉴别学习、参数/非参数学习、神经网络、支持向量机support vector machines);无监督学习(聚类clustering、降维、核方法);学习理论(偏差/方差权衡;风险投资理论VC theory;大的利润);强化学习和自适应控制。该课程还将讨论机器学习的最新应用,如机器人控制、数据挖掘data mining、自主导航、生物信息学、语音识别、文本和web数据处理。

第一课中,前半部分Ng主要照着handout简单说了一些课程的设置,需要掌握基础的统计知识,说明会有project,项目要求掌握matlab或者Octave。现在看来Python应该会是更好的选择,不仅可以调用matlab模块,还可以调用现成的机器学习算法包scikit-learn:http://scikit-learn.org/stable/。然后,Ng讲了什么是机器学习。1959年Arthur samuel定义机器学习是在不直接针对特定问题编程的情况下让机器具有特定学习能力的的领域。他写了一个下棋的程序,在程序自己和自己下了很多遍之后,程序可以知道说明会导致输赢。这也反驳了程序只会做明确指定的功能的言论。在1998年Tom Mitchell做了一个更加现代的定义:

对一个计算机来说,在拥有经验E和评价标准P,可以自己提升对任务T的性能,就可以称作机器学习。在表述中不仅做出了定义,还很押韵。

接下来对课程做一个整体的把握。分成四个部分

第一部分是有监督的学习supervised Learning。Ng举了一个房屋价格的例子。有一些是统计出来的,房屋面积和价格一一对应。当我们想要知道一个新的房屋价格,却只知道它的面积时,就可以根据之前采集的数据画出的曲线来预测。之前的几组数据看作是标准答案,所以叫监督,我们希望机器学习输入和标准答案之间的对应关系。这种问题就是回归问题,Regression Problem,Regression这个词也反映了我们预测的数据是连续的。另一个监督学习类的问题是分类问题。在分类问题中是离散的。Ng举了肿瘤的例子。为了简单起见,只考虑肿瘤的大小,和对应是否是良性肿瘤。而实际中输入的特征往往是多维的,比如肿瘤的大小,患者的年龄,肿块厚度等。通过学习现有的数据,判断新来的病人的肿瘤是否是良性。多维输入的情况下,我们不能将点画在平面中,可以用支持向量机SVM映射到计算机内存中

第二部分,Learning Theory。Ng的一般数学家朋友致力于揭示宇宙中的真美,但是Ng希望用机器学习解决实际的问题。什么样的算法可以近似不同的函数,需要多少训练数据。它只是一种工具,和木匠的锤子一样,真正的木匠能用工具解决其他人无法解决的问题。

第三部分是Unsupervised Learning,非监督学习。这中无监督的学习中我们事先不知道输入数据的标准答案,只能自己找到一些有趣的数据结构。有一个学生用聚类技术对图像的像素进行分类。进阶地,利用聚类的结果,实现了通过单幅图像建立了3D模型。还有社交网络分析,市场分析,宇宙星系分析。还有一个例子是鸡尾酒会,很多人在谈话,希望把感兴趣的人的声音单独分离出来。用matlab的一行代码就可以解决,实现了ICA算法。

第四部分是Reinforcement Learning,预测肿瘤属性的例子中,错判的代价是很大的。Ng展示了他做的无人直升机的例子。直升机可以实现四脚朝天飞的特技。这很难由人工之间直接写程序来实现。背后的一个基本概念是reward function汇报函数,就像像训练狗一样,做对事情的时候,就给以奖励。这时候我们只需要定义什么是好的积极的行为,机器会学习如何获得最大的回报。

还有很多人对机器学习不以为然,其实机器学习确实只是一种工具,还是需要建立在专业知识之上。好的木匠在动手之前在脑海中已经有一件伟大的作品了。

吴恩达斯坦福大学机器学习 CS229 课程学习笔记(一)相关推荐

  1. 吴恩达斯坦福大学机器学习 CS229 课程学习笔记(二)

    终于要开始正式的学习了.看了第一节课最大的印象是Ng老师的优雅,儒雅,偏英式的发音(突然意识到他从小在伦敦长大).配着字幕看的视频,但还是希望能锻炼一下自己的听力,也只有在自己看过一遍印象才深刻,别人 ...

  2. 马斯克称自己不喜欢做CEO,更想做技术和设计;吴恩达的《机器学习》课程即将关闭注册|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  3. 马斯克称自己不喜欢做CEO,更想做技术和设计;吴恩达的《机器学习》课程即将关闭注册|极客头条...

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  4. 斯坦福大学数据可视化课程学习笔记:第一节 可视化的发展与目标

    <斯坦福大学数据可视化课程学习笔记>课程资源来自于斯坦福大学数据可视化课程,是我所在团队实习生提升计划的一部分.本系列是 "秉姝" 同学在学习过程中记录和整理的学习笔记 ...

  5. 斯坦福大学数据可视化课程学习笔记:第二节 从数据到图像

    <斯坦福大学数据可视化课程学习笔记>课程资源来自于斯坦福大学数据可视化课程,是我所在团队实习生提升计划的一部分.本系列是 "秉姝" 同学在学习过程中记录和整理的学习笔记 ...

  6. 吴恩达deeplearning.ai五项课程完整笔记了解一下?

    来源:机器之心 本文共3744字,建议阅读8分钟. 通过本文为大家解读如何构建自然语言.音频和其他序列数据的模型. 自吴恩达发布 deeplearning.ai 课程以来,很多学习者陆续完成了所有专项 ...

  7. 吴恩达《构建机器学习项目》精炼笔记(1)-- 机器学习策略(上)

    AI有道 不可错过的AI技术公众号 关注 重要通知 本公众号原名"红色石头的机器学习之路"已经改名为"AI有道",请大家留意并继续关注本公众号!谢谢! 1 Wh ...

  8. 有人把吴恩达老师的机器学习和深度学习做成了中文版

    近年来 AI 越来越火,吴恩达是被公认的人工智能(AI)和机器学习领域国际最权威的学者,他一直致力于普及.宣传.推广 AI 教育,包括最前沿.最火爆的 AI 基础课程.深度学习课程等等.惠及全球超过 ...

  9. 吴恩达老师的机器学习和深度学习课程笔记打印版

    注意:下载笔记.视频.代码:请点击"阅读原文" 我和同学将吴恩达老师机器学习和深度学习课程笔记做成了打印版,放在github上,下载后可以打印. 公布了深度学习笔记的word和ma ...

最新文章

  1. LintCode: Edit Distance
  2. (0109)iOS开发之CocoaPods Mac App的安装和使用
  3. 斯坦福机器学习视频笔记 Week6 关于机器学习的建议 Advice for Applying Machine Learning...
  4. supervisor 守护多个进程_supervisor管理守护进程
  5. gpio的8种工作模式_Stm32之GPIO工作模式简介
  6. 复习知识点:UITableView和UICollectionView的常用属性
  7. linux 权限提示信息,命令行快速提示:权限进阶 | Linux 中国
  8. 【计算机系统设计】实践笔记(2)数据通路构建:第一类R型指令分析(1)
  9. 写在S3C2440A平台+winCE5.0+NAND +HIVE注册表的实现
  10. 各层电子数排布规则_原子核外电子排布原理
  11. web界面左边菜单设计_前端产品经理难点|“取消按钮”逻辑设计
  12. windows 2003 远程桌面无法使用剪贴板共享纯文本的解决方法(亲测可用)
  13. python-math函数
  14. 微信小程序-实现tab选项卡
  15. 如何将iPhone投屏到Mac电脑上?
  16. Python TypeError: cat() takes no arguments
  17. Apple News+收入滑铁卢,苹果“all in 软服务”能否留住用户?
  18. spark sql boardcast join 生效问题探索
  19. yolov4离线安装笔记
  20. 游戏中的造型师——3D美术

热门文章

  1. Github星标超3k的推荐系统入门资料合集(含教程、论文、代码、数据)
  2. Spring Cloud实战小贴士:版本依赖关系
  3. 论文浅尝 - AAAI2021 | 基于对比学习的三元组生成式抽取方法
  4. 技术动态 | 跨句多元关系抽取
  5. 论文浅尝 | 从知识图谱流中学习时序规则
  6. 领域应用 | 企业效益最大化的秘密:知识图谱
  7. SiameseSentenceSimilarity相似句子匹配分类项目
  8. Mysql data type(数据类型)
  9. 10分钟 在linux里创建.net core helloworld控制台程序
  10. 一ElasticSearch安装启动