2020.09.17 星期三课程笔记

1.学习资源

(1)在线课程

①清华学堂在线-袁春老师的《大数据机器学习》
②李宏毅的机器学习课程(中文)
③林轩田《机器学习基石上下》(中文)
④CV Stanford Li Feifei CS231N
⑤NLP Stanford CS224N
⑥Machine Learning: Andrew Ng 个人推荐这个可以看看
⑦Neural Networks for Machine Learning: Geoffrey E. Hinton

(2)参考书


其中以李航老师《统计学习方法》第二版为主要教材,南大周志华老师的“西瓜书”《机器学习》为辅,有兴趣还可以看看第三本《PRML》和最后一本“鲜花书”《Deep Learning》

2.期末考核方式

3.机器学习(Machine Learning)是个啥

(1)机器学习的定义

其实没有标准定义,各有个的说法,常见的有以下几种定义:
① “机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。
② “机器学习是对能通过经验自动改进的计算机算法的研究”。
③“机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。”
④ A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

(2)机器学习相关概念

以后在教材及论文中会经常遇到这些词
Artificial Intelligence 人工智能
Deep learning 深度学习
Data mining 数据挖掘
Computer vision 计算机视觉
Statistical learning 统计学习
AI\ML\DL有以下包含关系

Q1:Representataion Learning 是什么?
表示学习,具体见下面链接
https://blog.csdn.net/u010417185/article/details/83089882
注:MLP 多层感知机
ML 数据分析工具
DB 数据管理工具

机器学习和统计学习关系密切,有人提出这个公式

4.机器学习发展历程

起源于,1956年达特茅斯会议

用一张图片展示主要几种算法发展过程

Convolutional Neural Network 卷积神经网络(CNN)
Hinton等人提出,2012年在ILSVRC大方异彩,大幅度降低了错误率。
注:人类分类错误率5.1%
内部结构图我还没看明白


图灵奖三位大佬及其工作

机器学习两大顶会: ICML & NeurIPS
发展报告上呀近十年最佳论文,有时间可以看看

5.迁移学习

形象理解:比如你会打乒乓球,那么学习打羽毛球就更容易。

从源模型迁移到目标模型上:

有一说一,这个公式没懂呀!

6.强化学习

2016年Alphago以3:1战胜围棋大师李世石;
AlphaZero不需要专家数据,通过自训练(Self-Play)进行学习和评价
以3:0战胜围棋世界冠军柯洁

在星战游戏上,AlphaStar所向披靡!

7.思考深度学习的问题


众所周知,神经网络可解释性是真的差,只看最终结果无法判断问题出在哪里。如何透明化,是个问题?

好了,第一节先到这啦!下课!

大数据机器学习(一)概述相关推荐

  1. 大数据机器学习系统研究进展

    要实现高效的大数据机器学习,需要构建一个能同时支持机器学习算法设计和大规模数据处理的一体化大数据机器学习系统.研究设计高效.可扩展且易于使用的大数据机器学习系统面临诸多技术挑战.近年来,大数据浪潮的兴 ...

  2. 大数据+机器学习#x3D;天下无敌!

    通俗的说,机器学习就是基于一些高度复杂的算法和技术,在一个非生命的物体.机器或系统中构建人类行为.制造一台能够符合数十亿用户期望的人脑复制品的机器绝不是一件容易的事.但也有一些项目正在解决基于情境.情 ...

  3. 2015年《大数据》高被引论文Top10文章No.7——大数据机器学习系统研究进展(上)...

    2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将把2015年<大数据>高被引论文Top10的文章陆续发布,欢迎大家关注!本文为高被引Top10论文的No.7, ...

  4. 《大数据》第1期“专题”——大数据机器学习系统研究进展(下)

    6 跨平台统一大数据机器学习系统Octopus的研究设计 6.1 Octopus的基本设计思想 上述绝大多数大数据机器学习方法和系统都是基于特定平台构建的,难以集成和兼容现有和未来出现的多种大数据处理 ...

  5. 《大数据》第1期“专题”——大数据机器学习系统研究进展(上)

    大数据机器学习系统研究进展 黄宜华1,2 1.南京大学计算机软件新技术国家重点实验室 南京 210023: 2.南京大学PASA大数据技术实验室 南京 210023 摘要:要实现高效的大数据机器学习, ...

  6. 一个案例告诉你如何使用 Kyligence + Spark 进行大数据机器学习

    导语:今天,大数据.数据科学.机器学习分析不再只是热词,已经真实地渗透于生活方方面面.根据福布斯,到2025年,全球每年将会有 175 泽字节的数据产生.Kyligence的诞生为企业带来了极速的大数 ...

  7. 大数据云计算技术概述_云计算–概述,类型,优势和未来范围

    大数据云计算技术概述 Cloud Computing is a type of online on-demand service that includes resources like comput ...

  8. 大数据 机器学习 分类算法_13种用于数据科学的机器学习分类算法及其代码

    大数据 机器学习 分类算法 The roundup of most common classification algorithms along with their python and r cod ...

  9. 使用Java+SSM框架+JSP开发简单在线电影推荐网 电影推荐系统 豆瓣电影爬虫 基于用户、物品的协同过滤推荐算法 大数据 机器学习 SimpleMovieRecommendOnline

    使用Java+SSM框架+JSP开发简单在线电影推荐网 电影推荐系统 豆瓣电影爬虫 基于用户.物品的协同过滤推荐算法 大数据 机器学习 SimpleMovieRecommendOnline 一.项目简 ...

最新文章

  1. (解释)单片机与各种外围设备(Flash、RAM、网络控制器、A/D、传感器、MCU等)进行直接串行通信通常采用( D)接口
  2. Python之路(第九篇)Python文件操作
  3. JavaScript函数的反应性
  4. hubbledotnet 远程连接提示:无法从传输连接中读取数据:远程主机强迫关闭一个现有的连接...
  5. Axis通过wsdd部署Web Service
  6. 开源硬件 可穿戴_11个出色的可穿戴开源项目
  7. 7.边缘检测:2D运算——Canny边缘原理、Canny边缘检测器、Canny-Matlab实战_2
  8. 人工智能(9)---人工智能的发展趋势是什么?人工智能的行业应用
  9. WiFi穿透能力甩对手两堵墙 荣耀9X新特性令人侧目
  10. Linux重器 vi编辑器
  11. lucene案例demo
  12. 迭代收缩阈值算法matlab,一种基于自适应快速迭代收缩阈值算法的图像处理方法与流程...
  13. js判断浏览器是pc端还是手机端
  14. android 原生控件,抽离Android原生控件的方法
  15. Oracle逻辑读,物理读
  16. 基于JavaEE的游泳馆管理系统_JSP网站设计_SQLServer数据库设计
  17. javascript通过组合实现继承
  18. javaee实训报告总结_JavaEE实训报告.doc
  19. 百度网盘NDM高速下载
  20. 利用js本地读取excel文件

热门文章

  1. qspi AHB总线学习 - 01
  2. 情迁qq机器人图文api调用
  3. 利用python分析电商_某电商平台数据分析报告(1)
  4. 可持续化集成(九)之Jenkins项目构建细节
  5. 计算机专业自我总结100字,大学生自我总结100字.pdf
  6. 《tzoj5024》大数除以小数
  7. Tezo Lentil 零豆无线蓝牙耳机:包装精美,品质感佳
  8. spring boot 2.1学习笔记【二十】SpringBoot 2 freemarker bootstrap 集成
  9. C# 中什么是GUID?
  10. 水果店圈子:开小的水果店投资多少钱,开个水果店都需要什么费用