【清华AI自强计划】-第三讲课程笔记-1

数据归一化中的“一”是什么意思?

将不同变量的量纲都转化为1,消除单位的影响。
几种归一化方法:
1、范围(-1,1)

2、范围(-1,1)

3、

以\mu为均值,以\sigma为方差

明确课程定位:

垂直行业从业者&爱好者:

听课目标:0->0.5 定性理解,专注落地

算法科学家:

听课目标:0->1 初步入门,加强算法
提升方法:共享论文

AI工程师:

需要的代码工程能力更强,和真实业务环境相结合,如大量数据需要并行计算,有项目需要上线
听课目标:0->1 初步入门,加强代码 能力
提升方法:工程问题,做作业的时候将每个函数都弄清楚,再做些上下游的工作,如数据是怎么爬取的,将项目上线等。

第三讲目标:训练“识别手写数字”的算法

数据集介绍:
MNIST:
M 指是modified,原来数据集用高中生和公务员的手写数字分别作为测试集和训练集,modified版本将其混合,即将测试集和训练集混合。

如何用逻辑回归解决这一问题?(用二分类解决十分类的问题,One vs All)
训练10个分类器,每个分类器只打1个类别,想解决10分类的问题,训练10个分类器即可。(A defense of one-vs-all classification)
计算机看图是一个数字矩阵:

60000个图片样本,每个样本对应2828的维度,形成上图右边的输入矩阵。
训练结果:样本数量设置为55000时,最后输出预测精度刚超过50%:泛化能力不行。
而当训练样本数为500时,预测精度反而达到90%。
为什么样本数量少,精度反而更高呢?
拟合出来的模型相当于在28
28维度的空间中画出决策边界,样本数非常少,以至于随便画条线都可以很好把样本分隔开。

NN神经网络的历史渊源:
生物学神经元衍生出数学模型:

小于一个阈值不激活,大于一个阈值将数据往后传。
神经元多了–>感知机——>(有监督)BP神经网络
无监督:布尔计算机

如何了解一个新模型?

1、了解模型是什么样子的——参数是什么,参数怎么输入
2、了解参数的更新方式
触及到核心知识时是没有任何捷径的,要仔细弄懂每个符号,每个运算过程。

神经元结构图


只有输出没有输入的圆圈代表偏置,作用是让拟合曲线离开原点
输入层和输出层的神经元个数是确定的。

输入层:输入层神经元个数为特征个数
输出层:二分类输出层只有一个,多分类情况下分类类别等于输出层神经元个数。
隐藏层:神经元个数任意指定。

前馈传播示意图解析:
上图中字母上角标括号内的数字代表层数
a,z,x下角标为在此层中的序号
w为模型参数,下角标有两位,前面一位为指向神经元的序号, 后面一位是自己的序号。
全连接:前层每一个神经元和下一层所有神经元都要相连


变量及参数解析:

信号传导下一层神经元先加和到z,再经过激活函数输出a。

矩阵化表示,更加简洁:
第二层的z等于第一层的权值乘以数值。

【清华AI自强计划-计算机视觉课程-第三讲课程笔记1】相关推荐

  1. 干货 | “青年AI自强计划项目”首节讲座视频、课件分享

    由清华数据科学研究院主办的青年AI自强计划项目(原"AI青年人才培养项目")第一期培训讲座于9月29日晚在清华大学第二教学楼401顺利开展.讲座前期吸引了近千人报名,现场两百多人的 ...

  2. 【完结】有三AI阿里云的深度学习基础课程暂时完结,欢迎扩散学习

    2021年3月份有三AI与阿里天池联合推出了深度学习系列课程, 课程内容包括人工智能与深度学习发展背景,深度学习典型应用,卷积神经网络,循环神经网络,生成对抗网络,深度学习开源框架等内容,目前已经基本 ...

  3. 【清华AI公开课】雷鸣、徐小平开讲:别害怕BAT,AI领域投的钱还不够多

    此次课程开幕式活动上,清华大学理学院院长宫鹏教授.信息科学技术学院朱军副教授.在线教育办公室于世洁教授先后致辞. 宫鹏教授简要地回顾了全球农业.工业和信息革命,指出过去数十年推动社会巨变的主要动力之一 ...

  4. Google AI Residency 计划集锦

    文 / Google AI Residency 计划经理 Phing Lee 2016 年,我们迎来了 Google Brain Residency 首期学员,这 27 位学员将通过一个为期 12 个 ...

  5. 【清华 AI 公开课】IJCAI理事长杨强:人工智能在企业的落地是一门大学问

    在课程开始,雷鸣老师先概述了对产业有较大影响的技术,以及未来将发生的演变. 从技术角度看,未来对产业产生比较大影响的技术有: 基于视频的信息理解和处理技术 .现在,基于静态的图片的处理技术,比如人脸识 ...

  6. 发展第三代AI:清华AI研究院基础理论研究中心成立,朱军任主任

    https://www.toutiao.com/a6687778128141484552/ 人工智能正处在高速发展时期,而清华的研究人员却早已意识到了目前方法的局限,并放眼于下一代技术上了.5 月 6 ...

  7. 全球高校CS实力最新排行:清华AI界第二,中科院视觉领域最强

    铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 全球计算机科学专业最新实力排行刚刚出炉了. 全球各大高校CS专业哪家强?AI领域谁能称王?过去一年和过去十年排名又有什么变化? 在这份CSR ...

  8. 阿里云携手NVIDIA拓展AI培训计划

    来源:ATYUN AI平台 NVIDIA深度学习学院将联手阿里云培训与认证平台阿里云大学和云栖社区,在阿里云异构计算平台合作推出AI相关的在线培训.阿里云将会充分利用云端NVIDIA CPU的强大优势 ...

  9. 快讯丨 “工业大智 戴卡制造” 清华AI大数据走进中信戴卡

    6月14-15日,由中信戴卡.清华校友总会.清华大学人工智能研究院.数据科学研究院共同主办,信智公司.清华校友三创大赛组委会.清华校友总会AI大数据专委会.清数D-LAB联合承办的"清华AI ...

  10. “AI助力计划”上线,3D点云等标注工具1折起

    京东众智是京东数字科技旗下聚焦于人工智能领域的AI数据标注与采集平台,致力于通过技术革新高效生产AI所必须的训练数据集,并为客户提供多元化的高质量AI数据解决方案. 近期,京东众智推出了"A ...

最新文章

  1. php文本分割成csv,php将文本文件转换csv输出的方法
  2. sqoop 导入到hive字段全是null_Sqoop 一点通
  3. live555推流rtsp_Hi3518 RTSP推流
  4. 谷歌android go 销量,谷歌Android Go进入尴尬期:目前仅十多个App专门适配
  5. ActiveXObject文件读写
  6. Lesson5 How to open a new window from a pushbutton
  7. 网页左侧固定菜单栏的展开与收起
  8. 设计模式之Flyweight模式(笔记)
  9. VIIRS SDR数据预处理(一)
  10. 不确定性原理的前世今生 · 数学篇(一)
  11. Java旅游管理系统本科生毕业设计开题报告
  12. sql_全国省市区、邮编、经纬度、城市拼音、电话区号
  13. c语言家庭财务管理算法,c语言家庭财务管理报告.doc
  14. 单播、广播、组播的区别和特点
  15. 如何被猎头猎杀:猎头慕名而来的绝招
  16. 人体自身的神奇补肾法 ——你在外面花多少钱都学不到的
  17. 关于访问权限控制问题
  18. 如何批量重命名多张图片
  19. 微软os snmp服务器,windows服务器snmp v3
  20. 企业注销要谨慎,这些注意事项你要知道

热门文章

  1. [BFS]愿天下有情人都是失散多年的兄妹
  2. C#【文件操作篇】PDF文件和图片互相转换
  3. echarts地图api series_使用echarts结合百度地图API做迁徙图
  4. 4根网线水晶头接法(8根只接4根即可通讯)
  5. 如何撰写和发表SCI论文
  6. Flutter TV应用的开发尝试
  7. 2022-2028年中国全屋定制行业发展动态及投资前景分析报告
  8. 用CSS来实现一些动画在vue中使用之流星滑过(3)
  9. 网络模型(看这一篇就够了)
  10. 中国历史上水平最高的十首诗词,你都读过吗?