这个主题我很喜欢,嘿嘿~
1. 无监督特征学习
用稀疏自编码器从大量无标注数据中学习好的特征描述。
2. 数据预处理
无监督特征学习前,要对数据进行预处理。 如均值标准化,PCA,PCA白化,ZCA白化。但是需要记录下训练时的参数,即均值和U,在后面训练时要使用相同的参数。
3. 无监督特征学习的术语
自学习:不要求无标注数据和已标注的数据来自相同的分布。比如可以用汽车图像提取的W,用于摩托车的特征提取。
半监督学习:要求无标注数据和已标注的数据来自相同的分布。即要提取摩托车的特征,只能用摩托车的图像学习。
4. 把学习到的特征(W*data+b)输入到Softmax中训练model,就可以进行分类啦。
5. 教程练习
(1) 读取MINIST(手写数字库),包括图片和labels,进行如下划分:
数字0~4的图片作为有标签数据(其中一半trainData用于训练softmax模型,另一半testData用于测试)
数字5~9的图片作为无标签数据(unlabeledData),用于学习特征。
——自学习哦!
(2)程序结构
第一部分:训练
a. 把unlabeledData输入到稀疏自编码器,训练参数W1,b1。
b. 把trainData进行变换:W1*trainData+b1
得到提取的特征trainFeature.
c. 把trainFeature和对应label输入到softmax,得参数theta
现在稀疏自编码器和softmax模型都有了,下面就开始测试了!
第二部分:测试
a. 把testData进行变换:W1*testData+b1
得到提取的特征testFeature.
b. theta*testFeature,就可以进行预测了!
##后记
对稀疏自编码器提取特征的理解:在实验中能看到稀疏自编码得到的W1可视化后是一些笔画特征,有些地方称W1就是提取的特征。可以认为W1是从图像中提取出的基本组成部分,如这里的笔画;对于一个给定的图像从稀疏自编码中提取特征就是sigmoid(W1*inputData+b1),即隐藏层的激活值——这才是给定图像提取出的特征,然后把此特征送入分类器进行分类。而图像提取出的特征的每一维都可以看成是W1这些基本特征的某个线性组合运用非线性激活函数激活后的结果。

深度学习笔记4:Self-Taught Learning and Unsupervised Feature Learning相关推荐

  1. 吴恩达深度学习笔记——结构化机器学习项目(Structuring Machine Learning Projects)

    深度学习笔记导航 前言 传送门 结构化机器学习项目(Machine Learning Strategy) 机器学习策略概述 正交化(orthogonalization) 评价指标 数字评估指标的单一性 ...

  2. 深度学习笔记(转载)

    目录: 一.概述 二.背景 三.人脑视觉机理 四.关于特征 4.1.特征表示的粒度 4.2.初级(浅层)特征表示 4.3.结构性特征表示 4.4.需要有多少个特征? 五.Deep Learning的基 ...

  3. 《繁凡的深度学习笔记》前言、目录大纲 一文让你完全弄懂深度学习所有基础(DL笔记整理系列)

    <繁凡的深度学习笔记>前言.目录大纲 (DL笔记整理系列) 一文弄懂深度学习所有基础 ! 3043331995@qq.com https://fanfansann.blog.csdn.ne ...

  4. 一文弄懂元学习 (Meta Learing)(附代码实战)《繁凡的深度学习笔记》第 15 章 元学习详解 (上)万字中文综述

    <繁凡的深度学习笔记>第 15 章 元学习详解 (上)万字中文综述(DL笔记整理系列) 3043331995@qq.com https://fanfansann.blog.csdn.net ...

  5. TensorFlow 深度学习笔记 TensorFlow实现与优化深度神经网络

    TensorFlow 深度学习笔记 TensorFlow实现与优化深度神经网络 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnote ...

  6. 深度学习笔记:优化方法总结(BGD,SGD,Momentum,AdaGrad,RMSProp,Adam)

    深度学习笔记(一):logistic分类  深度学习笔记(二):简单神经网络,后向传播算法及实现  深度学习笔记(三):激活函数和损失函数  深度学习笔记:优化方法总结  深度学习笔记(四):循环神经 ...

  7. 下载量过百万的吴恩达机器学习和深度学习笔记更新了!(附PDF下载)

    今天,我把吴恩达机器学习和深度学习课程笔记都更新了,并提供下载,这两本笔记非常适合机器学习和深度学习入门.(作者:黄海广) 0.导语 我和同学将吴恩达老师机器学习和深度学习课程笔记做成了打印版,放在g ...

  8. 33万字!深度学习笔记在线版发布!

    吴恩达老师的深度学习课程(deeplearning.ai),可以说是深度学习入门的最热门课程,我和志愿者编写了这门课的笔记,并在 github 开源,为满足手机阅读的需要,我将笔记做成了在线版,可以在 ...

  9. 简单入门——深度学习笔记(Part II)

    更多深度文章,请关注:https://yq.aliyun.com/cloud 作者介绍:Deepak Shah Deepak Shah毕业于德克萨斯奥斯汀分校,徒步旅行爱好者,目前是深度学习\数据科学 ...

最新文章

  1. if(a==1且a==2且a==3),有没有可能为true?
  2. 小冰超级自然语音技术发布!PK真人真假难辨,同时获独角兽轮融资
  3. linux anacron 定时任务 计划任务
  4. Linux 内存管理 | 地址映射:分段、分页、段页
  5. oracle更改文件,Oracle修改数据文件名以及移动数据文件
  6. raw input()和input区别
  7. ## __VA_ARGS__ ... 宏和可变参数
  8. 随机产生13个0~51不同的随机数 -思想(定义参考系)
  9. 『中级篇』Docker-Stack部署wordpress(49)
  10. 基于Spring Boot2 + Spring Security OAuth2 实现单点登陆(二)
  11. python把英语句子成分字母_英语句子成分分析(最完整版)
  12. 加密与启示录:Crypto是流着奶与蜜的“应许之地”
  13. PADS-VX入门到精通实战项目讲解(下)—layout部分-覃小刚-专题视频课程
  14. Sass扫码点餐源码 单门店多门店餐饮连锁扫码点餐外卖自提系统源码
  15. Unix和Linux之间的区别?什么是bash?常用的linux命令
  16. 论举办黑客马拉松能为企业带来什么好处| 黑客松| 极客马拉松
  17. 局域网里如何访问wifi路由器下的设备?
  18. APP如何进行性能测试?
  19. python面向对象编程开胃菜
  20. 机器学习实战:信用卡欺诈检测

热门文章

  1. mysql能用case嵌套sql吗,关于sqlserver中查询语句中嵌套case语句使用方法
  2. 如何用mysql创建orders表_《MySQL必知必会》学习笔记
  3. tenginx配置负载均衡
  4. 计算机网络:浅谈HTTPS和加密
  5. Linux用户态协议栈好处,关于用户态协议栈的思考
  6. java linux 面试题_java 面试题
  7. python一些常用方法_python 的一些常用方法
  8. win2003禁止web等目录执行exe,bat,com的方法
  9. Java 读写Properties配置文件(转)
  10. docker实战——构建Jekyll