文章目录

  • K最近邻法-KNN
    • N折交叉验证法
    • KNN总结:
  • 线性分类器
    • 得分函数
    • 损失函数(代价函数)
      • 损失函数1:hinge loss/支持向量机损失
      • 损失函数2:互熵损失(softmax分类器)

K最近邻法-KNN

现在用的比较少,因为其比较耗费内存,运行速度较慢

练习:
CIFAR-10数据集
60000张32*32小图片,总共10类,50000张训练和10000测试


下图第一行,左侧为大量的飞机数据,右侧第一个为需要识别的图片,而KNN只是做像素上的识别,所以第六张图还能给出一匹马,两个图片在像素上比较接近。

N折交叉验证法

就是 把训练集分成N个部分,训练其他的N-1个,使用另一个部分进行测试。这样的轮番测试,我们就可以进行训练N次。

KNN总结:

如果去做图像识别,KNN准确度不高,主要原因是
1、找不到很好的特征去表征图像。
2、要记录全部的训练数据
3、训练速度慢

线性分类器

得分函数

我们首先将一个图像进行向量化,如3232的一个彩色猫(下图所示,CIFAR-10),它可以表示成一个32323(RGB三种颜色通道)的列向量,W是每一个参数的权重 ,W为什么是103072呢,3072好解释,就是每一个向量值的对应,10是指这个向量集合中已知是十种类别,每一种类别的得分。 然而W权重的数值范围以及选取,是由数据训练得来的

损失函数(代价函数)

给定W,可以由像素映射到类目的得分
可以调整参数\权重W,使得映射的结果和实际类别吻合
代价函数就是用来衡量吻合度的

损失函数1:hinge loss/支持向量机损失


上图最后一行的说明:max里边的。结果是第一类,则第一类的得分是基本准确额,那么,13就是最终需要的数,我们将其他两种类型的得分分别减去13,正确的分类的得分,再加上一个 区别量△

区别量△:要求最终的图片各种类型的得分,要与正确的分类的得分之间相差10,才算满足条件。如这是一张猫,猫的分类得分是13,此时,狗的分类为-7之间相差20>10,则说明狗的分类得分是满足最终要求的

损失函数2:互熵损失(softmax分类器)

【深度学习】01 - 图像识别相关推荐

  1. 基于深度学习的图像识别进展:百度的若干实践

    来源:<中国计算机学会通讯> 2015年第4期<专题> 作者:都大龙 余轶南 罗 恒 等 概述:深度学习和图像识别 近年来在人工智能领域最受关注的,非深度学习莫属.自2006年 ...

  2. 论题:基于深度学习的图像识别系统

    本文为论题:基于深度学习的图像识别系统 的编写思路. 目录 摘要: 引言 2.深度学习技术及卷积神经网络原理 3.图像识别系统设计 4.实验评估与改进策略 5.改进策略及未来发展趋势 6.结论 摘要: ...

  3. 读“基于深度学习的图像识别技术研究综述”有感

    "基于深度学习的图像识别技术研究综述"总结 现在流行的图像识别技术都是基于深度学习的算法,经过前辈们的探索改进,图像识别技术经历很多阶段,现如今图像识别技术已经广泛的应用于生活的方 ...

  4. [王晓刚]深度学习在图像识别中的研究进展与展望(转发)

    [王晓刚]深度学习在图像识别中的研究进展与展望(转发) (2015-06-04 08:27:56) 转载▼     深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识别.自然语言处理.计 ...

  5. 【通知】《深度学习之图像识别》再版工作启动,欢迎指导和提出建议

    不知不觉有三第一本书也上市超过1年半了,第一次写作略显稚嫩,许多细节处理不当,比如没有在印刷前核对公式,被删掉了参考文献影响读者阅读体验等.现在本书正式启动再版工作,注意不是重印,是再版.重印只是修正 ...

  6. 【AI学院】有三AI博士小姐姐带你学深度学习之图像识别下篇,附上篇回顾

    带学营第一期(上)圆满结束回顾 有三 AI 深度学习之图像识别带学营第一期(上)圆满结束,这一期我们主要的培训内容是深度学习基础+项目实战(人脸表情识别和鸟类细粒度识别). 以上的课程可以说是干货满满 ...

  7. 【AI学院】新手如何学CV?老司机带学有三书籍《深度学习之图像识别》,赠书8本...

    为什么以及怎么学计算机视觉? 作为一个普通的程序员,如果能转型成为一个计算机视觉算法工程师,带来的不仅是高薪,还有从劳动密集型工种转化为智力密集型工种带来的"阶级跃迁".因为相对于 ...

  8. 【AI学院】老司机手把手带学言有三的经典书籍《深度学习之图像识别》,需要的赶紧上车吧...

    为什么以及怎么学计算机视觉? 作为一个普通的程序员,如果能转型成为一个计算机视觉算法工程师,带来的不仅是高薪,还有从劳动密集型工种转化为智力密集型工种带来的"阶级跃迁".因为相对于 ...

  9. 【杂谈】关于批量采购与教材试点深度学习之图像识别,模型设计,人脸图像处理书籍相关问题...

    有三已经出了3本书了,目前遇到了若干有批量购买书籍需求的朋友,同时也有若干有意愿将书籍采纳为教材的客户,现在集中回答其中一些通用问题. 三本书的内容 有三写书的最初目标就是希望它能够成为教材或者参考教 ...

  10. pytorch 图像分割的交并比_「通知」《深度学习之图像识别》再版工作启动,欢迎指导和提建议...

    不知不觉有三第一本书也上市超过1年半了,第一次写作略显稚嫩,许多细节处理不当,比如没有在印刷前核对公式,被删掉了参考文献影响读者阅读体验等.现在本书正式启动再版工作,注意不是重印,是再版.重印只是修正 ...

最新文章

  1. java中的pattern_Java Pattern的用法是什么?
  2. 网页中如何显示版权符号
  3. React文档(十四)深入JSX
  4. windows 系统下多网卡绑定/绑定配置
  5. 小马儿随笔——实地参观A级数据中心
  6. java: 找不到符号 符号: 方法 setOperation(java.lang.String) 位置: 类型为.......
  7. jquery获取下拉框的值并传递给后端处理
  8. android filehelper,为AndroidStudio开发mvp插件(MvpHelper)
  9. ElasticSearch vs. Solr
  10. 递归列出文件下的文件信息,迭代器
  11. java response 状态码_response(向客户端写入数据、对相应进行设置(状态码、响应头))...
  12. Fork/Join 框架-设计与实现(翻译自论文《A Java Fork/Join Framework》原作者 Doug Lea)...
  13. 计算机的开机键在哪里设置,笔记本电脑怎么开机 笔记本电脑开机键在哪
  14. 强哥说Java--Java接口
  15. spring使用中applicationContext.xml文件头部声明
  16. 如何下载B站(bilibili)的视频
  17. python如何不以科学计数法形式输出小数
  18. 如何在服务器上部署静态网页,让所有人都能访看到?
  19. 计算机一级无法打开office,电脑中无法运行Office2016的两种解决方法
  20. 多源数据融合 Sar Optical(一)像素级融合

热门文章

  1. 台式计算机如何拆硬盘,机械硬盘怎么拆开?台式机3.5英寸机械硬盘拆卸方法图文教程...
  2. python每日学4:vscode的安装与基础使用
  3. springboot项目启动报错:The web application [ROOT] appears to have started a thread named [xx] but has fai
  4. ug10.0许可证服务器失败,ug10.0许可错误
  5. oracle卸载ksh,oracle与ksh(Korn Shell) | 学步园
  6. IDEA中Tomcat启动后提交表单,请求的资源[/servlet_demo2/book-add.html]不可用
  7. 谈谈第一次Web项目的感想(上)
  8. java 中报错 ~[classes/:na]
  9. 移动100m宽带慢的要死_移动宽带的弊端,100兆光纤正常使用,一到晚上就犯病是为何?...
  10. C# ObjectArx AutoCAD二次开发(转帖)