CV即计算机视觉,简单的来说:计算机模拟人来理解图像所表达的意思,或对图像进行一些理智的操作,比如分割,分类等等。

目前接触到的计算机视觉主要有:

图像分类(包括细粒度特征分类):将图像进行分类,该图像是飞机 ?汽车?狗?或者什么

目标定位和识别(如yolo ssd等神经网络):图像中的目标物体的位置(用框就行标注),框中物体的种类,是什么

图像分割:比如一张CT照片中,要求准确的将胃和肺切割出来

图像生产(主要利用的是GAN):可以随机产生一张特定的图像(该图像现实中不存在),比如神经网络自己根据对狗的学习,自己会自动生产一张狗的图像,该张图像人类和机器没有办法判断它不是狗,这时候他就成功了,成功的骗了机器和人类,还包括根据意境的描述生产图像等

用到的方法主要分为传统机器学习方法和深度学习:

1、传统机器学习方法:

为什么还有传统机器学习的存在--(传统机器学习方法的好处在于这些方法都已经被数学推导成立的,我们做的每一步都是有理可循,可逆向推导的,但是深度学习的神经网络就不一样了,当你的网络搭建的比较深时,其内部就像是一个黑盒子,你不知道里面是如何进行运行的,也不知道每一步的输出,比如:当你查看卷积后每一层的输出,第一层的输出可能是提取的边缘特征,那么到了第四层你根本无法理解他所表示的是什么,所以传统机器学习方法目前虽然不如神经网络的效果好,但也不可舍去,并且其中的思想很多可以被深度学习所借鉴)

传统的机器学习方法主要依赖SVM、LR、XGboost等传统的机器学习方法,这种方式也是出现比较早的方法,那么我们使用这些方法,又有一个问题了,图像是不能被这些方法所使用的,所以我们需要将图像进行转换,通常是将图像转换为一个向量,那么最简单的转换就是将图像直接展开,比如200*300*3的图像直接展开为一个(200*300*3)大小的向量,这是一种最简单的方式,但是实际效果中这样很差,制作的向量不仅表达性不好,而且又很大,对计算造成了很大的负担,那么这时候就有人提出来各种对图像做处理的方法了,最有名的是对图像做特征描述,其根本思想就是:图像的大部分信息存在于图像的边缘处,而图像的边缘信息可以被梯度来表示出来,所以就有了一种数学方式来解析图像了,其代表性的算法包括 SIFT HOG等,具体的分析可以见我之前的一个博客:Opencv SIFT SURF ORB FAST 代码以及效果对比

那么当图像可以被向量所有效的表示的时候,这时候在做一些处理就很方便了,这里简单的举两个例子:

(1)、hog+svm(或者其他分类器)

当一个图像通过hog算法可以返回一个向量,这个向量的大小和你设置的cell和block的大小有关系,假如返回的是一个(1900)的一个向量,此时面对这样大小的向量,你的第一反应该是做一下PCA,看看压缩后还可以保存的信息量,如果可以的话,就应该做降维,便于以后的计算,然后每个图像都用一个统一的合适大小的向量表示,最后直接将此作为特征送入到分类器就可以了

(2)、sift+kmeans+svm

不同于hog特征提取方法的是,sift方法返回的是描述子,也就是一个一幅图像是由多个描述子组成的,而每个描述子又是一个向量,比如一张图像可以表示为128*64,意思为该图像可以由128个描述子来描述,而每个描述子又是一个64长度的向量。

具体见我这个博客:SIFT+词袋+SVM的深入理解

2、深度学习

深度学习就相对来说比较复杂了,就目前来看已经有很多不同的网络了,这些网络也都是在CNN的基础上发展的,目前发展的趋势更倾向于一个端到端的学习,这些神经网络主要通过改变网络结构或者改变损失函数等来实现不同功能(分类,识别,切割等)。比如SSD,一个目标检测网络,其后端网络的实现也cnn,或者是摘选自某个经典网络(VGG16、Resnet)的一部分,其创新较yolo等目标检测网络主要创新在于增加了多个尺度下的feature map,提高了小物体的检测准确率。

持更。。。

CV计算机视觉(computer vision)概述--个人理解相关推荐

  1. 计算机视觉Computer Vision网址导航

    1常用网站 20条常用网站网址,更多点此 Google(gfsoso) [直达] 计算机视觉网 [直达] 增强现实资讯 [直达] 开源中国社区oschina [直达] 百度搜索 [直达] 小木虫,学术 ...

  2. 综述自动驾驶中的计算机视觉Computer Vision for Autonomous Vehicles: Problems, Datasets and State-of-the-Art(上)

    综述原文链接https://arxiv.org/pdf/1704.05519.pdf 17年CVPR上的一篇关于自动驾驶和计算机视觉的综述,比较全面,大体整理一个提纲,重点关注比较新的研究成果,侧重于 ...

  3. 计算机视觉Computer Vision领域博客资源

    视觉领域博客资源1之中国部分 这是收录的图像视觉领域的博客资源的第一部分,包含:中国内地.香港.台湾 这些名人大家一般都熟悉,本文仅收录了包含较多资料的个人博客,并且有不少更新,还有些名人由于分享的p ...

  4. 论文投稿指南——计算机视觉 (Computer Vision) 顶会归纳

    深度学习Tricks,第一时间送达 目录 (一)计算机视觉顶会 (1)ICCV:International Conference on Computer Vision (2)CVPR:Internat ...

  5. 计算机视觉Computer Vision的尴尬---by林达华

    Computer Vision是AI的一个非常活跃的领域,每年大会小会不断,发表的文章数以千计(单是CVPR每年就录取300多,各种二流会议每年的文章更可谓不计其数),新模型新算法新应用层出不穷.可是 ...

  6. 计算机视觉computer vision(CV) - 笔记1

    深度学习是什么 深度学习是机器学习算法的一种,通过模拟人脑实现相应的功能 深度学习应用场景 手机,机器翻译,自动驾驶,语音识别,医疗,安防等. 计算机视觉任务目标拆分为: 让计算机理解图片中的场景(办 ...

  7. 澳大利亚国立大学计算机学院,ANU澳大利亚国立大学机器学习与计算机视觉硕士Master of Machine Learning and Computer Vision...

    机器学习与计算机视觉硕士Master of Machine Learning and Computer Vision是澳大利亚国立大学研究生申请的热门专业,本文重点介绍了机器学习与计算机视觉硕士研究生 ...

  8. Computer Vision—计算机视觉 (一)

    Computer Vision-计算机视觉(一) (本文为总体概述,后续具体深入.原因的话,记录分享和本人水平成正比嘛~~~算是刚入门~~~) 总的来说,CV(计算机视觉)领域因为深度学习的引入,方兴 ...

  9. 转载:计算机视觉任务(Computer Vision)整理

    首发于 NLP迷路CV 写文章 计算机视觉任务(Computer Vision)整理 Fire-燚 ​ 关注他 32 人 赞同了该文章 计算机视觉是关于研究机器视觉能力的学科,或者说是使机器能对环境和 ...

  10. 基于深度学习的CVaaS计算机视觉即服务案例(Computer Vision as a Service)

    技术与技法日进千里,快速迭代过程中,真正能够留下的是应用场景的重构与对新商业范式的思考.转载请注明来源"素质云博客",谢谢合作!!微信公众号:素质云笔记 CVaaS 计算机视觉即服 ...

最新文章

  1. 解决Qt+OpenGL更换图像纹理的问题
  2. 计算机病毒按破坏性分为哪两类,计算机导论复习要点.doc
  3. python宇晨_Python 学习第11天 yield 和异常处理
  4. linux查看磁盘io带宽,[Linux] 磁盘IO性能查看和优化以及iostat命令
  5. 自定义 Javascript 模板规则,打造轻量级模板引擎
  6. 【LeetCode】剑指 Offer 11. 旋转数组的最小数字
  7. Shared File System Master Slave 全配置以及测试
  8. 重磅!公安部再度认可电子签名、电子印章法律效力!
  9. C#实现简单气泡屏保(一)
  10. CF1290F Making Shapes——数位背包DP
  11. 投机之殇——解说史上最大CPU漏洞
  12. 初学Python三周总结感想
  13. Django设置中国时区问题
  14. Android——USB转COM口(CH340)与传感器进行通讯
  15. 新版本谷歌浏览器自动运行flash
  16. elasticSearch常见问题答疑
  17. GrabCut函数使用简介
  18. 脑电必读文章:ERP经典成分汇总
  19. GD32F303CCT6与GD32F407VKTC spi 主从通信
  20. linux封包工具下载,Linux 的 ngrep 網路封包分析工具使用教學

热门文章

  1. H5直播站点运维笔记一 服务器篇
  2. tracert 显示网关到不了服务器,Tracert命令使用常见问题
  3. 静态资源文件加载错误
  4. 视频教程-HTML + CSS零基础经典教程系列-HTML5/CSS
  5. 《智能手机心率和呼吸率测量算法的前瞻性验证》阅读笔记
  6. c语言中的fbs和abs,防抱死制动系统(ABS)检测和诊断
  7. Win2003 + IIS6.0 + PHP5 / ASP + MySQL5 服务器配置及虚拟主机基本安全设置
  8. USACO 6.5.5 Checker Challenge 回溯
  9. 关于cache和cache miss
  10. 子午流注和五运六气windows版安卓版ASP网页版