计算机视觉CV的入门理解

最近开始,工作中需要使用计算机视觉CV,而博主之前没有系统学习过,因此把学习的知识记录下来,作为入门理解。

如果想要机器能够进行思考,我们需要先教会它们去看。 ——斯坦福人工智能实验室和视觉实验室主任-李飞飞

在机器学习大热的前景之下,计算机视觉与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为机器学习方向的三大热点方向。

用于自动驾驶的图像分割:


1. 计算机视觉cv

1.1 基本概念

计算机视觉(Computer vision):是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成更适合人眼观察或进行仪器检测的图像。

1.2 主要技术点

计算机视觉五大技术:图像分类、对象检测、目标跟踪、语义分割和实例分割。

1.3 应用场景

以下给出关于CV技术的使用场景:

(来自商汤):

(来自百度):

1.4 实际应用:

近几年随着人脸识别在生活中的应用场景不断增加,计算机视觉开始渐渐走入大众视野,近年来的一些实际的使用中:

  • 人脸识别: Snapchat 和 Facebook 使用人脸检测算法来识别人脸。

  • 图像检索:Google Images 使用基于内容的查询来搜索相关图片,算法分析查询图像中的内容并根据最佳匹配内容返回结果。

  • 游戏和控制:使用立体视觉较为成功的游戏应用产品是:微软 Kinect。

  • 监测:用于监测可疑行为的监视摄像头遍布于各大公共场所中。

  • 生物识别技术:指纹、虹膜和人脸匹配仍然是生物识别领域的一些常用方法。

  • 智能汽车:计算机视觉仍然是检测交通标志、灯光和其他视觉特征的主要信息来源。

除了上面这些看起来高大上的技术,其实在现实生活中,我们都有过接触类似的。比如美图秀秀里的美妆,就用到了人脸检测、人脸关键点定位的技术。百度识花,用到了通用物品识别的技术等等。

1.5 专业工具

工欲善其事,必先利其器。

OpenCV(开源计算机视觉库)是一个非常强大的学习资料库,包括了计算机视觉,模式识别,图像处理等许多基本算法。它免费提供给学术和商业用途,有C++,C,Python和java接口,支持Windows、Linux、Mac OS、iOS和Android。

在编程语言方面,我主要使用Python,计算机视觉离开计算机编程是完全行不通的。

基础技能,需要学会一些数字图像处理,它是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。


参考文献:
图片:https://www.jianshu.com/p/91de7a37d8e1
慕课:https://www.imooc.com/article/27970
李飞飞计算机视觉系列视频:https://study.163.com/course/introduction.htm?courseId=1003223001#/courseDetail?tab=1

好了,我要开始我的计算机视觉学习之旅了。

计算机视觉CV的入门理解相关推荐

  1. 入门理解计算机视觉、图形学、图像处理

    入门理解计算机视觉.图形学.图像处理 2019年后工作开始了,对于新的技术要求,盲目学习一阵子,发现还是得自己理清思路. 搞了opencv一段时间,还是对这些概念比较模糊,经过一些博客和知乎的帖子,别 ...

  2. 计算机视觉应该怎样入门?

    作者:量子位 链接:https://www.zhihu.com/question/23902574/answer/922634999 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转 ...

  3. 一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

    2020-03-06 20:00:00 计算机视觉(Computer Vision)是人工智能领域的一个重要分支.它的目的是:看懂图片里的内容. 本文将介绍计算机视觉的基本概念.实现原理.8 个任务和 ...

  4. 计算机视觉要掌握哪些知识,学习了哪些知识,计算机视觉才算入门?

    原标题:学习了哪些知识,计算机视觉才算入门? 本文来自知乎问题"学习了哪些知识,计算机视觉才算入门?需要哪些数学 编程 工具 等知识? 针对这个问题,我们邀请了微软亚洲研究院视觉计算组的高级 ...

  5. 论文经验 - 计算机视觉(CV)方向

    论文经验 - CV方向 前言 顶会顶刊介绍 顶级会议 顶级期刊 检索论文 顶会期刊官网 综合数据库 特殊检索 GitHub 公众号 搜索步骤 阅读经验 注意事项 论文命名方式 论文内容(总结) 论文代 ...

  6. 【我的OpenGL学习进阶之旅】计算机视觉 (CV) 、 计算机图形学 (CG) 以及图像处理(DIP)

    文章目录 一.计算机视觉 (Computer Vision) VS 计算机图形学 (Computer Vision) 以及图像处理(Digital Image Processing) 1.1 先说区别 ...

  7. [Embeding-2]文本表示学习-词嵌入入门理解

    转载自Scofield Phil: http://www.scofield7419.xyz/2017/09/25/文本表示学习-词嵌入入门理解/ 之前一段时间,在结合深度学习做NLP的时候一直有思考一 ...

  8. 深度学习Caffe 入门理解使用教程

    2019独角兽企业重金招聘Python工程师标准>>> 1.首先caffe 安装我就不解释了 如果有人安装不会的话 可以加我qq 1050316096 ,我会按照使用方式来介绍,首先 ...

  9. 【计算机视觉】opencv入门学习笔记Part.1

    [计算机视觉]opencv入门学习笔记Part.1 1 前言 1.1 opencv概述(摘取自百度百科) 1.2 图像概念引入 1.3 安装opencv库 2 图像基本操作 2.1 图像的读取 2.2 ...

最新文章

  1. linux进程下的线程数,Linux下查看进程线程数的方法
  2. 使用PyTorch从零开始实现YOLO-V3目标检测算法 (四)
  3. spring resource
  4. 社区计算机义务维修策划书,计协义务维修策划书(模板).doc
  5. 实验详解——parted单磁盘分区并进行配额
  6. IT运维服务管理问题总结 #F#
  7. Hadoop分布式文件系统:架构和设计要点
  8. 自适应简约数字动画404错误页面源码
  9. Ajax 和 PHP 实现验证码的实时验证
  10. android中打开pdf,在Android应用程序中打开PDF
  11. 《Windows游戏编程大师技巧》 四、GDI、控件和突发奇想
  12. vscode下载提速方法
  13. 【ANSYS APDL】提取结构刚度矩阵完整过程--附Python代码实现
  14. 安川e1000中文说明书_安川(YASKAWA)变频器E1000说明书.pdf
  15. Python网抓 2021年 获取全部沪深港股ETF股票信息 东方财富
  16. 在投射和录制时显示敏感信息时,免root授权确认框
  17. top和iostat指令的使用,linux负载,swap与内存,io
  18. html5多屏互动游戏,2017TFC深度盘点:未来H5游戏的发展趋势 重度化强社交多屏互动...
  19. 天翼物联获2022年移动物联网“先进企业”
  20. 李宏毅老师2022机器学习课程笔记 01 Introduction of Deep Learning

热门文章

  1. 电商企业如何做好经营数据分析?
  2. c语言网络编程百度云,C语言网络编程:C#网络编程(接收文件).pdf
  3. 浅谈电力线上网的前景
  4. GCC背景强大? 探寻linux系统下GCC编译器的背后故事!
  5. 关于当今大学生寒假生活的调查报告
  6. 老罗锤子手机发布会,我感到深深地愧疚
  7. Facebook中直接复制一个广告账户的广告到另外一个账户里,如何操作?
  8. Linux cpufreq 简介
  9. android 天气类应用,知否天气 - 一款简洁又有质感的天气 APP - Android 应用 - 【最美应用】...
  10. 一个简单的连续变焦红外镜头的从零开始的设计过程(zemax)(一)