计算机视觉的终极目标:让计算机自动理解图片(视频)的内容。
这个终极目标的核心其实可以拆解为一下几个任务:
1. 让计算机理解图片的场景(咖啡厅, 教室, 博物馆, 等等),
2. 理解场景中包含的物体(餐具,交通工具,人, 动物等等),
3. 理解物体所在图片中的位置(bounding box边界框的坐标, 物体的边界点),
4. 理解物体之间的关系和行为(是在交谈, 体育比赛,对抗, 等等), 以及图片所表达的抽象含义(例如表达讽刺挖苦, 暴力色情, 艺术,宗教的神圣, 大自然的壮阔, 节日的喜庆, 等等)。

如果我们可以让计算机做到这些,那么这个计算机视觉的终极目标就是可以达成的。而这些拆解完成的任务,单独或结合,也都构成了计算机视觉领域,今天在工业界和企业界中的的重要应用点。

转载链接:https://mp.weixin.qq.com/s/2VbHwigMdIHkAzynvKoDsQ

计算机视觉的终极目标相关推荐

  1. 计算机视觉——百度百科

    计算机视觉是一门研究如何使机器"看"的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别.跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送 ...

  2. 模式识别,计算机视觉,计算机图形学,智能控制,信号处理,语音识别,知识处理,机器学习,数据挖掘领域区别

    1.人工智能:给机器赋予人类的智能,让机器能够像人类那样独立思考.当然,目前的人工智能没有发展到很高级的程度,这种智能与人类的大脑相比还是处于非常幼稚的阶段,但目前我们可以让计算机掌握一定的知识,更加 ...

  3. 浅谈计算机视觉、机器视觉、图像处理

    图像处理与计算机视觉是计算机科学的一个分支,而机器视觉是系统工程的一个特殊领域,属于多 学科交叉应用.它们在理论上存在一定的交叉重叠,但各自关注的侧重点不同. [图像处理] (数字图像一般指数字图像处 ...

  4. 计算机视觉与图像处理

    图像处理技术的一般包括图像压缩,增强和复原,匹配.描述和识别3个部分.其中图像压缩技术,可以帮助进行快速且不失真的信息传递:图像增强和复原可以帮助人们更好的获取图像的信息,使模糊的图像变得清晰,如去雾 ...

  5. CVPR 2022大会主席、港科大教授权龙:计算机视觉的现状与未来

    来源:AI科技评论 本文约5200字,建议10+分钟. 权龙教授发表了题为<三维视觉重新定义人工智能安防>的演讲. 近日,由雷锋网主办的第二届中国人工智能安防峰会在杭州召开. 峰会现场,香 ...

  6. 深入探讨:视觉的目的是什么?

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自丨极市平台 导读 视觉的目的是什么?设计匹配亦或是分类.作 ...

  7. 图像基础知识 —— Opencv图像处理

    1.数字图像概念 数字图像: 数字图像,又称为数码图像或数位图像,是二维图像用有限数字数值像素的表示,由数组或矩阵表示: 数字图像可以理解为一个二维函数f(x,y)f(x,y)f(x,y),其中x和y ...

  8. CheetahLab:2018中国人工智能报告

    前言 从语音识别到智能音箱,从无人驾驶到人机对战,近年来,人工智能给人类社会带来了一次又一次惊喜.或许正如有句话所说,智慧不是一个名词,而是一个形容词.在那些被统称为"人工智能"技 ...

  9. 视觉的目的是什么?从监督学习到对比学习,回顾CV发展史

    2021-02-07 17:43:55 作者 | 周纵苇@知乎(已授权) 摘要:视觉,对于人类或动物来说,似乎是一件稀松平常的事情,我们甚至都不需要去有意识地训练自己,就可以天赋一般地认识世界. 对于 ...

  10. 在人工智能的角逐中,仿真数据是重要的平衡力量吗?

    全文共6085字,预计学习时长18分钟 图源:Unsplash 人工智能的角逐 人类正处于争夺人工智能统治地位的激烈角逐之中.美国五大科技公司(谷歌.亚马逊.脸书.苹果和微软)正将大量资金投入到图像识 ...

最新文章

  1. 微信小程序API·目录
  2. python与shell校验IP地址合法性
  3. 【最小割】HDU 3987 Harry Potter and the Forbidden Forest
  4. 004 IOC---IOC容器
  5. 机器人出魔切还是三相_哇!电站凝汽器清洗居然可以用机器人啦
  6. Codeforces 1323 div2题解ABC
  7. iOS开发UI篇—直接使用UITableView Controller
  8. 幼小衔接语言教案上c册_关于幼小衔接,这里有你最想要的解答
  9. c语言常考的程序,C语言 一些常考得东西
  10. 2022年计算机408统考大纲,相比往年大量改动
  11. totolink 虚拟服务器,TOTOLINK无线中继设置教程(图文)
  12. 通过存储过程,插入300万条数据的一点思考?
  13. 微软官方office教程和微软官方office模板
  14. python椭圆花瓣_python之花瓣美女下载详解
  15. 得到平面设计师进阶之路
  16. 30段超实用CSS代码
  17. 程序员的算法课(6)-最长公共子序列(LCS)
  18. Zotero安装使用及上标问题解决
  19. IEEE文章免费下载方法
  20. 汇编指令-MOV与ldr区别

热门文章

  1. WPF Blend 自定义控件
  2. vue中使用router打开一个新的窗口
  3. 运算放大器 你想知道的都在这里
  4. 你手写过堵塞队列吗?
  5. MOTO DEFY/MB525/ME525 RSD LITE 刷机教程(图文)
  6. 浙江工业大学2020考研经验分享
  7. 温度反转效应(文末附2018数字IC后端最新校招笔试题目)
  8. 机器学习--PCA(主成分分析)
  9. Java面试知识点汇总
  10. 全球网络安全行业全景图与中国网络安全行业全景图-2022