【我的OpenGL学习进阶之旅】计算机视觉 (CV) 、 计算机图形学 (CG) 以及图像处理(DIP)
文章目录
- 一、计算机视觉 (Computer Vision) VS 计算机图形学 (Computer Vision) 以及图像处理(Digital Image Processing)
- 1.1 先说区别
- 1.2 再说联系
- 1.3 计算机图形学:图像处理
- 1.4 计算机视觉
- 1.5 计算机图形学 和 计算机视觉 的关联
- 1.6 数字图像处理
- 1.7 计算机视觉
- 1.8 计算机图形学
- 1.9 人工智能
- 二、参考链接
PS: 本文摘自互联网几篇文章整合的内容。
一、计算机视觉 (Computer Vision) VS 计算机图形学 (Computer Vision) 以及图像处理(Digital Image Processing)
在 计算机视觉、图形学和图像处理,三者有什么联系? 中有如下所示的描述:
1.1 先说区别
Computer Graphics
,简称 CG 。输入的是对虚拟场景的描述,通常为多边形数组,而每个多边形由三个顶点组成,每个顶点包括三维坐标、贴图坐标、rgb 颜色等。输出的是图像,即二维像素数组。
[xyz xyz xyz … xyz] -> 图片
Computer Vision
,简称 CV。输入的是图像或图像序列,通常来自相机、摄像头或视频文件。输出的是对于图像序列对应的真实世界的理解,比如检测人脸、识别车牌、区分猫狗。
图片 -> dog or cat?
图片 -> [xyz xyz xyz … xyz]
Digital Image Processing
,简称 DIP。输入的是图像,输出的也是图像。Photoshop 中对一副图像应用滤镜就是典型的一种图像处理。常见操作有模糊、灰度化、增强对比度等。
图片 -> ps后的图片
1.2 再说联系
CG 中也会用到 DIP,现今的三维游戏为了增加表现力都会叠加全屏的后期特效,原理就是 DIP,只是将计算量放在了显卡端。通常的做法是绘制一个全屏的矩形,在 Pixel Shader 中进行图像处理。
CV 大量依赖 DIP 来打杂活,比如对需要识别的照片进行预处理,增强对比度、去除噪点。
最后还要提到今年的热点——增强现实(AR),它既需要 CG,又需要 CV,当然也不会漏掉 DIP。它用 DIP 进行预处理,用 CV 进行跟踪物体的识别与姿态获取,用 CG 进行虚拟三维物体的叠加。
在 图像处理(计算机图形学)和计算机视觉的区别和关系中是这样描述的
随着工业互联网的发展,图片处理计算机图形学
和计算机视觉
的应用越来越多,两者有区别也有紧密联系,在此进行简单介绍,共同学习。
CV和CG在其实是一个方向相反的过程(三者的流程图如下):
- CV是计算机从图像中提炼有用的信息,
- 而CG通过使用数学模型和计算机算法来生成图像。
- 而图像处理的输入和产出都是图像,只不过产出的图像在某些特征上被强化或者提取出来了。
1.3 计算机图形学:图像处理
是对输入的图像做某种变换,输出仍然是图像,基本不涉及或者很少涉及图像内容的分析。比较典型的有图像变换,图像增强,图像去噪,图像压缩,图像恢复,二值图像处理
等等。基于阈值的图像分割
也属于图像处理的范畴。它一般处理的是单幅图像。
1.4 计算机视觉
试图用视网膜输入来做人脑的工作,是对图像的内容进行分析、提取出有意义的特征
,再对得到的特征进行分析和预测视觉输入,提取场景的语义表示
,从而让计算机具有人眼和人脑的能力
。它处理的是部分单幅图像、多幅图像或者序列图像。
1.5 计算机图形学 和 计算机视觉 的关联
在【Games 101 】中有如下所示的PPT
闫令琪老是说过: 一切需要猜测的基本都是计算机视觉。需要计算机去理解图像。
在 一图理解计算机视觉、计算机图形学、数字图像处理 中有如下表述:
这张图片有着科学工作者们都无法抗拒的简洁美感,使目前科技领域几个重要概念显得泾渭分明。我尝试结合自身的经验去解释下这张图:
在 一图理解计算机视觉、计算机图形学、数字图像处理 中是这样描述的:
计算机视觉
是人工智能
的重要方向,数字图像处理
是计算机视觉
的第一步,而计算机图形学
,作为工具和平台支撑着数字图像处理
和计算机视觉
的发展与应用。
1.6 数字图像处理
数字图像处理,输入是图片,输出也是图片。
包括数字成像与图像处理。
数字成像最广泛的应用是:
数码相机:把大自然中的光信号转化为数字信号,通过一系列计算机处理得过程后,通过显示设备再度呈现为图像。
图像处理最广泛的应用是各类P图软件。Prisma是去年火爆世界的一款软件,它通过深度学习,让机器掌握把各类艺术家的艺术风格,然后再把某种艺术风格施加到正常的照片,进而让照片成为“大师之作”。
1.7 计算机视觉
计算机视觉,输入是图片,输出是知识。
包括机器视觉和计算机视觉,机器视觉广泛应用于工业检测领域,目的是高精度的测量。
而计算机视觉,重在让计算机像人类一样,看懂一张照片或视频中的内容,具体内容请参考李飞飞演讲。
医学类的应用主要是把AI应用在医疗影像学上:
1.8 计算机图形学
计算机图形学,输入是知识,输出是图片。
计算机图形学最广泛的应用是计算机辅助设计软件CAD,它彻底改变了人类工程设计的习惯。
而在娱乐上,基于计算机图形学的现代电脑游戏,也已经深刻影响着人类的娱乐习惯。
1.9 人工智能
人工智能,输入是各类信息,输出是知识
低水平的人工智能已经广泛应用于人类生活生产中——智能控制系统。
高水平的人工智能,也就是具备深度学习能力的人工智能,在最近两年已经证明了其巨大的潜力:
学无止境,从构建知识体系架构开始吧。
二、参考链接
- https://www.zhihu.com/question/20672053/answer/15854031
- 【Games 101 】
- 图像处理(计算机图形学)和计算机视觉的区别和关系
- 计算机图形学CG、计算机视觉CV和数字图形处理DIP的区别简谈
- 一图理解计算机视觉、计算机图形学、数字图像处理
- 一文看懂 计算机视觉(cv) 与 计算机图形学(cg) 的区别
【我的OpenGL学习进阶之旅】计算机视觉 (CV) 、 计算机图形学 (CG) 以及图像处理(DIP)相关推荐
- 【我的OpenGL学习进阶之旅】介绍一下 绘制图元
目录 一.绘制图元 1.1 `glDrawArrays` 1.1.1 `glDrawArrays`API说明 1.1.2 `glDrawArrays`API示例 1.2 `glDrawElements ...
- 【我的OpenGL学习进阶之旅】C++如何加载TGA文件?
一.TGA文件相关介绍 通过前面的博客 [我的OpenGL学习进阶之旅]什么是TGA文件以及如何打开TGA文件? 地址:https://ouyangpeng.blog.csdn.net/article ...
- 【我的OpenGL学习进阶之旅】【持续更新】关于学习OpenGL的一些资料
目录 一.相关书籍 OpenGL 方面 C方面 NDK 线性代数 二.相关博客 2.0 一些比较官方的链接 2.1 OpenGL着色器语言相关 2.2 [[yfan]](https://segment ...
- 【我的OpenGL学习进阶之旅】OpenGL ES 3.0新功能
目录 1.1 纹理 1.2 着色器 1.3 几何形状 1.4 缓冲区对象 1.5 帧缓冲区 OpenGL ES 2.0 开创了手持设备可编程着色器的时代,在驱动大量设备的游戏.应用程序和用户接口中获得 ...
- 【我的OpenGL学习进阶之旅】着色器和程序(上)------着色器
着色器和程序 一.前言 二.着色器和程序 2.1 创建和编译一个着色器 2.1.1 创建着色器 2.1.2 删除着色器 2.1.3 提供着色器源代码 2.1.4 编译色器 2.1.4 查询有关着色器对 ...
- 计算机视觉包含计算机图形学,[计算机视觉与图像识别]计算机视觉,计算机图形学和数字图像处理,三者之间的联系和区别.doc...
[计算机视觉与图像识别]计算机视觉,计算机图形学和数字图像处理,三者之间的联系和区别.doc [计算机视觉与图像识别]计算机视觉,计算机图形学和数字图像处理,三者之间的联系和区别 篇一 : 计算机视觉 ...
- 【我的OpenGL学习进阶之旅】关于3D模型知识之:什么是obj文件和mtl文件
文章目录 一.学习3D模型的背景 二.3D模型效果展示 三.好奇3D模型文件是啥内容? 3.1 打开.obj文件 3.2 打开.obj文件 3.3 在外部使用查看3D模型的软件打开.obj文件 3.3 ...
- 【我的OpenGL学习进阶之旅】什么是TGA文件以及如何打开TGA文件?
目录 一.问题描述 二.解决问题:打开TGA文件 三.什么是TGA文件? 四. 如何打开TGA文件 4.1. 使用图像编辑器打开TGA文件 4.2. 使用Pain.Net打开TGA文件 4.3.使用T ...
- 【我的OpenGL学习进阶之旅】解决关于在OpenGL ES开发中GLSurfaceView调用了onPause和onResume方法,然后息屏亮屏之后GLSurfaceView黑屏的问题
目录 一.问题描述 二.分析问题 2.1 排查onPause和onResume方法 2.2 注释掉onPause和onResume方法 2.3 GLSurfaceView 关于Activity生命周期 ...
最新文章
- golang 中string和int类型相互转换
- Mysql Mariadb 创建新用户
- 勒索软件赎金该不该交?
- 我总结的120页《图解MIT线性代数笔记.pdf》,都是干货!
- 深度剖析 synchronized
- 一分钟明确 VS manifest 原理
- Jeewx 捷微管家操作配置文档(开源版本)
- python代替嵌套列表_python含嵌套的列表去重问题
- word文档服务器多人打开后就损坏,打开word文档损坏
- Fantom已开始网络升级,大约需2个小时
- Kaggle 数据清洗挑战 Day 5 - 处理不一致数据
- 第21章 java线程(1)-线程初步
- Java最牛教材!甲骨文java认证考试试题
- 2021-10-26 模电共射放大电路部分
- Python吴恩达深度学习作业15 -- YOLO原理及应用(自动驾驶——汽车检测)
- 关于手机QQ-好友的秘密 发送秘密者的位置信息获取
- forward完美转发
- 【JavaScript】offset、client、scroll
- 最大信息系数MIC的python代码
- matlab社会统计学,深扒!低调的就业大热——统计学!
热门文章
- 分析一个bilibili Android端请求视频源地址的包
- html5骰子游戏实验报告,C++实验报告骰子游戏.doc
- multisim与门测试
- linux nfs配置参数,NFS常用参数
- STC8H运行smallRTOS51操作系统(1)
- 《Spring Boot+Vue全栈开发实战》读书笔记
- 达菲抗流感原理及作用
- 论文投稿指南——中文核心期刊推荐(环境科学)
- 爬取猫眼票房保存在MySQL_Scrapy爬取猫眼电影并存入MongoDB数据库
- AI Earth 深度学习模型替换数值天气预报模型中的参数化方案-大气辐射传输方案