深度学习在图像和视频的应用

文章目录

  • 深度学习在图像和视频的应用
    • 一、图像/视频处理
      • 1. 超分辨率问题
      • 2. 图像去噪
      • 3. 图像增强
        • 3.1 弱光照增强
        • 3.2 动态范围增强
      • 4. 质量评价
    • 二、图像/视频压缩
      • 2.1 传统压缩编码框架
      • 2.2 基于深度学习的图像压缩
      • 三、传统的计算机视觉处理

一、图像/视频处理

1. 超分辨率问题

超分辨率(Super Resolution),超分辨率问题简称SR问题。
目的:由低分辨率(Low Resolution,LR)图像->高分辨率(High Resolution,HR)清晰图像。

处理方法
1- 传统方法,优化损失函数.
2- 深度学习方法,卷积神经网络.
深度学习的SR研究:开山鼻祖是SRCNN,还有VDSR网络等.

2. 图像去噪

目的:从噪声图像中恢复出原始图像。

去噪方法
1- 传统方法,优化损失函数.
优化目的:恢复出的无噪图像与带噪图像尽可能相似。
why:一般认为带噪声信号的图像主要成分是图像本身信号。
2- 深度学习方法,卷积神经网络.
深度学习的去噪研究:DnCNN、CBDNet等,应对已知噪声强度/盲噪声强度。

3. 图像增强

目的:改善图像的视觉效果、图像质量、丰富信息量,加强图像判读和识别效果。

3.1 弱光照增强

问题:暗光拍照由于光线不足,导致欠曝光或者对比度不足。
解决方法:调整图像的对比度。

两类问题
1.夜景增强,LLNet
2.去雾,DehazeNet

3.2 动态范围增强

4. 质量评价

质量评价方法好坏的标准:是否与人的判断相近。
质量评价的目的:用数学的方法构建模型,使得这个模型能尽可能逼近人眼判别的结果。
质量评价的方法:
1.传统质量评价
2.基于深度学习的质量评价方法,DIQaM/NIMA

二、图像/视频压缩

2.1 传统压缩编码框架

  • 图片压缩编码框架
    JPEG是Joint Photographic Experts Group(联合图像专家组)的缩写,文件后辍名为".jpg"或".jpeg",是最常用的图像文件格式,由一个软件开发联合会组织制定。是有损压缩。
    虽然有损,但其去除的是冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像,可以用最少的磁盘空间得到较好的图像品质。
    方法:根据人眼视觉特性剔除图像信息中视觉不敏感得成分,从而实现图像信息的高度压缩。所根据的视觉特性主要为:高频不敏感性和色彩不敏感性。
  • 视频压缩编码框架
    预测编码:
    1、帧内预测编码
    2、帧间预测编码
  • 变换编码
  • 熵编码
  • 环路滤波

2.2 基于深度学习的图像压缩

三、传统的计算机视觉处理

1、早期 的计算机视觉处理

早期的计算机视觉处理的步骤
1- 特征提取 全局特征,浅层的简单特征
2- 索引技术 穷举索引
3- 相关反馈 正/负反馈
4- 重排序 按相关度排序

2、中期 的计算机视觉处理
词袋模型

中期的计算机视觉处理的步骤
1- 特征提取 提取局部特征,检测器+描述器
2- 向量化 对描述器得到的local word进一步处理,聚类去冗余,形成Viscal word
3- 生成词典 全体Viscal word(视觉关键词)构建词典
4- 索引技术 倒排索引
5- 后处理 TF-IDF加权排序,查询扩展

3、深度学习 的计算机视觉处理

  • Why?
    传统方法(人工特征提取+分类器)耗费人力物力,步骤繁琐,耗时。
深度学习 在计算机视觉处理的应用 模型
1- 图像分类 LeNet5/AlexNet/VGGNet/InceptionNet/ResNet
2- 物体检测 RCNN系列/YOLO系列/one-stage系列
3- 图像分割
4- 图像回归

深度学习学习笔记(一):深度学习在图像和视频的应用相关推荐

  1. 吴恩达【优化深度神经网络】笔记01——深度学习的实用层面

    文章目录 引言 一.训练集/验证集/测试集(Train/Dev/Test sets) 1. 数据集选择 2. 补充:交叉验证(cross validation) 二.偏差和方差(Bias/Varian ...

  2. mysq学习课堂笔记 第一天学习(值得收藏!)

    笔记来自b站 老杜带你学_mysql入门基础(mysql基础视频+数据库实战)很棒的mysql讲解,建议观看. 话不多说,开始笔记 一共四天的笔记,今天是第一天的,很高兴能给大家提供数据库笔记,这四个 ...

  3. 中国电信天翼物联学习总结笔记:SecureCRT的学习

    关于SecureCRT的下载,参考SecureCRT的安装与破解 - 简书 (jianshu.com) 第一次下载的SecureCRT官网上的文件,下载好了后找不到对应的破译包.只能下载博主的压缩包. ...

  4. 深度学习入门笔记(十六):计算机视觉之边缘检测

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

  5. 深度学习入门笔记(二):神经网络基础

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

  6. 深度学习入门笔记(十五):深度学习框架(TensorFlow和Pytorch之争)

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

  7. 深度学习入门笔记(五):神经网络的编程基础

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

  8. 深度学习入门笔记(二十):经典神经网络(LeNet-5、AlexNet和VGGNet)

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

  9. 深度学习入门笔记(一):深度学习引言

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

  10. 深度学习入门笔记(十八):卷积神经网络(一)

    欢迎关注WX公众号:[程序员管小亮] 专栏--深度学习入门笔记 声明 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具 ...

最新文章

  1. ReadFile 和 补充CreateFile
  2. MySQL命令行登陆,远程登陆MySQL
  3. FileItem API详解及演示
  4. 2019全球AI人才报告发布:AI专家仅3.6万
  5. JNDI学习总结(2)——JNDI数据源的配置
  6. MySQL学习笔记15:触发器
  7. 安装cuda时 提示toolkit installation failed using unsupported compiler解决方法
  8. LeetCode学习记录(1-3)
  9. EurekaClient启动报错:Invocation of destroy method failed on bean with name 'scopedTarget.eurekaClient'
  10. 背水一战 Windows 10 (53) - 控件(集合类): ItemsControl 的布局控件 - ItemsStackPanel, ItemsWrapGrid...
  11. 公司发声明了!禁止所有程序员使用 Lombok !再使用绩效直接打C!
  12. MySQL数据库学习资料(一)
  13. 量化交易之Dual Thrust策略
  14. python制作动态二维码步骤_七夕 | 如何用Python制作动态二维码,来哄女朋友开心?...
  15. 集合竞价如何买入_散户可以在集合竞价时买入股票吗?
  16. linux下解压dmp文件怎么打开,查看dmp文件
  17. Linux 下的IP/子网计算器:ipcalc
  18. 常见的Hash算法(General Purpose Hash Function Algorithms)
  19. 【Python基础】对象的浅拷贝与深拷贝
  20. Hive_处理NULL的几个函数 NVL, COALESCE, NULLIF

热门文章

  1. helm3使用需要注意的并推送charts到harbor
  2. cs224n学习笔记9-问答系统
  3. 解决Closing non transactional SqlSession [org.apache.ibatis.session.defaults.DefaultSqlS..(22.11.20)
  4. Hybrid APP 混合开发模式的选择之路(六:JSBridge---Native代码与JS代码的通信桥梁)
  5. python3讯飞语音识别
  6. 【MySQL】MySQL NDB Cluster安装
  7. ubuntu 20 安装mysql workbench 过程
  8. 【学习笔记】 IDEA中导入mysql的驱动jar包
  9. android游戏开发组件,Android实现疯狂连连看游戏之开发游戏界面(二)
  10. python如何统计函数被调用次数