【每周CV论文】初学深度学习图像超分辨应该要读的文章
欢迎来到《每周CV论文》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。
图像超分辨是一个非常实际应用价值的方向,今天给大家推荐初学该领域必须要读的文章。
作者&编辑 | 言有三
1 SRCNN
SRCNN方法[1]是将深度学习用于图像超分辨领域中最早期的尝试,它是一个前上采样结构,可以看作是经典的稀疏编码用深度学习模型进行实现。
文章引用量:2700+
推荐指数:✦✦✦✦✦
[1] Dong C, Loy C C, He K, et al. Image super-resolution using deep convolutional networks[J]. IEEE transactions on pattern analysis and machine intelligence, 2015, 38(2): 295-307.
2 ESPCN
SRCNN等前上采样框架中首先使用反卷积来完成上采样,这是一种很自然的操作,但是它计算复杂度较大,Twitter图片与视频压缩研究组则采用了与反卷积完全不同的上采样思路,提出了ESPCN模型[2],其中核心思想是亚像素卷积(sub-pixel convolution),这是一种后上采样框架。
文章引用量:1200+
推荐指数:✦✦✦✦✦
[2] Shi W, Caballero J, Huszar F, et al. Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network[C]. computer vision and pattern recognition, 2016: 1874-1883.
3 Perceptual loss
早期的基于CNN模型的超分辩框架如SRCNN,ESPCN都使用图像像素空间的欧式距离作为优化目标,结果能取得较高的PSNR和SSIM指标,但是存在结果过于平滑的问题,后来的研究者将SRCNN模型的像素损失改为感知损失后,显著提高了视觉效果。
文章引用量:2000+
推荐指数:✦✦✦✦✦
[3] Johnson J, Alahi A, Fei-Fei L. Perceptual losses for real-time style transfer and super-resolution[C]//European conference on computer vision. Springer, Cham, 2016: 694-711.
4 SRGAN
随着生成对抗网络GAN的发展,生成器和判别器的对抗学习机制在图像生成任务中展现出很强大的学习能力。Twitter的研究者们使用ResNet作为生成器结构,使用 VGG作为判别器结构,提出了SRGAN[4]模型。
文章引用量:1400+
推荐指数:✦✦✦✦✦
[4] Ledig C, Theis L, Huszár F, et al. Photo-realistic single image super-resolution using a generative adversarial network[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 4681-4690.
5 无监督模型
由于大部分模型都是基于成对的低分辨率和高分辨率图进行训练,研究者常通过固定的图像算法对高分辨率图进行采样获得低分辨率图,这与真实的图像蜕化过程并不一致,真实的图像蜕化往往包括各类模糊和噪声,缺陷等。因此,如何摆脱仿真数据集进行训练,产生真实的训练数据对模型泛化到真实场景非常重要,其中基于GAN的无监督模型大有可为。
文章引用量:70+
推荐指数:✦✦✦✦✧
[5] Bulat A, Yang J, Tzimiropoulos G. To learn image super-resolution, use a gan to learn how to do image degradation first[C]//Proceedings of the European conference on computer vision (ECCV). 2018: 185-200.
6 应用
图像超分辨可以用于老照片和视频的修复,同时也可以用于辅助目标检测等任务中提升目标的可辨识度,其中在人脸领域是最为成熟的应用方向[6-7],值得关注。
[6] Chen Y, Tai Y, Liu X, et al. FSRNet: End-to-End Learning Face Super-Resolution with Facial Priors[C]. computer vision and pattern recognition, 2018: 2492-2501.
[7] Menon S, Damian A, Hu S, et al. PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models[J]. arXiv: Computer Vision and Pattern Recognition, 2020.
7 文章解读
关于图像超分辨以及相关文章的详细解读,在有三AI知识星球-网络结构1000变-图像增强以及GAN下有较多的文章,感兴趣可以移步。
总结
本次我们介绍了初学图像超分辨领域值得读的文章,当前研究重点在于无监督模型,复杂退化类型图像的超分辨等方向,读者可以继续关注。
有三AI知识星球
知识星球是有三AI的付费内容社区,里面包括各领域的模型学习,数据集下载,公众号的付费图文原稿,技术总结PPT和视频,知识问答,书籍下载,项目推荐,线下活动等资源,了解详细请阅读以下文章:
【杂谈】有三AI知识星球一周年了!为什么公众号+星球才是完整的?
【杂谈】万万没想到,有三还有个保密的‘朋友圈’,那里面都在弄啥!
转载文章请后台联系
侵权必究
往期精选
【每周论文推荐】 初入深度学习CV领域必读的几篇文章
【每周CV论文推荐】 掌握残差网络必读的10多篇文章
【每周CV论文推荐】 初学者必须精读的5篇深度学习优化相关文章
【每周CV论文推荐】 CV领域中数据增强相关的论文推荐
【每周CV论文推荐】 初学高效率CNN模型设计应该读的文章
【每周CV论文推荐】 初学目标检测必须要读的文章
【每周CV论文推荐】 初学深度学习图像分割必须要读的文章
【每周CV论文推荐】 初学GAN必须要读的文章
【每周CV论文推荐】 深度学习人脸检测入门必读文章
【每周CV论文推荐】 初学深度学习人脸关键点检测必读文章
【每周CV论文推荐】 初学深度学习人脸识别和验证必读文章
【每周CV论文推荐】 初学深度学习人脸属性分析必读的文章
【每周CV论文推荐】 初学活体检测与伪造人脸检测必读的文章
【每周CV论文推荐】 初学深度学习单张图像三维人脸重建需要读的文章
【每周CV论文推荐】 人脸识别剩下的难题:从遮挡,年龄,姿态,妆造到亲属关系,人脸攻击
【每周CV论文推荐】换脸算法都有哪些经典的思路?
【每周CV论文】深度学习文本检测与识别入门必读文章
【每周CV论文】深度学习图像降噪应该从阅读哪些文章开始
【每周CV论文】初学GAN图像风格化必须要读的文章
【每周CV论文】初学深度学习图像超分辨应该要读的文章相关推荐
- 【每周CV论文】深度学习图像降噪应该从阅读哪些文章开始
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像降噪是图像处理领域中非常传统和经典的问题 ...
- 【每周CV论文】初学深度学习图像修复应该要读的文章
欢迎来到<每周CV论文>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像修复(image inpainting)或补 ...
- 【每周CV论文】深度学习文本检测与识别入门必读文章
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 文本检测和识别是计算机视觉的一个非常重要的应 ...
- 「每周CV论文」深度学习图像降噪应该阅读哪些文章
图像降噪是图像处理领域中非常传统和经典的问题,今天给大家推荐学习该领域值得读的文章. 作者&编辑 | 言有三 1 基本CNN结构 图像去噪模型的输出是无噪声的图像,与输入图像大小相同,所以可以 ...
- 【每周CV论文】初学深度学习图像风格化要读的文章
欢迎来到<每周CV论文>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像风格化的研究由来以久,这是一个艺术和科学相结 ...
- 【每周CV论文】初学深度学习图像对比度增强应该要读的文章
欢迎来到<每周CV论文>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像对比度增强,即增强图像中的有用信息,抑制无用 ...
- 论文笔记 | 深度学习图像数据增广方法研究
1 背景 在许多领域,受限于数据获取难度大,标注成本高等原因,往往难以获得充足的训练数据,这样训练得到的深度学习模型往往存在过拟合的问题,进而导致模型泛化能力差,测试精度不高等. 数据扩充的作用:扩大 ...
- 【每周CV论文推荐】初学基于GAN的三维图像生成有哪些经典论文需要阅读
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 当前二维图像生成领域的发展已经非常成熟,但是 ...
- 【每周CV论文】初学GAN图像风格化必须要读的文章
欢迎来到<每周CV论文>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像风格化是生成对抗网络的一大应用,今天给大家推 ...
最新文章
- python文本数据转换数值矩阵_python numpy矩阵的数据类型转换
- Linux文件与目录管理(文件查阅)
- 让面试官颤抖的 HTTP 2.0 协议面试题
- abb样本-感应电机与发电机手册_发电机工作原理图解
- linux – 我怎么知道我到somaxconn有多近?
- DHCP服务器 出现的故障
- tg3269c网卡驱动linux,TP-Link3269C网卡驱动官方版
- 小白学JAVA,与你们感同身受,JAVA---day6:抽象类接口的理解。鲁迅的一句话:总之岁月漫长,然而值得等待。
- 今晚直播 | Oracle技术加油站:快速处理紧急性能问题的工具与经验
- Shiro学习(24)在线回话管理
- java cxf服务端_webservice概述及cxf在Java开发中应用(二) 简单搭建cxf服务端
- Chess DP 思维题
- 【DM642学习笔记一】关于Can't Initialize Target CPU的一种解决方法 : Error 0x80000240
- 分享97个上传下载PHP源码,总有一款适合你
- VMware15安装mac10.14
- 6-1 哈夫曼树及哈夫曼编码分数
- HDU-1814 Peaceful Commission (2-SAT暴力模板 暴力染色+字典序最小)
- 太原科技大学调剂计算机,2016年太原科技大学考研调剂信息
- Java总结之基础篇
- mongodb添加仲裁节点无响应
热门文章
- java web总结:tomcat使用教程
- “面试不败计划”:面试题基础二
- Android之Inflate()方法用途
- .net 数字转汉字_[原创工具] 小熊汉字笔顺学习软件,查笔顺、学拼音、制作汉字英文数字字贴...
- iphone尺寸_iPhone折叠机概念图:屏幕双打孔,iPhone折叠机有多优秀!
- struts2自定义拦截器并配置拦截器使其生效
- CentOS下配置HTTPS访问主机并绑定访问端口号
- Linux中的管道与重定向
- Java经典面试题总结(一)
- Redis之慢查询分析