【图像超分辨(SR)】图像超分辨领域一些英文名词最通俗的中文解释
Motivation
博主算是刚入超分辨的坑没多久,自己在看论文的时候,会遇到很多名词,拆开来每个单词我都认识,但是组合起来就是不知道他在讲什么…
最难受的是很多名词都缺乏中文(甚至英文)的解释。可能刚入门的时候要知道某个名词(词组)是在说什么都要花很多时间去查去考证。我想很多朋友可能都有过类似的经历。
写这篇博客的目的一方面是记录一下自己查过的名词,方便以后查阅。另一方面是给很多和我一样还在入坑中的或者比我入坑要晚的小伙伴一点便利。博文会持续更新。
Single Image Super-Resolution (SISR)
通俗讲就是对于单图片的超分辨…(听君一席话,如听一席话)。注意区分,single image不是说只给你一张图片,其他什么都不给,你拿去做吧…(这种问题其实叫zero shot)。这里的single image其实是相对于video等其他任务来说的single。个人理解SISR就是网络输入是一张图片,网络的目标是处理单张图片,对单张图片进行超分,输出也是一张图片。而video这种序列数据(video一般会用到不同帧之间的信息)的超分辨问题,就不算是SISR。
相关论文实在太多了,就列一个董超老师的SRCNN吧,这篇是CNN做单图像SR的开山之作了。
相关论文:
- Image Super-Resolution Using Deep Convolutional Networks(ECCV 2014)
Deep Internal Learning
指利用一张图片中的重复信息进行学习
相关论文:
- “Zero-Shot” Super-Resolution using Deep Internal Learning(CVPR 2018)
- Blind Super-Resolution Kernel Estimation using an Internal-GAN(NIPS 2019)
Light field Super-Resolution
意思是光场超分辨
光场:The light field is a vector function that describes the amount of light flowing in every direction through every point in space. The space of all possible light rays is given by the five-dimensional plenoptic function, and the magnitude of each ray is given by its radiance.(维基百科,原文能看懂的朋友还是不建议看翻译,毕竟直接看懂传达的信息才是最准确的,别人翻译的终究是二手信息)
个人翻译:光场是一个描述光在空间中从各个方向穿过各个点的向量函数。光线所有可能存在的空间由五维全视函数(plenoptic function 描述了从空间任 意点所看到的全部光线)给出,每条射线的数值由沿着射线的总光量(The measure for the amount of light traveling along a ray is radiance)给出。
来自维基百科的图:
来自Nerf的图:
光场超分辨:大概意思是,光场相机可以记录当前场景不同视角的图像,每个视角图像的上下文信息(空间信息)与不同视角之间的互补信息(角度信息),基于这些信息来做图像超分辨。个人觉得简单理解可以和单图像超分辨做比较,光场超分辨相当于针对一种提供更多信息的场景做图像超分辨。
相关论文:
- Light Field Super-Resolution with Zero-Shot Learning(CVPR 2021)
Trivial and non-trivial
这两个词在深度学习论文里一般用来形容一个问题/任务/步骤非常简单(trivial)或困难(non-trivial),但在数学上这两个词会用来指代特定种类的问题。
Internal SR and External SR
internal SR表示用一张图片内部的信息进行超分,external SR表示用一张图片之外的信息进行超分。简单来说external SR就是用大量图片来训练,最后作用的图像和训练用的图像并不相同,相当于引入了外部信息。相比于internalSR,externalSR很有可能会引入很多伪影(很好理解,因为从外部学习到的信息并不一定准确)。
相关论文:
- Internal Statistics of a Single Natural Image(CVPR 2011)
【图像超分辨(SR)】图像超分辨领域一些英文名词最通俗的中文解释相关推荐
- MySQLWorkbench 常见操作英文说明及对应的中文解释
execute the selected portion of the script or everything,if there is no selection. 如果没有选择,则执行脚本的选定部分 ...
- 基于AI的超分辨技术在RTC领域的技术难点与挑战
正文字数:8603 阅读时长:12分钟 基于AI的超分辨技术在图像恢复和图像增强等领域的应用前景,受到了学术界的关注,但在RTC领域中很多算法并不能满足实际场景下的应用需求.本次分享我们邀请到了网易 ...
- 【线上分享】基于AI的超分辨技术在RTC领域的技术难点与挑战
基于AI的超分辨(Super Resolution)技术在图像恢复和图像增强等领域展现出广阔的应用前景,受到学术界和工业界的关注和重视.但是,在RTC领域中,很多算法并不能满足实际场景下的应用需求,超 ...
- 【线上分享】超分辨技术在RTC领域面临的机遇与挑战
基于AI的超分辨(Super Resolution)技术在图像恢复和图像增强等领域展现出广阔的应用前景,受到学术界和工业界的关注和重视.但是,在RTC领域中,很多算法并不能满足实际场景下的应用需求,超 ...
- 蚂蚁金服发布「定损宝」,推动图像定损技术在车险领域的应用
蚂蚁金服发布「定损宝」,推动图像定损技术在车险领域的应用 By 高静宜2017年6月28日 13:39 6 月 27 日,蚂蚁金服在北京宣布向保险行业全面开放技术产品「定损宝」,用 AI 技术模拟车险 ...
- 茶学领域如何用的上计算机,计算机视觉图像理技术在茶学领域应用方法的研究.pdf...
计算机视觉图像理技术在茶学领域应用方法的研究 摘 要 随着计算机技术的发展,计算机视觉图像处理技术已广泛应用到农业工程领域, 但在茶学领域的应用尚很少见有报道.本文对在茶学领域应用计算机视觉图像处理技 ...
- matlab图像降噪_图像超分:RealSR
点击上方"AIWalker",选择加"星标"或"置顶" 重磅干货,第一时间送达 paper: https://csjcai.githu ...
- 科学松鼠会压缩感知科普文章两篇:“压缩感知与单像素相机(陶哲轩)”“填补空白:用数学方法将低分辨率图像变成高分辨率图像(Jordan Ellenberg)
题目:科学松鼠会压缩感知科普文章两篇:"压缩感知与单像素相机(陶哲轩)""填补空白:用数学方法将低分辨率图像变成高分辨率图像(Jordan Ellenberg)" ...
- 计算机视觉技术在图像特征提取中的应用研究,基于图像特征提取的图像融合研究...
基于图像特征提取的图像融合研究 [摘要]:视觉信息是人类从自然界中获取信息的最主要手段,图像信息是一种主观性很强的重要信息表达形式,也是最难由计算机认知.处理与实现的信息之一.而图像特征提取作为计算机 ...
最新文章
- 聚类分析简单介绍(附R对应函数介绍)
- java 颜色比较_我该如何比较Java中的颜色?
- 使用iozone和bonnie测试磁盘IO
- 链表操作时头结点的好处
- java mongodb 模糊查询_Java操作MongoDB插入数据进行模糊查询与in查询功能的方法
- 问题解决 :浏览器默认请求favicon.ico图标
- 下单送奖励金的实现思路
- 数据库中数据数据初始化的好处
- 什么是WEBserver? 经常使用的WEBserver有哪些?
- mdx词典包_译者的电子工具——手机词典上篇
- php底部漂浮广告位代码,网站顶部底部(上下)悬浮(漂浮)广告位代码
- 鸿蒙太空是什么意思,“我所居兮,青埂之峰;我所游兮,鸿蒙太空。谁与我逝兮,吾谁与从?渺渺茫茫兮,归彼大荒”的意思...
- 带通滤波器幅频特性曲线图_滤波器和对讲机技术解析!
- Java/171. Excel Sheet Column Number Excel序号转换数字
- Python【第十天】文件与模块
- opengl: 太阳地球和月亮
- 如何用matlab实现小波变换
- 基于BIM+3DGIS物联网技术,如是实现智慧园区(楼宇)可视化管控平台的?
- java和 .net视频教程共享
- 应聘经历-百度华为移动
热门文章
- 《纪念碑谷》(Monument Valley) 系列游戏的空间结构是如何设计的?
- 关于计算机经历兼职的英文作文,关于兼职的英语作文
- Android 12安装app失败,提示安装包解析异常
- CPU 处理器 移动版 大集中
- 使用Python实现拉马努金的三角函数正弦公式
- 数学在计算机专业中的应用,高等数学在计算机专业教学中的应用
- 2021年CCF CCSP全国赛 赛后感想 心得 总结
- LeCun力挺,马毅教授五年集大成之作:完全数学可解释的白盒Transformer,性能不输ViT
- JS随机生成ID 以及随机生成坐标
- python里的非_python中逻辑非