生成模型是一种训练模型进行无监督学习的模型,即,给模型一组数据,希望从数据中学习到信息后的模型能够生成一组和训练集尽可能相近的数据

图像生成(Image generation,IG)则是指从现有数据集生成新的图像的任务。图像生成模型包括无条件生成和条件性生成两类,其中,无条件生成是指从数据集中无条件地生成样本,即p(y);条件性图像生成是指根据标签有条件地从数据集中生成样本,即p(y|x)。

去噪扩散概率模型(Denoising Diffusion Probabilistic Model,DDPM)
可以参考这篇文章
我觉得这句话说的很好虽然背后的推导比较复杂,但是最终得到的优化目标非常简单,就是让网络预测的噪声与真实的噪声一致。

高斯噪声是一种通过向输入数据添加均值为零和标准差(σ)的正态分布随机值而产生的噪声。 正态分布,也称为高斯分布,是一种连续概率分布

马尔科夫链用一句话来概括马尔科夫链的话,那就是某一时刻状态转移的概率只依赖于它的前一个状态。
我没有细读可以参考这篇文章马尔科夫链

图像分辨率指图像中存储的信息量,是每英寸图像内有多少个像素点,分辨率的单位为PPI(Pixels Per Inch),通常叫做像素每英寸

超分辨率(Super-Resolution),简称超分(SR)。是指利用光学及其相关光学知识,根据已知图像信息恢复图像细节和其他数据信息的过程,简单来说。超分辨率是将低分辨率图像转换为高分辨率图像的过程,而高分辨率图像是指原本就具有高像素密度的图像。

深度生成模型从整体上来说,是以某种方式寻找某种数据的概率分布,一句话总结我对 Deep Generative Models 的理解:一个生成模型通常刻画了一类数据或一类数据集的概率分布,通过对这个分布进行采样来生成相似的数据。

GANs 要获得一个强大的英雄(即生成器generator),我们需要一个更强大的对手(即鉴别器discriminator)。可以参考下这篇文章

U-net模型

卷积层
可参考这篇文章
卷积就是把卷积核放在输入上进行滑窗,将当前卷积核覆盖范围内的输入与卷积核相乘,值进行累加,得到当前位置的输出,其本质在于融合多个像素值的信息输出一个像素值,本质上是下采样的,所以输出的大小必然小于输入的大小,如下图所示:

卷积层的作用是提取输入图片中的信息,这些信息被称为图像特征,这些特征是由图像中的每个像素通过组合或者独立的方式所体现,比如图片的纹理特征,颜色特征。

池化层池化层用于输入的特征图进行压缩,使特征图变小,简化网络计算复杂度或进行特征压缩,提取主要特征

  1. 挑选不受位置干扰的图像信息。
  2. 对特征进行降维,提高后续特征的感受野,也就是让池化后的一个像素对应前面图片中的一个区域。
  3. 因为池化层是不进行反向传播的,而且池化层减少了特征图的变量个数,所以池化层可以减少计算量。

下采样/上采样
在卷积神经网络中,由于输入图像通过卷积神经网络(CNN)提取特征后,输出的尺寸往往会变小,而有时我们需要将图像恢复到原来的尺寸以便进行进一步的计算(如图像的语义分割),这个使图像由小分辨率映射到大分辨率的操作,叫做上采样。
下采样即缩小图像,主要有两个目的:使得图像符合需要的大小;生成对应图像的缩略图。下采样层有两个作用,一是减少计算量,防止过拟合

反卷积
可以参考这篇文章讲的很细这篇文章有一句话挺重要的最终我们得到的特征图与卷积输入的特征图值的大小并不相同,说明卷积和反卷积并不是完全对等的可逆操作(因为采用相同的卷积核,卷积和反卷积得到的输入输出不同),也就是反卷积只能恢复尺寸,不能恢复数值

自回归模型描述当前值与历史值之间的关系,用变量自身的历史时间数据对自身进行预测。

插入值图片放大是图像处理中的一个特别基础的操作。在几乎每一个图片相关的项目中,从传统图像处理到深度学习,都有应用。生活里,和朋友通过微信传张图片,从图片发出,到朋友收到图片,查看图片,都会数次的的改变图像的尺寸,从而用到这个算法。但是很少关注这个算法的实现细节:插值算法是如何工作的。
简单来说,插值指利用已知的点来“猜”未知的点,图像领域插值常用在修改图像尺寸的过程,由旧的图像矩阵中的点计算新图像矩阵中的点并插入,不同的计算过程就是不同的插值算法。

超参数
超参数也是一种参数,它具有参数的特性,比如未知,也就是它不是一个已知常量。一种手工可配置的设置,需要为它根据已有或现有的经验指定“正确”的值,也就是人为为它设定一个值,它不是通过系统学习得到的。

先验参数和后验参数
说的更直白一点,就是最开始没有观测数据的时候,我们依据以往的经验赋予了参数一个先验分布,然后来了实际的观测数据之后,我们就对先验进行了更新,得到了这次分析过程的后验分布。

**残差块(Residual Block)**是深度残差网络(Residual Neural Network,ResNet)中的基本构建块,旨在解决深度神经网络中的梯度消失和过拟合问题。
残差块有两个分支,一个是主路径(主要用于学习特征),另一个是跳跃连接(shortcut),跳跃连接将输入特征映射直接添加到输出特征映射中。残差块通过学习主路径中残差的方式保证了模型的有效性和网络层次结构的合理性
残差块的主要思想是学习输入特征的残差(residual),将残差与跳跃连接中的输入特征相加得到输出特征映射,而不是直接将输入特征映射提供给下一个区块。通过这种方式,可以显著加深网络的深度,同时减轻梯度消失和梯度弥散的问题

skip connection(跳跃连接)
这句话是在描述网络中使用跳跃连接时,对于每个层的输入(x)、输出(y)和跳跃连接的输出(x+y)之间的关系。跳跃连接是在网络中添加额外的直接连接,使得输入可以直接连接到输出层,从而有助于在梯度反向传播期间避免信息丢失。
换句话说,这句话的意思是,如果一个层的输入是 x,输出是 y,那么如果在这个层上添加一个跳跃连接,该层的输出则是 x+y,其中 x 和 y 分别表示该层的输入和输出。这样,跳跃连接就将原始输入的信息引导到了输出层,从而有助于改善模型的性能,并提高训练速度和稳定性。

在残差块中主路径指的是输入特征映射通过一系列卷积、批量归一化(batch normalization)和激活函数等层的处理后,得到的输出特征映射。主路径主要用于从输入中提取特征,并为跳跃连接提供输出特征映射。

Warmup 策略是深度学习中用来调节学习率(learning rate)的一种技巧。在训练刚开始的时候,学习率过小会导致收敛速度变慢,而学习率过大则容易发生梯度爆炸的情况,为了避免这些问题,通常会使用 Warmup 策略来让学习率在开始训练时逐渐增加到设定的值。
具体来说,Warmup 策略就是在训练的一开始,将学习率从初始值线性逐渐增加到预定的学习率值。这样可以有效地控制模型的训练速度和稳定性。在实际应用中,有很多种 Warmup 策略,比如线性增长、指数增长、多项式函数增长等。选择哪一种 Warmup 策略取决于具体的应用场景和实验结果。

学习率深度学习中的一个超参数,用于控制模型参数在每一次训练迭代中的更新程度。它决定了模型参数在训练过程中每次更新的步伐大小,过大或过小的学习率都会影响模型的性能。通常,学习率的初始值是通过在训练数据上进行实验选择的,并且在训练过程中可能需要动态调整学习率来获得更好的模型性能

过拟合
当一个模型在训练数据上表现良好,但在测试数据上表现较差时,就会出现过拟合现象。简单来说,过拟合是指模型在学习训练数据时,过分关注训练数据的细节和噪声,导致模型过度学习了训练数据的特点,无法泛化到新的数据上。
举例来说,假设你正在训练一个分类器来识别图片中的猫和狗。如果你的训练数据集中只有黄色猫和灰色狗,模型在训练过程中可能过于关注颜色特征,导致对于其他颜色下的猫和狗的分类表现不佳。这种情况就是过拟合的典型表现。

级联图像生成
级联图像生成是一种深度学习技术,其目的是生成具有高分辨率和高质量的图像。它使用多个生成器和判别器,每个生成器都负责生成图像的一部分,然后这些图像部分组合成最终的图像。在每个阶段中,判别器评估生成的图像部分,以便生成器可以改进其生成图像的部分。级联图像生成已经被证明是一种有效的方法,可以生成高质量的图像,尤其是在需要高分辨率图像的任务中,如人脸合成、艺术创作、社交媒体生成等。

低放大倍数是指图像在放大时的倍数比较低,也就是放大后的图像并没有很明显的增加像素数量。相反,高放大倍数则意味着放大后的图像包含了更多的像素,从而可能导致图像失真、模糊或者像素过于稀疏等问题。在图像处理中,低放大倍数的放大通常可以以一定程度上保持图像质量。

FID、IS、PSNR 和 SSIM 都是用于评估图像生成模型性能的指标

  1. FID(Fréchet Inception Distance)指标:FID 利用 Inception 网络提取特征,将真实图像和生成图像在 feature space 中的距离作为两者相似性的评估指标。FID 值越低表示生成图像与真实图像的相似性越高。

  2. IS(Inception Score)指标:IS 也是使用 Inception 网络,用于评估生成图像的多样性和质量。IS 值越高,表示生成图像多样性和质量都越高。

  3. PSNR(Peak Signal-to-Noise Ratio)指标:PSNR 度量了图像相对于原始图像的失真程度。PSNR 值越高,表示生成图像的失真程度越小,质量越高。

  4. SSIM(Structural Similarity Index)指标:SSIM 用于评估图像之间的结构相似性,即评估生成图像与真实图像的结构相似度。SSIM 值越接近 1,表示生成图像与真实图像的结构相似度越高。

全连接层
https://blog.csdn.net/weixin_36670529/article/details/84253019

细读论文基本概念了解相关推荐

  1. 计算机二级课程论文摘要,摘要、论文格式概念.doc

    摘 要 摘要内容(小四号宋体字,起行空两格,回行顶格,1.5倍行距) 关键词:关键词:关键词:关键词 论文题目(英文) Abstract:Thesis Topic Thesis Topic Thesi ...

  2. 论文的关键词应该如何选取?

    关键词是为了用于数据库对文章进行整理归档和后来学者进行检索和筛选.当我们在检索文献时,最先看到的是完整的论文标题.摘要和关键词,是不需要购买数据库访问权限下就可以获取的信息.其主要目的对于读者来说就是 ...

  3. 解读72篇DeepMind深度强化学习论文

    来源:王小惟的知乎https://zhuanlan.zhihu.com/p/70127847 编辑:DeepRL 论文下载方法:pdf合集下载见文章末尾 DRL领域交流与讨论加微信:NeuronDan ...

  4. 吴恩达:关于机器学习职业生涯以及阅读论文的一些建议

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:Mohamed Ali Habib 编译:ronghuaiy ...

  5. 焊接件技术要求怎么写_专硕论文写作要求有高么?具体怎么写?

    专业硕士是相对于学术性学位而言的学位类型.目的是培养具有扎实理论基础,并适应特定行业或职业实际工作需要的应用型高层次专门人才.要说明一点的的是,专业硕士仅仅是一个统称,在学位证上是不会注明" ...

  6. 硕士生写小论文的经验(转载)

    今天一大早来实验室,收到一份挂号信,打开一看,是编辑社寄过来的发票和稿件录用证明.心情很平静,因为这些都是意料中的事情,只是那1290RMB,看得我心如刀割啊.我投的是计算机核心期刊,影响因子还算可以 ...

  7. 如何写好一篇论文——闵老师《论文写作》心得

    如何写好一篇论文--闵老师<论文写作>心得 文章目录 如何写好一篇论文--闵老师<论文写作>心得 一. 学术论文基本概念 二.选题 三.准备工作 写作工具 阅读大量高质量论文 ...

  8. 科技论文的种类_如何快速对科技论文分类

    摘 要:该文通过归类整理的方法对科技论文进行种类划分,从科技论文所属学科和专业类别.写作目的和发挥作用.研究方法和论述内容三个不同的角度对科技论文分类,并进行了论述. 关键词:科技论文:归类整理:种类 ...

  9. 计算机基础知识论文统一格式,计算机论文格式(超级详细的攻略)

    一般来说,论文写作都是有标准的写作格式的,并且论文的优劣可以看出一个学者的学术情况,下面是计算机论文格式的介绍,欢迎阅读指正. 1.题名.题名是一篇论文的总题目,是论文内容的高度概括,是论文精髓集中表 ...

最新文章

  1. 每日一皮:在同一个项目上工作2年的样子...
  2. Android-2D绘图
  3. 我的Android进阶之旅------解决:debug-stripped.ap_' specified for property 'resourceFile' does not exist....
  4. 一个专家眼中的Go与Java垃圾回收算法大对比
  5. Ros无法自动补全命令的解决
  6. 企业微信应用权限签名api记录
  7. erlang底层c定时器设计-Erlang源码学习二
  8. C语言获取键盘方向键的键值
  9. 支付宝支付成功之后的接口_继支付宝微信之后,51信用卡还款也开始收费了,手续费再创新高...
  10. WebSphere Message Broker(2)--WMB V8下载、安装
  11. 千兆以太网和快速以太网有什么区别?
  12. 无人零售的黑科技:RFID技术
  13. 未明学院:双非学生风雨求职路 | 海投过上百封简历,面过券商、咨询、私募等6个方向后我得出的经验与教训
  14. 无人机介绍以及测评推荐
  15. 为什么在电力电子装置中,一般采集电压电流用来控制的采用霍尔传感器而不用互感器?
  16. 上海交通大学计算机专业培养方案,上海交通大学计算机科学与技术专业本科培养计划...
  17. 银行卡和预付卡的区别
  18. 前端学习网络资源链接汇总
  19. 学习之旅16-R数据可视化-图形处理(二)
  20. iPhone电池寿命深度解析

热门文章

  1. Smartbi产品军团战斗成员大阅兵
  2. css-超出内容省略号
  3. 2010年小学生学习全能托管
  4. 医院在线预约挂号管理系统(Java+SSH+MySQL)
  5. js将阿拉伯数字转换成中文的大写数字
  6. python中24≤2825是否合法_在下列Python语句中非法的是() (2.0分)_学小易找答案
  7. 国产可视化引擎PIE-Earth助力实景三维中国建设
  8. 自动阅读 到底 能不能赚钱
  9. Windows 下Nexus搭建Maven私服
  10. 用Python将excel表格按照列拆分为多个表格