主流模型一览


这篇文章对主流时空预测模型做了总结,我在提炼浓缩一下,predrnn的改进是结构上到下以及下到上的连接,实际上Trijgru里shi就提到过这个他的encode-forcast结构是顶层指导底层,这个和yunbowang的结构其实不太一样。predrnn++里用ghu解决梯度的问题,mim里作者发现foreget门只记住了平稳的线性信息,e3d是rnn和c3d的结合并且在内部有个attention机制,他后续打算ProphetNet嫁接到Gru上来。

gan外推方法

这篇当然是最早的一批文章

但实际上雷达图并没有所谓背景与移动图像的分离,我很早之前看过一篇类似于先快速傅里叶变化然后分别预测高频和低频的文章

dcgan与convgru结合的:

当然国防科的也有2篇dcgan的aenn和mlc-lstm,他们的图里的结果很清晰这就很奇怪,我猜是因为图片尺寸小的缘故128*128,dcgan好训练我他喵就没成功过那么清晰的无论d是基于流的还是单帧的。

如下的两个问题其实我感觉是从模式的角度出发的实际上并不是因,而是结果:

他的创新处:

lk光流的缺点,这个我很早也注意到了:

他把卷积层替换成inception的结构,convgru的单元换成predrnn,这个思路跟我比赛中的思路差不多,但我觉得问题在于predrnn的结构确实从模式的角度来看被证明确实有效提高时空关联,但incepation较之普通卷积层实际上并没有解决时间上的问题,换言之传统卷积层提取空间信息完全够用,你堆再多层感受野在大那是显卡的问题而并没有解决时间角度上的非线性,所以加attention也是这么个道理。

就是这张图,所以我一直对国防科的两篇文章有疑惑,他们是这么做到又清晰评分又高的呢?mpl-gan的作者实现了高分辨率的预测但他给我的回复明确表示hss等相关技巧评分没有提高反而下降。

EBGAN



gan模型的两种观点:

当然他这个数据显然是造的,太明显了
这个估计也是造的:

为什么呢,我猜测的一个可能的原因就是两种损失函数优化得到pdf的方向是不同的,你折中了不见得就是真实的pdf,所以评分没有显著提高,或者说另一个原因是使用gan的大前提是认为训练集就是真实分布,也有可能优化的方向是对的,但是这样的抽样带来的误差更大,因为就算是有100万张雷达图也不可能代表真实分布,跟不要说只挑选出有明显回波过程的序列了,抽样误差比拟合精度更高带来的误差更大,我也做过消融同样是这种问题,所以这个问题真的很难。

GAN视频预测

首先指出了它的问题就是有限数据样本模拟真实情况

是的我还跑过这个,但是后来换方向就不了了之了,但效果是真的差

这里提到一个很关键的点就是模糊确实是时间上带来的不确定

wgan坑就坑在开源的用的优化器是rmsprop这东西根本更新不动好吧,反正我是弄不出来

wgan-gp这东西loss的曲线都是乱的我也搞不懂服了

当然现在大多数的视频预测都是conditionGAN,来源于pix2pix

为什么GAN评分不高的一些猜想

在试验过程中如果使用mse&mae+ssim+gdl损失函数与用mse&mae损失函数的预测结果对比边缘要更清晰一些,整体层次感更强一些,在与使用mse&mae+gan损失函数相比整体更锐化,而mse&mae+gan的损失函数则给人的感觉就是分辨率更高一些。在试验过程中损失函数的权重系数很重要,并且GAN训练框架下很难调优,容易遇到‘模式崩溃’问题。对于GAN来说有两种视角来看待其一是以生成器为主导去修正判别器,其二是判别器主导来修正生成器,我们以第二种视角来看,如下公式所示:

在梯度反传的时候,梯度的方向是由上述四个损失函数共同决定的,但是四个优化的方向对数据集的分布假设不一样,因而多个损失函数联合的优化的方向是否朝着真实的雷达回波分布去优化,联合损失函数的极值点是否是真实函数的极值点,这里需要打上问号。现阶段已有最新的研究如《MPL-GAN: Toward Realistic Meteorological Predictive Learning Using Conditional GAN》实现预测清晰的雷达图,其模型结构如下:

其结果如下:

但其并没有提示综合技巧评分反而有所下降,其指出GAN带来的基于概率视角的不确定性可以提升锐度但反而导致预测精度下降。因此进一步的思考和阐述模糊的原因,基于对抗损失函数的基本思路即训练一个与真实回波序列分布相同的生成器和一个能够鉴别真假分布的判别器,那么模糊的来源就是模式没法通过有限的训练集来学到真实的分布,无法覆盖整个空间,这是必然的因为雷达回波是一个高度非线性的随机过程,即使在使用condition GAN的情况下(引入一个先验)也极难预测,故而这个不确定性就会导致模糊的情况,那么可以认为这是系统误差。另一个可能的原因基于上述联合损失函数的梯度下降,那么在训练的后期即使前期人为的调整过各个损失函数的缩放参数保证量级不会差的太远,究竟是哪个损失函数在起到主导作用?,进一步思考这个梯度下降的方向从mse&mae的角度来看和从对抗损失的角度来看究竟更偏向谁?速度如何?还是在‘折中’的时候导致了最后的预测模糊,这个需要进一步的探究和非常深入的定量分析。

雷达回波视频预测核心问题及关键技术纪要相关推荐

  1. 网易视频云:构建一站式视频云点播平台的关键技术

    网易视频云是网易倾力打造的一款基于云计算的分布式多媒体处理集群和专业音视频技术,为客户提供稳定流畅.低时延.高并发的视频直播.录制.存储.转码及点播等音视频的PaaS服务.在线教育.远程医疗.娱乐秀场 ...

  2. 音视频云系列 - 谈谈XR关键技术及VR/AR/MR/XR关系

    作者,李琳,毕蕾,灯塔 一.先别被VR/AR/MR/XR搞晕,说说区别 虚拟现实(Virtual Reality,VR).增强现实(Augmented Reality,AR)等业务以其三维化.自然交互 ...

  3. MPEG-4视频编码核心思想

    1 引言  当今时代,信息技术和计算机互联网飞速发展,在此背景下,多媒体信息已成为人类获取信息的最主要载体,同时也成为电子信息领域技术开发和研究的热点.多媒体信息经数字化处理后具有易于加密.抗干扰能力 ...

  4. 视频直播关键技术:流畅、拥塞和延时追赶

    这两年互联网领域的一个热门关键词就是视频直播,从刚开始的游戏直播和秀场娱乐开始,现在各个行业里都植入了直播元素.网易云信多年以来,一直深耕于音视频领域,这篇文章将和大家聊一聊视频直播的几个关键技术. ...

  5. 【揭秘】视频直播关键技术

    这两年互联网领域的一个热门关键词就是视频直播,从刚开始的游戏直播和秀场娱乐开始,现在各个行业里都植入了直播元素.网易云一直致力于给大家提供更好的视频服务,这篇文章聊一聊视频直播的几个关键技术:  清晰 ...

  6. 视频直播关键技术:流畅、拥塞和延时追赶 1

    这两年互联网领域的一个热门关键词就是视频直播,从刚开始的游戏直播和秀场娱乐开始,现在各个行业里都植入了直播元素.网易云信多年以来,一直深耕于音视频领域,这篇文章将和大家聊一聊视频直播的几个关键技术. ...

  7. 査勇:华为云在视频AI转码领域的技术实践

    随着5G的落地和消费终端的不断升级,消费环节对视频画质的要求也越来越高,为了给消费者带来更清晰.更逼真和更具沉浸感的观感体验,对云端视频处理技术也提出了更高的要求.本次分享,华为云媒体处理服务研发负责 ...

  8. 华为云媒体査勇:华为云在视频AI转码领域的技术实践

    随着5G的落地和消费终端的不断升级,消费环节对视频画质的要求也越来越高,为了给消费者带来更清晰.更逼真和更具沉浸感的观感体验,对云端视频处理技术也提出了更高的要求.在2022 LiveVideoSta ...

  9. 付晓岩 于宏志:数字经济时代关键技术对银行转型的影响

    以下文章来源于银行家杂志 作者 付晓岩 建信金科风险合规团队副总经理 于宏志 神州信息CTO 导语:古希腊数学家.哲学家毕达哥拉斯认为,"万物皆数",宇宙万物皆由"数&q ...

最新文章

  1. 2018-4-17论文《狼群算法的研究与应用》笔记2 :高维复杂单目标连续优化问题的改进狼群算法
  2. 老牌名校助理教授给出8个建议
  3. leetcode算法题--Group Anagrams
  4. 中粮集团对话农民丰收节交易会-万祥军:订单农业丰收经
  5. 使用绝对定位时浏览器大小改变排版会乱_HTML amp; CSS页面布局之定位
  6. Scrapy-redis实现分布式爬取的过程与原理
  7. cstring判断包含字符串_Python字符串方法之-解决判断问题
  8. matlab对多项式求导,matlab中多项式求导
  9. 百度-北大在Kaggle发起自动驾驶环境下的汽车6-DOF预测挑战赛
  10. http 500错误解决方案
  11. RN:Android 开发记录
  12. div+css实现背景透明
  13. php十六进制转为ascii,16进制转换成ascii_16进制转ascii码转换工具_16进制转ascii
  14. Oracle10g卸载
  15. idea插件开发教程
  16. Bootable USB Stick
  17. STM32F401的RCC时钟配置
  18. 运动图像国际压缩标准-整理
  19. Win7 开机后3分钟内硬盘等狂闪解决办法
  20. JCA Overview

热门文章

  1. 中证登姚前演讲:数字资产是数字金融的核心(全文)
  2. PCIe传输速率和有效带宽计算方式
  3. 带宽,速率,吞吐量区别
  4. 山东微信红包派发量全国第8
  5. 计算pi小数点后10000位
  6. 基于LSTM的股票预测模型_python实现_超详细
  7. 要考试了,通过爬虫获取试题,最后再看2小时
  8. 【微信小程序---如何引入阿里巴巴图标步骤】
  9. RAID容量在线计算器
  10. Latex aligned