文章目录

  • 主要内容
    • ELBO
    • 网络结构
    • 不同的数据
    • HI-VAE
  • 代码

Nazabal A., Olmos P., Ghahramani Z. and Valera I.
Handing incomplete heterogeneous data using VAEs.
Pattern Recognition, 2020, 107: 107501.

这篇文章利用VAE处理缺失数据, 以往的对缺失数据的处理往往是不区分连续离散, 数字符号的, 感觉这里利用分布的处理方式非常精彩.

主要内容

ELBO

首先, 既然是利用VAE, 那么就需要推导出相应的ELBO来.
文章首先假设数据xxx和隐变量之间关系满足:
p(xn,zn)=p(zn)∏dp(xnd∣zn),p(x_n, z_n) = p(z_n) \prod_d p(x_{nd}|z_n), p(xn​,zn​)=p(zn​)d∏​p(xnd​∣zn​),
即xnx_nxn​的各分量关于znz_nzn​的条件独立的.
进一步引入观测数据xox^oxo和xmx^mxm, 即
xndo={xnd,d∈On0,d∈Mn,xnm=xn−xno.x^o_{nd} = \left \{ \begin{array}{ll} x_{nd}, & d \in \mathcal{O}_n \\ 0, & d \in \mathcal{M}_n \end{array} \right ., \\ x^{m}_n = x_n - x_{n}^o. xndo​={xnd​,0,​d∈On​d∈Mn​​,xnm​=xn​−xno​.
其中O,M\mathcal{O}, \mathcal{M}O,M 分别是观测的元素和缺失的元素位置, 且彼此是互斥的.
那么
p(xn∣zn)=∏d∈Onp(xnd∣zn)∏d∈Mnp(xnd∣zn).p(x_n|z_n) = \prod_{d \in \mathcal{O}_n} p(x_{nd}|z_n) \prod_{d \in \mathcal{M}_n} p(x_{nd}|z_n). p(xn​∣zn​)=d∈On​∏​p(xnd​∣zn​)d∈Mn​∏​p(xnd​∣zn​).
q(zn,xnm∣xno)=q(zn∣xno)∏d∈Mnp(xnd∣zn).q(z_n, x_n^m|x_n^o) = q(z_n|x_n^o) \prod_{d \in \mathcal{M}_n} p(x_{nd}|z_n). q(zn​,xnm​∣xno​)=q(zn​∣xno​)d∈Mn​∏​p(xnd​∣zn​).

则通过极大似然即可推出ELBO:
log⁡p(Xo)=∑nEq(zn∣xno)log⁡p(xno,zn)q(zn∣xno)q(zn∣xno)p(zn∣xno)≥∑nEq(zn∣xno)log⁡p(xno∣zn)−∑nKL(q(zn∣xno)∥p(zn)).\begin{array}{ll} \log p(X^o) &= \sum_{n} \mathbb{E}_{q(z_n|x_n^o)} \log \frac{p(x_n^o, z_n)}{q(z_n|x_n^o)} \frac{q(z_n|x_n^o)}{p(z_n|x^o_n)} \\ &\ge \sum_n \mathbb{E}_{q(z_n|x_n^o)} \log p(x_n^o|z_n) - \sum_n \mathrm{KL}(q(z_n|x_n^o)\| p(z_n)). \end{array} logp(Xo)​=∑n​Eq(zn​∣xno​)​logq(zn​∣xno​)p(xno​,zn​)​p(zn​∣xno​)q(zn​∣xno​)​≥∑n​Eq(zn​∣xno​)​logp(xno​∣zn​)−∑n​KL(q(zn​∣xno​)∥p(zn​)).​
其中p(xno∣zn)=∏d∈Onp(xnd∣zn)p(x_n^o|z_n)=\prod_{d \in \mathcal{O}_n} p(x_{nd}|z_n)p(xno​∣zn​)=∏d∈On​​p(xnd​∣zn​).

网络结构

从上面的假设就可以看出, 整体的VAE的结构是这样的:

  1. 观测数据xox^oxo经过encoder得到μq(xo),Σq(xo)\mu_q(x^o), \Sigma_q(x^o)μq​(xo),Σq​(xo), 并从高斯分布中采样得到zzz.
  2. 隐变量zzz经过独立的网络h1,⋯,hdh_1, \cdots, h_dh1​,⋯,hd​得到预测的数据γ1,γ2,⋯,γd\gamma_1, \gamma_2, \cdots, \gamma_dγ1​,γ2​,⋯,γd​, 这些用于构建各自的分布p(xd∣γd)p(x_d|\gamma_d)p(xd​∣γd​), 这个分布是数据的类型而不同.

不同的数据

这对不同的数据类型, 可以假设不同的分布p(xd∣γd)p(x_d|\gamma_d)p(xd​∣γd​), 这我认为是非常有趣的一个点.

  1. 如果xdx_dxd​是实值变量, 则可以假设其为高斯分布:
    p(xd∣γd)=N(xd∣μd(z),σd2(z)).p(x_d|\gamma_d) = \mathcal{N} (x_d|\mu_d(z), \sigma_d^2(z)). p(xd​∣γd​)=N(xd​∣μd​(z),σd2​(z)).
  2. 如果xd∈R+x_d \in \mathbb{R}^+xd​∈R+, 则
    log⁡p(xd∣γd)=N(xd∣μd(z),σd2(z)),xd≥0.\log p(x_d|\gamma_d) = \mathcal{N} (x_d|\mu_d(z), \sigma_d^2(z)), x_d \ge 0. logp(xd​∣γd​)=N(xd​∣μd​(z),σd2​(z)),xd​≥0.
  3. xd∈{0,1,2,⋯}x_d \in \{0, 1, 2, \cdots \}xd​∈{0,1,2,⋯}, 则假设poisson分布:
    p(xd∣γd)=Poiss(xd∣λ(z))=λd(z)xdexp⁡(−λd(zn))xd!.p(x_d|\gamma_d) = \mathrm{Poiss}(x_d|\lambda(z)) = \frac{\lambda_d(z)^{x_d} \exp (-\lambda_d(z_n))}{x_d!}. p(xd​∣γd​)=Poiss(xd​∣λ(z))=xd​!λd​(z)xd​exp(−λd​(zn​))​.
  4. 类别数据, γd∈{hd0(z),⋯,hd(R−1)(z)}\gamma_d \in \{h_{d0}(z), \cdots, h_{d(R-1)}(z)\}γd​∈{hd0​(z),⋯,hd(R−1)​(z)}此时为logits, 最后的概率分布
    p(xd=r∣γd)=exp⁡(−hdr(z))∑rexp⁡(−hdr(z))p(x_d = r|\gamma_d) = \frac{\exp (-h_{dr}(z))}{\sum_r \exp (-h_{dr}(z))} p(xd​=r∣γd​)=∑r​exp(−hdr​(z))exp(−hdr​(z))​
  5. Ordinal data
    p(xd=r∣γd)=p(xd≤r∣γd)−p(xd≤r−1∣γd),p(x_d = r | \gamma_d) = p(x_d \le r|\gamma_d)-p(x_d \le r-1|\gamma_d), p(xd​=r∣γd​)=p(xd​≤r∣γd​)−p(xd​≤r−1∣γd​),
    其中
    p(xd≤r∣γd)=11+exp⁡(−(θr(z)−hd(z))).p(x_d \le r|\gamma_d) = \frac{1}{1 + \exp (-(\theta_r(z)- h_d(z)))}. p(xd​≤r∣γd​)=1+exp(−(θr​(z)−hd​(z)))1​.

HI-VAE

上述的假设有些过于强了, 为此, 作者做出了一些调整.

  1. 假设一个了一个混合的高斯先验: p(z∣sn)p(z|s_n)p(z∣sn​);
  2. 隐变量需要先经过一个共同的变化得到YnY_nYn​再和sns_nsn​一起经过独立的网络得到γ1,γ2,⋯,γd\gamma_1, \gamma_2, \cdots, \gamma_dγ1​,γ2​,⋯,γd​.

个人感觉第二点的设计还是不错的.

代码

原文代码

Handing Incomplete Heterogeneous Data using VAEs相关推荐

  1. 基于联邦学习的多源异构数据融合算法 Multi-Source Heterogeneous Data Fusion Based on Federated Learning

    5.基于联邦学习的多源异构数据融合算法 Multi-Source Heterogeneous Data Fusion Based on Federated Learning 摘要:随着科技的迅猛发展, ...

  2. Java异构数据翻译器_分布式异构数据,distributed heterogeneous data,音标,读音,翻译,英文例句,英语词典...

    补充资料:分布式异构型计算机系统 分布式异构型计算机系统 distributed heterogeneous computer system fenbushi yigOUxing iisuQnji X ...

  3. 【多目标轨迹预测】Trajectron++:Dynamically-Feasible TrajectoryForecastin With Heterogeneous Data(简化翻译+笔记)

    论文地址:https://arxiv.org/abs/2001.03093 代码地址:https://github.com/StanfordASL/Trajectron-plus-plus 摘要: 智 ...

  4. 每周大数据论文(二)Data Mining with Big Data

    日常声明:论文均来自于谷歌学术或者其他国外付费论文站,博主只是读论文,译论文,分享知识,如有侵权联系我删除,谢谢.同时希望和大家一起学习,有好的论文可以推荐给我,我翻译了放上来,也欢迎大家关注我的读论 ...

  5. Reinforcement Learning Enhanced Heterogeneous Graph Neural Network阅读笔记

    强化学习增强异质图神经网络 代码源:https://github.com/zhiqiangzhongddu/RL-HGNN 摘要 异构信息网络(HINs)涉及多种节点类型和关系类型,在许多实际应用中非 ...

  6. ICRA2022 SLAM相关论文整理

    目录 视觉SLAM相关 线.面.3Dfeature 多相机系统 VIO+GPS 其他 数据集 三维重建 语义SLAM Special sensor Lidar相关 视觉SLAM相关 线.面.3Dfea ...

  7. ICML 2019 Accepted Papers (Title, Author, Abstract, Code) (001-150)

    本博客致力于整理出ICML 2019接收的所有论文,包括题目.作者.摘要等重要信息,能够方便广大读者迅速找到自己领域相关的论文. 相关论文代码.附录可参考ICML 2019 #####1-10#### ...

  8. CCF A类会议或期刊----多视图,多模态近两年论文

    工具代码位置 期待您的PR 多模态多视图交流QQ群:927952513 会议/期刊 论文 neurips2020 Removing Bias in Multi-modal Classifiers: R ...

  9. 提取数据_基于众包的可视化图表数据提取

    Crowdsourcing-based Data Extraction from Visualization Charts 作者 Chengliang Chai† Guoliang Li† Ju Fa ...

  10. 基于众包的可视化图表数据提取

    Crowdsourcing-based Data Extraction from Visualization Charts 作者 摘要 1 介绍 2 问题模拟 3 CrowdChart框架 A 工人的 ...

最新文章

  1. 第五章ThinkingInJava
  2. php如何word转html格式文件,PHP将上传word文件,转化为Html格式,(多种转换方式)
  3. 集合的定义与并查操作(C语言)
  4. 分布式锁 分布式系统
  5. e - 数据结构实验之查找五:平方之哈希表_leetcode算法之哈希表
  6. java jdk 加密_jdk实现常见的加密算法
  7. 面向对象第二单元总结
  8. 解决方案 | 解决Adobe Acrobat 2020安装报错的一些问题,如无法打开键
  9. 微信服务器 系统发生错误,微信系统错误请重试怎么解决-解决微信提示“系统错误,请重试”的方案 - 河东软件园...
  10. 【Linux】gvim封装至gvi命令
  11. 新冠死亡率居高不下,为什么偏偏是意大利?
  12. 计算机基础知识考点合集
  13. Lesson 19 A very dear cat 内容鉴赏
  14. #### mysql联合索引 注意事项 ####
  15. N46期第十二周作业
  16. vs2013使用QT自带的openGL
  17. photoscan处理多光谱数据
  18. 【小程序】蓝色通信——控制蓝牙锁开关
  19. win 10 电脑喇叭音频显示红叉的处理方法
  20. 【Cocoa(mac) Application 开发系列之四】动作编辑器(Cocos2dx)制作流程详解及附上响应鼠标滚轴事件、反转坐标系、导入/创建资源目录等知识点代码!

热门文章

  1. 农商银行招聘计算机人员考什么,农商银行招聘考试考什么内容
  2. NLP领域的机器阅读理解方向的数据集总结
  3. Java小游戏之《大鱼吃小鱼》
  4. android坐标计算器,函数科学计算器算坐标
  5. Win10系统中耳机插入前后面板均没有声音
  6. win7台式机解决插入耳机没有声音以及显示麦克风未插入的解决方法
  7. 你的格局决定你的结局
  8. ES7.16.2基础操作之slop查询(三)
  9. PuTTY 远程连接 Linux 服务器
  10. uvalive4987