(X,Σ)(X,\Sigma)(X,Σ)为一个measurable space.

1. Total Variation (TV,全变分) distance

δ(Pr,Pg)=supA∈Σ∣Pr(A)−Pg(A)∣\delta(P_r,P_g)=\mathop{sup}\limits_{A\in \Sigma}|P_r(A)-P_g(A)|δ(Pr​,Pg​)=A∈Σsup​∣Pr​(A)−Pg​(A)∣
当XXX是有限空间时,有δ(P,Q)=maxx∈X∣P(x)−Q(x)∣\delta(P,Q)=\mathop{max}\limits_{x\in X}|P(x)-Q(x)|δ(P,Q)=x∈Xmax​∣P(x)−Q(x)∣

参考:

Total Variation

2. Kullback-Leibler (KL) divergence

KL((Pr∣∣Pg))=E(log(Pr(x)Pg(x))Pr(x))KL((P_r||P_g))=E(log(\frac{P_r(x)}{P_g(x)})P_r(x))KL((Pr​∣∣Pg​))=E(log(Pg​(x)Pr​(x)​)Pr​(x))
KL(Pr∣∣Pg)=1n∑i=1nlog(Pr(xi)Pg(xi))Pr(xi)KL(P_r||P_g)=\frac{1}{n}\sum_{i=1}^n log(\frac{P_r(x_i)}{P_g(x_i)})P_r(x_i)KL(Pr​∣∣Pg​)=n1​i=1∑n​log(Pg​(xi​)Pr​(xi​)​)Pr​(xi​)
KL(Pr∣∣Pg)=∫log(Pr(x)Pg(x))Pr(x)du(x)KL(P_r||P_g)=\int log(\frac{P_r(x)}{P_g(x)})P_r(x)d_{u(x)}KL(Pr​∣∣Pg​)=∫log(Pg​(x)Pr​(x)​)Pr​(x)du(x)​

  • 问题:不具有对偶性。
3. Jensen-Shannon (JS) divergence

JS(Pr,Pg)=KL(Pr∣∣Pm)+KL(Pg∣∣Pm)JS(P_r, P_g)=KL(P_r||P_m)+KL(P_g||P_m)JS(Pr​,Pg​)=KL(Pr​∣∣Pm​)+KL(Pg​∣∣Pm​)

  • 问题:不能解决平行线问题。
4. Wasserstein Distance
  • total cost(minimize)
    C(π∗)=infπ∈Π(u,v)E(x,y)∈(X,Y)c(x,y)C(\pi ^*)=\mathop{inf}\limits_{\pi \in \Pi(u,v)} \mathop{E}\limits_{(x,y)\in (X,Y)} c(x,y)C(π∗)=π∈Π(u,v)inf​(x,y)∈(X,Y)E​c(x,y)
  • 转移策略
    Π(u,v)={π∈P(X×Y):πx=u,πy=v}\Pi(u,v)=\{\pi\in P(X\times Y):\pi_x=u,\pi_y=v\}Π(u,v)={π∈P(X×Y):πx​=u,πy​=v}
    其中πx,πy\pi_x,\pi_yπx​,πy​分别是π\piπ在XXX和YYY上的边缘分布。
  • 1-Wasserstein Distance
    C(π∗)=infπ∈Π(u,v)∫X×Yc(x,y)dπ(x,y)C(\pi ^*)=\mathop{inf}\limits_{\pi \in \Pi(u,v)} \int_{X\times Y}c(x,y)d_{\pi(x,y)}C(π∗)=π∈Π(u,v)inf​∫X×Y​c(x,y)dπ(x,y)​
  • 优点
    Wasserstein distance 衡量的是把数据从分布p“移动成”分布q时所需要移动的平均距离的最小值。
    即使两个分布没有重叠或者重叠非常少,仍然能反映两个分布的远近。
  • 缺点
    不好优化。
5. Wasserstein Distance的对偶形式
*Learning parallel lines问题

gθ(z)=(θ,z)g_\theta(z)=(\theta,z)gθ​(z)=(θ,z):x=θx=\thetax=θ且y=z,z∼U[0,1]y=z,z \sim U[0,1]y=z,z∼U[0,1];
PθP_\thetaPθ​:gθ(z)g_\theta(z)gθ​(z)的分布。
可求得:
δ(P0,Pθ)={1θ≠00θ=0\delta(P_0,P_\theta)=\begin{cases} 1 & \theta\neq 0\\0 & \theta=0\end{cases}δ(P0​,Pθ​)={10​θ​=0θ=0​
KL(Pθ∣∣P0)=KL(P0∣∣Pθ)={+∞θ≠00θ=0KL(P_\theta||P_0)=KL(P_0||P_\theta)=\begin{cases} +\infty & \theta\neq0\\0 & \theta=0 \end{cases}KL(Pθ​∣∣P0​)=KL(P0​∣∣Pθ​)={+∞0​θ​=0θ=0​
JS(P0,Pθ)={log2θ≠00θ=0JS(P_0,P_\theta)=\begin{cases}log2 & \theta\neq0\\0 &\theta=0\end{cases}JS(P0​,Pθ​)={log20​θ​=0θ=0​
JS散度是怎么求的,不太懂?\color{red}{JS散度是怎么求的,不太懂?}JS散度是怎么求的,不太懂?
W(P0,Pθ)=∣θ∣W(P_0,P_\theta)=|\theta|W(P0​,Pθ​)=∣θ∣

分布的距离(Distance of Distributions)相关推荐

  1. 距离(distance)算法小结

    18种和"距离(distance)"."相似度(similarity)"相关的量的小结 在计算机人工智能领域,距离(distance).相似度(similari ...

  2. matlab 韩明距离_使用Matlab计算各种距离Distance

    计算距离的需求有两种: 一种是给定一个特征集合X,然后计算Pairwise距离矩阵,那么可使用D=pdist(X,distance)的方式: 另一种是给定两个对应的特征集合X和Y,然后计算X与Y对应的 ...

  3. 马氏距离 (马哈拉诺比斯距离) (Mahalanobis distance)

    马氏距离(Mahalanobis distance)是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示点与一个分布之间的距离.它是一种有效的计算两个未知样本集的相似度的方法 ...

  4. 推土距离, Wasserstein distance

    在鲁棒优化中见到一个名词:Wasserstein distance, 又称作 earth mover's distance,推土距离.用来测量两个随机分布的距离. 之所以叫推土距离,是因为它的物理含义 ...

  5. 浅谈马氏距离【Mahalonobis Distance】

    浅谈马氏距离[Mahalonobis Distance] 1. Introduction 2. 欧式距离对于多元数据会存在一些什么问题? 3 .什么是马氏距离 4.马氏距离背后的数学和intuitio ...

  6. 相似性度量的各种距离(Distance)计算归类详解及应用(强烈建议收藏!!!备用)

    Distance Classification Distance 欧氏距离(Euclidean Distance) 闵可夫斯基距离(Minkowski distance) 曼哈顿距离(Manhatta ...

  7. 用弗雷歇距离(Fréchet Distance)进行音质和视质度量

    用弗雷歇距离(Fréchet Distance)进行音质和视质度量 当你能够衡量自己所说的东西,并用数字来说明它,这意味着你对它有较好的了解:反之,则意味你对它并不是真正了解. ----William ...

  8. Distance computations - Cosine distance - 余弦距离

    Distance computations - Cosine distance - 余弦距离 Distance computations (scipy.spatial.distance) https: ...

  9. 计算机及统计学,统计学中及计算机视觉中的各种 距离 汇总。。。

    首先说一下距离三要素: 1)非负性:2)对称性:3)三角不等式.(PS:有些距离并不能同时满足) 集中一下都有啥距离: L1距离,L2距离(欧式距离),L∞距离,欧氏距离平方(squared Eucl ...

  10. R语言:计算各种距离

    R语言:计算各种距离 MATLAB 版本的 http://blog.csdn.net/sinat_26917383/article/details/52101425 PYTHON版本的 http:// ...

最新文章

  1. Does GATHER_STATS_JOB gather all objects' stats every time?
  2. ajax 跨域 headers JavaScript ajax 跨域请求 +设置headers 实践
  3. MATLAB基本操作(一):MATLAB中变量的文件存储
  4. Synchronize锁粒度
  5. 72.Minimum Window Substring(最小子串窗口)
  6. html2canvas关于图片不能正常截取
  7. QTableView双击 单机事件信号
  8. linux内存布局的内核实现--用户空间的映射方式
  9. Android的Service组件
  10. react 图表库 滚动_2019 年值得推荐的 React 可视化库
  11. Android自定义输入车牌号键盘、车牌简称,数字 ,字母键盘
  12. 学习笔记-OS - Exploits
  13. 世界各国国家代码简称
  14. Jabber Frame(超时传输帧)
  15. Matlab 齐次线性方程组求解举例
  16. 没想到 Python 中竟然还藏着这些稀奇古怪的东西...
  17. 【JAVA】JSON随机值生成工具类
  18. Google Safe Browsing API的使用
  19. 深度学习跑项目的注意事项
  20. likely()与unlikely()函数的作用

热门文章

  1. a标签提交form表单_Web前端开发基础知识,HTML中表单元素的理解
  2. golang 捕获堆栈信息_一篇文章教你如何捕获前端错误
  3. Spring AOP(七)之定义切入点
  4. 【sklearn第二十三讲】异常检测
  5. Docker系列(九)Docker的远程访问
  6. 基于FNC(全卷积神经网络)及PASCAL-VOC数据集做图像语义分割(附代码)
  7. idea maven列表有问题的
  8. 数据交互之封装request请求(微信小程序篇)
  9. spring官方文档列表
  10. [转]tar 命令使用