分布的距离(Distance of Distributions)
(X,Σ)(X,\Sigma)(X,Σ)为一个measurable space.
1. Total Variation (TV,全变分) distance
δ(Pr,Pg)=supA∈Σ∣Pr(A)−Pg(A)∣\delta(P_r,P_g)=\mathop{sup}\limits_{A\in \Sigma}|P_r(A)-P_g(A)|δ(Pr,Pg)=A∈Σsup∣Pr(A)−Pg(A)∣
当XXX是有限空间时,有δ(P,Q)=maxx∈X∣P(x)−Q(x)∣\delta(P,Q)=\mathop{max}\limits_{x\in X}|P(x)-Q(x)|δ(P,Q)=x∈Xmax∣P(x)−Q(x)∣
参考:
Total Variation
2. Kullback-Leibler (KL) divergence
KL((Pr∣∣Pg))=E(log(Pr(x)Pg(x))Pr(x))KL((P_r||P_g))=E(log(\frac{P_r(x)}{P_g(x)})P_r(x))KL((Pr∣∣Pg))=E(log(Pg(x)Pr(x))Pr(x))
KL(Pr∣∣Pg)=1n∑i=1nlog(Pr(xi)Pg(xi))Pr(xi)KL(P_r||P_g)=\frac{1}{n}\sum_{i=1}^n log(\frac{P_r(x_i)}{P_g(x_i)})P_r(x_i)KL(Pr∣∣Pg)=n1i=1∑nlog(Pg(xi)Pr(xi))Pr(xi)
KL(Pr∣∣Pg)=∫log(Pr(x)Pg(x))Pr(x)du(x)KL(P_r||P_g)=\int log(\frac{P_r(x)}{P_g(x)})P_r(x)d_{u(x)}KL(Pr∣∣Pg)=∫log(Pg(x)Pr(x))Pr(x)du(x)
- 问题:不具有对偶性。
3. Jensen-Shannon (JS) divergence
JS(Pr,Pg)=KL(Pr∣∣Pm)+KL(Pg∣∣Pm)JS(P_r, P_g)=KL(P_r||P_m)+KL(P_g||P_m)JS(Pr,Pg)=KL(Pr∣∣Pm)+KL(Pg∣∣Pm)
- 问题:不能解决平行线问题。
4. Wasserstein Distance
- total cost(minimize)
C(π∗)=infπ∈Π(u,v)E(x,y)∈(X,Y)c(x,y)C(\pi ^*)=\mathop{inf}\limits_{\pi \in \Pi(u,v)} \mathop{E}\limits_{(x,y)\in (X,Y)} c(x,y)C(π∗)=π∈Π(u,v)inf(x,y)∈(X,Y)Ec(x,y) - 转移策略
Π(u,v)={π∈P(X×Y):πx=u,πy=v}\Pi(u,v)=\{\pi\in P(X\times Y):\pi_x=u,\pi_y=v\}Π(u,v)={π∈P(X×Y):πx=u,πy=v}
其中πx,πy\pi_x,\pi_yπx,πy分别是π\piπ在XXX和YYY上的边缘分布。 - 1-Wasserstein Distance
C(π∗)=infπ∈Π(u,v)∫X×Yc(x,y)dπ(x,y)C(\pi ^*)=\mathop{inf}\limits_{\pi \in \Pi(u,v)} \int_{X\times Y}c(x,y)d_{\pi(x,y)}C(π∗)=π∈Π(u,v)inf∫X×Yc(x,y)dπ(x,y) - 优点
Wasserstein distance 衡量的是把数据从分布p“移动成”分布q时所需要移动的平均距离的最小值。
即使两个分布没有重叠或者重叠非常少,仍然能反映两个分布的远近。 - 缺点
不好优化。
5. Wasserstein Distance的对偶形式
*Learning parallel lines问题
gθ(z)=(θ,z)g_\theta(z)=(\theta,z)gθ(z)=(θ,z):x=θx=\thetax=θ且y=z,z∼U[0,1]y=z,z \sim U[0,1]y=z,z∼U[0,1];
PθP_\thetaPθ:gθ(z)g_\theta(z)gθ(z)的分布。
可求得:
δ(P0,Pθ)={1θ≠00θ=0\delta(P_0,P_\theta)=\begin{cases} 1 & \theta\neq 0\\0 & \theta=0\end{cases}δ(P0,Pθ)={10θ=0θ=0
KL(Pθ∣∣P0)=KL(P0∣∣Pθ)={+∞θ≠00θ=0KL(P_\theta||P_0)=KL(P_0||P_\theta)=\begin{cases} +\infty & \theta\neq0\\0 & \theta=0 \end{cases}KL(Pθ∣∣P0)=KL(P0∣∣Pθ)={+∞0θ=0θ=0
JS(P0,Pθ)={log2θ≠00θ=0JS(P_0,P_\theta)=\begin{cases}log2 & \theta\neq0\\0 &\theta=0\end{cases}JS(P0,Pθ)={log20θ=0θ=0
JS散度是怎么求的,不太懂?\color{red}{JS散度是怎么求的,不太懂?}JS散度是怎么求的,不太懂?
W(P0,Pθ)=∣θ∣W(P_0,P_\theta)=|\theta|W(P0,Pθ)=∣θ∣
分布的距离(Distance of Distributions)相关推荐
- 距离(distance)算法小结
18种和"距离(distance)"."相似度(similarity)"相关的量的小结 在计算机人工智能领域,距离(distance).相似度(similari ...
- matlab 韩明距离_使用Matlab计算各种距离Distance
计算距离的需求有两种: 一种是给定一个特征集合X,然后计算Pairwise距离矩阵,那么可使用D=pdist(X,distance)的方式: 另一种是给定两个对应的特征集合X和Y,然后计算X与Y对应的 ...
- 马氏距离 (马哈拉诺比斯距离) (Mahalanobis distance)
马氏距离(Mahalanobis distance)是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示点与一个分布之间的距离.它是一种有效的计算两个未知样本集的相似度的方法 ...
- 推土距离, Wasserstein distance
在鲁棒优化中见到一个名词:Wasserstein distance, 又称作 earth mover's distance,推土距离.用来测量两个随机分布的距离. 之所以叫推土距离,是因为它的物理含义 ...
- 浅谈马氏距离【Mahalonobis Distance】
浅谈马氏距离[Mahalonobis Distance] 1. Introduction 2. 欧式距离对于多元数据会存在一些什么问题? 3 .什么是马氏距离 4.马氏距离背后的数学和intuitio ...
- 相似性度量的各种距离(Distance)计算归类详解及应用(强烈建议收藏!!!备用)
Distance Classification Distance 欧氏距离(Euclidean Distance) 闵可夫斯基距离(Minkowski distance) 曼哈顿距离(Manhatta ...
- 用弗雷歇距离(Fréchet Distance)进行音质和视质度量
用弗雷歇距离(Fréchet Distance)进行音质和视质度量 当你能够衡量自己所说的东西,并用数字来说明它,这意味着你对它有较好的了解:反之,则意味你对它并不是真正了解. ----William ...
- Distance computations - Cosine distance - 余弦距离
Distance computations - Cosine distance - 余弦距离 Distance computations (scipy.spatial.distance) https: ...
- 计算机及统计学,统计学中及计算机视觉中的各种 距离 汇总。。。
首先说一下距离三要素: 1)非负性:2)对称性:3)三角不等式.(PS:有些距离并不能同时满足) 集中一下都有啥距离: L1距离,L2距离(欧式距离),L∞距离,欧氏距离平方(squared Eucl ...
- R语言:计算各种距离
R语言:计算各种距离 MATLAB 版本的 http://blog.csdn.net/sinat_26917383/article/details/52101425 PYTHON版本的 http:// ...
最新文章
- Does GATHER_STATS_JOB gather all objects' stats every time?
- ajax 跨域 headers JavaScript ajax 跨域请求 +设置headers 实践
- MATLAB基本操作(一):MATLAB中变量的文件存储
- Synchronize锁粒度
- 72.Minimum Window Substring(最小子串窗口)
- html2canvas关于图片不能正常截取
- QTableView双击 单机事件信号
- linux内存布局的内核实现--用户空间的映射方式
- Android的Service组件
- react 图表库 滚动_2019 年值得推荐的 React 可视化库
- Android自定义输入车牌号键盘、车牌简称,数字 ,字母键盘
- 学习笔记-OS - Exploits
- 世界各国国家代码简称
- Jabber Frame(超时传输帧)
- Matlab 齐次线性方程组求解举例
- 没想到 Python 中竟然还藏着这些稀奇古怪的东西...
- 【JAVA】JSON随机值生成工具类
- Google Safe Browsing API的使用
- 深度学习跑项目的注意事项
- likely()与unlikely()函数的作用
热门文章
- a标签提交form表单_Web前端开发基础知识,HTML中表单元素的理解
- golang 捕获堆栈信息_一篇文章教你如何捕获前端错误
- Spring AOP(七)之定义切入点
- 【sklearn第二十三讲】异常检测
- Docker系列(九)Docker的远程访问
- 基于FNC(全卷积神经网络)及PASCAL-VOC数据集做图像语义分割(附代码)
- idea maven列表有问题的
- 数据交互之封装request请求(微信小程序篇)
- spring官方文档列表
- [转]tar 命令使用