作者:桂。

时间:2017-03-21  07:25:17

链接:http://www.cnblogs.com/xingshansi/p/6592599.html

声明:欢迎被转载,不过记得注明出处哦~


前言

本文为曲线拟合与分布拟合系列的一部分,主要讲解混合拉普拉斯分布(Laplace Mixture Model,LMM)。拉普拉斯也是常用的统计概率模型之一,网上关于混合高斯模型(GMM)的例子很多,而关于LMM实现的很少。其实混合模型都可以用EM算法推导,只是求闭式解的运算上略有差别,全文包括:

  1)LMM理论推导;

  2)LMM代码实现;

内容多有借鉴他人,最后一并附上链接。

一、LMM理论推导

  A-模型介绍

对于单个拉普拉斯分布,表达式为:

$f(Y) = \frac{1}{{2b}}{e^{ - \frac{{\left| {Y - \mu } \right|}}{b}}}$

对于$K$个模型的混合分布:

$P\left( {{Y_j}|\Theta } \right) = \sum\limits_{k = 1}^K {{w_k}f\left( {{Y_j}|{\mu _k},{b_k}} \right)} $

如何拟合呢?下面利用EM分析迭代公式,仅分析Y为一维的情况,其他可类推。(先给出一个结果图)

  B-EM算法推导

E-Step:

1)求解隐变量,构造完全数据集

同GMM推导类似,利用全概率公式:

2)构造Q函数

基于之前混合高斯模型(GMM)的讨论,EM算法下混合模型的Q函数可以表示为:

$Q\left( {\Theta ,{\Theta ^{\left( i \right)}}} \right) = \sum\limits_{j = 1}^N {\sum\limits_{k = 1}^K {\log \left( {{w_k}} \right)P\left( {{Z_j} \in {\Upsilon _k}|{Y_j},{\Theta ^{\left( i \right)}}} \right)} }  + \sum\limits_{j = 1}^N {\sum\limits_{k = 1}^K {\log \left( {{f_k}\left( {{Y_j}|{Z_j} \in {\Upsilon _k},{\theta _k}} \right)} \right)} } P\left( {{Z_j} \in {\Upsilon _k}|{Y_j},{\Theta ^{\left( i \right)}}} \right)$

其中${{\theta _k}} = [\mu_k,b_k]$为分布$k$对应的参数,$\Theta$  = {$\theta _1$,$\theta _2$,...,$\theta _K$}为参数集合,$N$为样本个数,$K$为混合模型个数。

M-Step:

1)MLE求参

  • 首先对${{w_k}}$进行优化

由于$\sum\limits_{k = 1}^M {{w_k}}  = 1$,利用Lagrange乘子求解:

${J_w} = \sum\limits_{j = 1}^N {\sum\limits_{k = 1}^K {\left[ {\log \left( {{w_k}} \right)P\left( {\left. {{Z_j} \in {\Upsilon _k}} \right|{Y_j},{{\bf{\Theta }}^{\left( i \right)}}} \right)} \right]} }  + \lambda \left[ {\sum\limits_{k = 1}^K {{w_k}}  - 1} \right]$

求偏导:

$\frac{{\partial {J_w}}}{{\partial {w_k}}} = \sum\limits_{J = 1}^N {\left[ {\frac{1}{{{w_k}}}P\left( {{Z_j} \in {\Upsilon _k}|{Y_j},{{\bf{\Theta }}^{\left( i \right)}}} \right)} \right] + } \lambda  = 0$

  • 对各分布内部参数$\theta_k$进行优化

给出准则函数:

${J_\Theta } = \sum\limits_{j = 1}^N {\sum\limits_{k = 1}^K {\log \left( {{f_k}\left( {{Y_j}|{Z_j} \in {\Upsilon _k},{\theta _k}} \right)} \right)} } P\left( {{Z_j} \in {\Upsilon _k}|{Y_j},{\Theta ^{\left( i \right)}}} \right)$

仅讨论$Y_j$为一维数据情况,其他类推。对于拉普拉斯分布:

关于$\theta_k$利用MLE即可求参。

首先求解$b_k$的迭代公式:

由于$\mu_k$含有绝对值,因此需要一点小技巧。${J_\Theta }$对$\mu_k$求偏导,得到:

得到的$\mu_k$估计即为:

$\mu _k^{\left( {i + 1} \right)} = {{\hat \mu }_k}$

在迭代的最终状态,可以认为$i$次参数与$i+1$次参数近似相等,从而上面的求导结果转化为:

得到参数$\mu_k$的迭代公式:

总结一下LMM的求解步骤:

E-Step:

M-Step:

二、LMM代码实现

根据上一篇GMM的代码,简单改几行code,即可得到LMM:

function [u,b,t,iter] = fit_mix_laplace( X,M )
%
% fit_mix_laplace - fit parameters for a mixed-laplacian distribution using EM algorithm
%
% format:   [u,b,t,iter] = fit_mix_laplacian( X,M )
%
% input:    X   - input samples, Nx1 vector
%           M   - number of gaussians which are assumed to compose the distribution
%
% output:   u   - fitted mean for each laplacian
%           b - fitted standard deviation for each laplacian
%           t   - probability of each laplacian in the complete distribution
%           iter- number of iterations done by the function
%
N           = length( X );
Z           = ones(N,M) * 1/M;                  % indicators vector
P           = zeros(N,M);                       % probabilities vector for each sample and each model
t           = ones(1,M) * 1/M;                  % distribution of the gaussian models in the samples
u           = linspace(0.2,1.4,M);        % mean vector
b           = ones(1,M) * var(X) / sqrt(M);     % variance vector
C           = 1/sqrt(2*pi);                     % just a constant
Ic          = ones(N,1);                        % - enable a row replication by the * operator
Ir          = ones(1,M);                        % - enable a column replication by the * operator
Q           = zeros(N,M);                       % user variable to determine when we have converged to a steady solution
thresh      = 1e-7;
step        = N;
last_step   = 300;         % step/last_step
iter        = 0;
min_iter    = 3000;
while ((( abs((step/last_step)-1) > thresh) & (step>(N*1e-10)) ) & (iter<min_iter) )% E step% ========Q   = Z;P   = 1./ (Ic*b) .* exp( -(1e-6+abs(X*Ir - Ic*u))./(Ic*b) );for m = 1:MZ(:,m)  = (P(:,m)*t(m))./(P*t(:));end% estimate convergence step size and update iteration numberprog_text   = sprintf(repmat( '\b',1,(iter>0)*12+ceil(log10(iter+1)) ));iter        = iter + 1;last_step   = step * (1 + eps) + eps;step        = sum(sum(abs(Q-Z)));fprintf( '%s%d iterations\n',prog_text,iter );% M step% ========Zm              = sum(Z);               % sum each columnZm(find(Zm==0)) = eps;                  % avoid devision by zerou               = sum(((X*Ir)./abs(X*Ir - Ic*u)).*Z) ./sum(1./abs(X*Ir - Ic*u).*Z) ;b               = sum((abs(X*Ir - Ic*u)).*Z) ./ Zm ;t               = Zm/N;
end
end

给出上文统计分布的拟合程序:

clc;clear all;
%generate random
xmin = -10;
xmax = 10;
Len = 10000000;
x = linspace(xmin,xmax,Len);
mu = [3,-4];
b = [0.9 0.4];
w = [0.7 0.3];
fx = w(1)/2/b(1)*exp(-abs(x-mu(1))/b(1))+ w(2)/2/b(2)*exp(-abs(x-mu(2))/b(2));
ymax = 1/b(2);
ymin = 0;
Y = (ymax-ymin)*rand(1,Len)-ymin;
data = x(Y<=fx);
%Laplace Mixture Model fitting
K = 2;
[mu_new,b_new,w_new,iter] = fit_mix_laplace( data',K);
%figure
subplot 221
hist(data,2000);
grid on;
subplot 222
numter = [xmin:.2:xmax];
plot(numter,w_new(1)/2/b_new(1)*exp(-abs(numter-mu_new(1))/b_new(1)),'r','linewidth',2);hold on;
plot(numter,w_new(2)/2/b_new(2)*exp(-abs(numter-mu_new(2))/b_new(2)),'g','linewidth',2);hold on;subplot (2,2,[3,4])
[histFreq, histXout] = hist(data, numter);
binWidth = histXout(2)-histXout(1);
%Bar
bar(histXout, histFreq/binWidth/sum(histFreq)); hold on;grid on;
plot(numter,w_new(1)/2/b_new(1)*exp(-abs(numter-mu_new(1))/b_new(1)),'r','linewidth',2);hold on;
plot(numter,w_new(2)/2/b_new(2)*exp(-abs(numter-mu_new(2))/b_new(2)),'g','linewidth',2);hold on;

对应结果图(与上文同):

参考

  • Mitianoudis N, Stathaki T. Batch and online underdetermined source separation using Laplacian mixture models[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2007, 15(6): 1818-1832.

转载于:https://www.cnblogs.com/xingshansi/p/6592599.html

混合拉普拉斯分布(LMM)推导及实现相关推荐

  1. matlab中表示拉普拉斯分布_CHAPT1:场论;电磁学和微波学的基本的数学手段和表示...

    物理学中把某个物理量在空间一个区域内的分布称为场.从各种场的取值性质来看可以分成两大类,一类是每个点对应一个数值,这种场统称为标量场,如温度场.密度场等;另一类是每 个点对应一个向量,这种场称为向量场 ...

  2. matlab中表示拉普拉斯分布_神奇的正态分布

    在统计学中有各种各样的分布,称为统计分布,例如有离散型的伯努利分布.二项分布.超几何分布.几何分布.负二项分布.泊松分布,有连续型的均匀分布.指数分布.t分布.卡方分布.F分布.正态分布等等,其中正态 ...

  3. matlab中表示拉普拉斯分布_分布拟合——正态/拉普拉斯/对数高斯/瑞利 分布

    作者:桂. 时间:2017-03-16  20:30:20 声明:欢迎被转载,记得注明出处~ 前言 本文为曲线与分布拟合的一部分,主要介绍正态分布.拉普拉斯分布等常用分布拟合的理论推导以及代码实现. ...

  4. 拉普拉斯分布和拉普拉斯变换有什么区别

    拉普拉斯分布和拉普拉斯变换是两个不同的概念. 拉普拉斯分布是一种特殊的概率分布,它是单峰的非对称分布,广泛应用于负面事件的概率分布,例如负极限分布. 拉普拉斯变换则是一种数学变换,它是一种常用于图像处 ...

  5. 常用的概率分布:伯努利分布、二项分布、多项式分布、高斯分布、指数分布、拉普拉斯分布和Dirac-delta分布

    伯努利分布(Bernoulli distribution) **伯努利分布:**单个二值随机变量的分布.由单个参数φ∈[0,1]控制. 例:抛硬币,正面朝上的概率. 二项式分布(binomial di ...

  6. matlab中表示拉普拉斯分布_拉普拉斯分布的随机数

    一.功能 产生拉普拉斯分布的随机数. 二.方法简介 1.产生随机变量的组合法 将分布函数\(F(x)\)分解为若干个较为简单的子分布函数的线性组合 \[F(x)=\sum_{i=1}^{K}p_{i} ...

  7. R语言 t分布的推导 初级统计学 学生t分布理论

    t分布的推导 那我们来写写代码,实践这个过程.我设定一个总体均数为0,标准差=1,样本量为1000的人群(图A是这个总体的概率分布).图B,也是一次抽取三个人,抽了200个,图C一次抽取6个人.都分别 ...

  8. 机器学习中的数学——常用概率分布(七): 拉普拉斯分布(Laplace分布)

    分类目录:<机器学习中的数学>总目录 相关文章: · 常用概率分布(一):伯努利分布(Bernoulli分布) · 常用概率分布(二):范畴分布(Multinoulli分布) · 常用概率 ...

  9. Laplace distribution (拉普拉斯分布)

    在概率论和统计学中,拉普拉斯是一种连续概率分布.由于它可以看做是俩个不同位置的指数分布背靠背拼在一起,所以它也叫做双指数分布.如果随机变量的概率密度函数分布为: 那么他就是拉普拉斯分布.u为位置参数, ...

最新文章

  1. maya批量命名插件_教你玩转MAYA的四十二精华造诣(第一期)
  2. Linux 如何获取PAGE size的大小?
  3. Oracle19C的dbhome,Windows server 安装Oracle19c (WINDOWS.X64_193000_db_home.zip) 过程碰到的问题总结...
  4. 终于知道以后该咋办了!
  5. 7-64 计算平均成绩 (15 分)
  6. mysql传入乱码_mysql 插入中文乱码解决方案 --转了
  7. 做人的36条常情世故
  8. docker volume源码分析
  9. rvm,ruby的安装
  10. Swing中JColorChooser的Abbot单元测试
  11. 常用的四大绩效考核方法以及优缺点
  12. 以太坊之dapp例子
  13. 海康威视错误代码0xf_海康威视视频智能分析整理文档
  14. re -12 buuctf [Zer0pts2020]easy strcmp
  15. js数组操作(push,pop,shift,unshift,slice,splice,concat,sort)
  16. 棋圣高调搬弄名人日本棋圣挟五冠搬弄对手
  17. 墙面有几种装修方法_装修时墙面处理都有哪几种方式?
  18. Laravel OAuth2 (一) ---简单获取用户信息
  19. 如何修改C盘下的用户名
  20. 小程序 订单倒计时系列

热门文章

  1. 傅里叶变换是什么?一看就懂,写的超级棒!
  2. 腾讯云直播代码 java_JAVA 对接腾讯云直播的实现
  3. Java对base64编解码总结
  4. win7网络发现启用后找不到网络计算机,win7启用网络发现怎么又关闭了怎么解决...
  5. 如何获取酷我音乐播放器中的歌手写真
  6. MAC M1大数据0-1成神篇-7 补充CAP模式
  7. Jquery做的网页版连连看(初稿)
  8. html如何将网页分割开来,发现pdf文件页面内容太多,怎么把页面拆分开来?
  9. 在LInux系统上安装ImageMagick
  10. cleanmymac苹果电脑必备mac系统垃圾清理工具分享