Fisher Information(费雪信息)

定义

Fisher Information 是一种衡量“随机观测样本携带的未知参数 θ \theta θ的信息量”的方法,其中 θ \theta θ为待估计的参数。

假定观测随机变量序列为 X 1 , X 2 , . . . , X 3 X_1,X_2,...,X_3 X1​,X2​,...,X3​,且都服从概率分布 f ( X ; θ ) f(X;\theta) f(X;θ),则似然函数可以表示成:
L ( X ; θ ) = ∏ i = 1 n f ( X i ; θ ) L(\mathbf{X} ; \theta)=\prod_{i=1}^n f\left(X_i ; \theta\right) L(X;θ)=i=1∏n​f(Xi​;θ)
对数似然函数对 θ \theta θ求导并令一阶导数为0,则可以得到 θ \theta θ的最大似然估计值 θ ^ \hat{\theta} θ^。上述对数似然函数的一阶导数也称作Score function,其定义为:
S ( X ; θ ) = ∑ i = 1 n ∂ log ⁡ f ( X i ; θ ) ∂ θ = ∑ i = 1 n S ( X i ; θ ) S(\mathbf{X} ; \theta)=\sum_{i=1}^n \frac{\partial \log f\left(X_i ; \theta\right)}{\partial \theta}=\sum_{i=1}^n S(X_i;\theta) S(X;θ)=i=1∑n​∂θ∂logf(Xi​;θ)​=i=1∑n​S(Xi​;θ)
那么Fisher Information定义为Score function的二阶矩 I ( θ ) = E [ S ( X ; θ ) 2 ] I(\theta)=E\left[S(\mathbf{X} ; \theta)^2\right] I(θ)=E[S(X;θ)2],下面对以下两点进行证明

  • E [ S ( X ; θ ) ] = 0 E[S(\mathbf{X} ; \theta)]=0 E[S(X;θ)]=0
  • I ( θ ) = E [ S ( X ; θ ) 2 ] − E [ S ( X ; θ ) ] 2 = Var ⁡ [ S ( X ; θ ) ] I(\theta)=E\left[S(\mathbf{X} ; \theta)^2\right]-E[S(\mathbf{X} ; \theta)]^2=\operatorname{Var}[S(\mathbf{X} ; \theta)] I(θ)=E[S(X;θ)2]−E[S(X;θ)]2=Var[S(X;θ)]

证明一

因为概率密度函数 f ( X i ; θ ) f(X_i;\theta) f(Xi​;θ)有以下性质

上式两边对 θ \theta θ进行求导

对上式左端进行变换

证明二

由证明一,显然可得。

由证明二可以得到Fisher Information的第一条数学意义:最大似然估计的方程的方差。

进一步,如果对数似然函数二阶可导,则在一般情况下可以证明:

  • I ( θ ) = E [ S ( X ; θ ) 2 ] = − E ( ∂ 2 ∂ θ 2 log ⁡ L ( X ; θ ) ) I(\theta)=E\left[S(\mathbf{X} ; \theta)^2\right]=-E\left(\frac{\partial^2}{\partial \theta^2} \log L(\mathbf{X} ; \theta)\right) I(θ)=E[S(X;θ)2]=−E(∂θ2∂2​logL(X;θ))

证明三

令 ∂ ℓ ( θ ; x ) ∂ θ = ∂ log ⁡ f ( x ; θ ) ∂ θ \frac{\partial\ell \left( \theta ; x \right)}{\partial \theta} = \frac{\partial\log f \left( x ; \theta \right)}{\partial \theta} ∂θ∂ℓ(θ;x)​=∂θ∂logf(x;θ)​,根据证明一的结论有

对上式两边同时对 θ \theta θ求偏导

上式左边第二项可以写为

从中可以得出

证毕。于是可以得到Fisher Information的第二条数学意义:对数似然函数在参数真实值处的负二阶导数的期望。

下面举个例子说明其数学含义,下图为一个简单的归一化伯努利对数似然函数图。

容易看出,当其平且宽的时候,代表了对参数估计的性能差,而当且坚且窄时,代表了对参数估计的性能好,也可以说信息量越大。而这个对数似然函数的负二阶导数就反映了其在顶点处的弯曲程度,弯曲程度大,对数似然函数的形状就趋近于高而窄,也表示掌握的信息越多。

矩阵形式

现假定待估计参数为 θ = [ θ 1 , θ 2 , . . . , θ N ] T \mathbf{\theta}=[\theta_1,\theta_2,...,\theta_N]^T θ=[θ1​,θ2​,...,θN​]T,则Fisher Information此时可以用矩阵形式表示,该矩阵称为Fisher information matrix,其中的元素可以写为以下两种形式:
[ I ( θ ) ] i , j = E [ ( ∂ ∂ θ i log ⁡ f ( X ; θ ) ) ( ∂ ∂ θ j log ⁡ f ( X ; θ ) ) ∣ θ ] [ I ( θ ) ] i , j = − E [ ∂ 2 ∂ θ i ∂ θ j log ⁡ f ( X ; θ ) ∣ θ ] \begin{equation} \begin{aligned} {[\mathbb{I}(\theta)]_{i, j} } & =E\left[\left(\frac{\partial}{\partial \theta_i} \log f(X ; \boldsymbol{\theta})\right)\left(\frac{\partial}{\partial \theta_j} \log f(X ; \boldsymbol{\theta})\right) \mid \boldsymbol{\theta}\right] \\ {[\mathbb{I}(\theta)]_{i, j} } & =-E\left[\frac{\partial^2}{\partial \theta_i \partial \theta_j} \log f(X ; \boldsymbol{\theta}) \mid \boldsymbol{\theta}\right] \end{aligned} \end{equation} [I(θ)]i,j​[I(θ)]i,j​​=E[(∂θi​∂​logf(X;θ))(∂θj​∂​logf(X;θ))∣θ]=−E[∂θi​∂θj​∂2​logf(X;θ)∣θ]​​​
下面举例说明,归一化周期频率的复数正弦信号 s(t) 的均匀采样可以表示为
x [ n ] = s [ n ] + w [ n ] = A exp ⁡ [ j ( 2 π f 0 n + ϕ ) ] + w [ n ] = A ~ exp ⁡ ( j 2 π f 0 n ) + w [ n ] , 0 ≤ n ≤ N − 1 \begin{align*} x\left[ n \right] &= s\left[ n \right] + w\left[ n \right]\\ & = A\exp \left[ {j\left({2\pi {f_0}n + \phi } \right)} \right] + w\left[ n \right]\\ & = \tilde{A}\exp \left({j2\pi {f_0}n} \right) + w\left[ n \right], 0 \leq n \leq N - 1 \end{align*} x[n]​=s[n]+w[n]=Aexp[j(2πf0​n+ϕ)]+w[n]=A~exp(j2πf0​n)+w[n],0≤n≤N−1​
其中 A ~ = A exp ⁡ ( j ϕ ) \tilde{A} = A\exp ({j\phi }) A~=Aexp(jϕ)是复幅度, ω [ n ] \omega[n] ω[n]是功率为 σ w 2 \sigma_w^2 σw2​的加性高斯白噪声。其中 A , f 0 , ϕ A,f_0,\phi A,f0​,ϕ为待估计参数。则Fisher information matrix中的第 ( i , j ) (i,j) (i,j) 个元素为
[ I ( Θ ) i j ] = 2 σ w 2 R e { ∑ n = 0 N − 1 [ ∂ s [ n ; Θ ] ∂ Θ i ] ∗ [ ∂ s [ n ; Θ ] ∂ Θ j ] } \begin{equation*} \left[ {{{\bf I}}{{\left({{\bf \Theta } } \right)}_{ij}}} \right] = \frac{2}{{\sigma _w^2}}{\mathop {\rm Re}\nolimits } \left\lbrace {{{\sum \limits _{n = 0}^{N - 1} {\left[ {\frac{{\partial s\left[ {n;{{\bf \Theta } }} \right]}}{{\partial {\Theta _i}}}} \right]} }^*}\left[ {\frac{{\partial s\left[ {n;{{\bf \Theta } }} \right]}}{{\partial {\Theta _j}}}} \right]} \right\rbrace \end{equation*} [I(Θ)ij​]=σw2​2​Re{n=0∑N−1​[∂Θi​∂s[n;Θ]​]∗[∂Θj​∂s[n;Θ]​]}​
其中 Θ = [ A , f 0 , ϕ ] T {{\bf \Theta } } = {[A,{f_0},\phi ]^{\rm {T}}} Θ=[A,f0​,ϕ]T。他们的偏导可以表示为
∂ s [ n ; Θ ] ∂ A = exp ⁡ [ j ( 2 π f 0 n + ϕ ) ] ∂ s [ n ; Θ ] ∂ f 0 = j 2 π n A exp ⁡ [ j ( 2 π f 0 n + ϕ ) ] ∂ s [ n ; Θ ] ∂ ϕ = j A exp ⁡ [ j ( 2 π f 0 n + ϕ ) ] . \begin{align*} \frac{{\partial s\left[ {n;{{\bf \Theta } }} \right]}}{{\partial A}} &= \exp \left[ {j\left({2\pi {f_0}n + \phi } \right)} \right] \\ \frac{{\partial s\left[ {n;{{\bf \Theta } }} \right]}}{{\partial {f_0}}} &= j2\pi nA\exp \left[ {j\left({2\pi {f_0}n + \phi } \right)} \right] \\ \frac{{\partial s\left[ {n;{{\bf \Theta } }} \right]}}{{\partial \phi }} &= jA\exp \left[ {j\left({2\pi {f_0}n + \phi } \right)} \right]. \end{align*} ∂A∂s[n;Θ]​∂f0​∂s[n;Θ]​∂ϕ∂s[n;Θ]​​=exp[j(2πf0​n+ϕ)]=j2πnAexp[j(2πf0​n+ϕ)]=jAexp[j(2πf0​n+ϕ)].​
因此,FIM可以表示为
[ I ( Θ ) i j ] = 2 σ w 2 [ N 0 0 0 A 2 ∑ n ( 2 π n ) 2 A 2 ∑ n 2 π n 0 A 2 ∑ n 2 π n N A 2 ] . \begin{align*} \left[ {{{\bf I}}{{\left({{\bf \Theta } } \right)}_{ij}}} \right] &= \frac{2}{{\sigma _w^2}}\left[ {\begin{array}{ccc}N&0&0\\ 0&{{A^2}\sum \limits _n {{{\left({2\pi n} \right)}^2} } }&{{A^2}\sum \limits _n {2\pi n} }\\ 0&{{A^2}\sum \limits _n {2\pi n} }&{N{A^2}} \end{array}} \right]. \end{align*} [I(Θ)ij​]​=σw2​2​ ​N00​0A2n∑​(2πn)2A2n∑​2πn​0A2n∑​2πnNA2​ ​.​

Fisher Information(费雪信息)详解相关推荐

  1. matlab mic系数_科学网—最大信息系数 (Maximal Information Coefficient, MIC)详解(1) - 彭勇的博文...

    最大信息系数 (Maximal Information Coefficient, MIC)详解(1) 四年前看过的一篇论文,当时还在组会上报告过,很确信当时把它弄懂了,由于当时是用机器学习的方法来做预 ...

  2. SurfaceFlinger的dump信息详解

    SurfaceFlinger的dump信息详解 1. 特殊宏的打开 2. Sync机制 3. DispSync参数 4. layer的dump 4.1 区域信息 4.2 基本信息 4.3 buffer ...

  3. HTTP协议的头信息详解

    HTTP协议的头信息详解 http://blog.csdn.net/guoguo1980/archive/2008/07/14/2649658.aspx HTTP协议的头信息详解 HTTP(Hyper ...

  4. crashdumpandroid_Android 中Crash时如何获取异常信息详解及实例

    Android 中Crash时如何获取异常信息详解 前言: 大家都知道,Android应用不可避免的会发生crash,无论你的程序写的多完美,总是无法完全避免crash的发生,可能是由于Android ...

  5. linux l显示详细信息,fdisk -l显示信息详解

    fdisk -l显示信息详解 [root@www.linuxidc.com ~]# fdisk -l Disk /dev/sda: 10.7 GB, 10737418240 bytes 255 hea ...

  6. Debian操作系统的源配置信息详解--Source.list配置文件详解

    转载来源:https://wiki.debian.org/SourcesList#Repository_URL Debian操作系统的源配置信息详解--Source.list配置文件详解 Debian ...

  7. linux输出文件没有找到,Linux环境下标准输入、输出、错误信息详解

    Linux环境下标准输入.输出.错误信息详解 下面我们介绍在Linux环境下标准输入.输出.错误设备.标准输入设备代号为0, 用来显示输入信息,标准输出设备代号为1,用来显示正常信息,标准错误设备代号 ...

  8. linux查看多核cpu运行状态,Linux下查看多核CPU信息详解

    Linux系统下,CPU信息详解(cpuinfo,多核,多线程) 在Linux系统中,如何详细了解CPU的信息呢? 当然是通过cat /proc/cpuinfo来检查了,但是比如几个物理CPU/几核/ ...

  9. Linux中ls -l命令展示信息详解

    Linux中ls -l命令展示信息详解 在Linux系统中,ls -l命令是用以列表的形式来查看当前目录下的文件或目录,下面就让我们一起来看看展示的信息是什么意思吧 以CentsOS7为例子 [roo ...

  10. 英雄联盟s10信息详解

    英雄联盟s10信息详解 刚刚获得TGA2019最佳电竞游戏和最佳游戏赛事双奖的中国玩家耳熟能详的英雄联盟s10迎来了两次巨大的修改.两个新射手塞娜和厄斐琉斯给AD位置带来了新的活力:精密系天赋的修改和 ...

最新文章

  1. win10 uwp 按下等待按钮
  2. 封装html5,封装Html5 Fullscreen API
  3. 『设计模式』瑞幸咖啡还是星巴克,一杯下午茶让我明白 设计模式--模板方法模式(Template Method Pattern)
  4. Linux Socket C语言网络编程:UDP Socket
  5. 时间模块(import time)
  6. PCL之估计点云子集的表面法线
  7. 分享插件 Web前端助手、Restlet Client、Adblock-Plus
  8. Java图片识别技术原理-只取图片像素。。。
  9. Load Switch负载开关详解
  10. WordPress编辑器支持pdf上传
  11. Java使用winrar压缩和解压缩文件
  12. PMOS双电源供电隔离电路(USB接入为电池充电 电池断开供电)
  13. C#实现汉字转全拼与简拼
  14. java导入excel数据_java使用POI批量导入excel数据的方法
  15. 币圈炒币只有四种人能赚到钱其中之一是使用炒币机器人的玩家
  16. 9.16 a.m.小结
  17. tinker board 2s开发板 gt911 触摸屏调试记录
  18. 汇编语言贪吃蛇、俄罗斯方块双任务设计实现详解(一)——整体系统设计
  19. Manjaro 安装后的简单配置与美化以及小技巧 (2019.12.15 更新)
  20. 于学军理事长莅临2023玉米深加工产业展,行业翘楚齐聚

热门文章

  1. BFT News|科技行业重点新闻一周概览
  2. 数字后端基本概念介绍——Track
  3. win10配置深度学习环境(anaconda3+pytorch1.9+python3.7+cuda10.2)
  4. 源码大全,你一直寻找的源码可能真的就在这里
  5. C++ 递推与递归算法
  6. python下载文件损坏_四种方法 恢复损坏的Excel文档
  7. In scan(file = file, what = what, sep = sep, quote = quote, dec = dec,  :   EOF within quoted string
  8. php网页中出现问号,HTML_地址栏中的问号有什么作用,之前我们曾经解释?过链接地址 - phpStudy...
  9. 深度学习和目标检测系列教程 19-300:关于目标检测AP、IoU和mAP简介
  10. wma转mp3怎么弄_WMA格式如何转换成MP3格式