维特比算法

维特比算法（Viterbi algorithm）是一种动态规划算法。它用于寻找最有可能产生观测事件序列的- 维特比路径-隐含状态序列,特别是在马尔可夫信息源上下文和隐马尔可夫模型中。

术语“维特比路径”和“维特比算法”也被用于寻找观察结果最有可能解释相关的动态规划算法。例如在统计句法分析中动态规划算法可以被用于发现最可能的上下文无关的派生(解析)的字符串，有时被称为“维特比分析”。

维特比算法由安德鲁·维特比(Andrew Viterbi)于1967年提出，用于在数字通信链路中解卷积以消除噪音。^[1] 此算法被广泛应用于CDMA和GSM数字蜂窝网络、拨号调制解调器、卫星、深空通信和802.11无线网络中解卷积码。现今也被常常用于语音识别、关键字识别、计算语言学和生物信息学中。例如在语音(语音识别)中，声音信号做为观察到的事件序列,而文本字符串,被看作是隐含的产生声音信号的原因，因此可对声音信号应用维特比算法寻找最有可能的文本字符串。

算法

假设给定隐式马尔可夫模型（HMM）状态空间，初始状态的概率为，从状态到状态的转移概率为。令观察到的输出为。产生观察结果的最有可能的状态序列由递推关系给出：^[2]

此处是前个最终状态为的观测结果最有可能对应的状态序列的概率。通过保存向后指针记住在第二个等式中用到的状态可以获得维特比路径。声明一个函数，它返回若时计算用到的值或若时的 . 这样:

这里我们使用了arg max的标准定义。
算法复杂度为

伪代码

首先是一些问题必要的设置。设观察值空间为、状态空间为、观察值序列为, 为转移矩阵，其中为从状态转移到的转移概率、为放射矩阵(emission matrix)，其中为在状态观察到的概率、大小为的初始概率数组，为的概率。我们称路径为生成观察值的状态序列。

在这个动态规划问题中, 我们构造了两个大小为的二维表。的每个元素, ，保存生成时最有可能的路径，的概率。的每个元素, , 保存最有可能路径 , 的。

我们按增序填充两个表。

   输入:  观察空间 ,
状态 ,
观察序列   若在 时间观察值为  ,则 ,
大小为  的转移矩阵 ,  为从状态  到  的转移概率,
大小为  的放射矩阵 ,  为状态  观察到  的概率,
初始概率数组  of size ,  为  的概率,
输出: 最有可能的隐含状态序列 
A01 function VITERBI( O, S,π,Y,A,B ) : X
A02     for each state s_i do
A03         T₁[i,1]←π_iB_i
A04         T₂[i,1]←0
A05     end for
A06     for i←2,3,...,T do
A07         for each state s_j do
A08             T₁[j,i]←
A09             T₂[j,i]←
A10         end for
A11     end for
A12     z_T←
A13     x_T←s_{z_T}
A14     for i←T,T-1,...,2 do
A15         z_i-1←T₂[z_i,i]
A16         x_i-1←s_{z_i-1}
A17     end for
A18     return X
A19 end function

例子

想象一个乡村诊所。村民有着非常理想化的特性，要么健康要么发烧。他们只有问诊所的医生的才能知道是否发烧。聪明的医生通过询问病人的感觉诊断他们是否发烧。村民只回答他们感觉正常、头晕或冷。

假设一个病人每天来到诊所并告诉医生他的感觉。医生相信病人的健康状况如同一个离散马尔可夫链。病人的状态有两种“健康”和“发烧”，但医生不能直接观察到，这意味着状态对他是“隐含”的。每天病人会告诉医生自己有以下几种由他的健康状态决定的感觉的一种：正常、冷或头晕。这些是观察结果。整个系统为一个隐马尔可夫模型(HMM)。

医生知道村民的总体健康状况，还知道发烧和没发烧的病人通常会抱怨什么症状。换句话说，医生知道隐马尔可夫模型的参数。这可以用Python语言表示如下:

states = ('Healthy', 'Fever')
observations = ('normal', 'cold', 'dizzy')
start_probability = {'Healthy': 0.6, 'Fever': 0.4}
transition_probability = {'Healthy' : {'Healthy': 0.7, 'Fever': 0.3},
'Fever' : {'Healthy': 0.4, 'Fever': 0.6},
}
emission_probability = {'Healthy' : {'normal': 0.5, 'cold': 0.4, 'dizzy': 0.1},
'Fever' : {'normal': 0.1, 'cold': 0.3, 'dizzy': 0.6},
}

在这段代码中, 起始概率start_probability 表示病人第一次到访时医生认为其所处的HMM状态，他唯一知道的是病人倾向于是健康的。这里用到的特定概率分布不是均衡的,如转移概率大约是{'Healthy': 0.57, 'Fever': 0.43}。转移概率transition_probability表示潜在的马尔可夫链中健康状态的变化。在这个例子中，当天健康的病人仅有30%的机会第二天会发烧。放射概率emission_probability表示每天病人感觉的可能性。假如他是健康的，50%会感觉正常。如果他发烧了，有60%的可能感觉到头晕。

病人连续三天看医生，医生发现第一天他感觉正常，第二天感觉冷，第三天感觉头晕。于是医生产生了一个问题：怎样的健康状态序列最能够解释这些观察结果。维特比算法解答了这个问题。

# Helps visualize the steps of Viterbi.
def print_dptable(V):
print "    ",
for i in range(len(V)): print "%7d" % i,
print
for y in V[0].keys():
print "%.5s: " % y,
for t in range(len(V)):
print "%.7s" % ("%f" % V[t][y]),
print
def viterbi(obs, states, start_p, trans_p, emit_p):
V = [{}]
path = {}
# Initialize base cases (t == 0)
for y in states:
V[0][y] = start_p[y] * emit_p[y][obs[0]]
path[y] = [y]
# Run Viterbi for t > 0
for t in range(1,len(obs)):
V.append({})
newpath = {}
for y in states:
(prob, state) = max([(V[t-1][y0] * trans_p[y0][y] * emit_p[y][obs[t]], y0) for y0 in states])
V[t][y] = prob
newpath[y] = path[state] + [y]
# Don't need to remember the old paths
path = newpath
print_dptable(V)
(prob, state) = max([(V[len(obs) - 1][y], y) for y in states])
return (prob, path[state])

函数viterbi 具有以下参数: obs 为观察结果序列, 例如 ['normal', 'cold', 'dizzy']；states 为一组隐含状态； start_p 为起始状态概率; trans_p 为转移概率; 而emit_p 为放射概率。为了简化代码，我们假设观察序列 obs 非空且 trans_p[i][j] 和emit_p[i][j] 对所以状态 i,j 有定义。

在运行的例子中正向/维特比算法使用如下:

def example():
return viterbi(observations,
states,
start_probability,
transition_probability,
emission_probability)
print example()

维特比算法揭示了观察结果 ['normal', 'cold', 'dizzy'] 最有可能由状态序列 ['Healthy', 'Healthy', 'Fever']产生。换句话说，对于观察到的活动, 病人第一天感到正常，第二天感到冷时都是健康的，而第三天发烧了。

维特比算法的计算过程可以直观地由格图表示。维特比路径本质上是穿过格式结构的最短路径。诊所例子的格式结构如下, 黑色加粗的是维特比路径：

在实现维特比算法时需注意许多编程语言使用浮点数计算，当 p 很小时可能会导致结果下溢。避免这一问题的常用技巧是在整个计算过程中使用对数概率，在对数系统中也使用了同样的技巧。当算法结束时，可以通过适当的幂运算获得精确结果。

注

^29 Apr 2005, G. David Forney Jr: The Viterbi Algorithm: A Personal History
^Xing E, slide 11

参考资料

Viterbi AJ. Error bounds for convolutional codes and an asymptotically optimum decoding algorithm. IEEE Transactions on Information Theory. 1967.April,13 (2): 260–269. doi:10.1109/TIT.1967.1054010. (note: the Viterbi decoding algorithm is described in section IV.) Subscription required.

维特比算法[Wiki]相关推荐

语音识别维特比解码_自然语言处理之维特比算法
简介鉴于维特比算法可解决多步骤中每步多选择模型的最优选择问题,本文简要介绍了维特比算法的基本理论,并从源代码角度对维特比算法进行剖析,并对源码中涉及的要点进行了解读,以便能快速应用该算法解决自然语言 ...
条件随机场(CRF) - 4 - 学习方法和预测算法(维特比算法)
声明: 1,本篇为个人对<2012.李航.统计学习方法.pdf>的学习总结,不得用作商用,欢迎转载,但请注明出处(即:本帖地址). 2,由于本人在学习初始时有很多数学知识都已忘记,所以为了 ...
CRF(条件随机场)与Viterbi(维特比)算法原理详解
摘自:https://mp.weixin.qq.com/s/GXbFxlExDtjtQe-OPwfokA https://www.cnblogs.com/zhibei/p/9391014.html C ...
小白给小白详解维特比算法（二）
https://blog.csdn.net/athemeroy/article/details/79342048 本文致力于解释隐含马尔科夫模型和上一篇我们提到的篱笆网络的最短路径问题的相同点和不同点 ...
viterbi维特比算法和隐马尔可夫模型(HMM)
阅读目录隐马尔可夫模型(HMM) 回到目录隐马尔可夫模型(HMM) 原文地址:http://www.cnblogs.com/jacklu/p/7753471.html 本文结合了王晓刚老师的ENG ...
HMM——维特比算法(Viterbi algorithm)
1. 前言维特比算法针对HMM第三个问题,即解码或者预测问题,寻找最可能的隐藏状态序列: 对于一个特殊的隐马尔可夫模型(HMM)及一个相应的观察序列,找到生成此序列最可能的隐藏状态序列. 也就是说给 ...
《数学之美》第26章维特比和他的维特比算法
1 维特比算法维特比算法是一个特殊但应用最广的动态规划算法.利用动态规划,可以解决任何一个图中的最短路径问题.而维特比算法是针对一个特殊的图--篱笆网络(Lattice)的有向图最短路径问题而提出的 ...
维特比算法—打字输入预测
这里首先说下隐马尔可夫模型的相关知识. 1. 隐马尔可夫模型(HMM) 在说隐马尔可夫模型前还有一个概念叫做"马尔科夫链",既是在给定当前知识或信息的情况下,观察对象过去的历史状态 ...
em算法怎么对应原有分类_[PRML]序列数据 HMM维特比算法及扩展
序列数据相关文章:1.马尔可夫模型2.隐马尔可夫模型简介3.HMM最大似然4.HMM前向后向算法5.HMM和积算法与尺度因子 1 维特比算法在隐马尔可夫模型的许多应用中,潜变量有一些有意义的解释,因 ...

维特比算法[Wiki]

维特比算法

算法

伪代码

例子

注

参考资料

维特比算法[Wiki]相关推荐

最新文章

热门文章