NLP Homework 03 ——冯煜博

题目描述

(盒子和球模型)假设有3个盒子,每个盒子里装有红白两种颜色的球,盒子里的红白球有下表列出,初始状态分布。

解答

1. 给出HMM模型 \(\mu=(A, B,\pi)\)

A,“状态转移矩阵”如下:
\[ \begin{array}{c|lcr} A & \text{box1} & \text{box2} & \text{box3} \\ \hline box1 & 0.5 & 0.2 & 0.3 \\ box2 & 0.3 & 0.5 & 0.2 \\ box3 & 0.2 & 0.3 & 0.5 \end{array} \]

B,“符号发射概率”如下矩阵:
\[ \begin{array}{c|lcr} B & \text{red} & \text{white} \\ \hline box1 & \frac{1}{2} & \frac{1}{2} \\ box2 & \frac{2}{5} & \frac{3}{5} \\ box3 & \frac{7}{10} & \frac{3}{10} \end{array} \]

\(\pi\),“初始状态的概率分布”如下矩阵
\[ \begin{array}{c|cr} & \text{box1} & \text{box2} & \text{box3} \\ \hline \pi & 0.2 & 0.4 & 0.4 \end{array} \]

2. 试用前向算法计算观测序列概率:{红,白,红}

O = {红, 白, 红}

step 1 初始化

\(a_{红}(box1) = \pi_{box1} b_{box1}(红) = 0.2 \times \frac{1}{2} = 0.1\)

\(a_{红}(box2) = \pi_{box2} b_{box2}(红) = 0.4 \times \frac{2}{5} = 0.16\)

\(a_{红}(box3) = \pi_{box3} b_{box3}(红) = 0.4 \times \frac{7}{10} = 0.28\)

step 2 归纳计算

\[ \begin{align} a_{红白}(box1) & = \left[ \sum_{i=1}^{3} a_{红}(box_{i})a_{box_{i} box_{1}} \right] b_{box_{1}}(白) \\ & =\left[ a_{红}(box1) \times 0.5 + a_{红}(box2) \times 0.3 + a_{红}(box3) \times 0.2 \right] \times \frac{1}{2} \\ & = 0.077 \end{align} \]

\[ \begin{align} a_{红白}(box2) & = \left[ \sum_{i=1}^{3} a_{红}(box_{i})a_{box_{i} box_{2}} \right] b_{box2}(白) \\ & = \left[ a_{红}(box1) \times 0.2 + a_{红}(box2) \times 0.5 + a_{红}(box3) \times 0.3 \right] \times \frac{3}{5} \\ & = 0.1104 \end{align} \]

\[ \begin{align} a_{红白}(box3) & = \left[ \sum_{i=1}^{3} a_{红}(box_{i})a_{box_{i} box_{3}} \right] b_{box_{3}}(白) \\ & = \left[ a_{红}(box1) \times 0.3 + a_{红}(box2) \times 0.2 + a_{红}(box3) \times 0.5 \right] \times \frac{3}{10} \\ & = 0.0606 \end{align} \]

\[ \begin{align} a_{红白红}(box1) & = \left[ \sum_{i=1}^{3} a_{红白}(box_{i}) a_{box_{i}box1} \right] b_{box1}(红) \\ & = \left[ a_{红白}(box1) \times 0.5 + a_{红白}(box2) \times 0.3 + a_{红白}(box3) \times 0.2 \right] \times \frac{1}{2} \\ & = 0.04187 \end{align} \]

\[ \begin{align} a_{红白红}(box2) & = \left[ \sum_{i=1}^{3} a_{红白}(box_{i}) a_{box_{i}box2} \right] b_{box2}(红) \\ & = \left[ a_{红白}(box1) \times 0.2 + a_{红白}(box2) \times 0.5 + a_{红白}(box3) \times 0.3 \right] \times \frac{2}{5} \\ & = 0.035512 \end{align} \]

\[ \begin{align} a_{红白红}(box3) & = \left[ \sum_{i=1}^{3} a_{红白}(box_{i}) a_{box_{i}box3} \right] b_{box3}(红) \\ & = \left[ a_{红白}(box1) \times 0.3 + a_{红白}(box2) \times 0.2 + a_{红白}(box3) \times 0.5 \right] \times \frac{7}{10} \\ & = 0.052836 \end{align} \]

step 3 求和终结

\[ \begin{align} P(O | \mu) & = \sum_{i=1}^{3}a_{红白红} (box_{i}) \\ & = a_{红白红}(box1) + a_{红白红}(box2) + a_{红白红}(box3) \\ & = 0.04187 + 0.035512 + 0.052836 \\ & = 0.130218 \end{align} \]

3. 试用维特比算法,求解观测序列{红,白,红}的最优状态序列。 (要求给详细计算过程)

假设从盒子中取球是放回抽样概率模型。

step 1 初始化

\(\delta_{红}(box1) = \pi_{box1}b_{box1}(红) = 0.2 \times \frac{1}{2} = 0.1\)

\(\delta_{红}(box2) = \pi_{box2}b_{box2}(红) = 0.4 \times \frac{2}{5} = 0.16\)

\(\delta_{红}(box3) = \pi_{box3}b_{box3}(红) = 0.4 \times \frac{7}{10} = 0.28\)

\(\varphi_{红}(box1) = 0\)

\(\varphi_{红}(box2) = 0\)

\(\varphi_{红}(box3) = 0\)

step 2 归纳计算 1

\[ \begin{align} \delta_{红白}(box1) & = max \left[ \delta_{红}(box1)a_{box1box1} , \delta_{红}(box2)a_{box2box1} , \delta_{红}(box3)a_{box3box1} \right] b_{box1}(白) \\ & = 0.28 \times 0.2 \times \frac{1}{2} \\ & = 0.028 \end{align} \]

\[ \begin{align} \delta_{红白}(box2) & = max \left[ \delta_{红}(box1)a_{box1box2} , \delta_{红}(box2)a_{box2box2} , \delta_{红}(box3)a_{box3box2} \right] b_{box1}(白) \\ & = 0.28 \times 0.3 \times \frac{3}{5} \\ & = 0.0504 \end{align} \]

\[ \begin{align} \delta_{红白}(box3) & = max \left[ \delta_{红}(box1)a_{box1box3} , \delta_{红}(box2)a_{box2box3} , \delta_{红}(box3)a_{box3box3} \right] b_{box3}(白) \\ & = 0.28 \times 0.5 \times \frac{3}{10} \\ & = 0.042 \end{align} \]

记忆回退路径 1

\[ \begin{align} \varphi_{红白}(box1) & = argmax \left[ \delta_{红}(box1)a_{box1box1} , \delta_{红}(box2)a_{box2box1} , \delta_{红}(box3)a_{box3box1} \right] b_{box1}(白) \\ & = \frac{1}{2} \delta_{红}(box3)a_{box3box1} \end{align} \]

\[ \begin{align} \varphi_{红白}(box2) & = argmax \left[ \delta_{红}(box1)a_{box1box2} , \delta_{红}(box2)a_{box2box2} , \delta_{红}(box3)a_{box3box2} \right] b_{box2}(白) \\ & = \frac{3}{5} \delta_{红}(box3) a_{box3box2} \end{align} \]

\[ \begin{align} \delta_{红白}(box3) & = argmax \left[ \delta_{红}(box1)a_{box1box3} , \delta_{红}(box2)a_{box2box3} , \delta_{红}(box3)a_{box3box3} \right] b_{box3}(白) \\ & = \frac{3}{10} \delta_{红}(box3)a_{box3box3} \\ \end{align} \]

归纳计算 2

\[ \begin{align} \delta_{红白红}(box1) & = max \left[ \delta_{红白}(box1)a_{box1box1} , \delta_{红白}(box2)a_{box2box1} , \delta_{红白}(box3)a_{box3box1} \right] b_{box1}(红) \\ & = 0.0504 \times 0.3 \times \frac{1}{2} \\ & = 0.0756 \end{align} \]

\[ \begin{align} \delta_{红白红}(box2) & = max \left[ \delta_{红白}(box1)a_{box1box2} , \delta_{红白}(box2)a_{box2box2} , \delta_{红白}(box3)a_{box3box2} \right] b_{box1}(红) \\ & = 0.0504 \times 0.5 \times \frac{2}{5} \\ & = 0.01008 \end{align} \]

\[ \begin{align} \delta_{红白红}(box3) & = max \left[ \delta_{红白}(box1)a_{box1box3} , \delta_{红白}(box2)a_{box2box3} , \delta_{红白}(box3)a_{box3box3} \right] b_{box3}(红) \\ & = 0.042 \times 0.5 \times \frac{7}{10} \\ & = 0.0147 \end{align} \]

记忆回退路径 2

\[ \begin{align} \varphi_{红白红}(box1) & = argmax \left[ \delta_{红白}(box1)a_{box1box1} , \delta_{红白}(box2)a_{box2box1} , \delta_{红白}(box3)a_{box3box1} \right] b_{box1}(红) \\ & = \frac{1}{2} \delta_{红}(box2)a_{box2box1} \end{align} \]

\[ \begin{align} \varphi_{红白红}(box2) & = argmax \left[ \delta_{红白}(box1)a_{box1box2} , \delta_{红白}(box2)a_{box2box2} , \delta_{红白}(box3)a_{box3box2} \right] b_{box2}(红) \\ & = \frac{2}{5} \delta_{红白}(box2) a_{box2box2} \end{align} \]

\[ \begin{align} \delta_{红白红}(box3) & = argmax \left[ \delta_{红白}(box1)a_{box1box3} , \delta_{红白}(box2)a_{box2box3} , \delta_{红白}(box3)a_{box3box3} \right] b_{box3}(白) \\ & = \frac{7}{10} \delta_{红白}(box3)a_{box3box3} \\ \end{align} \]

step 3 终结

\[ \begin{align} \hat{Q}_{红白红} & = argmax \left[ \delta_{红白红}(box1) , \delta_{红白红}(box2) , \delta_{红白红}(box3) \right] \\ & = \delta_{红白红}(box3) \end{align} \]

\[ \begin{align} \hat{P}(\hat{Q}_{红白红}) & = max \left[ \delta_{红白红}(box1) , \delta_{红白红}(box2) , \delta_{红白红}(box3) \right] \\ & = 0.0147 \end{align} \]

step 4 路径(状态序列)回溯

\[ \begin{align} \hat{q}_{红白} = \varphi_{红白红}(\hat{q}_{红白红}) = \varphi_{红白红} \left[ \delta_{红白红}(box3) \right] \end{align} \]

\[ \begin{align} \hat{q}_{红} = \varphi_{红白}(\hat{q}_{红白}) = \varphi_{红白} \left[ \delta_{红白}(box2) \right] \end{align} \]

\[ \begin{align} \hat{q} = \varphi_{红}(\hat{q}_{红}) = \varphi_{红} \left[ \delta_{红}(box3) \right] \end{align} \]

转载于:https://www.cnblogs.com/fengyubo/p/6701172.html

nlp homework 03相关推荐

  1. NLP问题特征表达基础 - 语言模型(Language Model)发展演化历程讨论

    1. NLP问题简介 0x1:NLP问题都包括哪些内涵 人们对真实世界的感知被成为感知世界,而人们用语言表达出自己的感知视为文本数据.那么反过来,NLP,或者更精确地表达为文本挖掘,则是从文本数据出发 ...

  2. 学习资料参考:从深度学习到自然语言处理

    北京 | 深度学习与人工智能研修 12月23-24日 再设经典课程 重温深度学习阅读全文> 正文共6058个字,10张图,预计阅读时间:16分钟. 注意:本文已经更新,新版结合深度学习简介和发展 ...

  3. 春风app一直显示服务器内部错误,CHANGES.md

    # Jcseg versions change histories ### TODO List: 1. 词条格式调整为:"词条/词性集合/拼音/实体集合/自定义参数" 2. luc ...

  4. 由NPLM到Word2vec

    1. log-linear模型 之所以讲log-linearmodel,是因为后面要介绍的NNLM,CBOW与skip-gram都用log-likelihood作为目标函数,log likelihoo ...

  5. 如何布置电脑文件夹、电脑文件路径、浏览器收藏夹

    如何布置电脑文件夹.电脑文件路径.浏览器收藏夹 浏览器收藏夹 电脑文件夹 = 电脑文件路径 浏览器收藏夹 好的,我会为您增加收藏夹的深度,以更好地满足您的需求.以下是基于您之前提供的信息,在不丢失任何 ...

  6. AI公开课:19.04.03周明—MSRA副院长《NLP的进步如何改变搜索的体验》课堂笔记以及个人感悟

    AI公开课:19.04.03周明-MSRA副院长<NLP的进步如何改变搜索的体验>课堂笔记以及个人感悟 导读        周明博士,1999年加入微软研究院(MSRA).现任微软亚洲研究 ...

  7. Task 5: Homework(附代码)(Stanford CS224N NLP with Deep Learning Winter 2019)

    Task 5: Homework--英文词向量的探索 目录 Task 5: Homework--英文词向量的探索 词向量 本项目需要下载的包 Part 1:基于计数的词向量 问题1.1:实现不同单词 ...

  8. 技术03期:自然语言处理NLP【分词篇】

    NLP简介和三种分词模型 NLP逐渐成为人工智能一大热点研究方向,目前国外对英文分词的研究比较深入,而中文分词发展较缓.它需要联系上下文.作者背景.内容背景等进行调整. 处理这些高度模糊句子所采用消歧 ...

  9. 【NLP新闻-2013.06.03】New Book Where Humans Meet Machines

    英语原文地址:http://nlp.hivefire.com/articles/share/39865/ 注:本人翻译NLP新闻只为学习专业英语和扩展视野,如果翻译的不好,请谅解! (我挺想看这本书的 ...

最新文章

  1. Async和Await如何简化异步编程几个实例
  2. 后台管理系统框架bootstrap中文版
  3. (实战项目一)手机App抓包爬虫
  4. 对开发者有用的英文网站合集,建议收藏!
  5. 学习oracle的感悟,随笔:最近关于Oracle学习思考的一些感悟
  6. 04.SQLServer性能优化之---读写分离数据同步
  7. 使用OD修改程序窗口标题和提示信息
  8. 迷时师度 悟了自度
  9. python输入一个英文句子、统计单词个数_C语言编程求一个英文句子中的单词数和最长单词的位置、长度及输出这个单词。c++编程 从键盘输入一个英文...
  10. commons-poll、jedis-2.7.0、jedis.properties资源分享
  11. 设备远程监控物联网平台
  12. 苹果xrid不支持服务器,iPhone XR登录不了Apple ID怎么办?iTunes无法登录Apple ID怎么解决? ... ......
  13. 洛杉矶警局用 AI “预测犯罪”;北欧银行拟裁员六千,用智能机器取而代之
  14. Android 基础视频学习笔记 1 (完结)
  15. 四维插值matlab程序,四维离散数据插值并画图,源代码有点问题
  16. php获取贴吧帖子内容,众大一键采集百度贴吧内容 php版 v5.0
  17. LoRaWan协议1.1 ClassB部分学习笔记
  18. 益聚星荣:B站成“今年最亏视频平台”?爱奇艺都甘拜下风
  19. 计算机机房荷载,如何解决弱电工程中机房承重问题?
  20. js 保留两位小数的方法总结

热门文章

  1. 条件注释判断浏览器版本!--[if lt IE 9]
  2. 通用权限管理系统组件 (GPM - General Permissions Manager) 中后一个登录的把前一个登录的踢掉功能的实现...
  3. 第二届清华大学项目管理精英训练营【敏捷个人】分享
  4. 妙用SQL Server聚合函数和子查询迭代求和
  5. [专题总结]AC自动机
  6. CF587F Duff is Mad
  7. HashMap中的hash函数
  8. Qt ffmpeg环境搭建
  9. win32: 查询滚动条相关信息的注意事项
  10. 关于C++对象模型的一点理解(2)