设我们有一个法语句子 f,要把它翻译成英语句子 e,也即找到一个 e 使得 P(e|f) 最大。由 Bayes 定理,P(e|f) = P(e) * P(f|e) / P(f)。这里 P(f) 固定,故我们要找的就是一个 e 使得 P(e)*P(f|e) 最大。从噪声信道 (noisy channel) 的角度来分析就是,在我们头脑里按照 P(e) 生成了一个英文句子,结果在被我们说出或写出的时候发生了噪声干扰,这个干扰的概率分布是 P(f|e),最后表现出来的就是一个法语句子了。

由此,一个统计机器翻译 (SMT) 系统的任务就分为了三部分:

(1) 估计 P(e),即所谓的语言模型

(2) 估计 P(f|e),即所谓的翻译模型

(3) 用一个合适的算法找到一个 e 使得 P(e) * P(f|e) 最大(至少是尽可能大)

当初在看到这里的时候我十分不解,相信所有人都会有这个问题:为什么不直接估计 P(e|f) 然后直接取最大概率的 e?在很久以后我终于看到一个比较令人信服的解释:如果我们能够把模型估计得足够精确的话,实际上直接计算 P(e|f) 应该是更好的选择,然而由于数据集有限,这个估计不可能精确,所以往往得不到很好的结果。如果是用 P(e)*P(f|e) 来算的话,当然 P(e) 和 P(f|e) 也不会十分精确,但让这两者相乘,我们就可以期望找到一个 P(e) 和 P(f|e) 都不太坏的翻译,也就是说,这个翻译既比较像一个正常人说的英文,又和原来的法语意思比较接近,如果这两者中任何一个比较不靠谱的话,这个乘积就会比较小,从而也就不会被选出来。

噪音通道模型_噪声信道模型相关推荐

  1. 自然语言处理(六)图的随机游走模型与噪声信道模型与条件随机场

    图的随机游走模型非常适用于统计网页的权重,在文本处理方面则适用于提取关键字,生成人物关系网等. 噪声信道模型本质上就是贝叶斯,它能直接适用于翻译,对于文本简单替换的微博文本规范化来说,感觉还更简单了, ...

  2. WINNER II信道模型与WINNER+信道模型概述

    目录 1.WINNER II 2.WINNER+ 目前信道模型主要分为准确信道模型.随机信道模型.统计信道模型.其中随机信道模型集和其他两种模型的优点,成为主流的信道模型.随机模型中基于几何统计的随机 ...

  3. 人口预测和阻尼-增长模型_使用分类模型预测利率-第2部分

    人口预测和阻尼-增长模型 We are back! This post is a continuation of the series "Predicting Interest Rate w ...

  4. 决策树模型 朴素贝叶斯模型_有关决策树模型的概述

    决策树模型 朴素贝叶斯模型 Decision Trees are one of the highly interpretable models and can perform both classif ...

  5. 机器学习 训练较快的模型_通过心理模型更快地学习软件,第1部分

    机器学习 训练较快的模型 什么是心理模型? (What Are Mental Models?) The easiest way to describe them is that they're pat ...

  6. reactor多线程模型_网络编程模型的演进之路

    在没有IO多路复用的模型的情况下,为了支持高并发采取以下网络模型 一:阻塞IO+多线程 client连接服务器,服务器有一个线程阻塞的调用accept,accept接收到连接后,创建一个线程来读写读写 ...

  7. 斯特林发动机图纸尺寸_南昌教学模型订做,航空发动机模型_境海模型

    首页 > 新闻中心 发布时间:2020-11-08 13:57:07 导读:境海模型为您提供南昌教学模型订做,航空发动机模型的相关知识与详情: 曾经的沙盘模型一般只有模型自身,没有现代的视觉作用 ...

  8. logit回归模型_常见机器学习模型的假设

    > Photo by Thought Catalog on Unsplash 暂时忘记深度学习和神经网络. 随着越来越多的人开始进入数据科学领域,我认为重要的是不要忘记这一切的基础. 统计. 如 ...

  9. 人口预测和阻尼-增长模型_使用分类模型预测利率-第1部分

    人口预测和阻尼-增长模型 A couple of years ago, I started working for a quant company called M2X Investments, an ...

最新文章

  1. python机器学习入门(Day11:ANN)
  2. CentOS 6安装详解及PXE 安装
  3. 通过Dapr实现一个简单的基于.net的微服务电商系统(六)——一步一步教你如何撸Dapr之Actor服务...
  4. 关于IE6、7、8下实现盒阴影的几个注意点
  5. java线程池,信号量使用demo
  6. 二十三、PHP框架Laravel学习笔记——集合的常用方法
  7. SVG 入门教程系列列表
  8. python-socket客户服务端的传输原理异常关闭的情况
  9. 修改hostname不重启机器并生效
  10. 左侧侧拉栏html,html – 将侧边栏拉伸到页面的完整高度
  11. 2016中国大学生程序设计竞赛(长春)
  12. snipaste怎么滚动截长图_【神器】Snipaste——最好用的截图、贴图软件,没有之一...
  13. nexus6 android 6.0 root,KingRoot国内首个攻破Nexus6 支持超万款手机一键Root
  14. linux看视频装哪个软件,Ubuntu安装视频播放软件 SMPlayer 14.9.0.7042
  15. 【无标题】26-时尚精品服饰网店响应式网页模板
  16. 有趣的python小程序(附效果和程序)
  17. Python之pandas库(万年一更版)
  18. Kettle CSV文件与json文件转换实例
  19. 《公共管理学》考试重点及答案
  20. gem意思_邓紫棋为什么叫GEM 每次改名都有意义

热门文章

  1. java poi 加粗居中_poi生成excel整理(设置边框/字体/颜色/加粗/居中/)
  2. 中国空间技术研究院(航天五院)
  3. java 第一天_Java学习第一天:环境搭建
  4. 开心词典 2006 是什么
  5. AUTOCAD导出PDF文件之MAC版(无打印机)
  6. pda hvga vga
  7. 网站的图标 favicon.ico
  8. express设置favicon
  9. php 表格 链接代码,【PHPWord】超链接
  10. 栈简介、手撸顺序栈、手撸链栈和栈的应用