9.4.2 噪声信道模型(Noise Channel Model )

噪声信道模型可以理解为正确的查询通过一个噪声信道传输,在传输过程中受到外界 千扰,导致在信息接收端收到的杳询发生错误,图9-11是噪声信道模型的原理示意。

给定错误查询V及其对应的可能正确査询W,噪声信道模型将査询纠错任务转换成了 估汁概率P(W|V),其含义是:接收到错误的杳询V,这个查询对应的正确查询是W的概 率有多大,对于多个候选正确答案,选择概率值最大的作为v对应的正确査询。将/&wiv) 根据贝叶斯公式转写为:

因为对于多个候选答案W1,W2,…,W?来说,这个公式的分母P(V)都是相同的,所以 可以忽略不计,于是问题转换成求:

Argmax(尸(V| W) X />( W))

就是说哪个候选答案m使得上面公式得分最大,那么这个m就是错误查询V对应 的JH确查询。

上述公式又可以分为两个因子:P(V|W)与/>(W)。P(V|W)被称为错误模型,即正确杏 询W被错写成V的概率,具体计算方法有很多种,比如可以用上节提到的编辑距离计算, 也可以收集一些被错误拼写的查询例子,用这鸣例子的统计数据来计算错误模型。P(W)被 称为语言模型,可以通过计算查询W在所有查洵中出现的概率值来估计&如果可以估计以 上两个因子,就可以计算哪个Wi是错误査询V的正确输入。

田9-11嗓声信道檯型的原理示意

/Wl V)=尸(V| W) X P(W)/P(V)

本章提要

?准确分析用户的搜索意图是目前搜索引擎研发的潮流与重点方向。 ?用户的搜索意图可以粗分为导航型、信息型和事务型。

搜索日志是深入挖掘用户潜在搜索意图最常用的数据来源,而点击图、査询会话

这就是搜索引擎.核心技术详解ir播索I

和查询图是由搜索日志整理出的基础数据。

?相关搜索和査询纠错是非常常见的帮助用户澄清搜索意图的具体应用。

本章参考文献

[I]Fonseca, B. M.,Golgher, P. B.,de Moura, E. S., and Ziviani, N.(2003). Using association rules to discover search engines related queries. In Proc. of the 1st Latin American Web Congress (LA-WEB'03).

[2】Jansen, B. J., Spink, A., and Narayan, B.(2007). Query modifications patterns during web searching, in Proc. of 4th int. conf. on Information Technology (ITNG,07).

[3]Boldi, P., Bonchi, F? Castillo, C., Donato, D” Gionis, A., and Vigna, S.(2008). The query-flow graph: model and applications, in Proc.of the ACM 17th Conf. on Information and Knowledge Management (CIKM’08).

[4]Baeza-Yates, R., Hurtado, C., and Mendoza, M. (2004). Query recommendation using query logs in search engines. In International Workshop on Clustering Information over the Web (ClustWeb, in conjunction with EDBT), Creete, Greece.

[5]Huang, C” et al. (2003) Relevant term suggestion in interactive web search based on contextual information in query session logs. Journal of the American Society for Information Science and Technology, 54(7):638-649.

[6]Hosseini, M. and bolhassani, H. (2008). Clustering search engines log for query recommendation. CSICC, CCIS 6, pp. 380-387,Springer-Verlag Berlin Heidelberg 2008.

[7]Damerau, F. (1964). A technique for computer detection and correction of spelling errors. Communications of the ACM. 7(3):171-176.

上一篇:善用富媒体

下一篇:团队管理自动化

噪音通道模型_噪声信道模型(NoiseChannelModel)相关推荐

  1. 噪音通道模型_噪声信道模型

    设我们有一个法语句子 f,要把它翻译成英语句子 e,也即找到一个 e 使得 P(e|f) 最大.由 Bayes 定理,P(e|f) = P(e) * P(f|e) / P(f).这里 P(f) 固定, ...

  2. 自然语言处理(六)图的随机游走模型与噪声信道模型与条件随机场

    图的随机游走模型非常适用于统计网页的权重,在文本处理方面则适用于提取关键字,生成人物关系网等. 噪声信道模型本质上就是贝叶斯,它能直接适用于翻译,对于文本简单替换的微博文本规范化来说,感觉还更简单了, ...

  3. WINNER II信道模型与WINNER+信道模型概述

    目录 1.WINNER II 2.WINNER+ 目前信道模型主要分为准确信道模型.随机信道模型.统计信道模型.其中随机信道模型集和其他两种模型的优点,成为主流的信道模型.随机模型中基于几何统计的随机 ...

  4. 人口预测和阻尼-增长模型_使用分类模型预测利率-第2部分

    人口预测和阻尼-增长模型 We are back! This post is a continuation of the series "Predicting Interest Rate w ...

  5. 决策树模型 朴素贝叶斯模型_有关决策树模型的概述

    决策树模型 朴素贝叶斯模型 Decision Trees are one of the highly interpretable models and can perform both classif ...

  6. 机器学习 训练较快的模型_通过心理模型更快地学习软件,第1部分

    机器学习 训练较快的模型 什么是心理模型? (What Are Mental Models?) The easiest way to describe them is that they're pat ...

  7. reactor多线程模型_网络编程模型的演进之路

    在没有IO多路复用的模型的情况下,为了支持高并发采取以下网络模型 一:阻塞IO+多线程 client连接服务器,服务器有一个线程阻塞的调用accept,accept接收到连接后,创建一个线程来读写读写 ...

  8. 斯特林发动机图纸尺寸_南昌教学模型订做,航空发动机模型_境海模型

    首页 > 新闻中心 发布时间:2020-11-08 13:57:07 导读:境海模型为您提供南昌教学模型订做,航空发动机模型的相关知识与详情: 曾经的沙盘模型一般只有模型自身,没有现代的视觉作用 ...

  9. logit回归模型_常见机器学习模型的假设

    > Photo by Thought Catalog on Unsplash 暂时忘记深度学习和神经网络. 随着越来越多的人开始进入数据科学领域,我认为重要的是不要忘记这一切的基础. 统计. 如 ...

  10. 人口预测和阻尼-增长模型_使用分类模型预测利率-第1部分

    人口预测和阻尼-增长模型 A couple of years ago, I started working for a quant company called M2X Investments, an ...

最新文章

  1. 仅使用OpenCV实现活体检测!(附源码)
  2. 2021技术突破 MIT发布
  3. 权威解答495个最常遇到的C语言问题
  4. 提高网站有效流量从三个方面出发
  5. C语言经典例19-完数
  6. 非专业转行python的几点建议
  7. ELK+kafka日志系统搭建-实战
  8. python之datetime模块
  9. SHOW INDEX FROM 表名,查看mysql表中有哪些索引
  10. 程序员还有35岁的坎吗?
  11. [高等数学]这你不背?
  12. kaggle数据集下载-搜狐浏览器
  13. 编程福利:50本C语言电子书,你还怕没书看吗!
  14. 银行热衷拿区块链专利 背后有何意图
  15. java 转义符 输出,Java转义字符怎么输出的
  16. php 微信代扣开发步骤,【微信支付】微信代扣开发者文档
  17. c 语言 合并多个excel,C#操作Excel合并多个Excel文件
  18. [PC] 微软账号连接不上
  19. 跟我学LabVIEW:什么是全局变量?如何创建及使用全局变量?
  20. tolua全教程-Chinar

热门文章

  1. STM32F205转GD32F205晶振不能起振,什么原因?
  2. 解决百度文档复制时候的vip限制
  3. 支付宝支付提示 4006 ISV权限不足,建议在开发者中心检查签约是否已经生效
  4. android onitemclick参数,Android里的AdapterView中OnItemClickListener监听器四个参数的含义...
  5. 电子电路设计——multisum中快捷设置555定时器
  6. matlab前馈仿真,前馈-反馈控制系统的具体分析及其MATLAB/Simulink.PDF
  7. 数学建模 CUMCM2018年A题真题(本文由西南民族大学白白不加糖、薄荷CC糖原创)
  8. 一键清理C盘垃圾文件,让你的电脑运行飞起
  9. c 游戏服务器提前生成一批账号,天涯明月刀第一批天涯合璧 数据互通公告
  10. 详解!智能工厂物流系统规划步骤