zipf law :在给定的语料中,对于任意一个term,其频度(freq)的排名(rank)和freq的乘积大致是一个常数。

Zipfian distribution

一个离散幂律概率分布,也就是常常提到的长尾模型.在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。

频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,是出现频率第三位的单词的3倍。

t is known that the number of incoming links to pages on the Web follows a Zipfian distribution. That is, a small number of Web pages have an extremely large number of links pointing to them, while a majority of pages have only a small number of incoming links.

原文链接:

https://blog.csdn.net/Rockics/article/details/6544110

https://blog.csdn.net/u010945683/article/details/78843655

有一个基本定律,就是大家常说对于内容的访问遵循80/20原则,也就是20%的内容,会占有80%的访问量。

Zipf分布与其类似。
这是一个定性的原则,定量来说,内容访问近似符合Zipf定律(Zipf's law), 这个定律是美国语言学家Zipf发现的,他在1932年研究英文单词的出现频率时,发现如果把单词频率从高到低的次序排列,每个单词出现频率和它的符号访问排名存在简单反比关系:

这里 r 表示一个单词的出现频率的排名,P(r)表示排名为r的单词的出现频率.

(单词频率分布中 C约等于0.1, a约等于1)

后人将这个分布称为齐夫分布,这个分布是一个统计型的经验规律,描述了这样一个定理:只有少数英文单词经常被使用,大部分的单词很少被使用。这个定理也在很多分布里面得到了验证,比如人们的收入,互联网的网站数量和访问比例,互联网内容和访问比例(其他分>布两个常数有所不同,a越大,分布越密集,对于VOD来说某些时候符合双zipf分布)。

zipfian 参数是什么 Zipfian distribution 齐夫定律相关推荐

  1. 齐夫定律, Zipf's law,Zipfian distribution

    齐夫定律(英语:Zipf's law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律. 它可以表述为: 在 ...

  2. 本福特定律和齐夫定律是一回事吗

    关于本福特定律的简单解释和推导,参见: https://zhuanlan.zhihu.com/p/440462854 思考本福特定律,与齐夫定律对照,它们之间似乎可以相互推导,是真的吗? 本福特定律说 ...

  3. python作业|齐夫定律、平均多义性

    题目(1):P82.第23题. 齐夫定律:f(w)是自由文本中词w的频率.假设一个文本中的所有词都按照它们的频率排名,频率最高的排在最前面.齐夫定律指出一个词类型的频率与它的排名成反比(即f*r=k, ...

  4. [电路]3-基尔霍夫定律

    [电路]系列文章目录 1-发出功率和吸收功率关系 2-独立源和受控源 3-基尔霍夫定律 文章目录 [电路]系列文章目录 一.基尔霍夫定律 1.基尔霍夫电流定律(KCL) 2.基尔霍夫电压定律(KVL) ...

  5. MIT自然语言处理第二讲:单词计数(第一、二部分)

    MIT自然语言处理第二讲:单词计数(第一部分) 自然语言处理:单词计数 Natural Language Processing: (Simple) Word Counting 作者:Regina Ba ...

  6. Python概率分布大全(含可视化)

    文章目录 术语 前言 整数 浮点数 抽取 字节 洗牌 排列 贝塔分布 二项分布 卡方分布 狄利克雷分布 指数分布 F分布 伽玛分布 几何分布 耿贝尔分布 超几何分布 拉普拉斯分布(双指数分布) 逻辑斯 ...

  7. 自然语言处理第二讲:单词计数

    自然语言处理:单词计数 这一讲主要内容(Today): 1.语料库及其性质: 2.Zipf 法则: 3.标注语料库例子: 4.分词算法: 一. 语料库及其性质: a) 什么是语料库(Corpora) ...

  8. 微信高级研究员解析深度学习在NLP中的发展和应用 | 公开课笔记

    作者 | 张金超(微信模式识别中心的高级研究员) 整理 | Just 出品 | 人工智能头条(公众号ID:AI_Thinker) 近年来,深度学习方法极大的推动了自然语言处理领域的发展.几乎在所有的 ...

  9. MIT自然语言处理第三讲:概率语言模型(第一、二、三部分)

    MIT自然语言处理第三讲:概率语言模型(第一部分) 自然语言处理:概率语言模型 Natural Language Processing: Probabilistic Language Modeling ...

  10. MIT自然语言处理第二讲:单词计数(第三、四部分)

    MIT自然语言处理第二讲:单词计数(第三部分) 自然语言处理:单词计数 Natural Language Processing: (Simple) Word Counting 作者:Regina Ba ...

最新文章

  1. OPPO R11发布盛典昨晚举行,精彩程度不亚于大型晚会!
  2. 第一章 C++ primer Plus
  3. 所有被td:last-child a影响到了的Spartacus表格
  4. some SQL trace of pricing document generation
  5. 元组可以直接添加进数据库吗_数据库篇-第一章:数据库基本概念
  6. postgresql(2)
  7. php图片滑动的属性,使用css怎么实现图片的滑动效果?(示例)
  8. php post获取dvi,如何利用http来发送post请求
  9. java实现c语言的函数_C语言tolower函数介绍、示例和实现
  10. android不同应用程序之间启动Activity
  11. VK Cup 2012 Qualification Round 2 C. String Manipulation 1.0 线段树 or 树状数组+二分
  12. 红巨星粒子特效合集插件:Trapcode Suite 18 Mac版(支持m1)
  13. QT 处理TCP粘包问题
  14. HTML5七夕情人节表白网页(爱情树 Html5实现唯美表白动画代码) HTML+CSS+JavaScript
  15. arcgis地理配准_Arcgis 地理配准步骤(底图校正)详细讲解
  16. 兼容性和浏览器hack
  17. Android应用开发实战-保活组件
  18. GitHub 预览 Copilot,一个 OpenAI 驱动的编码助手
  19. 用python画蟒蛇
  20. VB文本框textbox的那点事

热门文章

  1. 让图片左右缓慢移动的MoveView
  2. iOS 6 SDK: 在应用内展示App Store
  3. shell函数显式的返回值
  4. [MSN谈话]专注、口碑和猎头
  5. 一个HTML 导航栏下划线跟随效果
  6. bzoj 3676: [Apio2014]回文串
  7. mysql 使用存储过程批量插数据
  8. 解决VisualStudio2008下asp.net mvc开发向View中添加服务器控件崩溃的问题
  9. Web Part加载错误的一点经验
  10. 拓端tecdat|R语言动量交易策略分析调整后的数据