长尾分布(long-tail distribution)和长尾效应

1、长尾效应

作者:赵澈
链接:https://www.zhihu.com/question/20027490/answer/20420381
来源:知乎

长尾效应其实是幂率分布的通俗提法,在物理上也被称为无标度现象,这种现象在自然界与社会生活中都相当地常见,可参考幂律分布_互动百科。里面也提到之所以叫无标度,是因为「系统中个体的尺度相差悬殊,缺乏一个优选的规模」。

如下图这般,极少数个体(横轴)对应极高的值(纵轴),而拥有极低值的个体,数量却占总体的绝大多数。形象地描述可称曲线靠近纵轴的部份为tall head,而靠近横轴的部份则是所谓的long tail:

据维基百科:長尾(英語:The Long Tail),或譯長尾效應,最初由《連線》的總編輯克里斯·安德森(Chris Anderson)於2004年發表於自家的雜誌中[1],用來描述諸如亞馬遜公司、Netflix和Real.com/Rhapsody之類的網站之商業和經濟模式。是指那些原來不受到重視的銷量小但種類多的產品或服務由於總量巨大,累積起來的總收益超過主流產品的現象

因此长尾效应这个提法,强调的是那些数量占绝大多数的个体的商业价值,它们单个的值虽然极低,但是这个长长的尾巴,总和不可小觑。而长尾之所以常常与互联网、电子商公司放在一起,主要是因为互联网与IT技术的发展使产品与服务的信息到达用户的平均成本降到了极低的值。幂率分布在海量产品信息与用户信息的情形下表现得尤其明显,并且被这些公司较早加以了良好利用。

以下拿网店与线下商店对比为例:

网店相当于用极小的成本,便换来几乎无限长的货架,可以同时包括大热门以及几乎无人问津的众多冷门。这众多冷门带来的效益总和则相当可观,甚至可以去与几个大热门相较量。用一个不恰当的比喻,「蚁多咬死象」。相较而言,线下实体商店由于可观的空间等成本是无法做到同样的事情的,边际效益不允许。

从用户的角度看,即使再小众的需求也可能通过互联网平台得以满足,相当于毫不费力逛一个无限大的、能尽可能满足自己的超级市场,可以说只要是世上存在的,都可能唾手可「见」(当然这是一种极为理想的描绘,实际的状况很大程度上依赖于技术的发展,比如搜索引擎、个性化推荐等,这裡暂且不谈)。之所以我不说唾手可「得」,是因为有物流这个实物类电子商贸无法逃避的瓶颈;O2O等服务类商品则也难以回避实际的消费一定发生在线下这一问题。即使消费者与商品之间碰撞出火花所需的时间再短,终不得不考虑这漫长多艰的蜀道难。这也是线下商店不会被电子商贸轻易打垮的重要原因之一。而手机话费、游戏点卡这类的虚拟(或者说完全数字化)商品,包括现在很热的网络金融产品,在这方面则受到很小的影响。

这种在电子商贸领域中的现象同样能够在其他互联网应用特别是平台化的应用上见到,比如多媒体内容分享平台、网络社区等。这时用户所拥有的值就从对商品或服务的需求(可能还对应为他们为实现这一需求愿意付出的代价)变成了对有趣、有价值的信息的需求(也可能对应愿付出的代价,当然这时可能更像是时间、精力这样的代价)。而这些信息同样主要来自于用户,也就是所谓的UGC。这种生产的长尾与需求的长尾同时作用,便是我所理解的Web 2.0的一个重要特徵。

现在也有不少其他领域借鉴了长尾这个说法,用以描述各自领域内的幂率分布现象。此外值得一提的是,幂率分布与正态分布都给人一种用以区分大多数与极少数的印象,但是正态分布的大多数集中于中间,极少数则分居两端,是个倒挂金钟的形状,二者描绘的其实是极为不同的现象。

2、长尾分布(和重尾分布即幂律分布)

Zipf分布是一种符合长尾的分布:

就是指尾巴很长的分布。那么尾巴很长很厚的分布有什么特殊的呢?有两方面:一方面,这种分布会使得你的采样不准,估值不准,因为尾部占了很大部分。另一方面,尾部的数据少,人们对它的了解就少,那么如果它是有害的,那么它的破坏力就非常大,因为人们对它的预防措施和经验比较少。也要所谓的二八法则。
https://www.cnblogs.com/huangshiyu13/p/6217180.html

长尾分布(long-tail distribution)和长尾效应相关推荐

  1. 一句话定义:什么是长尾分布?(数据的长尾标签)

    长尾分布,指的是一小部分标签(即头部标签)有很多数据实例,而大多数标签(即尾部标签)只有很少数据实例的不平衡分类情况. 例如:在自动驾驶数据集中,汽车类别的数据非常多,但是锥桶的类别非常少.

  2. 重尾分布,长尾分布,肥尾分布 和 随机游走 (Heavy-tailed, Long-tailed, Fat-tailed distribution and Random walk)

    一看题目就知道本文内容较多,但因为放在一起讨论才能互相比较理解异同.本文主要讨论重尾分布,长尾分布,肥尾分布三者的联系,同时顺带讨论了一下 Random walk 中的 Lévy flight 和 B ...

  3. 应对长尾分布的目标检测 -- Balanced Group Softmax

    应对长尾分布的目标检测 – Balanced Group Softmax 文章目录 应对长尾分布的目标检测 -- Balanced Group Softmax 长尾分布的数据 以往应对长尾分布的方法 ...

  4. 长尾分布系列论文解析(一)Decoupling Representation and Classifier for Long-Tailed Recognition

    大纲 引言 分类问题中的长尾分布 采样策略 解耦训练 实验结果 总结 引言  看了挺多长尾分布的论文,从中获益匪浅,长尾分布的问题并不仅仅只局限于早期的分类问题之中,而是广泛存在于深度学习的多项任务之 ...

  5. 长尾分布,重尾分布(Heavy-tailed Distribution)

    参考 长尾分布,重尾分布(Heavy-tailed Distribution) - 云+社区 - 腾讯云 Zipf分布: Zipf分布是一种符合长尾的分布: 就是指尾巴很长的分布.那么尾巴很长很厚的分 ...

  6. 长尾分布 long-tail distribution

    实际上,在稳定分布家族中,除了正态分布,其他均为长尾分布. 长尾分布指少部分的类别占据了大部分样本数量,大部分类别只占据很少的样本.head类别主导训练过程 解决方法: data re-samplin ...

  7. ECCV 2022|计算机视觉中的长尾分布问题还值得做吗?

    点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心技术交流群 后台回复[ECCV2022]获取ECCV2022所有自动驾驶方向论文! 后台 ...

  8. 损失函数——长尾分布 / Equalization Loss【论文笔记】

    Contents 1 前言 1.1 重采样(re-sampling) 1.2 重加权(re-weighting) 2 softmax/sigmoid cross-entropy 2.1 softmax ...

  9. ICCV 2021 LVIS Challenge 长尾分布实例分割挑战赛,冠军解决方案

    关注公众号,发现CV技术之美 本文为52CV粉丝投稿. 本文介绍在 ICCV 2021 LVIS Challenge Workshop上的冠军解决方案:『LVIS Challenge Track Te ...

最新文章

  1. 阿里P8大牛耗费三年整理的:Java大厂面试题
  2. 【机器视觉】机器视觉产业链
  3. python散点图最多能画几个点_Python的散点图竟然能画这么好看
  4. 阿里云上万个 Kubernetes 集群大规模管理实践
  5. 搭建认证服务器 - Spring Security Oauth2.0 集成 Jwt 之 【授权码认证流程】 总结
  6. python 英语分词_Python英文文本分词(无空格)模块wordninja的使用实例
  7. Ubuntu bitnami gitlab 安装
  8. [转] Bookmarklet(书签工具)编写指南
  9. [蓝桥杯][2013年第四届真题]大臣的旅费(树的直径)
  10. 【Python】Python Mako模板使用
  11. 中小学、幼儿园远程视频监控系统技术方案
  12. 视频教程-CCNA魔鬼训练营-思科认证
  13. 完整的连接器设计手册_富士康的连接器设计手册
  14. 将一般算术表达式转化为逆波兰表达式,并求逆波兰表达式的值。
  15. 光盘显示0字节可用_多么愚蠢的想法:用光盘来代替U盘
  16. 中国IT传奇人物柳传志--语录大全
  17. 电脑屏幕上计算机闪烁有框,电脑显示器有点闪烁该怎么解决
  18. matlab 神经网络设计多层隐含层_[rbf神经网络]请教关于MATLAB中RBF神经网络隐含层神经元个数的问题...
  19. 取球游戏(C++)[堆]
  20. Android Studio打地鼠小游戏

热门文章

  1. 商业银行管理(ROSE) 思维导图
  2. vue使用百度地图(BMap)去掉百度地图的标志。
  3. 5 种全局 ID 生成方式、优缺点及改进方案
  4. GD32篇 一、GD32程序设置读保护,防止程序被读取
  5. 帆软内置数据集实现决策报表联动
  6. html5 移动页面,html5入门到精通,移动设备的html5页面布局
  7. 线性回归中的最小二乘法和梯度下降法比较
  8. 主板和机箱螺丝孔对不上?
  9. 计算机按哪里有音乐键,电脑键盘声音键是哪个 怎么打开电脑键盘声音键 - 驱动管家...
  10. 计算机大赛指导老师自评怎么写,计算机*学生的简单自我评价