点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


作者:Abhishek Parbhakar

编译:ronghuaiyang

前戏

要问数据科学家最爱的女人是谁,这个问题很难,大家可能说出无数个答案,但是如果要问数据科学家最爱的男人是谁,那么回答就容易多了,毫无疑问就是高斯(这个答案的分布本身就是个高斯分布哦)!那么高斯分布为什么人见人爱呢?一起来看看!

高斯分布可视化.

对于深度学习和机器学习工程师来说,在世界上所有的概率模型中,高斯分布模型是最突出的。即使你从未参与过AI项目,你也很有可能遇到过高斯模型。

高斯分布模型,通常以其标志性的钟形曲线来识别,也称为正态分布,之所以如此流行,主要有三个原因。

高斯概率分布函数的数学公式

自然界中普遍存在的现象

所有的模型都是错的,但是有些是有用的!— George Box

扩散之后的粒子的位置可以用高斯分布来描述

自然界和社会科学中,遵循高斯分布的过程多得令人难以置信。即使没有,高斯函数给出了这些过程的最佳模型近似值。一些例子包括:

  • 我们成年人的身高、血压和智力

  • 扩散之后的粒子的位置

  • 测量误差

数学推理:中心极限定理

二维随机游走,200万步

中心极限定理指出,当我们加入大量的独立随机变量时,不管这些变量的原始分布如何,它们的归一化和都趋向于高斯分布。例如,随机游走所覆盖的总距离的分布趋向于高斯概率分布。

该定理的含义包括,大量专门为高斯模型开发的科学和统计方法也可以应用于可能涉及任何其他类型分布的广泛问题。

这个定理也可以解释为什么许多自然现象遵循高斯分布。

一次高斯,终生高斯!

不像许多其他分布在变换时性质会改变,高斯分布的变换往往仍然是高斯分布。

  • 两个高斯函数的乘积是高斯函数

  • 两个独立高斯随机变量的和是高斯的

  • 高斯函数与另一个高斯函数的卷积是高斯函数

  • 高斯函数的傅里叶变换是高斯函数

简单

奥卡姆剃刀是一个哲学原理,它强调在所有其他事情都相同的情况下,最简单的解决方案是最好的。

对于每一个高斯模型的近似,可能存在一个复杂的多参数分布,可以提供更好的近似。但高斯分布仍然是首选,因为它使数学更简单!

  • 均值、中位数、模型都是相同的

  • 整个分布可以用两个参数指定:均值和方差

高斯分布是以伟大的数学家和物理学家卡尔·弗里德里希·高斯命名的。


英文原文:

https://towardsdatascience.com/why-data-scientists-love-gaussian-6e7a7b726859


在2019年,大家喜欢哪些内容呢,给下面的菜单投个票吧!

往期精彩回顾

1、人人都能看得懂的深度学习介绍!全篇没有一个数学符号!

2、深度学习物体检测论文阅读路线图以及官方实现

3、新手必看的Top10个机器学习算法(这些都学会了你就是老手了

4、论文看吐了没有?做研究的同学瞧一瞧看一看啦,教你读论文:为什么读以及如何读

5、面试时,遇到决策树相关的问题怎么办?看完下面的30道题,你应该就心里有底了

本文可以任意转载,转载时请注明作者及原文地址。

请长按或扫描二维码关注本公众号

来,给我好看吧

高斯,数据科学家最爱的男人(我们不是GAY!)相关推荐

  1. 数据科学家:那些年,我都学过哪些编程语言…

    前言 我们对事物的看法各不相同,有时他人特别喜欢的语言可能会成为另一个人的的噩梦.而我个人的噩梦是用C语言进行日常的编程工作. 本文就介绍了作为一名数据科学家,我在职业生涯中所学过的语言,其中包括MA ...

  2. 数据科学家必须要掌握的5种聚类算法

    编译 | AI科技大本营 参与 |  刘 畅 编辑 |  明 明 [AI科技大本营导读]聚类是一种将数据点按一定规则分群的机器学习技术.给定一组数据点,我们可以使用聚类算法将每个数据点分类到一个特定的 ...

  3. 数据科学之基石:数据科学家必须掌握的10个统计学概念

    2021-01-29 12:29:00 全文共2848字,预计学习时长8分钟 图源:Google 数据科学是一个跨学科领域,其基石之一是统计学.如果没有足够的统计知识,就很难理解或解释数据. 统计学帮 ...

  4. 数据科学 python_为什么需要以数据科学家的身份学习Python的7大理由

    数据科学 python As a new Data Scientist, you know that your path begins with programming languages you n ...

  5. 阎焱多少身价_2020年,数据科学家的身价是多少?

    阎焱多少身价 Photo by Christine Roy on Unsplash 克里斯汀·罗伊 ( Christine Roy) 摄于Unsplash Although we find ourse ...

  6. 数据科学家编程能力需要多好_我们不需要这么多的数据科学家

    数据科学家编程能力需要多好 I have held the title of data scientist in two industries. I've interviewed for more t ...

  7. 数据中台是下一代大数据_全栈数据科学:下一代数据科学家群体

    数据中台是下一代大数据 重点 (Top highlight) Data science has been an eye-catching field for many years now to you ...

  8. 一份Yann LeCun等16个顶级数据科学家给新人的建议

    来源:大数据文摘 本文约8190字,建议阅读10分钟. 本文节选自<工作中的数据科学家>,书中采访了16个不同行业的16位顶级数据科学家,以了解他们在理论上如何思考,以及在实际中解决什么问 ...

  9. 教你如何成为数据科学家(二)

    由于数据科学家需要和大量的数字打交道,所以统计学方面的知识要求很多 Statistics Pick a Dataset (UCI Repo)                               ...

最新文章

  1. 饶毅坚守教育学者的风骨,网友鼓励:远离精致利己主义的舒适区
  2. 一台服务器能承载多少用户_一台入门级服务器能为你的办公应用带来哪些效率?评测告诉你...
  3. P1273 有线电视网
  4. Prometheus之kubernetes-sd自动发现
  5. 简单获取任意app的URL Schemes
  6. 玩JerseyTest(Jersey 2.5.1和DI)
  7. POJ 3126 Prime Path
  8. php 去掉字符串的最后一个字符
  9. 一些常见技术问题提问方式
  10. 计算机装配调试员培训内容.doc,电子计算机(微机)装配调试员文档.doc
  11. SQL语句优化常见方法
  12. LayUI树形表格treetable使用详解
  13. 怎么快速查找重复文件以及删除重复文件
  14. 高精度定位系统融合定位模式崭露头角
  15. pygame游戏教程目录
  16. echarts-gl三维展示自定义地图
  17. 分贝测试软件哪个好 家庭影院,家庭影院隔音怎么做效果最好 这7个解决方案你一定要知道...
  18. 用户画像原理、技术选型及架构实现
  19. Django自动化测试平台项目案例
  20. 批量修改文件名字、不同的目录下

热门文章

  1. 去过日本的朋友,说说在日本的感受如何?
  2. 通常所说的微型计算机主机是指,通常所说的微型主机是指
  3. 判断一个点是否在给定的凸四边形内
  4. 第四次网页前端培训笔记(css常用属性设置)
  5. 如何减少http请求的次数
  6. Clickhouse 在云原生场景下的部署和使用
  7. 爬虫---国家食品药品监督管理总局
  8. 深大uooc大学生心理健康章节答案第十一章
  9. “笨办法”学Python3,Zed A. Shaw, 习题4~5
  10. 物联网开发技术体系 2 软硬件开源物联平台