小结关注:决策智能与机器学习,深耕AI脱水干货

者 |  Cassie Kozyrkov

来源 | towardsdatascience

导言:因果关系通过来自于严禁的试验设计和分析,但如果没有得到因果关系,那么你所拥有的只有关联性。相关性是什么?特别强调,关联性不是因果关系!!!!

当然,你可能已经听到我们的统计学家对你大喊大叫了。但什么是相关性呢?它是指数据集中的变量看起来以某种方式在一起变化。

如果两个变量X和Y以某种方式一起运动,那么它们就是相关的。

数学定义

不完美的线性相关

例如,“X越高,Y越高”(称为正相关)或“X越高,Y越低”(称为负相关)。

如果你正在寻找(人口)相关性的公式,维基百科有你需要的一切。但如果你想这样做,为什么不直接去呢?你为什么在这里?你想要直观的解释吗?酷。这里有一个山:

在左边,高度和(从左到右)距离正相关。一个上升,另一个也上升。在右侧,高度和距离呈负相关

当大多数人听到相关性这个词时,他们倾向于认为是完美的线性相关性

在山上向右迈一步(X),在同一山坡上的任何地方,海拔高度的变化(Y)都是相同的。只要你从左到右向上(正相关),就不会出现令人惊讶的锯齿/弯曲。

记住,只有当你从左到右徒步旅行时,向上才是积极的,就像你读英语一样。如果你从右边接近希尔斯,统计学家将不知道如何处理你。我想统计学家试图告诉你的是,永远不要向右靠近。那只会把我们弄糊涂。

但如果你正确地徒步旅行,那么“向上”就是“积极的”。

在现实中,这座山并不是完美的,所以高度和距离的相关幅度小于100%。(你会在前面加上+/-取决于是上升还是下降,所以相关性在-1和1之间。这是因为它的公式(粘贴在上面的维基百科)除以标准差,从而消除了每个变量离散度的大小。如果没有这个分母,你会发现无论你用英寸还是厘米来测量身高,这种关系的强度都是一样的。每当你看到统计中的缩放/归一化,它通常是用来帮助你比较用不同单位衡量的苹果和橘子的。)

不相关的变量

零的相关性是什么样子的?你是在想一个里面没有可辨别的图案的凌乱的云吗?喜欢的东西:

当然,工作。你知道我怎么知道X和Y真的没有关系吗?因为我就是这样创造它们的。如果您想模拟两个不相关变量的类似图,请尝试在R online中运行以下基本代码片段:

X <- runif(100) # 100 regular random numbers between 0 and 1
Y <- rnorm(100) # Another 100 random numbers from bell curve
plot(X, Y, main = "X and Y have nothing to do with one another")

但还有另一种方法。关系越不线性,你的相关性就越接近于零。事实上,如果你把这座山看作一个整体(而不是每次只看一个斜率),你会发现两者之间的相关性为零,尽管高度和距离之间有明显的关系(这就是一座山)。

X <- seq(-1, 1, 0.01) # Go from -1 to 1 in increments of 0.01
Y <- -X^2 # Secret formula for the ideal hill
plot(X, Y, main = "The linear correlation is zero")
print(cor(X, Y)) # Check the correlation is zero

小结

总而言之,如果你想谈论因果关系,你需要一个验证实验。没有实验,你所拥有的只有相关性,对于许多决策——基于因果推理的决策——相关性是远远不够的。

交流合作

请加微信号:yan_kylin_phenix注明姓名+单位+从业方向+地点,非诚勿扰。

相关性的基本概念「AI基础」相关推荐

  1. 2021「AI中国」评选

    文章目录 2021「AI中国」评选 最强技术实力公司TOP 10 最具潜力创业公司TOP 10 最佳人工智能公司 TOP 30 最强技术生态 TOP 10 年度开源事件TOP 10 最具商业价值解决方 ...

  2. 企企通入选「AI中国」机器之心“最具商业价值解决方案 TOP 30” 榜单

    近日,由专业的人工智能信息服务平台机器之心,发起并评选的「AI 中国」机器之心2022 年度评选榜单正式公布,企企通凭借过去一年在采购供应链领域取得的成就,以及在技术.产品.服务能力方面具备的独特优势 ...

  3. 「AI+教育」和「AI教育」:一个为教育,一个做教育

    以机器学习.语音识别.图像处理等技术为主的人工智能(AI)技术逐渐展露在我们眼前,它不仅极大的改变了人们的生活方式,也带动了各领域的发展.随着人工智能的应用领域愈发广泛,如何普及.发展人工智能教育(A ...

  4. 字节跳动技术团队提出「AI渲染」方案,手机端也能实现影视级渲染效果

    随着3D技术的高速发展,影视渲染效果的复杂度.精细度都在逐步提升,但高质量的渲染效果和时间成本往往难以兼顾.针对这一行业痛点,字节跳动智能创作团队基于AI技术的优势提出了「AI渲染」方案.这一方案现已 ...

  5. 「软件测试基础」理论篇之软件测试概论

    文章目录 1. 软件 1.1 软件发展史 1.2 软件生命周期 1.3 软件缺陷 1.4 三种纠错技术 2. 软件过程 2.1 RUP 2.1.1 RUP各个阶段 2.1.2 RUP核心工作流 2.2 ...

  6. 奔驰首秀L4自动驾驶:100万最贵电动车展示最豪华「AI代客泊车」

    奔驰首秀L4自动驾驶:100万最贵电动车展示最豪华「AI代客泊车」 奔驰车主自己抡方向盘?不从容也不尊贵,这不解决方案来了>>> 最豪华的AI"代客泊车"长什么样 ...

  7. 问就是「AI 过」, 你认识的这 7 个 App 都支持 AI 了

    目录 1. 问就是「AI 过」, 你认识的这 7 个 App 都支持 AI 了 1.1. Notion AI 1.2. Carrot Weather 1.3. Warp AI 1.4. Readwis ...

  8. 聆听「创业」与「AI+教育」 | 爱莫×众里 in FM105.7

    日前,"南粤之声FM105.7"电台特邀爱莫科技CEO杨恒与众里社区运营总监卢倩前往做客,聊聊他们关于「创业」.「AI+教育」的见解.体会. 聆听「创业」与「AI+教育」 | 爱莫 ...

  9. 「AI孙燕姿」全网沸腾!AI翻唱大爆发

    一夜之间,「AI孙燕姿」火遍全网. B站上,AI孙燕姿翻唱的林俊杰「她说」.周董「爱在西元前」.赵雷「成都」等等,让一众网友深陷无法自拔.「冷门歌手」孙燕姿新晋成为2023年度热门歌手,掀起许多人的追 ...

最新文章

  1. 卡尔曼算法笔记---思想和实际应用物理含义的理解
  2. android apk瘦身之 图片压缩 tinypng
  3. 一套代码称霸5大端口,移动金融应用还能这样开发?
  4. OS- -进程详详解
  5. Linux内存管理段页
  6. python反编译加密文件_python打包的二进制文件反编译
  7. 《数据分析实战 基于EXCEL和SPSS系列工具的实践》一3.2 用“逐步推进法”推测需要的数据...
  8. Veeam 数据备份解决方案修复多个严重漏洞
  9. mysql慢查询ep_mysql 慢查询分析
  10. Hotpatching a C Function on x86
  11. 5.3输入两个正整数m和n,求其最大公约数和最小公倍数。
  12. 华盛顿大学计算机硕士什么时候录取,2020年华盛顿大学排名TFE Times美国最佳计算机科学硕士专业排名第5...
  13. centos7搭建webpack
  14. 离线安装linux的gcc,nvidia等错误
  15. 【Git】Conventional Commit 约定式提交规范
  16. 数据库(mysql)之用户管理
  17. TensorFlow简单实例(二):logistic regression
  18. java——html
  19. 录制课件时,小米笔记本电脑,外接耳麦, 麦克风没那有声音,怎么办?
  20. NET Core 模板项目 - NuGet

热门文章

  1. 建造者模式浅谈 与工厂模式的区别
  2. Jetson nano sudo运行vncserver后导致Ubuntu循环登录
  3. 计算机组成原理 第四章存储系统(二)测试
  4. Cortana小娜:竟然还能发微信朋友圈
  5. 第四范式陈雨强:如何利用高维度的AI解决商业难题?
  6. Cty的Linux学习笔记(六)
  7. Node.js基础汇总(一):什么是Node.js,创建最简单的Node.js应用,NPM介绍,安装express模块
  8. 阿里云:通过设置白名单解决因误判IP被拦截问题
  9. 群晖nas和文件服务器的区别,nas云服务器的区别(群晖nas搭建云服务器)
  10. 前端初级新人,如何撕去菜鸟标签