背景介绍

  笔者的第一本心理学启蒙教材《西奥蒂尼社会心理学》;揭开了自我、环境、群体之间看不见的影响力。“ 行为背后的目的到底是什么?” “ 目的背后的人和环境发挥了怎样的作用?” 是社会心理学探究的两大核心问题。笔者从心理学网站中抽取了有一组关于说服者态度强硬指数的数据,为了探究受试者态度强硬的程度与说服结果的关系,我们首先需要知道他们的强硬指数的 “ 段位 ”,即他们超过了群体中百分之几的人,又或者说群体中有百分之几的人在 TA 后/前面。不过为了让你对 z 分数有一个更加深刻的认识,请确保你已经掌握了如下的基础概念和简单的术语,它们在统计学实验和文献中会经常出现。


正式开始

z 分数

  z 分数是将个体分数,个体所在样本或总体的平均值和标准差串在一起的一个概念,它是对普通数据进行转换的结果,可以更好地描述数据在分布中的位置,进而得出原始分数在数据集合中的百分等级,这样便能让一个统计学外行人也能完全听懂;计算公式为 Z = (X - M)/SD,用来描述某分数在其分布中高于(或低于,如果它为负)平均数的标准差数目;总的来说,可以确定该分数所在的位置(“段位”)

数据预览 & 求解 z 分数

  我们现在随机抽取一位同学,计算 TA 强硬指数的“段位”

求解 z 分数

  现在我们知道了 “石军” 同学的 z 分数大约为 -0.63,那接下来该如何判断其“段位”呢?两个方法:结合正态分布曲线粗略标定法和直接查表法。

查表法:如下为z 分数表

  通过上表不难看出,石军的 z_score 为 -0.63,根据正态曲线的 z 分数表可以找出精确的百分比为 0.735(三位小数),即 73.5%,因为其 z 分数为负,所以我们可以这样说:石军同学的强硬指数低于 73.5% 的同学。

源代码

def z_score(data, individual):""" 传入这个样本的所有数据 & 希望探究的个体的数据,打印其对应的 Z 分数 """# 求解平均值和方差, 并求解 z 分数mean = data.mean()std = data.std()z = (individual - mean) / stdreturn {'原始分数': individual,'Mean': round(mean,3),'Standard deviation': round(std,3),'Z score': z}

粗略估计法则则可参照下图的范围区间(该图非常常用,需要牢记)

  顺便安利一个免费的提高效率的软件,用后再不说自己忙了。Office Lens:扫描软件,不多说,谁下谁知道。


正态曲线初探

  细心一点的朋友应该会发现,其实上面两个方法(精确查表和粗略看分布图)的方法都是基于正态曲线来说的。其实数据的分布情况并不会给 Z 分数的可信度造成很大影响。Z 分数有时候被称作标准分布,因为 Z 分数相对于平均数和标准差有着标准值,而且它提供了测量任意变量的标准尺度(话虽如此,又是只有当 Z 分数的分布为正态时,术语标准分数才能使用,后面会继续更博)

为什么自然界中正态曲线如此常见?

常见的连续分布的形式

  • 正态分布(刚好处于一半的那个位置):一般自然界自然生长/自然而成的东西的分布情况如人的身高 – 受到了多方面的影响,很难考量单一因素等。
  • 对数正态分布:收入是对数正态。最高的蓝线,最往右边偏的。几种分布中:其中对数正态分布在统计分析中运用最为广泛,顾名思义,这种类型的分布在取对数之后服从正态分布。因为其具有这样的良好属性,在精确度要求并不严格的统计分析中。描述性统计分析 – 直接正态分布描述就可以了;建模的时候才取对数。
  • 泊松分布:网页点击量、队伍长度 等符合泊松分布
  • 伽马分布:灾难给我们带来的经济损失,一旦到了理赔的方面,伽马分布就最常见了

  注意:数据分析中,一般情况下,右偏不严重的 – 当正态分布用;右偏严重的 – 当对数正态用;做描述性统计分析的时候,中心水平通常用均值或者中位数来表示。如何在两者中抉择呢?偏度一般:均值;偏度比较大时,使用中位数。为什么不一直使用中位数?对老百姓来说不好理解

说服者态度强硬指数的分布情况

如何一步到位的画出复杂精美的图片可以参考这篇博文

Python 数据可视化:seaborn displot 正态分布曲线拟合图代码注释超详解(放入自写库,一行代码搞定复杂细节绘图)


模拟问答

  1. 谈谈你对平均数,方差和标准差的理解吧,他们之间的关系

  2. z 分数是什么,计算公式?有什么意义?

  3. z 分数与百分位数有什么异同?计算公式与 numpy 中的 percentile 函数可当成是一体吗
    percentile(百分位数)更接近顺序变量,Z-score(标准分数)是连续变量。分布正态时两者无差别,偏态时用百分位数更好,不过还是要看具体情况。

  总而言之,了解 Z 分数,是入门统计学的开始,加油!


后记

  数据分析,商业实践,数据可视化,网络爬虫,统计学,Excel,Word, 社会心理学,认知心理学,行为科学,民族意志学 各种专栏后续疯狂补充

  欢迎评论与私信交流!

统计学(一): Z 分数 正态分布 (附 Python 实现代码) --Z 检验先修; Z 分数与正态分布两者关系; Z 分数与百分位数的异同;面试要点(以心理学实验为舟)相关推荐

  1. 【深度学习】(2) 数据加载,前向传播2,附python完整代码

    生成数据集: tf.data.Dataset.from_tensor_slices(tensor变量) 创建一个数据集,其元素是给定张量的切片 生成迭代器: next(iter()) next() 返 ...

  2. 【机器学习入门】(8) 线性回归算法:正则化、岭回归、实例应用(房价预测)附python完整代码和数据集

    各位同学好,今天我和大家分享一下python机器学习中线性回归算法的实例应用,并介绍正则化.岭回归方法.在上一篇文章中我介绍了线性回归算法的原理及推导过程:[机器学习](7) 线性回归算法:原理.公式 ...

  3. 前景背景样本不均衡解决方案:Focal Loss,GHM与PISA(附python实现代码)

    参考文献:Imbalance Problems in Object Detection: A Review 1 定义 在前景-背景类别不平衡中,背景占有很大比例,而前景的比例过小,这类问题是不可避免的 ...

  4. 【机器视觉案例】(5) AI视觉,手势调节物体尺寸,附python完整代码

    各位同学好,今天和大家分享一下如何使用opencv+mediapipe完成远程手势调节图片尺寸的案例.先放张图看效果.当拇指和食指竖起时,根据食指间的连线的长度自由缩放图片尺寸.图片的中点始终位于指尖 ...

  5. 【机器视觉案例】(5) AI视觉,远程手势控制虚拟计算器,附python完整代码

    各位同学好,今天和大家分享一下如何使用MediaPipe+Opencv完成虚拟计算器,先放张图看效果.FPS值为29,食指和中指距离小于规定阈值则认为点击按键,为避免重复数字出现,规定每20帧可点击一 ...

  6. 【MediaPipe】(4) AI视觉,远程手势调节电脑音量,附python完整代码

    各位同学好,今天和大家分享一下如何使用MediaPipe完成手势调节电脑音量,先放张图看效果. 注意!! 本节需要用到手部关键点的实时跟踪,我已经在之前的文章中详细写过了,本节会直接使用,有疑问的同学 ...

  7. 【机器学习入门】(13) 实战:心脏病预测,补充: ROC曲线、精确率--召回率曲线,附python完整代码和数据集

    各位同学好,经过前几章python机器学习的探索,想必大家对各种预测方法也有了一定的认识.今天我们来进行一次实战,心脏病病例预测,本文对一些基础方法就不进行详细解释,有疑问的同学可以看我前几篇机器学习 ...

  8. 【机器学习入门】(5) 决策树算法实战:sklearn实现决策树,实例应用(沉船幸存者预测)附python完整代码及数据集

    各位同学好,今天和大家分享一下python机器学习中的决策树算法,在上一节中我介绍了决策树算法的基本原理,这一节,我将通过实例应用带大家进一步认识这个算法.文末有完整代码和数据集,需要的自取.那我们开 ...

  9. 【机器学习入门】(3) 朴素贝叶斯算法:多项式、高斯、伯努利,实例应用(心脏病预测)附python完整代码及数据集

    各位同学好,今天我和大家分享一下朴素贝叶斯算法中的三大模型.在上一篇文章中,我介绍了朴素贝叶斯算法的原理,并利用多项式模型进行了文本分类预测. 朴素贝叶斯算法 -- 原理,多项式模型文档分类预测,附p ...

最新文章

  1. 值得推荐!安利8个小众好用的宝藏工具,解决各种需求
  2. tomcat7在eclipse中,调试时断点频繁停在threadpoolexecutor
  3. python3创建定时任务
  4. 833c语言程序是什么,江南大学
  5. 今天突然想到一个问题:地球在转动吗,由东西向西跳与由西向东跳哪个更远...
  6. 2.外部链接数据库报错Can't connect to mysql server on xxx.xxx.xxx.xxx(10038)
  7. excel模糊搜索_Excel进阶篇:星号*用法,学会这些功能的,都按时加班了
  8. python保存模型的路径怎么写_使用python在MongoDB中保存机器学习(ML)和深度学习(DL)模型...
  9. python-自定义模块-文件的操作
  10. Python python 五种数据类型--字符串
  11. 最近点对模板__hdu1007
  12. STM32_GPIO口
  13. 基础学习day03---程序结构与控制、函数与数组入门
  14. 线程与进程最通俗易懂的解释(附面试题与答案)
  15. 大唐凌烟阁开国廿四将
  16. TRUNK理论与配置实验
  17. OneClock 不息屏的极简时钟,不仅仅是翻页时钟那么简单!
  18. js 匹配正确手机号
  19. 学java被“劝退”的第六天
  20. c++ set使用(增删查遍历)

热门文章

  1. JAVA反射----->看这篇就够了
  2. 秒会pygame:究极无敌闪烁小球与碰壁反弹程序(完整代码)
  3. 塞瓦定理与梅涅劳斯定理
  4. 织梦DEDECMS 整合Kindeditor编辑器美化版nkeditor版可H5多图上传摒弃SWF上传
  5. Self-supervised Graph Neural Networks for Multi-behavior Recommendation-IJCAI 2022 读书笔记
  6. PYTHON练习题---设有一头小母牛,从出生第四年起每年生一头小母牛
  7. 遥感深度学习数据集汇总(更新中)
  8. 微信公众号网页H5跳转微信小程序
  9. CF专题(长安大学)
  10. 苹果以旧换新活动_为什么苹果手机回收官方报价那么低?内行人告诉你!