p值 t值 统计

Here is a summary of how I was taught to assess the p-value in hopes of helping some other non-statistician out there.

这是关于如何教会我评估p值的摘要,希望可以帮助其他一些非统计学家。

P-value in Context

上下文中的P值

Let’s start with the context. When does the p-value even come into play? It is important to make decisions that are backed by data. In Data Science, this is called Data-Driven Decision Making (DDDM). Data is collected, hypotheses are formed about what that data means, the data is then run through a series of statistical calculations also known as hypothesis testing, and in the end, you have calculated values that help guide you in assessing the validity of your hypotheses. One of these calculated values is the p-value or probability value.

让我们从上下文开始。 p值何时生效? 做出由数据支持的决策很重要。 在数据科学中,这称为数据驱动决策(DDDM)。 收集数据,形成关于数据含义的假设,然后通过一系列统计计算(也称为假设检验)运行数据,最后,您获得的计算值可帮助您评估假设的有效性。 这些计算值之一是p值或概率值。

Hypothesis Testing

假设检验

Assume you have data on animal sightings in city streets. These sightings include foxes, coyotes, mice, cats, dogs, and even elephants! What is the probability of seeing an elephant walking down the street? As any good scientist does, you develop a hypothesis and test it. This is called hypothesis testing. In hypothesis testing, you have two opposing hypotheses. First is the null hypothesis, which effectively states there’s no evidence of anything significant in the data here, in this case, elephant sightings are not rare. Alternately, you have a hypothesis that essentially states the purpose of the study or what you are testing for in your calculations. Put simply, the alternative hypothesis states there is evidence of a significant event occurring and you should reject the null hypothesis, in this case, sighting an elephant is rare and therefore is a significant event. Significant can be hard to define. Statisticians call it the alpha value. It is typical to use a significance level, or alpha, of 0.05 as the threshold of significance, meaning that if calculations on your data yield a p-value of less than 0.05, the results are considered statistically significant.

假设您有关于在城市街道上发现动物的数据。 这些目击者包括狐狸,土狼,小鼠,猫,狗,甚至大象! 看到大象走在街上的概率是多少? 就像任何优秀的科学家所做的一样,您会提出一个假设并进行检验。 这称为假设检验。 在假设检验中,您有两个相反的假设。 首先是零假设,它有效地表明这里的数据中没有任何重要的证据,在这种情况下,发现大象的情况并不罕见 。 或者,您有一个假设,该假设基本上说明了研究的目的或您要在计算中测试的内容。 简而言之,替代假设指出有证据表明发生了重大事件,因此您应该拒绝原假设,在这种情况下,很少见到大象,因此是重大事件。 重要程度可能很难定义。 统计人员称其为alpha值。 通常使用0.05的显着性水平或alpha作为显着性阈值,这意味着,如果对数据进行的计算得出的p值小于0.05,则认为结果具有统计学意义。

How do you Interpret the P-value

您如何解释P值

You’ve cleaned your data, developed your hypothesis, put the data into the black box of data science magic, and now you have a p-value. What do you do with it? The p-value is a measurement of the probability of obtaining the results in the data assuming that the null hypothesis is true. How likely is it that you see something as extreme as an elephant walking down a city street? A low p-value, less than the 0.05 significance threshold, indicates that it is not very likely and thus the occurrence of such an event is significant. A high p-value, such as a p-value of 1 indicates the event is commonplace and not an unusual occurrence. Perhaps you would get this value if your sample population were comprised of members of a circus.

您已经清理了数据,提出了假设,并将数据放入了数据科学魔术的黑匣子中,现在您有了一个p值。 你用它做什么? p值是在假设零假设为真的情况下获得数据结果概率的度量。 您看到象大象在城市街道上行走一样极端的可能性有多大? 低的p值(小于0.05的显着性阈值)表明它不太可能发生,因此此类事件的发生非常重要。 较高的p值(例如p值为1)表示该事件很普遍,而不是异常情况。 如果您的样本总体由马戏团成员组成,则可能会得到此值。

Quite simply, the lower the p-value the more significance it holds. If the p-value of seeing an elephant walking down a city street is 0.01 and you do in fact see an elephant, it is a significant event! It means it is rare to get this value and unlikely to be happen-chance that it occurred.

很简单,p值越低,它的重要性就越大。 如果看到大象在城市街道上行走的p值是0.01,而您实际上看到的是大象,那将是一件很重要的事情! 这意味着很难获得此值,并且不太可能发生它。

翻译自: https://medium.com/swlh/p-value-for-the-non-statistician-5484f95fd9c0

p值 t值 统计


http://www.taodudu.cc/news/show-994809.html

相关文章:

  • 如何不部署Keras / TensorFlow模型
  • 对食材的敬畏之心极致产品_这些数据科学产品组合将给您带来敬畏和启发(2020年中的版本)
  • 向量积判断优劣弧_判断经验论文优劣的10条诫命
  • sql如何处理null值_如何正确处理SQL中的NULL值
  • 数据可视化 信息可视化_动机可视化
  • 快速数据库框架_快速学习新的数据科学概念的框架
  • 停止使用p = 0.05
  • 成像数据更好的展示_为什么更多的数据并不总是更好
  • vue domo网站_DOMO与Tableau-逐轮
  • 每个人都应该使用的Python 3中被忽略的3个功能
  • 数据探查_数据科学家,开始使用探查器
  • 从ncbi下载数据_如何从NCBI下载所有细菌组件
  • 线性插值插值_揭秘插值搜索
  • 如果您不将Docker用于数据科学项目,那么您将生活在1985年
  • docker部署flask_使用Docker,GCP Cloud Run和Flask部署Scikit-Learn NLP模型
  • 问卷 假设检验 t检验_真实问题的假设检验
  • 大数据技术 学习之旅_为什么聚焦是您数据科学之旅的关键
  • 无监督学习 k-means_无监督学习-第4部分
  • 深度学习算法原理_用于对象检测的深度学习算法的基本原理
  • 软件本地化 pdf_软件本地化与标准翻译
  • 数据库不停机导数据方案_如何计算数据停机成本
  • python初学者_面向初学者的20种重要的Python技巧
  • 贝叶斯网络建模
  • 数据科学家数据分析师_使您的分析师和数据科学家在数据处理方面保持一致
  • python db2查询_如何将DB2查询转换为python脚本
  • 爱因斯坦提出的逻辑性问题_提出正确问题的重要性
  • 餐厅数据分析报告_如何使用数据科学选择理想的餐厅设计场所
  • 熊猫直播 使用什么sdk_没什么可花的-但是16项基本操作才能让您开始使用熊猫
  • 关系型数据库的核心单元是_核中的数据关系
  • 小程序 国际化_在国际化您的应用程序时忘记的一件事

p值 t值 统计_非统计师的P值相关推荐

  1. 非枚举的属性值不合法什么意思_一起来捉妖种族值有什么用?全妖灵种族值一览表...

    [海峡网] 一起来捉妖作为借鉴了Pokemon系列的游戏,也有着种族值的设定.那么种族值是什么意思呢,它对我们抓到的妖灵有什么样的影响呢.此外不同的妖灵的种族值大概又是多少呢,跟着小编一起来看看吧. ...

  2. mysql 统计_告别硬编码,mysql 如何实现按某字段的不同取值进行统计

    上周我突然意识到,我在grafana上写的 sql 语句存在多处硬编码.这篇笔记将记录如何实现没有硬编码的sql语句,以及自学编程过程中如何应对自己的笨拙代码和难题不断的状况. 1.有效但粗笨的硬编码 ...

  3. pandas使用groupby函数和count函数返回的是分组下每一列的统计值(不统计NaN缺失值)、如果多于一列返回dataframe、size函数返回分组下的行数结果为Series(缺失值不敏感)

    pandas使用groupby函数和count函数返回的是分组下每一列的统计值(不统计NaN缺失值).如果多于一列返回dataframe.size函数返回分组下的行数结果为Series(不区分缺失值和 ...

  4. fread读结构体返回值是0无错误_嵌入式C编程之错误处理(附代码例子)!

    原标题:嵌入式C编程之错误处理(附代码例子)! 作者: clover-toeic 前言 本文主要总结嵌入式系统C语言编程中,主要的错误处理方式.文中涉及的代码运行环境如下: 一.错误概念 错误分类 从 ...

  5. R语言dataframe数据列中的缺失值NA的个数统计实战:特定数据列的NA值统计、所有特征的NA值统计

    R语言dataframe数据列中的缺失值NA的个数统计实战:特定数据列的NA值统计.所有特征的NA值统计 目录

  6. UA MATH566 统计理论5 假设检验:p值

    UA MATH566 统计理论5 假设检验:p值 p-value 做实证研究的paper大多数都要汇报p值,并且几乎是只看p值的.2016年ASA做了一个关于p值的statement,指出了关于p值的 ...

  7. vue3.0js 非prop属性的值和setup函数的使用

    非prop属性的值 一个非 prop 的 attribute 是指传向一个组件,但是该组件并没有相应 prop 定义的 attribute. 因为显式定义的 prop 适用于向一个子组件传入信息,然而 ...

  8. 机器学习基础(三十六)—— 非规整数据(值缺失、异常值)的处理

    (1)非规整 (2)值缺失 (3)异常值(outlier) 一般来说,现实中的数据会存在信息不完整.数据点缺失和异常值的情况,理想情况下,我们会去尝试修复非规整数据,但很多数据集都源于一些难以重现(不 ...

  9. 与或非运算(布尔值/非布尔值)

    1 <!DOCTYPE html> 2 <html> 3 <head> 4 <meta charset="utf-8"> 5 < ...

最新文章

  1. pg数据库生成随机时间_postgresql 时区与时间函数-阿里云开发者社区
  2. 没有流程的项目管理,都是无用功!
  3. [Leedcode][JAVA][第125题][验证回文串][双指针][String]
  4. textmate bundle for jquery
  5. 织梦DeDeCMS友情链接文字显示不全
  6. Nginx配置优化解读
  7. Spring AOP之静态代理
  8. 网络编程项目——在线电子词典
  9. 一文掌握有序logistic回归分析
  10. windows无法完成格式化怎么办?
  11. Wireshark实验——了解PDU
  12. NAIPC2018 Zoning Houses(ST表)
  13. MATLAB提取图片点击处的坐标代码(仅供参考)
  14. 编程语言排行榜2021年3月
  15. 计算机一级考试试题excel,计算机一级考试模拟题(word、excel、ppt以及基础知识);...
  16. 刻录光盘软件测试工资,Windows XP刻录数据光碟
  17. C语言——矩阵的上三角化
  18. 2012年4月23日
  19. runtime 入门与简介
  20. 解决OpenWrt下安装插件缺少依赖、架构不兼容、依赖冲突的问题

热门文章

  1. 数据分割-并查集+set
  2. (C++版)链表(一)——实现单向链表创建、插入、删除等相关操作
  3. 内核的Makefile与Kconfig关系解析
  4. epoll反应堆模型代码
  5. C/C++入门易错点及常用小技巧
  6. 网易严选Java开发三面面经:mysql索引面试题
  7. 覆盖所有面试知识点,持续更新中
  8. 阿里P7亲自教你!我的头条面试经历分享,完整PDF
  9. spring分布式事务学习笔记(2)
  10. 腾讯云AI应用产品总监王磊:AI 在传统产业的最佳实践