标称型数据和数值型数据

If you're studying for a statistics exam and need to review your data types this article will give you a brief overview with some simple examples.

如果您正在学习统计考试,并且需要检查数据类型,那么本文将通过一些简单的示例为您提供简要概述。

Because let's face it: not many people study data types for fun or in their real everyday lives.

因为我们要面对现实:很少有人在娱乐或现实生活中研究数据类型。

So let's dive in.

因此,让我们开始吧。

定量与定性数据-有什么区别? (Quantitative vs Qualitative data - what's the difference?)

In short: quantitative means you can count it and it's numerical (think quantity - something you can count). Qualitative means you can't, and it's not numerical (think quality - categorical data instead).

简而言之:定量意味着您可以对它进行计数,并且它是数字(想想数量 -您可以计数)。 定性意味着您不能,而且不是数字(请考虑质量 -而是分类数据)。

Boom! Simple, right?

繁荣! 简单吧?

There's one more distinction we should get straight before moving on to the actual data types, and it has to do with quantitative (numbers) data: discrete vs. continuous data.

在继续介绍实际的数据类型之前,我们还应该弄清楚一个区别,它与定量(数字)数据有关:离散数据与连续数据。

Discrete data involves whole numbers (integers - like 1, 356, or 9) that can't be divided based on the nature of what they are.

离散数据涉及整数(例如1、356或9之类的整数),这些整数无法根据它们的本质进行划分。

Like the number of people in a class, the number of fingers on your hands, or the number of children someone has. You can't have 1.9 children in a family (despite what the census might say).

就像班上的人数,您的手指上的手指数或某人的孩子数一样。 一个家庭中不能有1.9个孩子(尽管人口普查可能会说 )。

Continuous data, on the other hand, is the opposite. It can be divided up as much as you want, and measured to many decimal places.

另一方面, 连续数据则相反。 可以根据需要将其划分为多个小数位。

Like the weight of a car (can be calculated to many decimal places), temperature (32.543 degrees, and so on), or the speed of an airplane.

就像汽车的重量(可以计算到许多小数位),温度(32.543度,等等)或飞机的速度一样。

Now for the fun stuff.

现在来看看有趣的东西。

定性数据类型 (Qualitative data types)

名义数据 (Nominal data)

Nominal data are used to label variables without any quantitative value. Common examples include male/female (albeit somewhat outdated), hair color, nationalities, names of people, and so on.

标称数据用于标记没有任何定量值的变量。 常见的示例包括男性/女性(尽管有些过时),头发颜色,国籍,姓氏等等。

In plain English: basically, they're labels (and nominal comes from "name" to help you remember). You have brown hair (or brown eyes). You are American. Your name is Jane.

用简单的英语来说:基本上,它们是标签(名义名称来自“名称”,以帮助您记住)。 您有一头棕色的头发(或棕色的眼睛) 。 你是美国人 。 你的名字叫

Examples:

例子:

What color hair do you have?

你有什么颜色的头发?

  • Brown棕色
  • Blonde金发女郎
  • Black黑色
  • Rainbow unicorn彩虹独角兽

What's your nationality?

你是哪个国家的?

  • American美国人
  • German德语
  • Kenyan肯尼亚人
  • Japanese日本

Notice that these variables don't overlap. For the purposes of statistics, anyway, you can't have both brown and rainbow unicorn-colored hair. And they're only really related by the main category of which they're a part.

请注意,这些变量不重叠。 无论如何,出于统计目的,您不能同时拥有棕色和彩虹独角兽色的头发。 而且它们只是与它们所属的主要类别真正相关。

序数数据 (Ordinal data)

The key with ordinal data is to remember that ordinal sounds like order - and it's the order of the variables which matters. Not so much the differences between those values.

序数数据的关键是要记住序数听起来像顺序-这是重要的变量顺序。 这些值之间的差异不大。

Ordinal scales are often used for measures of satisfaction, happiness, and so on. Have you ever taken one of those surveys, like this?

顺序量表通常用于满意度,幸福感等的量度。 您是否曾经参加过其中一项调查?

"How likely are you to recommend our services to your friends?"

“您向您的朋友推荐我们服务的可能性有多大?”

  • Very likely很可能
  • Likely可能的
  • Neutral中性
  • Unlikely不太可能
  • Very unlikely不太可能

See, we don't really know what the difference is between very unlikely and unlikely - or if it's the same amount of likeliness (or, unlikeliness) as between likely and very likely. But that's ok. We just know that likely is more than neutral and unlikely is more than very unlikely. It's all in the order.

瞧,我们真的不知道极不可能和不太可能之间有什么区别-或可能性与可能性之间是否存在相同的可能性(或可能性)。 但是没关系。 我们只知道,可能性不仅是中立的,而且可能性是非常不可能的。 全部按顺序进行。

定量数据类型 (Quantitative data types)

间隔数据 (Interval Data)

Interval data is fun (and useful) because it's concerned with both the order and difference between your variables. This allows you to measure standard deviation and central tendency.

间隔数据很有趣(而且很有用),因为它与变量的顺序差异有关。 这使您可以测量标准偏差和集中趋势 。

Everyone's favorite example of interval data is temperatures in degrees celsius. 20 degrees C is warmer than 10, and the difference between 20 degrees and 10 degrees is 10 degrees. The difference between 10 and 0 is also 10 degrees.

每个人最喜欢的时间间隔数据示例是摄氏温度。 20摄氏度比10摄氏度高,而20摄氏度和10摄氏度之间的差为10摄氏度。 10与0之间的差也是10度。

If you need help remembering what interval scales are, just think about the meaning of interval: the space between. So not only do you care about the order of variables, but also about the values in between them.

如果需要帮助您记住间隔标度是多少,请考虑一下间隔的含义: 之间的间隔。 因此,您不仅关心变量的顺序,而且关心变量之间的值。

There is a little problem with intervals, however: there's no "true zero." A true zero has no value - there is none of that thing - but 0 degrees C definitely has a value: it's quite chilly. You can also have negative numbers.

但是,间隔有一个小问题:没有“真零”。 真正的零没有任何价值-没有任何东西-但0摄氏度绝对有一个价值:这很冷。 您也可以使用负数。

If you don't have a true zero, you can't calculate ratios. This means addition and subtraction work, but division and multiplication don't.

如果没有真正的零,则无法计算比率。 这意味着加法和减法工作,但除法和乘法却没有。

比率数据 (Ratio data)

Thank goodness there's ratio data. It solves all our problems.

谢天谢地,这里有比例数据。 它解决了我们所有的问题。

Ratio data tells us about the order of variables, the differences between them, and they have that absolute zero. Which allows all sorts of calculations and inferences to be performed and drawn.

比率数据告诉我们变量的顺序,变量之间的差,并且变量的绝对值为零。 这允许执行和绘制各种计算和推论。

Ratio data is very similar interval data, except zero means none. For ratio data, it is not possible to have negative values.

比率数据与间隔数据非常相似,但零表示无。 对于比率数据,不可能有负值。

For instance, height is ratio data. It is not possible to have negative height. If an object's height is zero, then there is no object. This is different than something like temperature. Both 0 degrees and -5 degrees are completely valid and meaningful temperatures.

例如,高度是比率数据。 不可能有负高度。 如果对象的高度为零,则没有对象。 这不同于温度。 0度和-5度都是完全有效且有意义的温度。

Now that you have a basic handle on these data types you should be a bit more ready to tackle that stats exam.

既然您已经掌握了这些数据类型的基本知识,那么您应该准备好应对该统计数据考试了。

翻译自: https://www.freecodecamp.org/news/types-of-data-in-statistics-nominal-ordinal-interval-and-ratio-data-types-explained-with-examples/

标称型数据和数值型数据

标称型数据和数值型数据_统计信息中的数据类型-标称,有序,间隔和比率数据类型,并举例说明相关推荐

  1. 标称型数据和数值型数据_数据的来源与类型以及数据的特征抽取

    数据的来源与类型 大部分的数据都来自已有的数据库,如果没有的话也可以交给很多爬虫工程师去采集,来提供.也可以来自平时的记录,反正数据无处不在,大都是可用的. 数据的类型 按照机器学习的数据分类我们可以 ...

  2. 机器学习中标称型数据和数值型数据的区别

    这两种数据在监督学习的分类一章经常有说到 标称型:一般在有限的数据中取,而且只存在'是'和'否'两种不同的结果(一般用于分类) 数值型:可以在无限的数据中取,而且数值比较具体化,例如4.02,6.23 ...

  3. 字符型数据与数值型数据之间的转换

    (1)char字符型数据可以转换成任意一种数值类型,反之亦然.将整数转换成插入型数据时,只用到该数据的低十六位,其余部分被忽略.如:char ch=(char)0xAB0041;输出ch+'A'; ( ...

  4. 标称型数据和数值型数据_2017-12-9 机器学习(4)-标称型和数值型

    [标称型数据和数值型数据] 监督学习一般使用两种类型的目标变量:标称型和数值型 标称型:一般在有限的数据中取,而且只存在'是'和'否'两种不同的结果(一般用于分类) 数值型:可以在无限的数据中取,而且 ...

  5. 机器学习学习笔记 --- 标称型数据和数值型数据

    [标称型数据和数值型数据] 监督学习一般使用两种类型的目标变量:标称型和数值型 标称型:一般在有限的数据中取,而且只存在'是'和'否'两种不同的结果(一般用于分类) 数值型:可以在无限的数据中取,而且 ...

  6. 【20210805】【数据分析】标称型数据和数值型数据

    (参考:两个基本概念 标称型数据和数值型数据) 监督学习使用的目标变量一般有两种:标称型数据 和 数值型数据. 1. 标称型数据 即离散值.只在有限目标集中取值,如:"真" 或 & ...

  7. 一种基于随机投影的本地差分隐私高维数值型数据收集算法

    一种基于随机投影的本地差分隐私高维数值型数据收集算法 孙慧中, 杨健宇, 程祥, 苏森 北京邮电大学网络与交换技术国家重点实验室,北京 100876 摘要:对满足本地差分隐私的高维数值型数据收集问题进 ...

  8. Excel VBA 小程序 - 文本型数字转为数值型数字

    实现功能:选中当前工作表中的所有数据内容,将文本型数字转换为数值型数字. 缺点:日期格式的字符串会变成数值 Sub 转数值型数字() With ActiveSheet.UsedRange.Number ...

  9. 【Excel】数值型数字和文本型数字

    文章目录 一.介绍 文本型数字 数值型数字 二.相互转换 文本型转数值型 数据分列法 提醒法 选择性粘贴法 数值型转文本型 数据分列法 英文单引号法 一.介绍 文本型数字 特点: 单元格默认左对齐 单 ...

最新文章

  1. 聚类算法api初步使用
  2. 虚拟内存——Windows核心编程学习手札之十四
  3. python 淘宝滑块验证_python2.7+selenium2实现淘宝滑块自动认证功能
  4. linux mysql 5.7 双机热备_2017年5月5日 星红桉liunx动手实践mysql 主主双机热备
  5. 本周阅读清单:从NeurIPS 2020到EMNLP 2020
  6. android studio中断,Android Studio是否有任何修复方法可以在Macbook Pro中断开测试设备的连接?...
  7. php csrf攻击 xss区别,XSS与CSRF攻击及防御方法
  8. C++ 对象关系映射(ORM)介绍
  9. 自动化运维之 - puppet 服务端安装
  10. ireport导出pdf后中文字符全部不显示(已解决)
  11. mysql linux 手动安装mysql服务_Linux手动安装Mysql
  12. 打印准考证服务器异常显示,2020准考证打印30个常见问题汇总及解决办法
  13. linux vi 应用
  14. Ember.js 入门指南 (一)
  15. Detours框架实现原理探究
  16. 运行npm install 出现thon Python is not set from command line or npm configuration解决方案
  17. Python深度学习婴儿啼哭声分类识别,测试集准确率67.5%
  18. 【课程学习】(中国大学MOOC)武汉理工大学高级人工智能原理与技术课后习题笔记(1-5章)
  19. Android 仿朋友圈单张图片限定宽高超出时按比例缩放效果实现
  20. 自从上了K8S,项目更新都不带停机的!

热门文章

  1. 事务相关命令 mysql
  2. 媒体控件的暂停与播放 0130 winform
  3. 扩展图形输出 1111 java
  4. 需求 实现轮播图效果 1022
  5. group_concat函数使用
  6. Mysql数据库重命名
  7. kubernetes安装Helm
  8. 【批处理学习笔记】第十四课:常用DOS命令(4)
  9. 易宝典文章——玩转Office 365中的Exchange Online服务 之二十六 根据文本内容筛选群发邮件...
  10. IOProcess基础知识