【数据收集】名义变量、序级变量、区间变量、比率变量的理解及例子

  • 名义变量(Nominal Variable)
    • 分类及举例
  • 序级变量(Ordinal Variable)
    • 分类和举例
  • 区间变量(Interval Variable)
    • 分类和举例
  • 比率变量
    • 分类和举例
  • Reference

测量变量(measurement variable)是用来描述一个特定的实体的未知属性的,可以被分为以下四类:名义变量、序级变量、区间变量和比率变量。 其中名义变量和序级变量描绘数据的定性属性(qualitative attributes),区间变量和比率变量描绘数据的定量属性(quantitative attributes)。

名义变量(Nominal Variable)

名义变量是一种用于对被度量的特定属性进行命名、标签或分类的变量。它采用代表不同类别的定性值,这些类别没有内在的排序。
不能对名义变量进行数值运算
Operations: =、!=

分类及举例

可以在两个层面上对名义变量进行分类:1.数据收集的方法 2.数值属性

  • 从数据收集方法
    开放性问题 open-ended technique
    e.g. 开放性问答:你认为怎样提升我们的服务质量?
    闭合性问题 closed-ended technique
    e.g. 多选题问卷调查:你认为以下方法怎么做可以提升我们的服务质量?A. 重新装修店面 B.推出新菜品 C.培训员工
  • 数值属性
    数值型的变量(Numeric Variable)
    e.g. 电话号码、身份证号
    非数值型变量(Non numeric Variable)
    e.g.名字、性别、地址

序级变量(Ordinal Variable)

序级变量是一种把数值按顺序排列的测量变量。在序级变量中,没有标准的排序,有中值和众数。
Operations:=、!=、>、<、>=、<=

分类和举例

没有标准的分类方法,但通常和名义变量一样将其分为数值型变量和非数值型变量。
e.g.成绩(A、A+、B)、用户满意度(10、9、8)

区间变量(Interval Variable)

区间变量定义沿尺度测量的值,每两个点之间距离相等,为连续变量
没有0值。
Operations:=、!=、>、<、>=、<=、+、-

分类和举例

e.g. 温度(华氏度/摄氏度)、时间(12-hour clock)

分类:
- 正态分布/高斯分布
- 非正态分布

比率变量

连续变量,与区间变量唯一的区别就是比率变量拥有一个绝对的零值
Operations:=、!=、>、<、>=、<=、+、-、:

分类和举例

e.g. Kelvin温度、身高、体重
温度(摄氏度/华氏度)不是比率变量因为只能说今天温度比昨天温度高/低多少度,不会说今天温度是昨天温度的几倍。温度计上的0摄氏度是规定的相对零点。

MCQ:今年妈妈年龄是小明年龄的2倍,小明今年20岁,妈妈10年后多少岁?
A 30 B 40 C 50

调查问卷:你每天看手机时间有多久?
A少于两小时 B2-5小时 C5小时以上

分类方法同区间变量一样

Reference

formplus.

[第一次写blog,有任何不准确的地方,请多多指教,谢谢;)]

【数据收集】名义变量、序级变量、区间变量、比率变量的理解及例子相关推荐

  1. CORL: 基于变量序和强化学习的因果发现算法

    深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 来源:诺亚实验室 华为诺亚方舟实验室.西安交通大学 ...

  2. 将变量区分_【统计学】区分定类、定序、定距、定比变量!

    从宏观角度分析,数据类型分为定性和定量两种.定性:变量是品质特征,如车的品牌,宝马,奔驰,只是为了区分. 定量:变量是数值,可以量化,如身高体重等.定量可以分为离散型和连续型. 离散型一般为计数结果, ...

  3. R语言dplyr包的mutate函数将列添加到dataframe中或者修改现有的数据列:基于条件判断创建布尔型指示变量、将异常离散编码转化为NA值

    R语言dplyr包的mutate函数将列添加到dataframe中或者修改现有的数据列:基于条件判断创建布尔型指示变量.将异常离散编码转化为NA值 目录

  4. R语言ggplot2可视化分组变量下的数据分布(线条、色彩配置)、WVPlots包的ShadowHist函数比较分组下的数据直方图、ggplot2分面图facet_wrap可视化分组变量下的数据分布

    R语言ggplot2可视化分组变量下的数据分布(线条.色彩配置).WVPlots包的ShadowHist函数比较分组下的数据直方图.ggplot2分面图facet_wrap可视化分组变量下的数据分布 ...

  5. spark 广播变量大数据_Spark基础知识(三)--- Spark的广播变量和累加器

    在spark程序中,当一个传递给Spark操作(例如map和reduce)的函数在远程节点上面运行时,Spark操作实际上操作的是这个函数所用变量的一个独立副本.这些变量会被复制到每台机器上,并且这些 ...

  6. var/let/const、块级作用域、TDZ、变量提升

    概览 ES6 新增了两个定义变量的关键字:let 与 const,它们几乎取代了 ES5 定义变量的方式:var.let是新的var,const简单的常量声明. function f() {{let ...

  7. R语言描述性统计分析:使用epiDisplay包的summ函数获取dataframe数据中每个变量的常用统计量、对每个变量进行汇总统计

    R语言描述性统计分析:使用epiDisplay包的summ函数获取dataframe数据中每个变量的常用统计量.对每个变量进行汇总统计 目录

  8. 国家基础地理信息中心行政边界等矢量数据免费下载保姆级教程--关于地理数据收集与处理的基本工具推荐(7)

    关于地理数据收集与处理的基本工具推荐系列,有导航,不迷路: 关于地理数据收集与处理的基本工具推荐(1) -高分辨率卫星影像数据免费下载方式 关于地理数据收集与处理的基本工具推荐(2)-10m精度的全球 ...

  9. 网站统计中的数据收集原理及实现

    网站数据统计分析工具是网站站长和运营人员经常使用的一种工具,比较常用的有谷歌分析.百度统计和腾讯分析等等.所有这些统计分析工具的第一步都是网站访问数据的收集.目前主流的数据收集方式基本都是基于java ...

最新文章

  1. c 正则去除a以外的html,正则表达式:去除除SRC以外的HTML属性
  2. 【RFID】基于MATLAB的RFID 系统的空中接口过程以及防碰撞算法仿真
  3. 成功解决_catboost.CatBoostError: Bad value for num_feature: Cannot convert ‘b‘\x8f\x91‘‘ to float
  4. 关于document.write
  5. BZOJ 3514 Codechef MARCH14 GERALD07加强版
  6. boost::hana::remove_range用法的测试程序
  7. DWZ与百度编辑器的IE8以下上传图片兼容问题
  8. 百亿身家中年男子告别房地产转行学Python,我们推荐他读这6本书
  9. ECMAScript 6学习总结(2)——ECMAScript 6常用方法总结
  10. 删除排除链表中的重复元素
  11. SMP IRQ affinity
  12. xamarin之 安装工具介绍
  13. 【设计模式】Iterator设计作业-设计LinkedList的iterator
  14. js基础-23-websocket和ajax的区别
  15. IP地址被屏蔽怎么解决
  16. linux+ARM学习路线
  17. php aria2离线下载器,下载神器——Aria2,打造你自己的离线下载服务器
  18. MATLAB中Spline插值使用记录
  19. 3D模型欣赏:美杜莎女妖 角色设计完整 造型独特
  20. linux图形界面bind dns,在linux上使用BIND建立DNS服务器

热门文章

  1. 【Flink系列】开发篇:1. Flink维表关联方案
  2. Python GUI代码转为可执行文件(.exe)实例——进制转化器
  3. 【UVM实战】第五章:UVM验证平台的运行(2)objection机制
  4. 树莓派图形界面显示NO wireless interfaces found
  5. 【SLAM】——DynaSLAM项目环境配置(超多坑)
  6. 前端学习之路之图片轮播(已实现自动轮播)
  7. js 中编码(encode)和解码(decode)
  8. 嵌入式毕设分享 红外热成像仪
  9. 巴恩斯利VS西布朗分析
  10. HTML5 在a标签内放置块级元素