【数据收集】名义变量、序级变量、区间变量、比率变量的理解及例子
【数据收集】名义变量、序级变量、区间变量、比率变量的理解及例子
- 名义变量(Nominal Variable)
- 分类及举例
- 序级变量(Ordinal Variable)
- 分类和举例
- 区间变量(Interval Variable)
- 分类和举例
- 比率变量
- 分类和举例
- Reference
测量变量(measurement variable)是用来描述一个特定的实体的未知属性的,可以被分为以下四类:名义变量、序级变量、区间变量和比率变量。 其中名义变量和序级变量描绘数据的定性属性(qualitative attributes),区间变量和比率变量描绘数据的定量属性(quantitative attributes)。
名义变量(Nominal Variable)
名义变量是一种用于对被度量的特定属性进行命名、标签或分类的变量。它采用代表不同类别的定性值,这些类别没有内在的排序。
不能对名义变量进行数值运算
Operations: =、!=
分类及举例
可以在两个层面上对名义变量进行分类:1.数据收集的方法 2.数值属性
- 从数据收集方法
开放性问题 open-ended technique
e.g. 开放性问答:你认为怎样提升我们的服务质量?
闭合性问题 closed-ended technique
e.g. 多选题问卷调查:你认为以下方法怎么做可以提升我们的服务质量?A. 重新装修店面 B.推出新菜品 C.培训员工 - 数值属性
数值型的变量(Numeric Variable)
e.g. 电话号码、身份证号
非数值型变量(Non numeric Variable)
e.g.名字、性别、地址
序级变量(Ordinal Variable)
序级变量是一种把数值按顺序排列的测量变量。在序级变量中,没有标准的排序,有中值和众数。
Operations:=、!=、>、<、>=、<=
分类和举例
没有标准的分类方法,但通常和名义变量一样将其分为数值型变量和非数值型变量。
e.g.成绩(A、A+、B)、用户满意度(10、9、8)
区间变量(Interval Variable)
区间变量定义沿尺度测量的值,每两个点之间距离相等,为连续变量。
没有0值。
Operations:=、!=、>、<、>=、<=、+、-
分类和举例
e.g. 温度(华氏度/摄氏度)、时间(12-hour clock)
分类:
- 正态分布/高斯分布
- 非正态分布
比率变量
连续变量,与区间变量唯一的区别就是比率变量拥有一个绝对的零值。
Operations:=、!=、>、<、>=、<=、+、-、:
分类和举例
e.g. Kelvin温度、身高、体重
温度(摄氏度/华氏度)不是比率变量因为只能说今天温度比昨天温度高/低多少度,不会说今天温度是昨天温度的几倍。温度计上的0摄氏度是规定的相对零点。
MCQ:今年妈妈年龄是小明年龄的2倍,小明今年20岁,妈妈10年后多少岁?
A 30 B 40 C 50
调查问卷:你每天看手机时间有多久?
A少于两小时 B2-5小时 C5小时以上
分类方法同区间变量一样
Reference
formplus.
[第一次写blog,有任何不准确的地方,请多多指教,谢谢;)]
【数据收集】名义变量、序级变量、区间变量、比率变量的理解及例子相关推荐
- CORL: 基于变量序和强化学习的因果发现算法
深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 来源:诺亚实验室 华为诺亚方舟实验室.西安交通大学 ...
- 将变量区分_【统计学】区分定类、定序、定距、定比变量!
从宏观角度分析,数据类型分为定性和定量两种.定性:变量是品质特征,如车的品牌,宝马,奔驰,只是为了区分. 定量:变量是数值,可以量化,如身高体重等.定量可以分为离散型和连续型. 离散型一般为计数结果, ...
- R语言dplyr包的mutate函数将列添加到dataframe中或者修改现有的数据列:基于条件判断创建布尔型指示变量、将异常离散编码转化为NA值
R语言dplyr包的mutate函数将列添加到dataframe中或者修改现有的数据列:基于条件判断创建布尔型指示变量.将异常离散编码转化为NA值 目录
- R语言ggplot2可视化分组变量下的数据分布(线条、色彩配置)、WVPlots包的ShadowHist函数比较分组下的数据直方图、ggplot2分面图facet_wrap可视化分组变量下的数据分布
R语言ggplot2可视化分组变量下的数据分布(线条.色彩配置).WVPlots包的ShadowHist函数比较分组下的数据直方图.ggplot2分面图facet_wrap可视化分组变量下的数据分布 ...
- spark 广播变量大数据_Spark基础知识(三)--- Spark的广播变量和累加器
在spark程序中,当一个传递给Spark操作(例如map和reduce)的函数在远程节点上面运行时,Spark操作实际上操作的是这个函数所用变量的一个独立副本.这些变量会被复制到每台机器上,并且这些 ...
- var/let/const、块级作用域、TDZ、变量提升
概览 ES6 新增了两个定义变量的关键字:let 与 const,它们几乎取代了 ES5 定义变量的方式:var.let是新的var,const简单的常量声明. function f() {{let ...
- R语言描述性统计分析:使用epiDisplay包的summ函数获取dataframe数据中每个变量的常用统计量、对每个变量进行汇总统计
R语言描述性统计分析:使用epiDisplay包的summ函数获取dataframe数据中每个变量的常用统计量.对每个变量进行汇总统计 目录
- 国家基础地理信息中心行政边界等矢量数据免费下载保姆级教程--关于地理数据收集与处理的基本工具推荐(7)
关于地理数据收集与处理的基本工具推荐系列,有导航,不迷路: 关于地理数据收集与处理的基本工具推荐(1) -高分辨率卫星影像数据免费下载方式 关于地理数据收集与处理的基本工具推荐(2)-10m精度的全球 ...
- 网站统计中的数据收集原理及实现
网站数据统计分析工具是网站站长和运营人员经常使用的一种工具,比较常用的有谷歌分析.百度统计和腾讯分析等等.所有这些统计分析工具的第一步都是网站访问数据的收集.目前主流的数据收集方式基本都是基于java ...
最新文章
- c 正则去除a以外的html,正则表达式:去除除SRC以外的HTML属性
- 【RFID】基于MATLAB的RFID 系统的空中接口过程以及防碰撞算法仿真
- 成功解决_catboost.CatBoostError: Bad value for num_feature: Cannot convert ‘b‘\x8f\x91‘‘ to float
- 关于document.write
- BZOJ 3514 Codechef MARCH14 GERALD07加强版
- boost::hana::remove_range用法的测试程序
- DWZ与百度编辑器的IE8以下上传图片兼容问题
- 百亿身家中年男子告别房地产转行学Python,我们推荐他读这6本书
- ECMAScript 6学习总结(2)——ECMAScript 6常用方法总结
- 删除排除链表中的重复元素
- SMP IRQ affinity
- xamarin之 安装工具介绍
- 【设计模式】Iterator设计作业-设计LinkedList的iterator
- js基础-23-websocket和ajax的区别
- IP地址被屏蔽怎么解决
- linux+ARM学习路线
- php aria2离线下载器,下载神器——Aria2,打造你自己的离线下载服务器
- MATLAB中Spline插值使用记录
- 3D模型欣赏:美杜莎女妖 角色设计完整 造型独特
- linux图形界面bind dns,在linux上使用BIND建立DNS服务器