2.4 因子

统计中的变量有几中重要类别:区间变量、名义变量和有序变量。区间变量取连续的数值,可以进行求和、平均值等运算。名义变量和有序变量取离散值,可以用数值代表,也可以是字符型值,其具体数值没有加减乘除的意义,不能用来计算,而只能用来分类或计数。名义变量如性别、省份、职业,有序变量如班级、名次

2.4.1 factor()函数

> sex<-c("M","F","M","M","F")
> sexf<- factor(sex);sexf
[1] M F M M F
Levels: F M

函数factor()用来把一个向量编码成为一个因子,其一般形式为:

factor(x,levels=sort(unique(x),na.last=TRUE),labels,exclude=NA,ordered=FALSE)

其中x是向量,levels是水平,可以自行指定各离散取值,不指定时由x的不同值来求得。labels可以用来指定各水平的标签,不指定时用各离散取值的对应字符串。exclude参数用来指定要转换为缺失值(NA)的元素值集合,如果指定了levels,则因子的第i个元素当它等于水平中第j个时元素值取“j”,如果它的值没有出现在levels中,则对应因子元素值取NA;ordered取值为真(TRUE)时,表示因子水平是有次序的;否则(缺省值)是无次序的

> sex.level<-levels(sexf);sex.level
[1] "F" "M"
> sex.tab<-table(sexf);sex.tab
sexf
F M
2 3

2.4.2 tapply()函数

> height<- c(174,165,180,171,160)
> tapply(height,sex,mean)F     M
162.5 175.0

2.4.3 gl()函数

gl()函数可以方便地产生因子,其一般用法是

gl(n,k,length=n*k,labels=1:n,ordered=FALSE)

其中n为水平数,k为重复的次数,length为结果的长度,labels是一个n维向量,表示因子水平,ordered是逻辑变量,表示是否为有序因子,缺省值为FALSE

> gl(3,5)[1] 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3
Levels: 1 2 3
> gl(3,1,15)[1] 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3
Levels: 1 2 3

转载于:https://www.cnblogs.com/SweetZxl/p/chapter24.html

统计分析与R软件-chapter2-4相关推荐

  1. 统计分析与R软件-chapter2-5

    2.5 多维数组和矩阵 2.5.1 生成数组或矩阵 数组有一个特征属性叫做维数向量(dim属性),维数向量是一个元素取正整数的向量,其长度是数组的维数,比如维数向量有两个元素时数组为2维数组(矩阵). ...

  2. 【R】【课程笔记】02+03 基于R软件的计算

    本文是课程<数据科学与金融计算>第2-3章的学习笔记,主要介绍R语言在统计和机器学习中的应用,用于知识点总结和代码练习,Q&A为问题及解决方案,参考书籍为<R软件及其在金融定 ...

  3. R语言笔记一:R软件的下载、界面简介、帮助文档

    如何使用R软件求解统计问题? 一.R软件简介 R是一个有着统计分析功能及强大作图功能的软件系统.R既是一种软件也可以说是一种语言. R软件是完全免费的,我们可以通过R软件网站(https://www. ...

  4. R软件与RStudio安装(版本R-4.2.2)Windows10

    目录 一.R软件的安装 (一)R软件安装(R开发环境安装) 二.RStudio的安装 (一)下载RStudio (二)安装RStudio R 语言是一款为数学研究工作者设计的处理数据的完全面向对象的编 ...

  5. 【视频】向量自回归VAR数学原理及R软件经济数据脉冲响应分析实例

    最近我们被客户要求撰写关于向量自回归VAR的研究报告,包括一些图形和统计输出. 向量自回归 (VAR) 是一种用于多变量时间序列分析的统计模型,尤其是在变量具有相互影响关系的时间序列中,本视频中我们介 ...

  6. 《应用时间序列分析:R软件陪同》——1.5 习题

    本节书摘来自华章计算机<应用时间序列分析:R软件陪同>一书中的第1章,第1.5节,作者:吴喜之,刘苗著, 更多章节内容可以访问云栖社区"华章计算机"公众号查看. 1.5 ...

  7. R语言入门学习笔记 - 对R软件的认识

    一.R软件 1.安装R:自行百度☺ 2.R控制台(R Console)和R程序脚本: 打开R软件,就会直接打开控制台,控制台可以显示程序运行的结果.错误提示等信息,也可以直接输入想要执行的操作并立即返 ...

  8. 统计之都统计分析和R语言方面的图书

    图书出版 统计之都的成员编著.翻译了大量关于统计分析和R语言方面的图书. 已出版 读者可以点击下面每本书的链接进入该书的的页面,下载随书代码,我们还会不定期发布图书的勘误,也欢迎读者留言提问. < ...

  9. 《应用时间序列分析:R软件陪同》——2.3 随机游走

    本节书摘来自华章计算机<应用时间序列分析:R软件陪同>一书中的第2章,第2.3节,作者:吴喜之,刘苗著, 更多章节内容可以访问云栖社区"华章计算机"公众号查看.

  10. 《应用时间序列分析:R软件陪同》——导读

    ** 前言 ** 首先,一些教材偏重于数学理论和推导.作者多为数学出身,他们习惯于数学的严格性和导出精确而又漂亮的数学结论.这些书适用于那些愿意为时间序列的数学理论研究做出贡献的读者. 其次,国内教材 ...

最新文章

  1. hdu 4587 2013南京邀请赛B题/ / 求割点后连通分量数变形。
  2. Nginx 独立图片服务器的搭建
  3. Reverse Sort 思维
  4. BZOJ 1412 [ZJOI2009]狼和羊的故事(最小割)
  5. 浅谈GSM/GPRS模块软硬件设计(基于有方M660+模块和单片机)
  6. LeetCode MySQL 1581. 进店却未进行过交易的顾客
  7. Fastdata极数:2021年中国互联网基金投资用户报告
  8. MSI/MSI-X Capability结构 (转)
  9. linux下configure命令详细介绍(转)
  10. LaTeXila:Linux 的多语言 LaTeX 编辑器简介
  11. 2014Esri全球用户大会之ArcGIS Online
  12. 基于R实现统计中的检验方法---方差分析
  13. 高斯投影坐标正算公式详解
  14. 高鹏清华计算机系,中国最顶尖的学霸到底有多厉害?看完,膝盖已跪碎!
  15. 2021大三学习机器学习课程手杖之机器学习基本概念的理解
  16. 系统业务逻辑书籍_企业应该如何建立自己的分销系统和分销团队
  17. SEBASTIEN KWOK 2022春夏系列新品上市
  18. Java学习路线,java学习教程(入门到精通)
  19. [论文阅读] Structure-Consistent Weakly Supervised Salient Object Detection with Local Saliency Coherence
  20. 补数的概念和取模运算

热门文章

  1. woff字体找不到导致的404错误
  2. 用递归的方法,判断某个字符串是否为回文
  3. ADO.NET编程(3)在内存中对DataTable进行增/删/改操作
  4. 使用ViewModel模式来简化WPF的TreeView
  5. 【笔记】定积分的近似计算
  6. Python 使用标准库根据进程名获取进程PID
  7. CPU 和 GPU 的区别
  8. x264 编码数配置
  9. securityPolicy与安全策略等级配置
  10. SQLServer 之 2008还原的时候无法获得对数据库的独占访问权解决