注:如在B站看到的文件格式不好看,可以在简书中搜索“康华同学”即可查看。

2.1 数据集的概念

数据集通常是有数据构成的一个矩阵数组,行表示观测,列表示变量。表2-1提供了一个假想的病例数据集。

不同行业对数据集的行和列叫法不同。统计学家称他们为观测(observation)和变量(variable),数据库分析师则称其为记录(record)和字段(field),数据挖掘是和机器学习学科的研究者则把他们叫做示例(example)和属性(attribute)。在本书中通篇使用术语观测和变量。

2、数据结构

R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表。它们在存储数据的类型、创建方式、结构复杂度,以及用于定位和访问其中个别元素的标记等方面均有所不同。图2-1给出了这些数据结构的一个示意图。

3、 向量

向量是用于存储数值型、字符型或逻辑型数据的一维数组。执行组合功能的函数c()可用来创建向量。

a是数值型向量,b是字符型向量,而c是逻辑型向量.

通过在方括号中给定元素所处位置的数值,我们可以访问向量中的元素。例如,a[c(2, 4)]用于访问向量a中的第二个和第四个元素。

4、矩阵

矩阵是一个二维数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型)。可通过函数matrix()创建矩阵。

其中vector包含了矩阵的元素,nrow和ncol用以指定行和列的维数,dimnames包含了可选的、以字符型向量表示的行名和列名。

4.1 创建矩阵

创建5x4的矩阵

按行填充2x2的矩阵

按列填充的2×2矩阵

我们可以使用下标和方括号来选择矩阵中的行、列或元素。X[i,]指矩阵X中的第i行,X[,j]指第j列,X[i, j]指第i行第j 个元素。选择多行或多列时,下标i和j可为数值型向量.

**代码清单2-2 矩阵下标的使用 **

首先,我们创建了一个内容为数字1到10的2×5矩阵。默认情况下,矩阵按列填充。然后,我们分别选择了第二行和第二列的元素。接着,又选择了第一行第四列的元素。最后选择了位于第一行第四、第五列的元素。

halcon实例实战第二版_R语言实战(第2版):第二章 创建数据集(01)相关推荐

  1. readxmls r语言_R语言实战(一)介绍、数据集与图形初阶

    本文对应<R语言实战>前3章,因为里面大部分内容已经比较熟悉,所以在这里只是起一个索引的作用. 第1章       R语言介绍 获取帮助函数 help(), ? 查看函数帮助 exampl ...

  2. r语言electricity数据集_R语言实战学习

    <R语言实战>中文电子版 提取码:lx35 已经学习打卡R语言22天了,可以说是初窥真容--基本了解R的数据和函数:作为程序语言,就是要多练习,多领悟,在实战中发现问题并解决问题. 所以, ...

  3. R plot图片背景设置为透明_R语言实战 牛国庆

    [toc] 第一章 1.3.2 R中帮助函数 R中用于管理R工作空间的函数 函数setwd()不会自动创建一个不存在的目录.如果必要的话,可以使用函数dir.create()来创建新目录,然后使用se ...

  4. r语言 新增一列数字类型_R语言实战之R语言基础语法精讲(一)

    R是用于统计分析.绘图的语言和操作环境.R是属于GNU系统的一个自由.免费.源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具.在学习R数据科学之前,我们首先要对R语言的基础语法有一个良好的了 ...

  5. r语言 新增一列数字类型_R语言实战(2)——创建数据集【学习分享】

    往期回顾: R语言实战(1)--R语言介绍[学习分享] 引言:上一章我们通过简单的例子了解了R语言及R语言能实现的一些功能,本期我们将一起学习R中的数据结构,以及向R中导入数据的方法. 2.1 数据结 ...

  6. spss典型相关分析_R语言实战 多元统计分析Day10— —典型相关分析

    R语言实战多元统计分析Day10-- 典型相关分析 01 前言 典型相关分析是用于分析两组随机变量之间的相关性程度的一种统计方法,它能够有效的揭示两组随机变量之间的相互线性依赖关系,这种方法是由Hot ...

  7. r语言 悲观剪枝_R语言实战(5) ——高级数据管理

    往期回顾: R语言实战(1)--R语言介绍 R语言实战(2)--创建数据集 R语言实战(3)--图形初阶 R语言实战(4) --数据管理 本期是我们推出<R语言实战>赠书活动的最后一天啦! ...

  8. r语言 图形一览_R语言实战—图形篇(图形初阶)

    最近沉迷学习R语言,不得不说<R语言实战>真的太详细了,详细的阅读完这本书后,我的收获不小.为了方便自己复习,将这本书的内容整理归纳为两个部分:统计篇(数据分析)和图形篇(数据可视化). ...

  9. c语言模拟器安卓版,C语言学习宝典电脑版下载

    C语言学习宝典电脑版是一款热门的学习办公软件,功能齐全,操作简单流畅,具备良好的用户体验.本站提供C语言学习宝典电脑版下载.C语言学习宝典电脑版包含了C语言学习各阶段知识,内容包含C语言课程的全部章节 ...

  10. 丁亚涛c语言程序设计第3版,c语言程序设计(第3版)丁亚涛.pdf

    <C 语言程序设计 (第3 版)>丁亚涛 教材习题与解答 习题1 [参考答案] 1. C 语言基本特点:简洁.紧促.灵活.运算符丰富.数据结构丰富.移植性好等. 2. 程序如下: #inc ...

最新文章

  1. 使用Apache对Tomcat进行负载均衡
  2. C语言之父:因拒付论文装订费错失博士学位,论文52年后重见天日
  3. Singleton、MultiThread、Lib——实现单实例无锁多线程安全API
  4. 基于Redis的分布式锁实现
  5. MFC多文档框架 基于CVIEW视图类正常显示超出屏幕范围的部分(支持BCG库绘图)
  6. java list 取几个字段组装成map_java.util.concurrent 并发包诸类概览
  7. 使用MyEclipse开发中的编码设置
  8. php快速就业教程,PHP就业快学教程004,基本语法“条件控制语句”!
  9. 计算机硬件中内存的作用是什么,内存是什么 内存条的作用到底是什么
  10. 基本初等函数求导公式
  11. 求证:原函数与逆函数具有相同的单调性
  12. MarkdownPad2 使用教程
  13. 爽啊!写了一个网页:首字母索引的单词(十分垃圾,简单的不得了)
  14. STM32之AD8403驱动
  15. 音视频开发之旅(56) -H264/AVC基本结构
  16. 计算机维修志愿活动策划书,去敬老院志愿者活动策划书5
  17. 计算机网络技术毕业生实习报告_计算机网络技术实习报告
  18. 博通向芯片交换机中新增软件控制功能
  19. (转)阿里巴巴大数据平台“达芬奇密码”进化论
  20. ubuntu14.04 输入法配置

热门文章

  1. 【优化分类】基于matlab灰狼算法优化最小二乘支持向量机分类(多输入多分类)【含Matlab源码 1558期】
  2. 【优化调度】基于matlab一致性算法求解电力系统分布式经济调度优化问题【含Matlab源码 770期】
  3. 【数字信号调制】基于matlab GUI数字信号调制仿真系统【含Matlab源码 336期】
  4. python安装及运行环境_Python 安装及环境搭建
  5. 端到端车道线检测_弱监督对象检测-端到端培训管道
  6. java中的流思想_Java8新特性 Stream流式思想(二)
  7. PHP如果查询结果为空,php – 如果子查询的结果为NULL,则整个查询失败
  8. 通过反射修改强转值类型_什么是反射机制?反射机制的应用场景有哪些?
  9. js 多个定时器_《进击的前端工程师》Node.js事件循环
  10. HashMap、LinkedHashMap、HashTable、HashSet笔记