本文对应《R语言实战》前3章,因为里面大部分内容已经比较熟悉,所以在这里只是起一个索引的作用。

第1章       R语言介绍

获取帮助函数

help(), ?

查看函数帮助

example()

使用函数示例

vignette()

列出vignette文档

vignette(“svmdoc”)

打开对应文档

管理工作空间

getwd()

显示当前工作目录

setwd(“mydirectory”)

修改当前工作目录为mydirectory

rm(objectlist)

删除对象

save.image(file = “myfile”)

保存工作空间到myfile.RData

save(objectlist, file = “myfile”)

保存指定对象到myfile.RData

load(file = “myfile”)

读取一个工作空间到当前会话中(.RData)

输入与输出

source(“filename”)

在当前会话中执行R脚本

sink(“filename”, append = F, split = F)

输出文本。append = T追加内容而不是覆盖文件,split = T将结果同时发送到屏幕和文件

pdf(“filename.pdf”)

PDF文件(以下都是图形输出方式)

win.metafile(“filename.wmf”)

Windows图元文件

png(“filename.png”)

PNG文件

jpeg(“filename.jpg”)

JPEG文件

bmp(“filename.bmp”)

BMP文件

postscript(“filename.ps”)

PostScript文件

第2章       创建数据集

数据结构:标量、向量、矩阵、数组、数据框、列表

标量与向量:

标量只含一个元素,向量为多个相同模式的标量组成的一维数组,使用c()进行组合

矩阵:

相同模式元素的二维数组,通过matrix()创建

数组:

维度可以大于2,元素模式相同,通过array()创建

数据框:

不同的列可以包含不同模式的数据

选取数据框中的特定变量

patientdata$status

简化方式:attach(), detach()或单独使用with()

示例:

#简化前

summary(mtcars$mpg)

plot(mtcars$mpg, mtcars$disp)

plot(mtcars$mpg, mtcars$wt)

#简化后

attach(mtcars)

summary(mpg)

plot(mpg, disp)

plot(mpg, wt)

detach(mtcars)

局限性:存在名称相同的对象时,有可能出现masked的警告,原始对象为优先

with()函数示例

#with()用法

with(mtcars, {

summary(mpg)

plot(mpg, disp)

plot(mpg, wt)

})

这种方式,赋值仅为with()内的局部变量,要使内部赋值在接下来的代码中可以用,需要使用特殊赋值符( <

#nokeepstats只在with()内可以使用,keepstats可以在全局使用

with(mtcars, {

nokeepstats

keepstats <

})

选取数据框中特定实例:实例标识符

#指定标识符,用于标记各类打印输出和图形中实例名称

patientdata

因子:

分为类别变量和有序类别变量。

#有序类别变量,默认排序规则为字母顺序

status

status

#编码为1 = Excellent, 2 = Improved, 3 = Poor

#自定义顺序

status

列表:

#创建列表

mylist

mylist

#提取元素

mylist[[1]]

mylist[[“name1”]]

mylist$name1

导入数据

#带分隔符的文件

mydataframe

#默认stringAsFactors = TRUE一般需要修改

#colClasses为每一列数据指定class

#更多设置信息参考帮助文档

#Excel数据

library(RODBC)

channel

mydataframe

odbcClose(channel)

library(xlsx)

workbook

mydataframe

#XML数据

library(XML)

#网页抓取数据

?readLines

?grep

?gsub

library(XML)

library(RCurl)

#SPSS数据

library(foreign)

?read.spss

library(Hmisc)

?spss.get

#SAS数据

#旧版SAS使用与SPSS数据类似方法

#新版SAS可以先将数据存为.csv文件再导入

#Stata数据

library(foreign)

?read.dta

#netCDF数据

library(ncdf)

nc

myarray

#HDF5数据

library(hdf5)

#访问数据库管理系统

#ODBC接口

library(RODBC)

myconn

crimedat

pundit

close(myconn)

#DBI相关包

library(DBI)

library(RJDBC)

library(RMy)

library(ROracle)

library(RPostgreSQL)

library(RSQLite)

ODBC包主要函数

odbcConnect(dsn, uid = “”, pwd = “”)

建立一个ODBC连接

sqlFetch(channel, sqltable)

读取表

sqlQuery(channel, query)

向ODBC数据库提交查询并返回结果

sqlSave(channel, mydf, tablename = sqtable, append = FALSE)

将数据库写入或更新(append = TRUE)到ODBC数据库中的某个表中

sqlDrop(channel, sqtable)

删除ODBC数据库中的某个表

close(channel)

关闭连接

处理数据对象的实用函数

length(object)

显示对象中元素/成分的数量

dim(object)

显示某个对象的维度

str(object)

显示某个对象的结构

class(object)

显示某个对象的类或类型

mode(object)

显示某个对象的模式

names(object)

显示某对象中各成分的名称

c(object1, object2, …)

将对象合并入一个向量

cbind(object1, object2, …)

按列合并对象

rbind(object1, object2, …)

按行合并对象

object

输出对象

head(object)

列出某个对象的开始部分

tail(object)

列出某个对象的最后部分

ls()

显示当前的对象列表

rm(object1, object2, …)

删除对象

rm(list = ls())可以删除几乎所有对象

newobject

编辑对象并另存为newobject

fix(object)

直接编辑对象

第3章       图形初阶

因为总体来讲,作为最终展示的作图,往往使用ggplot2包更好一点。然而在数据分析的过程中,需要首先对数据分布进行一定了解,这就需要一些比较基础的图形。由于本章只是对于图形的创建、保存、颜色、标注等进行解说,因此并不是我们关心的重点,所以我们仅仅将一些通用的方法以索引的方式罗列出来,作为参考。而作为最终展示的图形,在后面的ggplot2包的学习中,将会进行更加详细的阐述。

#图形的输出与保存

pdf(“mygraph.pdf”)

plot(x, y)

title(“my graph”)

dev.off()

#图形参数修改

#通过par()函数修改参数,这种方式设定的参数值,在会话结束前一直有效

#生成一个可以修改的当前图形参数列表

opar

#设置参数

par(lty = 2, pch = 17)

#作图

plot(dose, drugA, type = ‘b’)

#还原原始设置

par(opar)

另外也可以直接在绘图函数里设置参数键值对,只对当前图形有效

符号和线条

pch

绘制的点符号(0:25)

cex

绘制点大小(默认1)

lty

绘制线形状(1:6)

lwd

绘制线宽度(默认1)

颜色

col

默认的绘图颜色,若颜色向量小于绘图数量,则循环使用

col.axis

坐标轴刻度文字的颜色

col.lab

坐标轴标签名称的颜色

col.main

标题颜色

col.sub

副标题颜色

fg

前景色

bg

背景色

#用于创建连续型颜色向量的函数

rainbow()

heat.colors()

terrain.colors()

topo.colors()

#多阶灰度色

gray()

#以上函数使用help()查询具体使用参数

文本尺寸、图形尺寸略

添加标题,可以在plot()函数里声明,也可以用title()函数追加:main标题、sub副标题、xlab, ylab坐标轴标签

设置坐标轴范围xlim, ylim

添加坐标轴函数axis(side, at = x)

添加参考线函数abline(h = yvalues, v = xvalues)

添加图例函数legend(location, title, legend, …)

添加文本标注函数text()向绘图区域内部添加,mtext()向图形边界之一添加

数学标注:详见help(plotmath)

图形组合

#方法1

par(mfrow = c(nrows, ncols))

#接下来的几幅图排列在nrows, ncols矩阵中

#方法2

layout(matrix(c(1, 1, 2, 3)), 2, 2, byrow = TRUE)

#指在2*2矩阵中,第一幅图占据(1,1)和(1,2)第二幅(2,1)第三幅(2,2)

layout(matrix(c(1, 1, 2, 3)), 2, 2, byrow = TRUE,

widths = c(3, 1), heights = c(1, 2))

#各列宽度及各行高度组成的向量,即矩阵的四个部分,宽之比3:1高之比1:2

多幅图形的精细控制:

通过par()函数里的fig参数设置多个图形的相对位置,可以多试几次,直到找到最合适的参数。

opar

#设置散点图

par(fig = c(0, 0.8, 0, 0.8))

plot(mtcars$wt, mtcars$mpg,

xlab = "Miles Per Gallon",

ylab = "Car Weight")

#在上方和右侧添加箱线图

par(fig = c(0, 0.8, 0.55, 1), new = TRUE)

boxplot(mtcars$wt, horizontal = TRUE, axes = FALSE)

par(fig = c(0.65, 1, 0, 0.8), new = TRUE)

boxplot(mtcars$mpg, axes = FALSE)

mtext("Enhanced Scatterplot", side = 3, outer = TRUE, line = -3)

par(opar)

readxmls r语言_R语言实战(一)介绍、数据集与图形初阶相关推荐

  1. r语言 图形一览_R语言实战—图形篇(图形初阶)

    最近沉迷学习R语言,不得不说<R语言实战>真的太详细了,详细的阅读完这本书后,我的收获不小.为了方便自己复习,将这本书的内容整理归纳为两个部分:统计篇(数据分析)和图形篇(数据可视化). ...

  2. R语言学习笔记——入门篇:第三章-图形初阶

    R语言 R语言学习笔记--入门篇:第三章-图形初阶 文章目录 R语言 一.使用图形 1.1.基础绘图函数:plot( ) 1.2.图形控制函数:dev( ) 补充--直方图函数:hist( ) 补充- ...

  3. r语言 图形一览_R语言实战(第2版):第三章 图形初阶(01)

    注:如果在头条里面的代码不清楚,可以在""简书""中搜索"康华同学",同步更新!!! 3.1 使用图形 R是一个惊艳的图形构建平台.这里我特 ...

  4. readxmls r语言_R语言系列 数据读入(完整版)

    [免责声明:本文用于教学] 04. 数据读入 R提供了适用范围广泛的数据导入工具.向R中导入数据的权威指南参见可在http://cran.r-project.org/doc/manuals/R-dat ...

  5. 包r语言_R语言交互式可视化包CanvasXpress

    CanvasXpress包简介 CanvasXpress核心是一个JavaScript语言编写的库,主要用于可重复研究. 在R中可以安装canvasXpress包,使用canvasXpress命令绘制 ...

  6. 包r语言_R语言入门之寻找你的R包

    关于寻找目标R包,一般可以在官网利用关键词搜索即可获得相关信息,不过米老鼠在这里想给大家介绍一个特别的R包,它可以帮助你寻找你想要的理想R包. 不过,在正式讲解,我想和大家提醒一下安装R包的注意事项: ...

  7. 1071svm函数 r语言_R语言机器学习之核心包e1071 - 数据分析

    R语言有很多包可以做机器学习(Machine Learning)的任务.机器学习的任务主要有有监督的学习方式和无监督的学习方式. 有监督学习:在正确结果指导下的学习方式,若是正确结果是定性的,属于分类 ...

  8. 格兰杰因果关系检验r语言_R语言系列第四期:R语言单样本双样本差异性检验

    之前详细介绍了利用R语言进行统计描述,详情点击:R语言系列第三期:①R语言单组汇总及图形展示.R语言系列第三期:②R语言多组汇总及图形展示.R语言系列第三期:③R语言表格及其图形展示 从这个部分我们就 ...

  9. 下载的长数据怎么分开R语言_R语言学习笔记(一):学代码,我们从最基础的开始...

    *本文是本人在学习 res method 课程中反复学不会被自己蠢到的笔记作品,仅供本人娱乐使用,如果恰好里面的内容也能帮到你,那可真是太好了. 同学们,我们这节课来学习R语言,那么我们为什么要学习R ...

最新文章

  1. Single Shot Multibox Detection (SSD)实战(下)
  2. HDFS——HDFS+Zookeeper搭建高可用HDFS
  3. Kmeans、Kmeans++和KNN算法比较
  4. 微信有电脑客户端吗_微信公众号文章下载、打印、精确搜索定位与交流方式分享...
  5. back在java里面是什么意思,手机APP中使用history.back()的问题
  6. mint mvc简介
  7. 制作css开关,纯css实现开关效果
  8. 装配图中齿轮的画法_装配图的规定画法 和特殊画法
  9. ubuntu安装时发现GPT分区表,无法安装问题
  10. Primefaces,Hibernate和SpringRoo集成
  11. python 从大到小循环_python算法(3) 插入排序
  12. AVR Studio 5 使用初体验及完整版下载地址
  13. android上传项目到码云_直播开源项目
  14. python join_Python中join()方法的用法
  15. java实现音频播放小程序_微信小程序实现音频文件播放进度的实例代码
  16. 微信小程序教程笔记6
  17. 老罗Android开发 视频教程
  18. Windows内核基础之权限级别
  19. [双系统]安装双系统的步骤及注意事项(含分区工具介绍)
  20. vue中Number方法将字符串转换为数字

热门文章

  1. 根目录,子目录,当前目录
  2. 述职答辩提问环节一般可以问些什么_论文答辩一般会问什么问题 有哪些答辩的技巧...
  3. java解析excel,poi和easyExcel
  4. mplab哪个版本编译c语言,mplab c18编译器下载-mplab c18软件下载(正版MPLAB C18 C编译器) 3.0 完整版 - 河东下载站...
  5. Jmeter常用场景梳理
  6. K_A04_003 基于单片机驱动COG12864显示图片文字和字符串
  7. [渝粤教育] 南京理工大学泰州科技学院 大学物理(电磁学部分) 参考 资料
  8. 热量传递的三种基本方式
  9. 安装visual c++提示16 bit windows subsystem错误
  10. Excel中双击格式刷的妙用