r语言在linux下取数据,菜鸟第一步,跪在数据处:R语言读取数据
1. 温故知坑
实践是学习知识的最好途径。之前我讲的内容都非常非常基础,包括:
(1)什么是R语言?R语言和Rstudio软件的安装,Rstudio的界面介绍;
(2)R语言的基本逻辑,基本数据类型;
(3)ggplot基础绘图;
(4)学习R语言的思路(整理,总结问题)。
通过不断的踩坑,走弯路,我们可以在勤奋的基础上,找一些快速的方法。我们已经不能再像上大学时候一样了,先啃完一本书,学好各种基础知识,然后开始应用。工作之繁忙,生活之琐碎,各种被电子产品占据走的时间。已经很难找出一整块的时间去学习了。
换句话说,没有目的性的理论学习就是耍流氓。怎么讲这么多数据类型,格式,可是我用不着呀?因此,我们调整策略,按照完成project为主线来解说在完成数据分析的过程中,我们需要用的R语言知识。
2. 一个超级简单的project流程
以我之前处理的GEO数据为蓝本,我们详细的介绍每一个数据处理过程,所需要的知识(不仅仅是R语言代码,还有各种背景知识)。
步骤基本上是:导入数据--整理为可以进行分析的形式--差异分析(火山图等)--GO/KEGG注释(各种好看的图)。其中每一个步骤都可以说是好几把辛酸泪。
但素!为了降低炸毛的风险,我自己捏造了一段非常非常小的数据用来做示例。想要跟着我步骤的小伙伴,需要这小小数据,你们可以想办法找到我。
so,今天我们来讲,导入数据!
(1)首先自然是要有数据
数据的来源:A. 自己课题组的各种测序结果,在经过linux的上游分析之后,得到一个表达量和分组的表格(我们也称之为表达矩阵),经过精心整理之后,它大概需要变成这样:
expression data.frame.jpg
B. 从公共数据库下载:例如GEO、TCGA数据库(知识点:自行去了解这两个数据库),那根据数据库的不同,下载的数据也是有所不同的。GEO数据可以直接通过R语言下载,可以说是非常方便了!
(2)载入数据方式
R语言载入数据的方式如下:
R语言数据的输入:
(1)手打;(2)文本文件txt;(3)Excel;(4)Acess;(5)其他统计软件出来的数据,例如SPSS,SAS;(6)XML数据;(7)网页抓取;(8)Stata;(9)netCDF;(10)HDF5;(11)通过数据库接口下载;(12)通过Stat/Transfer导入数据 。
看到这么多会直接炸毛,这么多!没关系,我们又没有期末考,掌握自己所需要的就可以了。
最最最常见的数据就是txt,xls,csv(有点像xls)。
(3)读取Excel文件
step 1-2 新建proj,管理文件,而后双击打开
step1-2.png
step 3 将Excel另存为csv文件,而后载入
## (1)另存为csv文件之后,以下代码均可以读取数据
data_1
data_2
## 知识点,header= T,sep="," 是什么意思?
## header= T,字面上的意思就是:有抬头,本文件的抬头(即列名)就是:
> colnames(data_1)
[1] "ensembl_id" "control_1" "control_2" "control_3" "experiment_1" "experiment_2"
[7] "experiment_3"
## 那什么是sep="," 你试试看不要这么参数?试试嘛!
step 4 我偏不另存为,我就要读Excel
好的,妥妥的满足你!虽然我不会,但是我去话了小洁大佬,她支的招就是,使用R包 tidyverse
## (2)我偏不另存为,那就试试tidyverse包
install.packages("tidyverse")
library(tidyverse)
## 调出帮助文档,学习如何使用该包
?tidyverse
## 可是我怕不想看帮助文档怎么办?偷懒的我发现了一个小妙招
请看图
amazing.png
## 然后就妥妥的会啦
data_3
loaddata.jpg
至于txt文档怎么载入,我想你用到的时候,定会查到的!
3. 还是温故知新的!
其实写这篇推文呢,我才是最大的收获者,为了写得简洁明了,我回去自己看了一下书,然后又请教了小洁,真是妥妥的--温故知不足,求索方知新。大家加油吧!
r语言在linux下取数据,菜鸟第一步,跪在数据处:R语言读取数据相关推荐
- linux c语言 ppt,Linux下C语言编程.ppt
Linux下C语言编程 Linux中C语言的重要性 Linux和C天生有不解之缘. Linux操作系统的内核主要是用C写的,另外Linux下的很多软件也是用C写的,特别是一些著名的服务软件,比如MyS ...
- 在Linux下运行你的第一个汇编程序
在Linux下运行你的第一个汇编程序 汇编语言对于大多数程序员来说都是进而远之的,原因当然是汇编语言晦涩难懂,各种指令搞得人头疼,不过汇编语言适当了解一些还是蛮有意思的,今天带大家在Linux上运行第 ...
- 网管菜鸟第一步:两年后必须跳槽『博客之星访谈』
<?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" />4月1 ...
- linux 网卡包存储,Linux下使用libpcap进行网络抓包并保存到文件-Go语言中文社区
libpcap是一个抓取网络数据报文的C语言函数库,使用这个库可以非常方便的抓取网络上的报文,方便我们分析经过我们设备上的各种报文: 1.libpcap安装 下载文件:libpcap-x.x.x.ta ...
- c语言除法向下取整是加一么,【向上取整/向下取整】C语言向上或向下取整 函数...
C语言有以下几种取整方法: 1.直接赋值给整数变量.如: int i = 2.5; 或 i = (int) 2.5; 这种方法采用的是舍去小数部分 2.C/C++中的整数除法运算符"/&qu ...
- linux c语言工具,Linux下C语言编程环境的工具.doc
Linux下C语言编程环境的工具 Linux下C语言编程环境的工具 Linux下C语言编程环境的工具 要想在Linux下进行C语言编程,首先得搭建好一个编程环境.这里分别说明一下几个非常有用的软件包. ...
- 单片机c语言 openssl,Linux下C语言使用openssl库进行加密
在这里插一小节加密的吧,使用openssl库进行加密. 使用MD5加密 我们以一个字符串为例,新建一个文件filename.txt,在文件内写入hello ,然后在Linux下可以使用命令md5sum ...
- linux c语言 信号,linux下基于C语言的信号编程实例
搜索热词 本文实例讲述了linux下基于C语言的信号编程方法.分享给大家供大家参考.具体如下: #include #include #include #include #include void si ...
- linux怎么杀死线程c语言,教程-linux下c语言编程 第一弹-线程的使用
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 /*linux下最常用的应该就是pthread线程库了 本教程就是关于pthread的 关于线程是什么东西我就不赘述了 百科上都有*/ #include ...
最新文章
- 未来的程序员面临着怎样的职业变化
- 【数据结构和算法16】堆排序
- es 删除数据_es 写入数据的工作原理是什么啊?es 查询数据的工作原理是什么啊?...
- oracle11gasm,Oracle11gASM之ACFS创建案例
- python 高维数据_Python数据分析入门|利用NumPy高效处理高维数据
- python 3.5.2设计页面_怎么解决win10系统搭建Python 3.5.2开发环境的处理方案
- C++ 程序运行前内存分区模型
- 10深入Redis Cluster
- Hosts 文件作用及如何修改
- springBoot 注入@Slf4j,框架中的方法无法调用。。。
- 19.Virtual Type
- [娱乐]帝国时代I:罗马复兴秘籍
- 【Centos7进入root权限是报错:sudo: /etc/sudo.conf is owned by uid 1000, should be 0】
- OPC:服务器开发(一)如何开发OPC Server
- Java---多线程入门
- 流量无限离我们还有多远?
- SyntaxError: can't assign to operator
- 循环控制语句break,continue
- 百度2023届暑期实习生面经-产品运营岗
- 教你如何把视频转成序列图片的实用技巧
热门文章
- web——javascript实现动态时钟
- java写创建对象时找不到符号_在JDK 1.8上构建java代码时找不到符号错误
- 史上最简单的入门Django教程!
- 防止.class被反编译 的方法
- 《花开半夏》--4 生死之间的吻(2)
- Python+OpenCV边学边做-机器视觉检测之贝类含砂量X射线影像
- SOA面向服务的架构
- 看看自己咬自己鼻子的牛人
- 教MM如何正确试用化妆品 - 生活至上,美容至尚!
- win7开机启动项设置_win7系统如何修改开机启动项 电脑修改开机启动项操作方法【图文】...