转自:https://www.jianshu.com/p/a7af4f6e50c3

1.原始数据

以上是原有的一个,再生成一个新的:

> gene_exp_tidy2 <- data.frame(GeneId = rep("gene5", times = 3),sample_name = paste("sample", 1:3, sep = ""), expression = 2:4)
> gene_exp_tidy2GeneId sample_name expression
1  gene5     sample1          2
2  gene5     sample2          3
3  gene5     sample3          4
> mode(gene_exp_tidy2)
[1] "list"
> typeof(gene_exp_tidy2)
[1] "list"

//这个生成数据框的一句代码好厉害啊,学习了。

2.数据框拼接

# 1.使用R自带的函数rbind拼接
rbind(gene_exp_tidy,gene_exp_tidy2)
# 2.使用dplyr的bind_rows函数
bind_rows(gene_exp_tidy,gene_exp_tidy2)

其中对dplyr中拼接函数的说明:

包括按行合并和按列合并。也就是会改变表中y的值。

3.交集

3.1构建一个gene1和gene5组成的数据框

gene_exp_tidy3 <- filter(gene_exp_tidy, GeneId == "gene1")%>%bind_rows(gene_exp_tidy2)

//就是过滤吧,从原来的当中根据列名过滤,列名中的内容=gene1的列,然后进行合并到变量2的行上。结果如上。

3.2求交集

# 求两个数据框的交集
intersect(gene_exp_tidy, gene_exp_tidy3)

3.3并集(自动去重)

# 求两个数据框的并集(自动去除重复)
union(gene_exp_tidy, gene_exp_tidy3)

3.3并集(不去重)

# 求两个数据框的并集,不去除重复
union_all(gene_exp_tidy, gene_exp_tidy3)

//是三个元素完全相同,才会判断为相同的。

3.4求差集

# 求两个数据框的差集
setdiff(gene_exp_tidy, gene_exp_tidy3)

4表连接操作

4.1内连接

上图中,左边的数据框中有基因的表达信息,右边的数据框中有基因的功能注释,如何把两个数据框相关联,将基因功能注释添加到基因的表达信息中呢?

//也就是以左边的表为基准,查看当前geneid是否在右边表中出现,如果出现,则合并呗。

左连接:以第一个数据框为准,将第二个数据框的相关信息添加进去

# 将两张表以GeneId进行关联
left_join(gene_exp_tidy, gene_anno, by = "GeneId")

对于如果两个表的列名不恰好相同的话,使用以下语句:

# 使用rename函数将GeneId换成Geneid
gene_anno <- rename(gene_anno, Geneid = GeneId)
# 将两个数据框关联,设置两个数据框中相同的列名
left_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))

by中是一个向量,左边表的列名=右边表的列名 。结果与上述是一样的结果。

4.2右连接

右连接:以第二个数据框为准,将第一个数据框中的相关信息添加进去

# 右连接
right_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))

4.3内连接:保留两个数据框中共有的GeneId

# 内连接
inner_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))

4.4全连接:保留两张表格中所有GeneId的信息

# 全连接
full_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))

4.5半连接

半连接:只保留第二个数据框中包含的GeneId信息

//应该是只根据c中的保留表2中的列,不会进行其他列的信息合并。

4.6反连接:只保留第二个数据框中不包含的GeneId信息

# 反连接
anti_join(gene_exp_tidy, gene_anno, by =c("GeneId" = "Geneid"))

转载于:https://www.cnblogs.com/BlueBlueSea/p/10182907.html

R中双表操作学习[转载]相关推荐

  1. 聚类分析在SPSS、Matlab与R中的实现(转载: Liu Xuhua 机会的数学 )

    原文:https://mp.weixin.qq.com/s/1aBlwX11cBxw0sxONaHJRQ 笔记:修改后代码 ① a<-scan() 7.90 39.77  8.49 12.94 ...

  2. R之ddlpy函数学习[转载]

    转自:https://www.cnblogs.com/aloiswei/p/6032513.html 1.函数 ddply(.data, .variables, .fun = NULL, ..., . ...

  3. python神经网络库 keras_在Python和R中使用Keras和Tensorflow进行深度学习

    了解TensorFlow 2.0和Keras在Python和R中的深度学习并构建神经网络 深入了解人工神经网络(ANN)和深度学习 了解Keras和Tensorflow库的用法 了解适用人工神经网络( ...

  4. 碎片︱R语言与深度学习

    笔者:受alphago影响,想看看深度学习,但是其在R语言中的应用包可谓少之又少,更多的是在matlab和python中或者是调用.整理一下目前我看到的R语言的材料: ---------------- ...

  5. sql语句求上四分位数_SAS和R中,非常规分位数的计算方法

    先说下什么是常规的分位数,比如四分位数,也即25%和75%位置的数值. 求常规分位数很简单,但是很多时候我们也要报道不太常见的位数,比如昨天有位大夫咨询如何求97.5%位数. 今天就来讲讲在sas和r ...

  6. 【转载】R语言与数据挖掘学习笔记

    (1):数据挖掘相关包的介绍 今天发现一个很不错的博客(http://www.RDataMining.com),博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整 ...

  7. R语言数据分析笔记——t检验(含正态性检验和方差齐性检验在SPSS和R语言中的操作t检验(单样本、双独立样本、配对样本)在Excel、SPSS、R语言中的操作)

    前言:本文为个人学习笔记,为各大网站上的教学内容之综合整理,综合整理了①假设分析的基础知识.②正态性检验和方差齐性检验在SPSS和R语言中的操作.③t检验(单样本.双独立样本.配对样本)在Excel. ...

  8. 使用Win10系统在R中加载TensorFlow-gup加快深度学习运行之攻略

    弗朗索瓦.肖莱著<深度学习R语言版>说,用CUP进行深度学习运算可能需要数小时,但用GPU可能只要几分钟.不过,该书只叙述了在Ubuntu下安装GUP的方法,不推荐Windows下使用Te ...

  9. R 中的哪些命令或者包让你相见恨晚?--转载知乎

    https://www.zhihu.com/question/24501195 节选: 看了这么多答案,觉得 Hadley Wickhamhad.co.nz 在R使用者的地位好高啊.其实我也觉得Had ...

最新文章

  1. .data和.text段合并
  2. Dubbo官方的Starter发布1.0.0测试版,与Spring Boot的结合将更加自然
  3. foreach循环怎么获取全部返回值_jmeter基础逻辑控制器之ForEach控制器
  4. python pipeline框架_Python爬虫从入门到放弃(十六)之 Scrapy框架中Item Pipeline用法...
  5. 关于完全删除电脑上多余的tomcat服务器的解决办法
  6. 工作流中ServiceTask的各种方法
  7. (20120731)Android中的各种对话框总结(dialog)
  8. 【剑指offer】连续子数组的最大和(未完待续。。。)
  9. Hibernate本机SQL查询示例
  10. 三星投8万亿扩充10nm、7nm产能:骁龙835爆发
  11. python udp 直播_Python使用UDP协议实现局域网内屏幕广播
  12. vsco怎么两个滤镜叠加_做图比设计师还快?!这帮饭圈女孩是怎么做到的?
  13. 正则表达式提取省市区县乡镇等
  14. html css3滤镜,CSS滤镜之Glow属性_css
  15. 【C语言】0x1F<<11等于0还是0xF800 ?
  16. Java多态练习宠物喂食
  17. 青少年CTF_misc部分题解
  18. 201771010137 赵栋《面向对象程序设计(java)》第十六周学习总结
  19. 图书信息管理系统c语言txt,小型图书信息管理系统(C语言)
  20. Ubuntu 14.04 下安装Skype

热门文章

  1. 2016年9月份工作知识点汇总
  2. 随机获取部分ListObject集合
  3. window.location和document.location的区别分析
  4. 13.C++ vector 操作
  5. onclick 事件
  6. Ionic常见问题--插件无法下载:npm ERR打包sha1错误
  7. SQL Server中授予用户查看对象定义的权限
  8. OSX下解决PIL的IOError: decoder jpeg not available 问题
  9. 第一天开博,想和大家认识。
  10. 【辨异】limit, limitation