PRS之后的一个小问题

在计算完PRS之后,如果选择的是全部阈值(或者设定的阈值有多个)的话,PRS_allscore.prisice文件中就可以看到每个阈值对应的p值(即这个阈值下计算的PRS与表型是否显著),和通过这个阈值的SNP的数量。

比如我基于候选基因去做GRS,会得到下图,我感兴趣的是10的-6次方下计算所得的PRS,可以看到仅仅纳入了2个SNP(Num_SNP)。如果我想知道这两个SNP是谁?????

首先,这两个SNP是即在base中的p值小于10的-6次方,又存在于我们给的target的SNP中,因此我们分别取出这两部分的SNP,取交集即可得到:

1.把文件保存成可读格式, 并读入R中
对于target,我们应该要用到的是bim文件,先把它保存成txt文件;
对于base文件同样的命令保存成txt,然后在R中提取出p值小于10的-6次方的部分,保存为txt

sort -o targetSNP.txt target.bim

读入R中,要注意这里用的分割符号是制表符,如果不加参数**sep = “\t”**的话,R会默认把txt文件读成一列

targetSNP <- read.table("targetSNP.txt", sep = "\t")
baseSNP <- read.table("SCZ_eas_1e-6", sep = "\t")

2.R语言指定列取交集

# 两个数值向量取交集
intersect(x=1:4, y = 2:6)# 两个字符向量取交集
intersect(x=letters[1:4], y = letters[2:6])# 混合向量
intersect(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))

这个案例中用的是SNP的rs号,所以用intersect函数

overlap <- intersect(x=targetSNP$V2, y = baseSNP$SNP)

这个问题就解决了!

3.猜你喜欢
R语言取并集union

# 两个数值向量取并集
union(x=1:4, y = 2:6)# 两个字符向量取并集
union(x=letters[1:4], y = letters[2:6])# 混合向量
union(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))

R语言找两个数据集的不同setdiff,只保留x或y中不同的元素

setdiff(x, y)
x = 1:4
y = 2:6
# 找x中不同于y的元素
setdiff(x, y)
# 找y中不同于x的元素
setdiff(y, x)

找出纳入PRS/GRS计算的SNP是哪些?相关推荐

  1. Java黑皮书课后题第7章:7.14(计算gcd)编写方法,返回个数不确定的整数的最大公约数。编写一个测试程序,提示用户输入5个数字,调用该方法找出这些数的最大公约数,并显示这个最大公约数

    7.14(计算gcd)编写方法,返回个数不确定的整数的最大公约数.编写一个测试程序,提示用户输入5个数字,调用该方法找出这些数的最大公约数,并显示这个最大公约数 题目 题目描述 破题 代码 运行实例 ...

  2. C语言习题:输入10个学生5门课的成绩,分别用函数实现下列功能:①计算每个学生的平均分;②计算每门课的平均分;③找出所有50个分数中最高的分数所对应的学生和课程;④计算平均分方差;

    ***题目:***输入10个学生5门课的成绩,分别用函数实现下列功能: ①计算每个学生的平均分; ②计算每门课的平均分; ③找出所有50个分数中最高的分数所对应的学生和课程; ④计算平均分方差; /* ...

  3. 输入10个学生某门课的成绩,用函数找出最高分、最低分,计算平均分,并在主函数中输入和输出(用函数和全局变量来完成)(C语言)

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 题目: 输入10个学生某门课的成绩,用函数找出最高分.最低分,计算平均分,并在主函数中输入和输出(用函数和全局变量来完成). 代码: ...

  4. 编写程序读取一系列整数,找出它们的最大数,然后计算该数的出现次数,假定输入以0结束。

    编写程序读取一系列整数,找出它们的最大数,然后计算该数的出现次数,假定输入以0结束.输入格式 在一行中输入待统计的整型数,各个数可以以一个或多个空格或回车分隔,以0结束. 输出格式: 以两行输出: 第 ...

  5. MATLAB函数判断绝对素数,自定义函数,找出 以内所有素数(质数)并计算它们的和,matlab...

    C++,VC2008,问题是 编写一个函数,找出3~1000之内,所有的素数.求高手!我在线等 #include#includevoidf(){//筛法charprime[1001];memset(p ...

  6. 三个学生四门课程,求出学生平均成绩和课程的平均成绩;n个学生每人m门课程,找出最高分学生,输出有一门成绩不合格的学生的各门成绩,计算每门成绩都在85分及以上的学生的人数(C)

    养成好习惯,点个赞 再走:有问题,欢迎私信.评论,我看到都会回复的 以下两个题目就是玩一下for循环语句和二维数组 文章目录 三个学生四门课程,求出学生平均成绩和课程的平均成绩 n个学生,每人m门课程 ...

  7. OpenJudge计算概论-找出第k大的数

    /*================================================ 找出第k大的数 总时间限制: 1000ms 内存限制: 1000kB 描述 用户输入N和K,然后接 ...

  8. 笔试强训第三周编程题part01(年终奖,迷宫问题;微信红包,计算字符串的距离;小易的升级之路,找出字符串中第一个只出现一次的字符,洗牌)

    年终奖 OJ链接 此题是一道动态规划的问题 读题可知:只能从上往下和从左往右移动 由此需要前[i-1] [ j ]和[i][j-1]来比较大小来确实最优解. 其中有两种特殊情况,第一行和第一列 代码如 ...

  9. 如何用excel计算断色断码_如何在EXCEL里面快速找出断码的衣服

    款式名称款式编码颜色名称SMLXL2XL3XL4XLT恤PB2008浅紫012227T恤PB2028白色003216T恤PB2028熟黄002003T恤PB2029白色0073313T恤PB2029大 ...

最新文章

  1. 自定义jstl函数标签
  2. 【SQLAlchemy】is not bound to a Session; attribute refresh operation cannot proceed
  3. .NET Core跨平台图形处理库ImageSharp
  4. 树链剖分入门+HYSBZ - 1036树的统计Count
  5. 【Python基础入门系列】第09天:Python tuple
  6. 博主日常工作中使用的shell脚本分享
  7. dir函数python_Python dir()函数
  8. [转][python] 常用正则表达式爬取网页信息及分析HTML标签总结
  9. 惠普z800工作站bios设置_HP工作站BIOS说明书适用Z228Z440Z230Z640Z840Z800Z620Z420Z820主板设置.doc...
  10. 雷达相关书籍学习顺序推荐
  11. android里面的USB功能-----Accessory模式
  12. 个人空间岁末大回报活动12月25日获奖名单
  13. 一加9pro 鸿蒙系统,想换国产旗舰,一加9 Pro和华为Mate 40 Pro怎么选?
  14. 自动下载RDS MySQL备份文件
  15. 8266,永远滴神!美女设计师的「舌头控制器」,从此动动嘴就能玩游戏!
  16. SCAPE、BlendSCAPE、SMPL、SMPL-H、SMPL-X、STAR等都是什么?请分别仔细介绍一下
  17. CFileDialog控件ID值
  18. 研发流程——准入体系设计
  19. 苹果桌面主题_iOS 14自定义“桌面主题” ,果粉们都玩疯了~【附教程】
  20. 构建统一平台消除“数据烟囱”“信息孤岛”

热门文章

  1. 这一世的缘分——穿过重重劫数的你的脸
  2. 重庆北大青鸟校长班同学部门作品欣赏
  3. Jmeter保存报错Couldn‘t save test plan to file
  4. word空白页怎么删除
  5. 计算机台式硬件排名价格,CPU天梯图2018年1月最新版 台式电脑处理器天梯排行 (全文)...
  6. 获取外网IP,再根据IP定位城市
  7. 最常用的9个机器学习算法,解决99%的业务问题!
  8. 2018全球智能+新商业峰会:AI的“危”与“机”,梁建章、邢波、傅盛等大佬来揭秘| 互联网行业公会
  9. 挥别2021,奋进2022
  10. win10安装docker教程、常见问题和原理总结