SNP Flank sequence align gene sequence

根据SNP标记探针的序列来查看具体的一个基因上有多少SNP标记。采用序列回帖的方法进行查看。在R和Linux 中操作,需要安装的软件是BWA, samtools 等
步骤如下:

#extract snp flank sequence to make a fasta file for BWA alignment
setwd("/Users/zhanghuairen/600Ksnp/")
library(stringr)
da=read.csv(file="chr1.csv",header = T) #snp chip annotation file
head(da)
sink('snp_marker_seq.fa')#创建一个fasta文件
for (i in 1:nrow(da)){Frank_seq=unlist(str_split(da$Flank[i],"\\[.*\\]")) #split the seq with []cat(str_c(">",paste(da$Probe.Set.ID[i],da$Physical.Position[i],sep="|")))cat("\n")cat(paste(Frank_seq[1],Frank_seq[2],sep=""))cat("\n")
}
sink()
######using BWA to create a index file for align#
system("bwa index gene2.fasta -p gene2 ")
######using BWA to align snp marker frank sequence to gene sequence
system("bwa mem gene2.fasta snp_marker_seq.fa > snpMarke_align.sam")
#####using samtools to extract the algined sequence
system("samtools view -F 4 snpMarke_align.sam > snpMarkerFiltered.sam")
system("wc -l  snpMarkerFiltered.sam ")

SNP芯片探针回帖基因序列相关推荐

  1. 用R获取芯片探针与基因的对应关系三部曲-bioconductor

    用R获取芯片探针与基因的对应关系三部曲-bioconductor 现有的基因芯片种类不要太多了! soft和miniml都是表示该platform的基础信息,比如GPL编号,上传日期等,soft文件的 ...

  2. 基因探针c语言编程,如何零代码实现芯片探针表达矩阵转化为基因表达矩阵?...

    GEO下载到的标准化后的表达矩阵(Series Matrix File(s)文件)或是下载原始.CEL文件自己归一化后形成的表达矩阵,每行的标注是以探针的形式给出的,例如. 这样在分析差异基因之后,并 ...

  3. (重磅!价值一千元的R代码送给你)芯片探针序列的基因组注释 芯片没有注释信息 从头基因组比对gtf文件开始atcg 只有探针核苷酸序列的首先探针核苷酸序列需要比对到参考基因组然后比对后的文件

    这是我第二次在标题上写重磅!价值一千元的代码,虽然下面的技能或者说代码对我来说是非常简单啦,但是在有需求的粉丝看来真正的价值不可估量. 第一次是:TCGA的28篇教程-风险因子关联图-一个价值1000 ...

  4. 芯片数据分析步骤6 探针注释

    注释探针 注释探针的原因 为了防止非特异性结合造成的干扰,芯片厂商往往会使用多个探针检测同一个基因的表达.因此,芯片厂商不会使用基因名作为探针的名称,而是使用自己定义的探针名称.要合并重复探针,我们必 ...

  5. 基因组表达分析:如何选择RNA-seq vs. 芯片

    基因组表达分析:如何选择RNA-seq vs. 芯片 发布日期:2017-03-29 10:00 DNA 芯片(上图左侧)由附着在表面的核酸探针组成.首先,从样品中提取 RNA 并转化为互补 DNA( ...

  6. Bioconductor分析基因芯片数据第五章

    使读者初步了解使用Bionconductor完成基因芯片预处理的流程 接着详细讲解戏弄i按预处理和数据分析等内容 最后深入了解实际工作中会遇到的芯片处理问题以及如何用学到的只是解决问题 目的:掌握芯片 ...

  7. 芯片数据分析笔记【05】 | 处理芯片数据的R包

    芯片数据分析笔记[01] | 基因芯片的基本原理 芯片数据分析笔记[02] | 芯片数据库 芯片数据分析笔记[03] | GEO数据库使用教程及在线数据分析工具 芯片数据分析笔记[04] | Arra ...

  8. GEO数据库学习一(简介 数据下载 芯片知识)

    目录 1.GEO数据库简介 2.从GEO数据库下载数据 2.1使用GEOquery包从GEO数据库下载数据 2.2了解下载函数返回的对象 2.3ExpressionSet对象简单讲解 3.芯片基础知识 ...

  9. CNV学习2(illumina芯片分析CNV的主流软件------PennCNV)

    PennCNV官网:https://penncnv.openbioinformatics.org/en/latest/ PennCNV软件的文献: DOI: 10.1101/gr.6861907 本次 ...

最新文章

  1. hadoop mac和linux,How to Install Hadoop? (On Mac OS,Linux or Cygwin on Windows)
  2. linux里打包和压缩文件,linux ---打包和压缩文件
  3. 博途v15安装过程中提示出错_博途V15.1安装及无限重启和.net3.5SP1错误处理解决方法...
  4. Android Http请求框架二:xUtils 框架网络请求
  5. 机器学习面试题(part5)
  6. oracle连接外部数据库_使用Oracle验证外部数据
  7. pandas打印全部列_python——pandas练习题1-5
  8. 大并发下程序出错_Python并发编程理论篇
  9. 一款无需写任何代码即可一键生成前后端代码的开源工具
  10. 编码技术新突破:字节跳动AVG让视频缩小13%
  11. python能做什么软件-一篇告诉你为什么人人都应该学点Python?
  12. 分享AceAdminUI后台框架-你喜欢吗?
  13. 微信小程序项目实例——图片处理小工具(自制低配版美图秀秀)
  14. LoRa网关与服务器通信——MQTT
  15. C# Abp框架入门系列文章(一)
  16. 计算机图形学:DDA(数值微分)画线法
  17. The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals
  18. java数组转换成单链表_【转】单向链表(单链表)的Java实现
  19. nginx 404及5xx页面配置
  20. 通俗解释机器学习中的召回率、精确率、准确率

热门文章

  1. JDK11安装-macos
  2. 搭建SpringBoot+Vue 项目 完整流程
  3. 记录:macbook 下剪切快捷键
  4. F函数的极大极大算法
  5. 20181212股票早盘
  6. 如何给自己的网站添加 gitalk 评论系统
  7. python计算量比指标
  8. GeoServer入门学习:04-发布Shapfile地图数据
  9. 域名1元价,我也来注册一个
  10. 《C语言》爱心代码,送给心爱之人