STAR:超快的通用RNA-seq比对器

动机:因为不连续的转录本结构,相对短的片段长度,和测序技术持续增加的通量,高通量RNA-seq数据的准确比对是一个有挑战性且仍未解决的问题。当前可用的RNA-seq比对器遭受高比对错误率,低比对速度,片段长度限制和比对偏差。结果:为了比对我们的大量(> 800亿片段)ENCODE转录组RNA-seq数据集,我们基于一种以前未描述的RNA-seq比对算法开发了STAR(Spliced Transcripts Alignments to a Reference,STAR)软件,该算法使用了未压缩后缀阵列中的连续最大可比对种子搜索,接着种子聚类和缝合过程。STAR在比对速度上胜过其他比对器50多倍,在一个普通的12核服务器上,每小时比对5.5亿2 x 76 bp双端片段到人类基因组上,同时改进了比对敏感性和准确性。除了典型剪接的非偏从头检测外,STAR能够发现非典型拼接和嵌合(融合)转录本,并能够比对全长RNA序列。使用逆转录聚合酶链式反应扩增子的罗氏454测序,我们实验上验证了1960个新的基因间剪接点,具有80-90%的准确率,证实了STAR比对策略的高准确性。可用性和实现:STAR被实现为一个单机C++代码。STAR是在GPLv3许可证下发布的免费开源软件,能够从https://github.com/alexdobin/STAR/下载。

STAR: ultrafast universal RNA-seq aligner

Dobin Alexander   Davis Carrie A   Schlesinger Felix   Drenkow Jorg   Zaleski Chris

MOTIVATION: Accurate alignment of high-throughput RNA-seq data is a challenging and yet unsolved problem because of the non-contiguous transcript structure, relatively short read lengths and constantly increasing throughput of the sequencing technologies. Currently available RNA-seq aligners suffer from high mapping error rates, low mapping speed, read length limitation and mapping biases. RESULTS: To align our large (>80 billon reads) ENCODE Transcriptome RNA-seq dataset, we developed the Spliced Transcripts Alignment to a Reference (STAR) software based on a previously undescribed RNA-seq alignment algorithm that uses sequential maximum mappable seed search in uncompressed suffix arrays followed by seed clustering and stitching procedure. STAR outperforms other aligners by a factor of >50 in mapping speed, aligning to the human genome 550 million 2 × 76 bp paired-end reads per hour on a modest 12-core server, while at the same time improving alignment sensitivity and precision. In addition to unbiased de novo detection of canonical junctions, STAR can discover non-canonical splices and chimeric (fusion) transcripts, and is also capable of mapping full-length RNA sequences. Using Roche 454 sequencing of reverse transcription polymerase chain reaction amplicons, we experimentally validated 1960 novel intergenic splice junctions with an 80-90% success rate, corroborating the high precision of the STAR mapping strategy. AVAILABILITY AND IMPLEMENTATION: STAR is implemented as a standalone C++ code. STAR is free open source software distributed under GPLv3 license and can be downloaded from http://code.google.com/p/rna-star/.

STAR: ultrafast universal RNA-seq aligner STAR:超快的通用RNA-seq比对器相关推荐

  1. STC用PCA测量脉宽_超快激光脉冲测量和诊断使用自相关仪

    近几年,随着激光技术飞速发展,超快激光因具备独特的超短脉冲.超强特性,成为了目前最为先进的激光技术.超快激光器以皮秒.飞秒激器为代表,主要应用于非线性光学.超快动力学.激光光谱.新型显示.生物医疗.3 ...

  2. AAAI2020/风格迁移:Ultrafast Photorealistic Style Transfer via Neural Architecture基于神经结构搜索的超快逼真风格转移

    AAAI2020/风格迁移:Ultrafast Photorealistic Style Transfer via Neural Architecture基于神经结构搜索的超快逼真风格转移 0.摘要 ...

  3. A Leaky Integrate-and-Fire Laser Neuron for Ultrafast Cognitive Computing 用于超快认知计算的LIF激光神经元

    Abstract 摘要 We propose an original design for a neuron-inspired(神经元) photonic(光子) computational prim ...

  4. 捕捉不可控iframe的close事件_湖南大学王建锋团队:光/湿驱动的超快可逆可控致动器...

    致动器是将外部刺激(磁场.温度.湿度.光等)转化为机械运动的智能材料系统,可用于电子皮肤,仿生机器人,人造肌肉等领域.传统非对称双层结构致动器面临着响应速度慢.变形单一和变形方向不可控的问题. 湖南大 ...

  5. 水凝胶 静电纺丝_【再生医学前沿】Nature子刊:静电纺丝玩出新花样!静电射流偏转的超快3D打印亚微米结构...

    [EFL观点]静电纺丝纳米纤维有力地推动了纳米材料的发展,但静电纺丝的缺点是无序,难以获得可控结构.本期的西班牙团队通过射流外施加电场,在静电纺丝的基础上实现了微纳结构的超快打印. 传统的3D打印技术 ...

  6. 2022年全球与中国超快激光器市场现状及未来发展趋势

    2022-2028全球与中国超快激光器市场现状及未来发展趋势 根据QYR(恒州博智)的统计及预测,2021年全球超快激光器市场销售额达到了7.9亿美元,预计2028年将达到16亿美元,年复合增长率(C ...

  7. ECCV2020|超快的车道线检测,代码模型已开源

    作者|cfzd 来源|https://zhuanlan.zhihu.com/p/157530787 很高兴和大家分享一下我们刚刚被 ECCV 2020 接收的新工作:一种超快速的车道线检测算法(Ult ...

  8. WebMGA:超快的基因组序列聚类注释在线工具

    文章目录 超快的基因组序列聚类注释在线工具WebMGA 序列聚类cd-hit 基因预测ORF prediction 蛋白COG注释 作者简介 参考文献 猜你喜欢 写在后面 超快的基因组序列聚类注释在线 ...

  9. 三代测序数据超快组装软件--大牛Li heng 力作

    三代测序数据超快组装软件--大牛Li heng 力作 (2017-06-19 16:53:46) 转载▼   分类: 三代 1:软件链接:https://github.com/lh3/miniasm ...

最新文章

  1. UVa 10652 (简单凸包) Board Wrapping
  2. Android Studio 单刷《第一行代码》系列 01 —— 第一战 HelloWorld
  3. 打包镜像并同时压缩多个镜像
  4. 前端翻译:Activating Browser Modes with Doctype
  5. AC自动机(python)
  6. 95-862-040-源码-runtime-blob-BlobStore
  7. java hibernate 插入数据_hibernate 批量插入数据
  8. python在线diff工具在哪_使用Python创建你自己的diff-tool
  9. 基于AI的恶意软件分析技术(3)
  10. wordpress电商独立站模板
  11. Kindle 文言文 古汉语 字典
  12. Overlaps的压盖计数规则
  13. 至于你信不信,反正我信了
  14. 方法重载在同一个类中,方法名相同,参数不同,可以定义多个同名的方法根据不同的参数,可以调用不同的方法
  15. 关于计算机的英语小品,英文好玩简短的小品
  16. 人类一败涂地做图教程_人类一败涂地地图制作教程 创意工坊自制地图方法
  17. 1024程序员节,带你解锁过节新方式
  18. 如何用计算机放音乐,教你如何用iPhone远程遥控电脑播放音乐教程
  19. WAP 2.0 VS WEB 2.0
  20. bs4的BeautifulSoup使用

热门文章

  1. 计算机书籍-医学图像数据可视化分析与处理
  2. 用于点云视频时空建模的点4D transformer网络(CVPR 2021)
  3. 基于ceres的后端优化的代码实现
  4. 马斯克活猪脑机接口试验成功!多芯片植入,硬币大小,实时读取脑电波,已被批准人脑实验...
  5. Linux错误代码15872,Linux运维常用命令
  6. 如何安装rabbitmq
  7. 基于RDKit的溶解度预测的机器学习模型
  8. 第二十六课.深度强化学习(一)
  9. 生信服务器 | 更改 CentOS/RHEL 6/7 中的时区
  10. 漫画:什么是公有云、私有云和混合云?