STAR: ultrafast universal RNA-seq aligner STAR:超快的通用RNA-seq比对器
STAR:超快的通用RNA-seq比对器
动机:因为不连续的转录本结构,相对短的片段长度,和测序技术持续增加的通量,高通量RNA-seq数据的准确比对是一个有挑战性且仍未解决的问题。当前可用的RNA-seq比对器遭受高比对错误率,低比对速度,片段长度限制和比对偏差。结果:为了比对我们的大量(> 800亿片段)ENCODE转录组RNA-seq数据集,我们基于一种以前未描述的RNA-seq比对算法开发了STAR(Spliced Transcripts Alignments to a Reference,STAR)软件,该算法使用了未压缩后缀阵列中的连续最大可比对种子搜索,接着种子聚类和缝合过程。STAR在比对速度上胜过其他比对器50多倍,在一个普通的12核服务器上,每小时比对5.5亿2 x 76 bp双端片段到人类基因组上,同时改进了比对敏感性和准确性。除了典型剪接的非偏从头检测外,STAR能够发现非典型拼接和嵌合(融合)转录本,并能够比对全长RNA序列。使用逆转录聚合酶链式反应扩增子的罗氏454测序,我们实验上验证了1960个新的基因间剪接点,具有80-90%的准确率,证实了STAR比对策略的高准确性。可用性和实现:STAR被实现为一个单机C++代码。STAR是在GPLv3许可证下发布的免费开源软件,能够从https://github.com/alexdobin/STAR/下载。
STAR: ultrafast universal RNA-seq aligner
Dobin Alexander Davis Carrie A Schlesinger Felix Drenkow Jorg Zaleski Chris
MOTIVATION: Accurate alignment of high-throughput RNA-seq data is a challenging and yet unsolved problem because of the non-contiguous transcript structure, relatively short read lengths and constantly increasing throughput of the sequencing technologies. Currently available RNA-seq aligners suffer from high mapping error rates, low mapping speed, read length limitation and mapping biases. RESULTS: To align our large (>80 billon reads) ENCODE Transcriptome RNA-seq dataset, we developed the Spliced Transcripts Alignment to a Reference (STAR) software based on a previously undescribed RNA-seq alignment algorithm that uses sequential maximum mappable seed search in uncompressed suffix arrays followed by seed clustering and stitching procedure. STAR outperforms other aligners by a factor of >50 in mapping speed, aligning to the human genome 550 million 2 × 76 bp paired-end reads per hour on a modest 12-core server, while at the same time improving alignment sensitivity and precision. In addition to unbiased de novo detection of canonical junctions, STAR can discover non-canonical splices and chimeric (fusion) transcripts, and is also capable of mapping full-length RNA sequences. Using Roche 454 sequencing of reverse transcription polymerase chain reaction amplicons, we experimentally validated 1960 novel intergenic splice junctions with an 80-90% success rate, corroborating the high precision of the STAR mapping strategy. AVAILABILITY AND IMPLEMENTATION: STAR is implemented as a standalone C++ code. STAR is free open source software distributed under GPLv3 license and can be downloaded from http://code.google.com/p/rna-star/.
STAR: ultrafast universal RNA-seq aligner STAR:超快的通用RNA-seq比对器相关推荐
- STC用PCA测量脉宽_超快激光脉冲测量和诊断使用自相关仪
近几年,随着激光技术飞速发展,超快激光因具备独特的超短脉冲.超强特性,成为了目前最为先进的激光技术.超快激光器以皮秒.飞秒激器为代表,主要应用于非线性光学.超快动力学.激光光谱.新型显示.生物医疗.3 ...
- AAAI2020/风格迁移:Ultrafast Photorealistic Style Transfer via Neural Architecture基于神经结构搜索的超快逼真风格转移
AAAI2020/风格迁移:Ultrafast Photorealistic Style Transfer via Neural Architecture基于神经结构搜索的超快逼真风格转移 0.摘要 ...
- A Leaky Integrate-and-Fire Laser Neuron for Ultrafast Cognitive Computing 用于超快认知计算的LIF激光神经元
Abstract 摘要 We propose an original design for a neuron-inspired(神经元) photonic(光子) computational prim ...
- 捕捉不可控iframe的close事件_湖南大学王建锋团队:光/湿驱动的超快可逆可控致动器...
致动器是将外部刺激(磁场.温度.湿度.光等)转化为机械运动的智能材料系统,可用于电子皮肤,仿生机器人,人造肌肉等领域.传统非对称双层结构致动器面临着响应速度慢.变形单一和变形方向不可控的问题. 湖南大 ...
- 水凝胶 静电纺丝_【再生医学前沿】Nature子刊:静电纺丝玩出新花样!静电射流偏转的超快3D打印亚微米结构...
[EFL观点]静电纺丝纳米纤维有力地推动了纳米材料的发展,但静电纺丝的缺点是无序,难以获得可控结构.本期的西班牙团队通过射流外施加电场,在静电纺丝的基础上实现了微纳结构的超快打印. 传统的3D打印技术 ...
- 2022年全球与中国超快激光器市场现状及未来发展趋势
2022-2028全球与中国超快激光器市场现状及未来发展趋势 根据QYR(恒州博智)的统计及预测,2021年全球超快激光器市场销售额达到了7.9亿美元,预计2028年将达到16亿美元,年复合增长率(C ...
- ECCV2020|超快的车道线检测,代码模型已开源
作者|cfzd 来源|https://zhuanlan.zhihu.com/p/157530787 很高兴和大家分享一下我们刚刚被 ECCV 2020 接收的新工作:一种超快速的车道线检测算法(Ult ...
- WebMGA:超快的基因组序列聚类注释在线工具
文章目录 超快的基因组序列聚类注释在线工具WebMGA 序列聚类cd-hit 基因预测ORF prediction 蛋白COG注释 作者简介 参考文献 猜你喜欢 写在后面 超快的基因组序列聚类注释在线 ...
- 三代测序数据超快组装软件--大牛Li heng 力作
三代测序数据超快组装软件--大牛Li heng 力作 (2017-06-19 16:53:46) 转载▼ 分类: 三代 1:软件链接:https://github.com/lh3/miniasm ...
最新文章
- UVa 10652 (简单凸包) Board Wrapping
- Android Studio 单刷《第一行代码》系列 01 —— 第一战 HelloWorld
- 打包镜像并同时压缩多个镜像
- 前端翻译:Activating Browser Modes with Doctype
- AC自动机(python)
- 95-862-040-源码-runtime-blob-BlobStore
- java hibernate 插入数据_hibernate 批量插入数据
- python在线diff工具在哪_使用Python创建你自己的diff-tool
- 基于AI的恶意软件分析技术(3)
- wordpress电商独立站模板
- Kindle 文言文 古汉语 字典
- Overlaps的压盖计数规则
- 至于你信不信,反正我信了
- 方法重载在同一个类中,方法名相同,参数不同,可以定义多个同名的方法根据不同的参数,可以调用不同的方法
- 关于计算机的英语小品,英文好玩简短的小品
- 人类一败涂地做图教程_人类一败涂地地图制作教程 创意工坊自制地图方法
- 1024程序员节,带你解锁过节新方式
- 如何用计算机放音乐,教你如何用iPhone远程遥控电脑播放音乐教程
- WAP 2.0 VS WEB 2.0
- bs4的BeautifulSoup使用
热门文章
- 计算机书籍-医学图像数据可视化分析与处理
- 用于点云视频时空建模的点4D transformer网络(CVPR 2021)
- 基于ceres的后端优化的代码实现
- 马斯克活猪脑机接口试验成功!多芯片植入,硬币大小,实时读取脑电波,已被批准人脑实验...
- Linux错误代码15872,Linux运维常用命令
- 如何安装rabbitmq
- 基于RDKit的溶解度预测的机器学习模型
- 第二十六课.深度强化学习(一)
- 生信服务器 | 更改 CentOS/RHEL 6/7 中的时区
- 漫画:什么是公有云、私有云和混合云?