测序数据的处理方法及装置制造方法及图纸

技术编号:19389025阅读:109留言:0更新日期:2018-11-10 02:04

本发明专利技术公开了一种测序数据的处理方法及装置。其中,该方法包括:拆分三代测序数据,得到至少一个子测序数据;将任意一个子测序数据比对到对应的参考基因组,得到任意一个子测序数据对应的比对结果;合并得到的所有比对结果,得到合并结果。本发明专利技术解决了现有技术中进行基因组的组装过程中,需要使用大量资源和时间完成基因组比对,导致比对速度慢、效率低的技术问题。

Processing method and device for sequencing data

The invention discloses a processing method and device for sequencing data. Among them, the method includes: splitting three generations of sequencing data to get at least one sub-sequencing data; comparing any sub-sequencing data to the corresponding reference genome to get the corresponding results of any sub-sequencing data; and combining all the results to get the combined results. The invention solves the technical problem that in the process of genome assembly in the prior art, a large amount of resources and time are needed to complete genome alignment, resulting in a slow speed and low efficiency of the alignment.

全部详细技术资料下载

【技术实现步骤摘要】
测序数据的处理方法及装置
本专利技术涉及生物信息
,具体而言,涉及一种测序数据的处理方法及装置。
技术介绍
随着高通量测序技术的普及,越来越多的物种的基因组图谱被破解,然而受困于二代测序长度较短或者三代测序基因错误率高的原因,目前通过高通量测序技术得到的基因组一般是处于草图的水平,一般是由几千到几万个scaffold序列组成的。目前基于三代PacBio测序数据连接scaffold的常用软件为SSPACE-LongRead

它首先用blasr软件将所有reads比对到基因组,得到所有reads跟基因组草图scaffolds的比对结果。

然后挑选出能同时比对到多个scaffolds的reads比对结果,然后这些三代测序reads在所对应的scaffolds的比对位置和比对方向,将两个或者多个scaffold连接成一个长序列。

由于blasr软件比对速度慢、内存占用大,导致SSPACE-LongRead连接scaffold需要大量的计算资源和CPU运行时间。许多大基因组,三代测序数据大于100G,比对需要数周时间。此外,blasr只通过设置cpu来提高并行计算的能力,该多线程并行的能力受限于单个节点的总cpu数目。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种测序数据的处理方法及装置,以至少解决现有技术中进行基因组的组装过程中,需要使用大量资源和时间完成基因组比对,导致比对速度慢、效率低的技术问题。根据本专利技术实施例的一个方面,提供了一种测序数据的处理方法,包括:拆分三代测序数据,得到至少一个子测序数据;将任意一个子测序数...

【技术保护点】
1.一种测序数据的处理方法,其特征在于,包括:拆分三代测序数据,得到至少一个子测序数据;将任意一个所述子测序数据比对到参考基因组,得到所述任意一个子测序数据对应的比对结果;合并得到的所有比对结果,得到合并结果。

【技术特征摘要】
1.一种测序数据的处理方法,其特征在于,包括:拆分三代测序数据,得到至少一个子测序数据;将任意一个所述子测序数据比对到参考基因组,得到所述任意一个子测序数据对应的比对结果;合并得到的所有比对结果,得到合并结果。2.根据权利要求1所述的方法,其特征在于,将任意一个子测序数据比对到参考基因组,得到所述任意一个子测序数据对应的比对结果,包括:使用高速比对软件对拆分得到的任意一个子测序数据进行比对;其中,所述比对结果的格式包括如下至少之一:M4格式、paf格式和M1文件格式。3.根据权利要求2所述的方法,其特征在于,将格式为所述M4格式和/或所述paf格式的比对结果转换为所述M1文件格式,并整合每个比对结果。4.根据权利要求1至3中任意一项所述的方法,其特征在于,在合并得到的所有比对结果,得到合并结果之后,所述方法还包括:从所述合并结果中提取比对到至少两个contig的比对结果;根据所述比对结果确定所述contig在Pacbioread上的方向,并计算具有连接关系的两个contig之间的gap距离。5.根据权利要求4所述的方法,其特征在于,在根据所述比对结果确定所述contig在Pacbioread上的方向,并计算所述具有连接关系的两个contig之间的gap距离之后,所述方法还包括:根据所述contig在Pacbioread上的方向以及所述具有连接关系的两个contig之间的gap距离,从最大的contig开始连接scaffold,得到测序基因组。6.根据权利要求1所述的方法,其特征在于,拆分得到每个所述子测序数据均为相同大小的fa...

测序数据的处理方法及装置制造方法及图纸相关推荐

  1. 基于块的纹理合成 matlab程序,基于块的纹理合成方法和装置制造方法

    基于块的纹理合成方法和装置制造方法 [专利摘要]本发明公开了一种基于块的纹理合成方法和装置.其中,该方法包括:查找候选纹理块集合中的每个候选纹理块与在目标纹理图中已合成纹理块的重叠区:将已合成纹理块中 ...

  2. 光眼图和电眼图_一种电眼调试方法及装置制造方法及图纸

    [技术实现步骤摘要] 本专利技术涉及相干光通讯领域,特别是涉及一种电眼调试方法及装置. 技术介绍 目前,在主流相干光通信技术中,主要是将发送数据预编码后,复合成XI.XQ.YI和YQ四通道高速电信号, ...

  3. python语言高空坠球_高空坠物打击体验装置制造方法

    高空坠物打击体验装置制造方法 [专利摘要]本实用新型涉及一种高空坠物打击体验装置,包括:模拟杆塔,内部设有上下方向传输的链条,链条连接有滑动导轨,滑动导轨上连接有运球凹槽:模拟横担,其一端连接在模拟杆 ...

  4. java鱼眼相机标定_鱼眼相机标定方法及标定装置制造方法

    鱼眼相机标定方法及标定装置制造方法 [专利摘要]本发明公开了一种鱼眼相机标定方法及标定装置,包括:建立所述鱼眼相机的成像模型:从不同视角采集多幅标定板图像,在所述标定板图像上获取特征点的坐标,参考所述 ...

  5. 教学计算机示教,一种计算机示教键盘联控装置制造方法

    一种计算机示教键盘联控装置制造方法 [专利摘要]一种计算机示教键盘联控装置,由一个上位机和数个下位机组成,上位机包括上位主机.上位显示器和上位键盘,下位机包括下位主机.显示器和键盘,下位机的显示器同时 ...

  6. 公司内服务器微信报警怎么做,一种用企业微信实现信息报警的装置制造方法及图纸...

    [技术实现步骤摘要] 一种用企业微信实现信息报警的装置 本专利技术涉及远程报警 ,特别是涉及一种用企业微信实现信息报警的装置. 技术介绍 目前市场上的各种报警器,有一种是用电话或手机短信实现报警,这种 ...

  7. 基于三代测序数据的结构变异检测,PBHoney方法解读

    本文来自"生信算法"公众号. 基因变异普遍存在于同一物种内的不同个体中,如人与人之间的基因组是不完全一样的(即是多态的),彼此之间都存在着一些差异,即使是和父母或是兄弟姐妹之间去比 ...

  8. 计算机排线知识,一种计算机排线梳理装置制造方法及图纸

    [技术实现步骤摘要] 一种计算机排线梳理装置 本技术涉及计算机排线梳理 ,具体涉及一种计算机排线梳理装置. 技术介绍 计算机俗称电脑,是现代一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行 ...

  9. 计算机2级u盘作弊,一种带LED指示灯的计算机考试防U盘作弊装置制造方法及图纸...

    [技术实现步骤摘要] 一种带LED指示灯的计算机考试防U盘作弊装置本申请是申请日为2016年4月1日,申请号为2016102009851,专利技术名称为"一种防U盘舞弊的计算机考试装置&qu ...

最新文章

  1. linux的逻辑运算参数,Linux基础之bash脚本编程初级-逻辑运算与测试
  2. scrapy基础知识之 parse()方法的工作机制思考:
  3. 日志组件logback介绍及配置使用方法
  4. android requestpermissions参数,Android M Permissions:onRequestPermissionsResult()未被调用
  5. 世界定级 企业即时通讯软件
  6. [BZOJ1798][AHOI2009]Seq维护序列 线段树
  7. Bzoj1899: [Zjoi2004]Lunch 午餐
  8. 特斯拉自动驾驶遭遇中国性价比强敌!纽劢(mài)L3方案发布,成本1万3
  9. cts测试的一些总结
  10. MySQL不应出现的开始声明_备考:2019年9月计算机二级MySQL试题
  11. awk --- 常用技巧
  12. Android HttpURLConnection 获取下载文件大小
  13. 信捷PLC远程上下载程序,远程控制
  14. 页面置换算法之 LRU算法
  15. 网页轮播图(详细版)
  16. 脱粉之后,华为的喜忧参半
  17. c语言语法要素,第6章DSP_C语言程序设计要素.ppt
  18. 医院管理信息系统与临床信息系统
  19. vue获取麦克风_微信小程序实现录音时的麦克风动画效果实例
  20. CVPR 2021 | 真内卷!Involution:构建新一代视觉识别网络

热门文章

  1. 想象中的论文答辩和真实的论文答辩!哈哈哈哈哈哈……
  2. 语义SLAM开源代码汇总
  3. 多传感器融合 | R-LINS概述
  4. 物体的三维识别与6D位姿估计:PPF系列论文介绍(五)
  5. [SLAM] a bite of SLAM
  6. java oauth sso 源码_基于Spring Security Oauth2的SSO单点登录+JWT权限控制实践
  7. java读取txt文件中的内容
  8. 松本行弘:我的编程人生
  9. 指定模块打包命令_大前端进阶之Babel、模块化、webpack
  10. Linux 下 PostgreSQL 源码编译安装