个人比较熟悉FASTA 或者FASTQ文件格式,PacBio 测序得到的数据以hdf5格式存储,在应用过程中如果需要输入相应的fasta 或者fastq格式,需要格式转换。

格式转化工具推荐:Pacbio: extract fastq from h5 file based on quality filtering

我选用的是: dextractor

dextractor 是用c实现的,编译过程依赖hdf5库,需要先安装hdf5库。

第一步:编译安装hdf5库。

hdf5库的下载:HDF5 Source Code

编译安装hdf5的教程在目录 release_docs/中,参数默认,只需要设置安装路径(非root用户)

Instructions for building HDF5 can be found in the release_docs/ directory in the source code.

第二步:编译安装dextractor

git clone git@github.com:thegenemyers/DEXTRACTOR.git

修改Makefile 中hdf5的路径为第一步中hdf5安装的位置。

make 编译可能会出错,GitHub issue中有提到,需要把代码中 DB_CSS 修改为DB_CCS,编译通过。

第三步:运行dextract

给出个example, 详细参数见GitHub README.

./dextract -v input.bax.h5

PacBio hdf5 格式 向 FASTA格式转换相关推荐

  1. 基因组序列genbank格式和fasta格式批量下载

    from Bio import Entrez,SeqIO import csv# 参数设置 Entrez.email = "example@163.com" Entrez.tool ...

  2. .seq格式转为.fasta格式

    #1.让连续的文件每60个字符换行 for ((i=1; i<500; i=60+"$i")); do j=$(expr 59 + "$i" ); cut ...

  3. 生物信息数据格式:fasta格式

    文章目录 格式说明 查看fasta 实例演练 读取fasta文件,并打印 把每条FASTA序列连成一行然后输出 把每条FASTA序列按一定长度输出 提取fasta.name中名字对应的test2.fa ...

  4. linux系统fasta程序,fasta格式文件处理大全(一)

    前面我们介绍了fastq格式文件的处理,大概有20多个案例,掌握了这些案例,后面拿到fastq格式之后就可以根据需求,使用合适的软件工具进行处理了,从这次内容开始,我们将逐渐介绍fasta格式文件的处 ...

  5. 常用生物信息学格式介绍(fasta、fastq、gff2、gtf(gff2.5)、gff3、bed、sam、bam、vcf)

    前言 在各个行业都是有行业标准的,这样才能统一规范而方便后面的分析,在生物信息学领域中主要是各种大量序列数据.注释数据等,这些都是有特定的格式去表示,下面列举几种常见的格式.了解这些是进行后续生物信息 ...

  6. bam格式转换为Fastq/Fasta格式

    bam格式转换为Fastq/Fasta格式 Samtools Fastq GATK SamToFastq Bedtools bamtofastq 举例说明,比如说我们现在有一个转录组比对文件D1_D1 ...

  7. YUV视频格式到RGB32格式转换的速度优化 上篇(转)

    YUV视频格式到RGB32格式转换的速度优化 上篇                     HouSisong@GMail.com    2007.10.30   tag: YUV,YCbCr,YUV ...

  8. Linux下时间戳格式和标准时间格式的转换

    转载地址:http://yinqingsong520.blog.163.com/blog/static/392100201010252595916/  做个备忘! 在LINUX系统中,有许多场合都使用 ...

  9. python文件写入字典格式输出_Python把对应格式的csv文件转换成字典类型存储脚本的方法...

    该脚本是为了结合之前的编写的脚本,来实现数据的比对模块,实现数据的自动化!由于数据格式是定死的,该代码只做参考,有什么问题可以私信我! CSV的数据格式截图如下: readDataToDic.py源代 ...

最新文章

  1. 分享一些好用的 Chrome 插件!
  2. 单模光电转换器怎么接_行业观察 | 硅基光电子与微电子单片集成研究进展
  3. 【转】Docker —— 从入门到实践
  4. jenkins自动化打包部署
  5. linux rsa登录改密码登录_LINUX中RSA认证登录SSH(不需要输入密码登录)2种方法
  6. 包含服务器数据库的聊天系统,聊天服务器数据库
  7. cass简码大全_Cass简码成图
  8. 网站头像: favicon.ico
  9. dB、dBFS、dBV、dBu...都是啥啊..
  10. w ndows摄像头驱动怎么安,如何安装摄像头驱动?求安装步骤和方法!!!
  11. 这 26个 Python 技巧,你肯定还不知道!
  12. 小米智能插排内部结构
  13. android开发者mac(含M1芯片)电脑全新配置2022
  14. StoryDALL-E复现(基于预训练文本到图像Transformer的故事续编)
  15. mysql 查询数据库ip_如何查看连接MYSQL数据库的IP信息
  16. 虚拟服务器端口211,双路由器要这样映射-路由器设置端口映射
  17. Kerberos在linux安装部署
  18. 《网络基础》课程综合性实验(pkt文件请见我的资源)
  19. AI治退“七天无理由退换货”
  20. Java媒体框架(JMF),个人很欣赏.... (转)

热门文章

  1. 力扣—— 19. 删除链表的倒数第 N 个结点(java)、剑指 Offer 22. 链表中倒数第k个节点(java)
  2. sigmaster解码播放
  3. 人物渲染篇(一) —— 基础卡通渲染 上
  4. WebHtmlEditor Version 1.5.2004.729 Beta1 发布测试
  5. Linux-新用户创建和删除
  6. 由113号元素鉨114号元素夫115号元素镆元素汞银金等元素构成的超导体
  7. 《GEB-EGB》-人工智能
  8. IT 路,梦里思路长。
  9. 这次把怎么做好一个PPT讲清-动画篇
  10. 计算机常见的应用系统,计算机常见的系统软件