[E::fai_build_core] Different line length in sequence ‘kraken:taxid|436|NZ_CP062147.1‘
ERROR record:
下载了所有细菌fna后,整合成一整个fna文件,大小99G.
samtools faidx library.fna
error:[E::fai_build_core] Different line length in sequence 'kraken:taxid|436|NZ_CP062147.1'
Did you take a look at that sequence in question? It may be just a
case of a broken fasta record.
The error looks pretty clear - Your sequences may be of unequal length in different lines. Why an indexer does not auto-normalize (or at least provide an option for it),
picard NormalizeFasta --INPUT 1.fa --OUTPUT normalized.fa
得到的结果依然无法够建索引
seqkit seq -w 70 s.fa > s2.fa
只是把fa的序列行的每一行碱基数目调整,对错误序列部分无改正效果
error sequence 所在 row 250946642
总row 1497262490
查看 250946642 后50000行 找到错误行
sed -n '250946642,250996642'p normalized_library.fa > index.error.50000
kraken:taxid|436|NZ_CP062147.1’的末尾出现了新的seq
44099 CTCCGCCCCATCCGGCCCCGCCACACGGAGCTGCCCCGCCGCGTCCCAGCCCAGCCAGCGATGCC>krak
44100 en:taxid|1513|NZ_CP035785.1 Clostridium tetani strain Harvard 49205 ch
44101 romosomeNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
44102 NNNNNNNNNNNNNNNNNNNNNCAACAACGTATTTCATTTTAACACATTTAAATTTACCTATTGAGTATTA
grep '[A-Z]>' normalized_library.fa
找出有多少行fa出了错
CTCCGCCCCATCCGGCCCCGCCACACGGAGCTGCCCCGCCGCGTCCCAGCCCAGCCAGCGATGCC>krak
TTATGTGGGATTAAACTTGAAATTTCATT>kraken:taxid|290847|NC_017382.1 Helicoba
查看真正错误所在行:grep -n 'CC>krak' normalized_library.fa
250990740:CTCCGCCCCATCCGGCCCCGCCACACGGAGCTGCCCCGCCGCGTCCCAGCCCAGCCAGCGATGCC>kra
659005136:TTATGTGGGATTAAACTTGAAATTTCATT>kraken:taxid|290847|NC_017382.1 Helicoba
先删除那部分试试
sed ‘row1d;row2d’ .fa > .fa
[E::fai_build_core] Different line length in sequence ‘kraken:taxid|436|NZ_CP062147.1‘相关推荐
- fatal: protocol error: bad line length character: No s原因
在向配置gitlab的服务器进行git push 出现以下错误 fatal: protocol error: bad line length character: No s 出现的原因是这个当前用户不 ...
- git更新项目失败报错 protocol error: bad line length character: Acti
在idea更新git上的项目到本地时提示如下报错: 11:33 Fetch failed protocol error: bad line length characte ...
- Vue 关于ESLint语法规范报错:Line 10 exceeds the maximum line length of 100
ESLint语法报错 最近在使用vue-cli4创建项目,在项目编译时,报出来了一些语法错误; 因为我使用的是bootstrap组件,所以在一行引用时报出来: Line 10 exceeds the ...
- phpstorm 用git pull或者 git push报错 protocol error: bad line length character: Acti
首先排除是ssh的key的配置问题,因为用git本身可以正常pull和push 解决方案: 在phpstorm中配置git 选择SSH executable 从 Built-in 改为 Native ...
- git push报错 protocol error: bad line length character: Acti
idea配置git 选择SSH executable 从 Built-in 改为 Native 重启idea即可
- Sequence Model-week1编程题3-用LSTM网络生成爵士乐
Improvise a Jazz Solo with an LSTM Network 实现使用LSTM生成音乐的模型,你可以在结束时听你自己的音乐,接下来你将会学习到: 使用LSTM生成音乐 使用深度 ...
- Sequence Model-week1编程题3(用LSTM网络即兴独奏爵士乐)
# Improvise a Jazz Solo with an LSTM Network 实现使用LSTM生成音乐的模型,你可以在结束时听你自己的音乐,接下来你将会学习到: - 使用LSTM生成音乐 ...
- 设计如下类: 1) 建立一个Point类,表示平面中的一个点;建立一个Line类,表示平面中的一条线端, 内含两个Point类的对象;建立Triangle类,表示一个三角形
设计如下类: 1) 建立一个Point类,表示平面中的一个点:建立一个Line类,表示平面中的一条线端, 内含两个Point类的对象:建立Triangle类,表示一个三角形,内含三个L ...
- 序列(SEQUENCE)、同义词(SYNONYM)
--============================================= --SQL基础--> 序列(SEQUENCE).同义词(SYNONYM) --========== ...
最新文章
- linux终端中运行网银盾,Linux下使用Virtualbox安装 Windows 7 操作网银攻略
- Postgresql相关数据库、表占用磁盘大小统计
- (转)SQL操作全集
- 从0搭建一个Springboot+vue前后端分离项目(二)使用idea进行页面搭建+页面搭建
- Ring3下Dll注入方法整理汇总
- php实现金币提现,PHP实现微信提现功能
- 05-图像的平滑处理(不同的滤波操作)
- php的验证码要gd库,PHP通过GD库实现验证码功能
- Stata统计学软件
- 简单快速的UG编程入门操作
- h5 标签video和audio标签的下载按钮
- 你的计算机无法连接到远程计算机,因为远程桌面网关服务器暂时不可用。
- python:游戏倒计时器
- 91 个常见的 Laravel 面试题和答案
- 输入scor为80结果实验
- CS 与 PS 的区别
- ffmpeg入门教程之YUV编码成h264 API详解
- uboot命令之bootm详解
- archlinux下网易云音乐netease-cloud-music部分问题
- 芯片架构RISC-V、X86、ARM三足鼎立
热门文章
- 简析Uber的可伸缩监控:uMonitor和Neris
- Linux echo详解
- 3.5.5 CSMA/CA 协议
- 基于FPGA的几种排序算法总结
- c语言 sizeof length,size()、length ()和sizeof()的区别
- vb链接远程mysql数据库代码_vb链接远程mysql数据库代码
- 一个电子工程师的经验之谈!
- “由于/bin 不在PATH 环境变量中,故无法找到该命令”
- python基础算法-归并排序
- jittor和pytorch生成网络对比之wgan_gp