ERROR record:
下载了所有细菌fna后,整合成一整个fna文件,大小99G.
samtools faidx library.fna

error:[E::fai_build_core] Different line length in sequence 'kraken:taxid|436|NZ_CP062147.1'


google

Did you take a look at that sequence in question? It may be just a
case of a broken fasta record.

The error looks pretty clear - Your sequences may be of unequal length in different lines. Why an indexer does not auto-normalize (or at least provide an option for it),

picard NormalizeFasta --INPUT 1.fa --OUTPUT normalized.fa得到的结果依然无法够建索引
seqkit seq -w 70 s.fa > s2.fa只是把fa的序列行的每一行碱基数目调整,对错误序列部分无改正效果


error sequence 所在 row 250946642
总row 1497262490

查看 250946642 后50000行 找到错误行
sed -n '250946642,250996642'p normalized_library.fa > index.error.50000

kraken:taxid|436|NZ_CP062147.1’的末尾出现了新的seq

44099 CTCCGCCCCATCCGGCCCCGCCACACGGAGCTGCCCCGCCGCGTCCCAGCCCAGCCAGCGATGCC>krak
44100 en:taxid|1513|NZ_CP035785.1 Clostridium tetani strain Harvard 49205 ch
44101 romosomeNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
44102 NNNNNNNNNNNNNNNNNNNNNCAACAACGTATTTCATTTTAACACATTTAAATTTACCTATTGAGTATTA

grep '[A-Z]>' normalized_library.fa找出有多少行fa出了错

CTCCGCCCCATCCGGCCCCGCCACACGGAGCTGCCCCGCCGCGTCCCAGCCCAGCCAGCGATGCC>krak
TTATGTGGGATTAAACTTGAAATTTCATT>kraken:taxid|290847|NC_017382.1 Helicoba

查看真正错误所在行:grep -n 'CC>krak' normalized_library.fa

250990740:CTCCGCCCCATCCGGCCCCGCCACACGGAGCTGCCCCGCCGCGTCCCAGCCCAGCCAGCGATGCC>kra
659005136:TTATGTGGGATTAAACTTGAAATTTCATT>kraken:taxid|290847|NC_017382.1 Helicoba

先删除那部分试试
sed ‘row1d;row2d’ .fa > .fa

[E::fai_build_core] Different line length in sequence ‘kraken:taxid|436|NZ_CP062147.1‘相关推荐

  1. fatal: protocol error: bad line length character: No s原因

    在向配置gitlab的服务器进行git push 出现以下错误 fatal: protocol error: bad line length character: No s 出现的原因是这个当前用户不 ...

  2. git更新项目失败报错 protocol error: bad line length character: Acti

    在idea更新git上的项目到本地时提示如下报错: 11:33    Fetch failed             protocol error: bad line length characte ...

  3. Vue 关于ESLint语法规范报错:Line 10 exceeds the maximum line length of 100

    ESLint语法报错 最近在使用vue-cli4创建项目,在项目编译时,报出来了一些语法错误; 因为我使用的是bootstrap组件,所以在一行引用时报出来: Line 10 exceeds the ...

  4. phpstorm 用git pull或者 git push报错 protocol error: bad line length character: Acti

    首先排除是ssh的key的配置问题,因为用git本身可以正常pull和push 解决方案: 在phpstorm中配置git 选择SSH executable 从 Built-in 改为 Native ...

  5. git push报错 protocol error: bad line length character: Acti

    idea配置git 选择SSH executable 从 Built-in 改为 Native 重启idea即可

  6. Sequence Model-week1编程题3-用LSTM网络生成爵士乐

    Improvise a Jazz Solo with an LSTM Network 实现使用LSTM生成音乐的模型,你可以在结束时听你自己的音乐,接下来你将会学习到: 使用LSTM生成音乐 使用深度 ...

  7. Sequence Model-week1编程题3(用LSTM网络即兴独奏爵士乐)

    # Improvise a Jazz Solo with an LSTM Network 实现使用LSTM生成音乐的模型,你可以在结束时听你自己的音乐,接下来你将会学习到: - 使用LSTM生成音乐 ...

  8. 设计如下类: 1) 建立一个Point类,表示平面中的一个点;建立一个Line类,表示平面中的一条线端, 内含两个Point类的对象;建立Triangle类,表示一个三角形

    设计如下类:     1) 建立一个Point类,表示平面中的一个点:建立一个Line类,表示平面中的一条线端,     内含两个Point类的对象:建立Triangle类,表示一个三角形,内含三个L ...

  9. 序列(SEQUENCE)、同义词(SYNONYM)

    --============================================= --SQL基础--> 序列(SEQUENCE).同义词(SYNONYM) --========== ...

最新文章

  1. linux终端中运行网银盾,Linux下使用Virtualbox安装 Windows 7 操作网银攻略
  2. Postgresql相关数据库、表占用磁盘大小统计
  3. (转)SQL操作全集
  4. 从0搭建一个Springboot+vue前后端分离项目(二)使用idea进行页面搭建+页面搭建
  5. Ring3下Dll注入方法整理汇总
  6. php实现金币提现,PHP实现微信提现功能
  7. 05-图像的平滑处理(不同的滤波操作)
  8. php的验证码要gd库,PHP通过GD库实现验证码功能
  9. Stata统计学软件
  10. 简单快速的UG编程入门操作
  11. h5 标签video和audio标签的下载按钮
  12. 你的计算机无法连接到远程计算机,因为远程桌面网关服务器暂时不可用。
  13. python:游戏倒计时器
  14. 91 个常见的 Laravel 面试题和答案
  15. 输入scor为80结果实验
  16. CS 与 PS 的区别
  17. ffmpeg入门教程之YUV编码成h264 API详解
  18. uboot命令之bootm详解
  19. archlinux下网易云音乐netease-cloud-music部分问题
  20. 芯片架构RISC-V、X86、ARM三足鼎立

热门文章

  1. 简析Uber的可伸缩监控:uMonitor和Neris
  2. Linux echo详解
  3. 3.5.5 CSMA/CA 协议
  4. 基于FPGA的几种排序算法总结
  5. c语言 sizeof length,size()、length ()和sizeof()的区别
  6. vb链接远程mysql数据库代码_vb链接远程mysql数据库代码
  7. 一个电子工程师的经验之谈!
  8. “由于/bin 不在PATH 环境变量中,故无法找到该命令”
  9. python基础算法-归并排序
  10. jittor和pytorch生成网络对比之wgan_gp