更多代码请见:https://github.com/xubo245

基因数据处理系列

1.解释

由于要生成新的score matrix:blosum50,第一次使用静态方法,直接传给align,到时每次运行都需要进行一次score matrix的计算,而这个是将blosum50的矩阵转换成128*128的矩阵,当计算Q0,即8个字符串的query时,显然时间占比大,本来序列比对时间就不长,所以比sparkSW慢

2.代码:

优化:将静态方法传给静态矩阵,然后再给align方法,这样在类加载的时候静态矩阵就计算好的,多次调用的时候也就只计算了一次,而不需要每次都计算。

DSW: ssw.SSW

3.结果:

2.01611E+16 SparkSW D1Line.fasta    0P18691.file    128 1   5   18.679      /xubo/project/SparkSW/output/time/20161127200906643SparkSW_queryFile_0P18691.file_dbFile_D1Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D1Line.fasta    0P18691.file    128 1   5   18.594      /xubo/project/SparkSW/output/time/20161127200931088SparkSW_queryFile_0P18691.file_dbFile_D1Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D1Line.fasta    0P18691.file    128 1   5   17.815      /xubo/project/SparkSW/output/time/20161127200955742SparkSW_queryFile_0P18691.file_dbFile_D1Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D1Line.fasta    0P18691.file    128 1   5   22.759      /xubo/project/SparkSW/output/time/20161127201019619SparkSWSSW_queryFile_0P18691.file_dbFile_D1Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D1Line.fasta    0P18691.file    128 1   5   22.801      /xubo/project/SparkSW/output/time/20161127201048357SparkSWSSW_queryFile_0P18691.file_dbFile_D1Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D1Line.fasta    0P18691.file    128 1   5   21.942      /xubo/project/SparkSW/output/time/20161127201117262SparkSWSSW_queryFile_0P18691.file_dbFile_D1Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D2Line.fasta    0P18691.file    128 1   5   25.162      /xubo/project/SparkSW/output/time/20161127201145181SparkSW_queryFile_0P18691.file_dbFile_D2Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D2Line.fasta    0P18691.file    128 1   5   24.905      /xubo/project/SparkSW/output/time/20161127201216281SparkSW_queryFile_0P18691.file_dbFile_D2Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D2Line.fasta    0P18691.file    128 1   5   24.998      /xubo/project/SparkSW/output/time/20161127201246764SparkSW_queryFile_0P18691.file_dbFile_D2Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D2Line.fasta    0P18691.file    128 1   5   33.404      /xubo/project/SparkSW/output/time/20161127201317724SparkSWSSW_queryFile_0P18691.file_dbFile_D2Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D2Line.fasta    0P18691.file    128 1   5   33.419      /xubo/project/SparkSW/output/time/20161127201357058SparkSWSSW_queryFile_0P18691.file_dbFile_D2Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D2Line.fasta    0P18691.file    128 1   5   33.071      /xubo/project/SparkSW/output/time/20161127201436498SparkSWSSW_queryFile_0P18691.file_dbFile_D2Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D3Line.fasta    0P18691.file    128 1   5   35.385      /xubo/project/SparkSW/output/time/20161127201515580SparkSW_queryFile_0P18691.file_dbFile_D3Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D3Line.fasta    0P18691.file    128 1   5   35.632      /xubo/project/SparkSW/output/time/20161127201557039SparkSW_queryFile_0P18691.file_dbFile_D3Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D3Line.fasta    0P18691.file    128 1   5   36.336      /xubo/project/SparkSW/output/time/20161127201638723SparkSW_queryFile_0P18691.file_dbFile_D3Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D3Line.fasta    0P18691.file    128 1   5   54.668      /xubo/project/SparkSW/output/time/20161127201720962SparkSWSSW_queryFile_0P18691.file_dbFile_D3Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D3Line.fasta    0P18691.file    128 1   5   54.857      /xubo/project/SparkSW/output/time/20161127201821633SparkSWSSW_queryFile_0P18691.file_dbFile_D3Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D3Line.fasta    0P18691.file    128 1   5   53.338      /xubo/project/SparkSW/output/time/20161127201922460SparkSWSSW_queryFile_0P18691.file_dbFile_D3Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D4Line.fasta    0P18691.file    128 1   5   45.174      /xubo/project/SparkSW/output/time/20161127202021797SparkSW_queryFile_0P18691.file_dbFile_D4Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D4Line.fasta    0P18691.file    128 1   5   42.346      /xubo/project/SparkSW/output/time/20161127202112921SparkSW_queryFile_0P18691.file_dbFile_D4Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D4Line.fasta    0P18691.file    128 1   5   44.676      /xubo/project/SparkSW/output/time/20161127202201329SparkSW_queryFile_0P18691.file_dbFile_D4Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D4Line.fasta    0P18691.file    128 1   5   66.426      /xubo/project/SparkSW/output/time/20161127202252059SparkSWSSW_queryFile_0P18691.file_dbFile_D4Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D4Line.fasta    0P18691.file    128 1   5   69.492      /xubo/project/SparkSW/output/time/20161127202405206SparkSWSSW_queryFile_0P18691.file_dbFile_D4Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D4Line.fasta    0P18691.file    128 1   5   67.195      /xubo/project/SparkSW/output/time/20161127202520291SparkSWSSW_queryFile_0P18691.file_dbFile_D4Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D5Line.fasta    0P18691.file    128 1   5   55.823      /xubo/project/SparkSW/output/time/20161127202633365SparkSW_queryFile_0P18691.file_dbFile_D5Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D5Line.fasta    0P18691.file    128 1   5   56.501      /xubo/project/SparkSW/output/time/20161127202735122SparkSW_queryFile_0P18691.file_dbFile_D5Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSW D5Line.fasta    0P18691.file    128 1   5   55.71       /xubo/project/SparkSW/output/time/20161127202837220SparkSW_queryFile_0P18691.file_dbFile_D5Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D5Line.fasta    0P18691.file    128 1   5   102.413     /xubo/project/SparkSW/output/time/20161127202939014SparkSWSSW_queryFile_0P18691.file_dbFile_D5Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D5Line.fasta    0P18691.file    128 1   5   93.266      /xubo/project/SparkSW/output/time/20161127203127477SparkSWSSW_queryFile_0P18691.file_dbFile_D5Line.fasta_splitNum_128_taskNum_1_topK_5
2.01611E+16 SparkSWSSW  D5Line.fasta    0P18691.file    128 1   5   104.084     /xubo/project/SparkSW/output/time/20161127203306305SparkSWSSW_queryFile_0P18691.file_dbFile_D5Line.fasta_splitNum_128_taskNum_1_topK_5

参考

【1】https://github.com/xubo245
【2】http://blog.csdn.net/xubo245/

基因数据处理123之SSW代码不正确,到时比SparkSW时间长相关推荐

  1. 基因数据处理118之SSW运行

    更多代码请见:https://github.com/xubo245 基因数据处理系列 1.解释 SSW是一个更快的SW算法,并且提供了c语言lib和java的调用 代码: https://github ...

  2. 基因数据处理122之SSW和SparkSW评分不一致,query为Q9

    更多代码请见:https://github.com/xubo245 基因数据处理系列 1.解释 RT,但是顺序一致 2.代码: hadoop@Master:~/disk2/xubo/project/a ...

  3. 基因数据处理121之SSW的score matrix调整,使得与SparkSW评分一致

    更多代码请见:https://github.com/xubo245 基因数据处理系列 1.解释 SSW的评分矩阵是128*128的,是按char的int值来进行计算的.而blosum50是蛋白质的,而 ...

  4. 基因数据处理120之scala调用SSW在linux下运行

    更多代码请见:https://github.com/xubo245 基因数据处理系列 1.解释 先有java提供转换,使用jni调用c 然后scala调用java 2.代码: 2.1 java: pa ...

  5. 基因数据处理119之java调用SSW在linux下运行

    更多代码请见:https://github.com/xubo245 基因数据处理系列 1.解释 测试自带Example: xubo@xubo:~/xubo/tools/Complete-Striped ...

  6. java文件正确编写格式_java Srpingboot框架书写mapper代码的正确格式

    java Srpingboot框架书写mapper代码的正确格式 发布时间:2019-07-16原创 阅读(326) 最近新项目使用的是springboot框架,很多地方比以往的spring框架做了简 ...

  7. 基因数据处理12之samtool的tview来查看sam的匹配文件

    基因数据处理12之samtool的tview来查看sam的匹配文件 具体的之前有文章讲过:http://blog.csdn.net/xubo245/article/details/50836185 记 ...

  8. 基因数据处理8之BWA_MEM小数据集处理(成功)

    基因数据处理8之BWA_MEM小数据集处理 环境:ubuntu14.04 6G内存 参考基因:GRCH38 来源请参考[1] 1.fastq数据:SRR003161.fastq 的头20行,即5条re ...

  9. 基因数据处理1之mapping_to_cram

    基因数据处理1之mapping_to_cram 参考资料: A Worked Example Obtain some public data We will use the first 100,000 ...

最新文章

  1. 支持Dubbo接口文档生成的工具!
  2. easyui js解析字符串_easyui的解析器Parser
  3. python自学行_怎么自学python?
  4. (2021) 23 [持久化] I/O设备与驱动
  5. api postmain 鉴权_认证鉴权与API权限控制在微服务架构中的设计与实现(一)
  6. VB得到指定文件夹下的文件列表
  7. LoadRunner11录制APP脚本(2)
  8. 19 矩阵——矩阵的相抵、相抵标准形、秩1矩阵、矩阵的满秩分解
  9. 4.从Paxos到Zookeeper分布式一致性原理与实践--- Zookeeper 与 Paxos
  10. c语言= 什么意思,C语言=是什么意思?
  11. win11家庭版使用远程桌面-RDPWrapper常见问题
  12. 微信小程序UI设计(二)之view组件
  13. tewa600agm是千兆吗_请问电信天翼网关光纤猫超级用户 型号tewa-600aem/tewa600agm
  14. 客户的sample和项目计划
  15. 加泰罗尼亚理工大学 计算机 排名,加泰罗尼亚理工大学排名
  16. 小程序使用mp-html解析html
  17. 帆软中的日期函数,当月第一天,当年第一天,当月最后一天等
  18. wx小程序(wxml)
  19. Ajaxfileupload上传多张图片
  20. 写了很久,这是一份最适合/贴切普通大众/科班/非科班的『学习路线』

热门文章

  1. Honeypot Networks
  2. zcu102_注意_PS程序DDR空间分配
  3. 小米与魅族同样使304有什么区别呢
  4. 求字符串的长度(string char)
  5. 兼容MySQL中的find_in_set函数
  6. [原创内容] 自己编写的Windows7SP1Update离线更新安装汇总-完全开源2.0版[2016.08.26]
  7. 低功耗设计二之Bypassing(旁路)
  8. a4proxy.exe
  9. 魅族升级android p,魅族16截止目前没有适配安卓P的计划,黄章要加油
  10. 软考常考知识点整理-V型生命周期模型