PSSP之特征提取(PSSP protein secondary structure prediction)

  • One-hot encoding AAC
  • PSSM encoding
  • SVM 分类
  • 优化之特征清洗

One-hot encoding AAC

维度为20+3(BXZ)。

PSSM encoding

  1. fasta文件
  2. psi-blast程序+protein db(nr db 40G 下载失败 uniref50 6G 下载成功)
  3. makeblastdb.exe (uniref50 格式化成功 耗时 4846 secords)
  4. python批量 cmd操作(待续)
  5. data_process.py

SVM 分类

多核组合rbf+lin 效果好

优化之特征清洗

  • 加上标志位
  • 或是化学性能的特征
  • 还有加上3个AAC
  • 再用数据库uniref50跑一下pssm 还是自己的程序跑出来PSSM 比较靠谱 而且 看了很多论文也用了uniref50说明他还是有点靠谱的
  • 还有就是归一化特征 我去我之前LSTM跑的文本分类里去找一下灵感
  • 还有就是划窗操作 吧PSSM用滑动窗口处理下 看看会不会有优化效果
  • 给PSSM的值归一化

PSSP之特征提取(PSSP protein secondary structure prediction)相关推荐

  1. Alphafold2:Highly accurate protein structure prediction with AlphaFold

    Highly accurate protein structure prediction with AlphaFold(★ Nature) AlphaFold 高精度预测蛋白质结构 paper:Hig ...

  2. 2022-ICML-EquiBind: Geometric Deep Learning for Drug Binding Structure Prediction

    2022-ICML-EquiBind: Geometric Deep Learning for Drug Binding Structure Prediction Paper: https://arx ...

  3. 【论文分享】AF2:Highly accurate protein structure prediction with AlphaFold

    前言:本文是PPT分享的文字稿,偏口语化,仅供参考. Outline 论文正文内容梳理 团队介绍 背景介绍 预测方法分类 预测效果 算法框架 1. 模型输入 2. Evoformer 3. Struc ...

  4. 论文笔记:Highly accurate protein structure prediction with AlphaFold (AlphaFold 2 appendix)

    注:这篇Nature的论文,如果光看正文,没法理解,需要结合它的补充材料一起看 同时这篇文章看得太吃力了QAQ,如果有说的不对的地方欢迎指正 0 前言 蛋白质结构预测:给定某一个蛋白质的一串氨基酸序列 ...

  5. AAAI2021 蒸馏论文review

    简介 aaai论文列表:https://aaai.org/Conferences/AAAI-21/wp-content/uploads/2020/12/AAAI-21_Accepted-Paper-L ...

  6. 关于深度学习在生物学领域的应用分析

    申明:本文来源于对论文"Applications of Deep Learning in Biomedicine"的理解. 深度学习研究及其在生物医药领域的潜在应用 深度学习已经在 ...

  7. 关于深度学习在生物学领域的应用分析Applications of Deep Learning in Biomedicine

    申明:本文来源于对论文"Applications of Deep Learning in Biomedicine"的理解. 深度学习研究及其在生物医药领域的潜在应用 深度学习已经在 ...

  8. IJCAI 2021 医药AI必读论文推荐

    论文名称 AMA-GCN: Adaptive Multi-layer Aggregation Graph Convolutional Network for Disease Prediction 表型 ...

  9. 蛋白质集合c语言算法,利用蛋白质序列的预测方法

    分析新发现的蛋白质或未知功能的基因产物的第一步是用BLAST或其它工具在公共数据库中进行相似性搜索.然而,这种搜索可能无法找到一个已知相符蛋白质:即使能得到一个统计显著的相符蛋白质,也很可能在序列记录 ...

  10. 【生信】初探蛋白质性质和结构分析

    实验目的 熟悉蛋白质序列和结构的主要分析内容 在实践中逐步理解蛋白质序列和结构的主要分析算法的基本原理 实验内容 综合使用多种在线工具,对蛋白质的一级.二级和三级结构进行分析和预测 综合使用多种在线工 ...

最新文章

  1. MySQL主从复制延时方法
  2. java 唯一索引冲突_JPA merge联合唯一索引无效问题解决方案
  3. 最详细的Eigen笔记
  4. c语言中嵌套循环的作用,C语言中n层循环嵌套实现
  5. mini2440驱动分析之PWM
  6. Documentum之基础(2)
  7. controller调用controller的方法_【笔记】Simulink C语言代码生成与使用方法
  8. pb5.0-pb10.0各版本高速下载
  9. 基于JavaSwing开发医院信息管理系统 毕业设计 课程设计 大作业
  10. JS事件 内容选中事件(onselect)选中事件,当文本框或者文本域中的文字被选中时,触发onselect事件,同时调用的程序就会被执行。...
  11. 给网站添加优质内容的25种方式
  12. hidl 原理分析_【一点资讯】安卓手机NFC模拟门禁卡(设置UID)的一种方法 www.yidianzixun.com...
  13. 家里蹲太孤单?来用python画一只单身狗吧
  14. 易捷文件共享web服务器 v3.5,易捷文件共享Web服务器 官方版
  15. 近日onedrive突然消失问题的解决
  16. 日本开设无人机专业,打造无人机“人才市场”
  17. matlab/simulink中代数环的问题及解决措施
  18. 面试官:使用无界队列的线程池会导致内存飙升吗?
  19. 设计分享 | STM32F103RCT6定时器定时中断原理
  20. IPC-共享内存 (七猫的藏经阁 )

热门文章

  1. trivial、standard layout、POD和literal类型解析
  2. 常用广告过滤规则整理
  3. yolov5训练时的dataset not found
  4. 在阿里云用python发送邮件
  5. excel 第5讲:分类汇总与数据有效性
  6. c#Winform自定义控件-目录
  7. 人工智能续写哈利波特,超魔幻风格你能接受吗?
  8. System memory,AGP memory和video memory【转】
  9. 程序猿段子_那些关于程序员的段子
  10. 梦幻西游手游经验任务链计算机,梦幻西游手游经验和道具任务链攻略