PSSP之特征提取(PSSP protein secondary structure prediction)
PSSP之特征提取(PSSP protein secondary structure prediction)
- One-hot encoding AAC
- PSSM encoding
- SVM 分类
- 优化之特征清洗
One-hot encoding AAC
维度为20+3(BXZ)。
PSSM encoding
- fasta文件
- psi-blast程序+protein db(nr db 40G 下载失败 uniref50 6G 下载成功)
- makeblastdb.exe (uniref50 格式化成功 耗时 4846 secords)
- python批量 cmd操作(待续)
- data_process.py
SVM 分类
多核组合rbf+lin 效果好
优化之特征清洗
- 加上标志位
- 或是化学性能的特征
- 还有加上3个AAC
- 再用数据库uniref50跑一下pssm 还是自己的程序跑出来PSSM 比较靠谱 而且 看了很多论文也用了uniref50说明他还是有点靠谱的
- 还有就是归一化特征 我去我之前LSTM跑的文本分类里去找一下灵感
- 还有就是划窗操作 吧PSSM用滑动窗口处理下 看看会不会有优化效果
- 给PSSM的值归一化
PSSP之特征提取(PSSP protein secondary structure prediction)相关推荐
- Alphafold2:Highly accurate protein structure prediction with AlphaFold
Highly accurate protein structure prediction with AlphaFold(★ Nature) AlphaFold 高精度预测蛋白质结构 paper:Hig ...
- 2022-ICML-EquiBind: Geometric Deep Learning for Drug Binding Structure Prediction
2022-ICML-EquiBind: Geometric Deep Learning for Drug Binding Structure Prediction Paper: https://arx ...
- 【论文分享】AF2:Highly accurate protein structure prediction with AlphaFold
前言:本文是PPT分享的文字稿,偏口语化,仅供参考. Outline 论文正文内容梳理 团队介绍 背景介绍 预测方法分类 预测效果 算法框架 1. 模型输入 2. Evoformer 3. Struc ...
- 论文笔记:Highly accurate protein structure prediction with AlphaFold (AlphaFold 2 appendix)
注:这篇Nature的论文,如果光看正文,没法理解,需要结合它的补充材料一起看 同时这篇文章看得太吃力了QAQ,如果有说的不对的地方欢迎指正 0 前言 蛋白质结构预测:给定某一个蛋白质的一串氨基酸序列 ...
- AAAI2021 蒸馏论文review
简介 aaai论文列表:https://aaai.org/Conferences/AAAI-21/wp-content/uploads/2020/12/AAAI-21_Accepted-Paper-L ...
- 关于深度学习在生物学领域的应用分析
申明:本文来源于对论文"Applications of Deep Learning in Biomedicine"的理解. 深度学习研究及其在生物医药领域的潜在应用 深度学习已经在 ...
- 关于深度学习在生物学领域的应用分析Applications of Deep Learning in Biomedicine
申明:本文来源于对论文"Applications of Deep Learning in Biomedicine"的理解. 深度学习研究及其在生物医药领域的潜在应用 深度学习已经在 ...
- IJCAI 2021 医药AI必读论文推荐
论文名称 AMA-GCN: Adaptive Multi-layer Aggregation Graph Convolutional Network for Disease Prediction 表型 ...
- 蛋白质集合c语言算法,利用蛋白质序列的预测方法
分析新发现的蛋白质或未知功能的基因产物的第一步是用BLAST或其它工具在公共数据库中进行相似性搜索.然而,这种搜索可能无法找到一个已知相符蛋白质:即使能得到一个统计显著的相符蛋白质,也很可能在序列记录 ...
- 【生信】初探蛋白质性质和结构分析
实验目的 熟悉蛋白质序列和结构的主要分析内容 在实践中逐步理解蛋白质序列和结构的主要分析算法的基本原理 实验内容 综合使用多种在线工具,对蛋白质的一级.二级和三级结构进行分析和预测 综合使用多种在线工 ...
最新文章
- MySQL主从复制延时方法
- java 唯一索引冲突_JPA merge联合唯一索引无效问题解决方案
- 最详细的Eigen笔记
- c语言中嵌套循环的作用,C语言中n层循环嵌套实现
- mini2440驱动分析之PWM
- Documentum之基础(2)
- controller调用controller的方法_【笔记】Simulink C语言代码生成与使用方法
- pb5.0-pb10.0各版本高速下载
- 基于JavaSwing开发医院信息管理系统 毕业设计 课程设计 大作业
- JS事件 内容选中事件(onselect)选中事件,当文本框或者文本域中的文字被选中时,触发onselect事件,同时调用的程序就会被执行。...
- 给网站添加优质内容的25种方式
- hidl 原理分析_【一点资讯】安卓手机NFC模拟门禁卡(设置UID)的一种方法 www.yidianzixun.com...
- 家里蹲太孤单?来用python画一只单身狗吧
- 易捷文件共享web服务器 v3.5,易捷文件共享Web服务器 官方版
- 近日onedrive突然消失问题的解决
- 日本开设无人机专业,打造无人机“人才市场”
- matlab/simulink中代数环的问题及解决措施
- 面试官:使用无界队列的线程池会导致内存飙升吗?
- 设计分享 | STM32F103RCT6定时器定时中断原理
- IPC-共享内存 (七猫的藏经阁 )