生信蛋白分析数据库与ID转换
对于数据分析(工程师)来说,数据库的海量信息可能蕴含着无数的新发现!
目录
前言
一、PDB
1.如有PDBID
二、chembl
1.基本信息
2.转化chemblID为uniprotID
3.使用chembl API 代码检索
三、bindingd
前言
生物信息学是生命科学与计算机科学等学科的交叉学科;蛋白在生物体中扮演着极为重要的功能,分析蛋白结构、功能也有助于药物的开发。以下常用数据库提供了许多极为重要的参数。
一、PDB
对于分析二三级结构,PDB数据库(RCSB PDB: Homepage)极为有用,且有众多蛋白结构(194,820 个)。
分为两种情况,已知蛋白序列和已知PDBID(以已知PDBID为例)。
1.如有PDBID
用于蛋白对接分析时一般不考虑离子配体。
二、chembl
chembl生物化学信息数据库,展示了生物活性、目标蛋白(target等信息)
1.基本信息
2.转化chemblID为uniprotID
uniprotmapping(UniProt)可以实现这一转换。
结果如下:
3.使用chembl API 代码检索
chembl API 是用Python写成的化学信息学分析代码,原理是SQL命令提取数据库信息,你可以在Python管理工具中安装这个库并使用,
GitHub - chembl/chembl_webresource_client: Official Python client for accessing ChEMBL APIOfficial Python client for accessing ChEMBL API. Contribute to chembl/chembl_webresource_client development by creating an account on GitHub.https://github.com/chembl/chembl_webresource_client在线jupyter文档,无需安装,只要修改target_name等信息就可快速使用。
Binderhttps://mybinder.org/v2/gh/chembl/chembl_webresource_client/master?filepath=demo_wrc.ipynb
根据chembl里的专利号可以进一步去surechembl查看同一专利下的化学分子
三、bindingdb
BindingDBhttps://www.bindingdb.org/可以根据PDB ID寻找小分子亲和力信息:Kd越低亲和力越好,一定情况下,ki=kd
生信蛋白分析数据库与ID转换相关推荐
- 【生信】R语言进行id转换的方法(附可直接使用代码)
本文我都默认已经下载好了表达矩阵exp了哦 代码都是直接给出来了,需要修改的地方我进行了标记 一般只要修改一下都能直接用了 方法一:下载平台数据以得到对应信息 然后进入官网https://www.nc ...
- 生信漫谈分析杨梅UDP-糖基转移酶基因家族
今天小白带大家来看一篇2022年9月份发表在SCI分区Q1区[Frontiers in Plant Science]的基因家族文献:杨梅UDP -糖基转移酶基因家族的全基因组分析及类黄酮糖基化相关成员 ...
- 生信常用分析图形绘制03 -- 富集分析圈图
有了R语言的基础,以及ggplot2绘图基础,我们的生信常用分析图形的绘制就可以提上日程了!本系列,师兄就开始带着大家一起学习如何用R语言绘制我们自己的各种分析图吧! 由于本系列的所有分析代码均为师兄 ...
- 生信常用分析图形绘制01 -- 各种类型的热图!你学会了吗?
有了R语言的基础,以及ggplot2绘图基础,我们的生信常用分析图形的绘制就可以提上日程了!本系列,师兄就开始带着大家一起学习如何用R语言绘制我们自己的各种分析图吧! 由于本系列的所有分析代码均为师兄 ...
- 生信常用分析图形绘制04 -- 桑基图
有了R语言的基础,以及ggplot2绘图基础,我们的生信常用分析图形的绘制就可以提上日程了!本系列,师兄就开始带着大家一起学习如何用R语言绘制我们自己的各种分析图吧! 由于本系列的所有分析代码均为师兄 ...
- 生信学习--生物数据库大全
本文转自https://blog.csdn.net/g863402758/article/details/52957299 综合数据库 ★ INSD,国际核酸序列数据库(International N ...
- 生信自动化分析流程 nf-core 的离线运行(图文详解)
Nextflow 包括流程代码,软件,参考基因组,甚至远程数据源 由于众所周知的原因,需要在离线系统运行流程,下面我们来安装 nf-core. Nextflow 在 Linux 系统安装好 Nextf ...
- 【生信】KEGG数据库在线使用
KEGG数据库在线使用 KEGG简介 KEGG是一个整合了基因组.化学和系统功能信息的数据库.把从已经完整测序的基因组中得到的基因目录与更高级别的细胞.物种和生态系统水平的系统功能关联起来是KEGG数 ...
- uniport ID 转换为 gene symbol(ID转换)
网站 ID转换网址 input 选择 uniprot accession output 选择 Gene symbol 一般一次转换不能超过1万个基因ID,数据量太大就转换不出来,如果一次转换太多,需要 ...
最新文章
- android画布,android-视图在画布比例上不适合画布
- jvm性能调优 - 17案例实战_每日上亿请求量的电商系统 老轻代垃圾回收参数如何优化
- MySQL 如何查找删除重复行?
- 成功解决SyntaxError: import * only allowed at module level
- 计算机网络校园网络设计方案,毕业论文--《计算机网络》校园网设计方案
- LIRe 源代码分析 4:建立索引(DocumentBuilder)[以颜色布局为例]
- 11462 - Age Sort
- SpringBoot建立数据库连接JdbcTemplate和Mybatis两种方式
- 90 亿美元的“Java 第一版权案”终落幕:谷歌胜!
- 你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
- 正确的座机号码格式_正确的座机号码格式
- 慧都与数据库厂商Devart进一步提升合作层次
- 离职通知邮件主题写什么好_辞职邮件怎么写,需要包含哪些内容
- Sqlmap中代理及其他常用参数
- HTTP,TCP,UDP常见端口对照表大全
- 白衣观音大士灵感神咒
- 英语口语在线测试软件,4个最实用的英语口语练习软件
- wordpress+HTML5游戏,轻松在wordpress上植入一个网页游戏
- freebsd运行Linux软件,FreeBSD 常用软件
- 局域网内多台windows设备共用一套键鼠【微软官方】Mouse without Borders 2.2.1.0327