一、PointSite背景简单介绍

现在有很多AI开发的各种方法和工具,可以替代传统的CADD工具。这里介绍的PointSite这个工具可以从原子级别识小分子的结合位点,参考文章来源于Zhen Li的工作,原文链接:

PointSite: a point cloud segmentation tool for identification of protein ligand binding atoms (biorxi​​​​​​v.org)

PointSite将原始的3D蛋白质结构转译成点云(point clouds), 然后使用基于U-Net的Submanifold Sparse Convolution (SSC)进行分割。PointSite在位点的原子层级识别上较其他方法获得显著的提升,当与其他口袋层面的识别方法相结合,可以获得最优的性能。

文章还是很有意思的,感兴趣的同学可以看看。

二、PointSite的安装及使用

PointSite提供了源代码:PointSite/PointSite: PointSite: a point cloud segmentation tool for identification of protein ligand binding atoms (github.com)

## 安装方法

#复制源代码
git clone --recursive https://github.com/PointSite/PointSite_Inference.git
cd PointSite_Inference/
#建立conda虚拟环境,安装使用到的包
./install.sh 

在执行 /install.sh可能会出现pytroch装不上的情况。单独使用conda安装一下即可,安装1.4.0或者1.5.0都可以:

conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch
运行案例:
conda activate pointsite_inference
chmod +x ./util/PDB_Tool
chmod +x ./util/PDB_To_XYZ
python inference.py --output blind_out --data example/blind --select_list example/blind_list
conda deactivate

程序根据example/blind_list中的PDB名单,从example/blind目录中提取PDB文件,将结果保存在blind_out文件夹内。example/blind_list中包含了81个蛋白,单V100 GPU的机子,运行时间大概为10分钟左右。

blind_out文件夹内每一个输入的PDB会产生一个结果文件夹,其中有*_output.xyz文件和可视化文件夹,即为预测的结果。

三、实际检测

这里,以5T1A为例子,其中包含了两个小分子,一个为底物小分子,一个为变构调剂小分子。如下图:

PointSite的预测结果如下图,大致相关位置:

可以到看预测的位置还是很准的,位置很接近。主要的是,连变构小分子的位置都可以被标记到!

但是存在一个问题,PointSite仅给出了可视化的文件,预测为结合口袋的残基标为红色。但是并没有直接给出每一个氨基酸的标签(True/False)。

四、pymol标记Pointsite的结果

我们查看了代码发现,PointSite先使用了PDB-Tool工具将pdb文件进行了预处理,删除了不必要的水分子等,然后从生成的pdb文件中提取原子,用于点云分割,最后给出每一个原子的颜色标记。

源代码中的预处理方式:

下面给出了,使用PointSite进行位点预测,并将预测出来的位点使用dpb文件中的Bfactor标记出来的代码 PointSite_Predict_Visual.py

#encoding=utf-8SOURCE_DATA_FOLDER = './PDB-Pool'
OUT_PATH = './Result'
HANDLE_PDB = SOURCE_DATA_FOLDER+'-out'
SOURCE_DATA_LIST = 'test' #用于保存源数据中的PDB名import os#根据PDB-Pool文件夹,生成PDB文件列表
files = os.listdir(SOURCE_DATA_FOLDER)
files = [i[:-4] for i in files]
with open(SOURCE_DATA_LIST, 'w') as f:for pdb in files:f.write(pdb+'\n')#使用PointSite寻找小分子的结合位点,结果在Test文件夹中cmd_ = './pointsite_run.sh {} {} {} ./'.format(SOURCE_DATA_LIST, SOURCE_DATA_FOLDER, OUT_PATH)os.system(cmd_)# 获取PointSite处理以后的蛋白文件
out_dir = HANDLE_PDB
os.system('mkdir {}'.format(out_dir))
files = os.listdir(SOURCE_DATA_FOLDER)
for file in files:file = file[:-4]cmd_ = './util/PDB_Tool -i ./PDB-Pool/{}.pdb -r _ -R 1 -o ./PDB-Pool-out/{}-out.pdb'.format(file, file)os.system(cmd_)# 将PointSite和PDB_Tool处理的结果整合起来,得到每一个残基是否被预测为结合口袋
pdb_out_list = os.listdir(HANDLE_PDB)
point_out_list = os.listdir(OUT_PATH)
point_out_list = [file for file in point_out_list if len(file)==4 ]#整合起来结果保存在pdb文件中
for pdb in point_out_list:print(pdb)#打开pointsit结果文件with open (OUT_PATH+"/{}/visual/{}_atom_pred.obj".format(pdb, pdb), 'r') as f:lines = f.readlines()qs = [line.split()[4] for line in lines]qs = [" 200.0" if i=='255' else "  10.0" for i in qs]with open (HANDLE_PDB+"/{}-out.pdb".format(pdb), 'r') as f:lines = f.readlines()for i in range(len(lines)):lines[i]=lines[i][:61]+qs[i]+lines[i][67:] #pdb的第#写入PDB文件with open(OUT_PATH+"/{}/visual/{}_pointsite_pred.pdb".format(pdb, pdb),'w') as f:f.writelines(lines)

使用方法:将该文件拷贝到Pointsite的目录下

python PointSite_Predict_Visual.py

运行完毕以后,就可以在Result文件夹内,找到相应的*_pointsite_pred.pdb文件,例如1A3W蛋白的结果文件在:./Result/1A3W/visual/1A3W_pointsite_pred.pdb。示意图如下,红色为Pointsite识别的结合位点。

(注:这个蛋白有两个成药位点,一个是变构调节功能位点,一个是底物功能为点,说明Pointsite也可以识别变构位点)

小分子结合位点/成药位点识别工具-PointSite相关推荐

  1. smiles、sdf 小分子可视化展示标记软件DataWarrior、chemdraw;pdf或图片化学分子提取工具StoneMIND | Collector

    1.smiles网页接口可视化 http://hulab.rxnfinder.org/smi2img/ 直接替换下列最后的simles就行 http://hulab.rxnfinder.org/smi ...

  2. G 蛋白偶联受体与小分子化合物的相互作用

    化学遗传学 (Chemogenetics) 是指一种蛋白被改造与先前未被识别的小分子化合物相互作用的过程.多种蛋白的改造已被报道,包括激酶.非激酶的酶类.G 蛋白偶联受体 (GPCRs) 和配体门控离 ...

  3. PROTAC——小分子化合物

    PROTAC VS. 传统小分子 PROTAC 全称为 proteolysis-targeting chimeras (蛋白水解靶向嵌合分子),是一种杂合双功能小分子化合物,由三部分组成:靶蛋白配体. ...

  4. Chem. Sci.|AlphaFold加速了人工智能药物的发现:一种新型CDK20小分子抑制剂

    ​ 题目:AlphaFold accelerates artificial intelligence powered drug discovery: efficient discovery of a ...

  5. 蛋白对接_【分子对接教程】蛋白/核酸/多肽-小分子对接(DOCK 6.9)

    用途 使用UCSF DOCK 6.9程序进行分子对接计算,研究蛋白/核酸/多肽与有机小分子的结合模式与相互作用. 预备知识 分子对接的算法流程 将配体放置在受体口袋中,搜索/调整配体构象,获得可能的结 ...

  6. 来一场蛋白和小分子的风花雪月

    分子对接(Molecular Docking)理论 所谓分子对接就是两个或多个分子之间通过几何匹配和能量匹配相互识别找到最佳匹配模式的过程.分子对接对酶学研究和药物设计中有重要的应用意义. 分子对接计 ...

  7. MCE | 靶向相分离 小分子药物研发

    细胞内的各种组分如何在正确的时间.地点上聚集并执行其相应的功能,是生命科学领域内的一大问题.近些年来,细胞内一些没有细胞膜结构包被的"细胞器" (Membrane-less org ...

  8. MCE | 小分子降解剂——分子胶

    小分子抑制剂是靶向治疗的主要类型之一,但也有它的局限性,如无法完全阻断蛋白功能,会引起的脱靶效应和副作用等.然而近年来,小分子降解剂颠覆了先前认为 "不可治疗" 靶点的观点.这些小 ...

  9. 【Amber】带小分子配体分子动力学模拟

    目录 适用于Amber18\20版本 一.文件准备 1.文件检查与拆分 2.小分子文件处理 3.蛋白质文件处理 4.复合体文件处理 二.分子动力学模拟 1.能量最小化 2.体系加热 3.恒压平衡 4. ...

最新文章

  1. java-数组排序--冒泡排序、鸡尾酒排序、地精排序
  2. Java HashMap的put操作(Java1.8)
  3. winform 打包
  4. 图片安全保护(未启动)
  5. java 事务管理 子父线程_Java中的父线程与子线程
  6. 表主键自增长Mybatis插入数据报错
  7. Task Office for mac(任务办公计划管理)
  8. 解决mysql不是内部或外部命令 菜鸟教程
  9. 2018最新游戏蛮牛Egret游戏引擎
  10. 【Java编程】写一个将华氏温度转换成摄氏温度的程序,转换的公式是:°F = (9/5)*°C + 32 其中C表示摄氏温度,F表示华氏温度。
  11. C# AHP层次分析法:一致性校验
  12. EasyPlayer流媒体播放器播放HLS视频,起播速度慢的技术优化
  13. 【典型液压系统】组合机床动力滑台液压系统
  14. 达内java月考_达内java5.第二次月考(附答案)..doc
  15. java虚拟机内存情况检测,测试啦啦啦啦啦1111
  16. js控制的Flv视频播放器源码下载
  17. 功放限幅保护_限幅器在音响系统中限幅阈值的计算方法
  18. 苹果鼠标怎么充电_无线充电器怎么用?看一次就会了!-装修攻略
  19. =,==,===的区别
  20. 倒计时1天!VIVO NEX3配置细节汇总,或许这就是未来旗舰

热门文章

  1. BeanDefinition
  2. Async/Await FAQ (Stephen Toub)
  3. 从布尔函数的真值表求其代数正规型(ANF)
  4. 切换Mellanox网卡工作模式
  5. 深度强化学习系列(8): Prioritized Experience Replay(PER-DQN)原理及实现
  6. 超级账本Fabric的架构与设计
  7. 正身以俟时,守己而律物
  8. 中国联通再次下调国际漫游资费 最高降幅达90.42%
  9. android音乐柱状频谱实现
  10. SQL更新(INSERT,UPDATE,DELETE)语句的一般格式及注意事项