前言

做RNA-seq基因表达数据分析挖掘,我们感兴趣的其实是“基因互作”,哪些基因影响了我们这个基因G,我们的基因G又会去影响哪些基因,从而得到基因调控的机制。

直觉确实是很明确的,但是细节处却有很多问题。

我们讨论的到底是基因表达的互作,还是基因产物的互作?

------------

对于蛋白编码基因,它翻译产生蛋白,如果此蛋白不参与转录过程,理论上不可能会影响另一个基因的表达,那也就不存在基因表达的互作的,它们的基因表达被很好的隔离起来了,相互独立,互不影响。

但现在鉴定出了很多调控基因或其他在基因组上的调控序列,比如miRNA、lncRNA等,它们也都需要从基因组上转录出来,然后转录产物会去影响其他基因的表达(影响转录)。这才是基因表达互作,虽然MiRNA、lncRNA不能被称作基因。

------------

基因产物的互作就普遍了,那就是蛋白互作,也就是STRING等数据库里收集的信息。

蛋白互作也容易直观理解些,复杂的多细胞生命体,几乎所有的功能都是靠蛋白来实现的,所以有很多蛋白要互相结合(空间上)在一起来行使自己的功能。

------------

还有一个就是遗传学领域的基因互作,这与生物学的基因互作完全不同,遗传学考虑的是宏观的基因互作,站在表型的基础上。 Novel phenotypes often result from the interactions of two genes。

遗传学的基因互作是生物学基因产物互作的结果。

Defining genetic interaction

GENE INTERACTIONS


STRING database的挖掘

这个数据库绝对是做实验人的宝藏,里面包含了各种蛋白互作关系,不用做实验就有一大堆证据。

IPA了解一下,收费的高端分析软件,大部分就是整合的这个数据库,很多大佬喜欢用IPA来找明星基因,再来讲故事,实例请看之前解读的CSC paper。

首先了解一下STRING里面有哪些文件可以下载:

https://string-db.org/cgi/download.pl?sessionId=yMNmD7s36wS8

选你的物种,减少文件大小,常用的就是互作数据:

一般我们想知道某个蛋白会与哪些其他蛋白互作,以及互作的类型,然后做下游分析,信息都在这几个文件里了。

注:有哪些互作关系需要好好搞清楚,移步help,https://string-db.org/cgi/help.pl?sessionId=yMNmD7s36wS8

Docs » User documentation » Getting started » Evidence

Conserved Neighborhood
Co-occurrence
Fusion
Co-expression
Experiments
Databases
Text mining

每一个PPI关系的证据来源是不同的,选择你需要的证据。我觉得里面最可靠的就是Experiments, Databases和Text mining了。

当然,我们是高手,能用更简单的方法绝不用复杂的,那么STRING的API了解一下。

用任意脚本语言读以下格式化地址:

https://string-db.org/api/[output-format]/interaction_partners?identifiers=[your_identifiers]&[optional_parameters]

就能得到一个dataframe结果,不用下载,不用筛选,速度更快,随调随用。

实例,我想知道HDAC4的互作蛋白,可以这么抓:

老鼠:Mus%20musculus

url <- "https://string-db.org/api/tsv/interaction_partners?identifiers=HDAC4&species=Homo%20sapiens"
webDf <- read.table(url, header=T)
head(webDf)stringId_A      stringId_B preferredName_A preferredName_B ncbiTaxonId score
1 ENSP00000264606 ENSP00000080059           HDAC4           HDAC7        9606 0.934
2 ENSP00000264606 ENSP00000202967           HDAC4           SIRT4        9606 0.809
3 ENSP00000264606 ENSP00000209873           HDAC4            AAAS        9606 0.901
4 ENSP00000264606 ENSP00000209875           HDAC4            CBX5        9606 0.779
5 ENSP00000264606 ENSP00000212015           HDAC4           SIRT1        9606 0.988
6 ENSP00000264606 ENSP00000215832           HDAC4           MAPK1        9606 0.572nscore fscore pscore ascore escore dscore   tscore
1      0      0      0  0.061  0.320   0.90 0.061985
2      0      0      0  0.052  0.166   0.00 0.778000
3      0      0      0  0.058  0.000   0.90 0.000000
4      0      0      0  0.062  0.463   0.54 0.159000
5      0      0      0  0.052  0.415   0.90 0.812000
6      0      0      0  0.000  0.433   0.00 0.276000  

结果解读:

Output fields (TSV and JSON formats):

Field Description
stringId_A STRING identifier (protein A)
stringId_B STRING identifier (protein B)
preferredName_A common protein name (protein A)
preferredName_B common protein name (protein B)
ncbiTaxonId NCBI taxon identifier
score combined score
nscore gene neighborhood score
fscore gene fusion score
pscore phylogenetic profile score
ascore coexpression score
escore experimental score
dscore database score
tscore textmining score

抓其他信息改下API就行了

还有很多工具是基于STRING做富集分析的,也可以了解一下,主要看自己需求。

待续~

转载于:https://www.cnblogs.com/leezx/p/10718486.html

PPI | protein-protein interaction | 蛋白互作分析 | gene interaction | 基因互作相关推荐

  1. 一文解决Cellphonedb单细胞互作分析及可视化作图(2)

    之前我们已经讲述了Cellphonedb的安装配置和数据分析,就差可视化了,这里简单说一下常见的可视化,如果需要其他更加个性化的可视方式,就需要发挥自己的聪明才智了! CellphoneDB单细胞互作 ...

  2. 哇!单细胞测序-配体受体互作分析原来可以这么简单又高大上!

    NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞测序分析 (重磅综述:三万字长文读 ...

  3. 双代号网络图基础算法_从网络图探寻基因互作的蛛丝马迹(5)

    在前面的4期中,我们分别给大家讲解了网络图的构造. STRING 数据库.Cytoscape 软件的安装以及使用,链接如下: 从网络图探寻基因互作的蛛丝马迹(1) [科研猫·绘图]从网络图探寻基因互作 ...

  4. 两对等位基因控制一对相对性状的规律(基因互作)

    两对等位基因控制一对相对性状的规律(基因互作) 参考文档:https://wenku.baidu.com/view/edf42b6682c4bb4cf7ec4afe04a1b0717fd5b3e1.h ...

  5. 重磅!这个生信神器助你文章秒出图——miRNA与基因互作数据库

    我们熟知,在特定情况下,microRNA(miRNA)可以直接或间接激活和抑制基因表达.但是,尚没有基于多组学的数据库能够证明对激活与抑制以及正常与癌症状况之间相互作用模式转换的系统数据.今天我们为大 ...

  6. canoco5冗余分析步骤_基因富集分析|理解

    Gene Set Enrichment Analysis 基因富集分析 哈罗大家好!ヾ(≧▽≦*)o 年初在和老板研究 Identifying Cell Subpopulations 有关的课题,发现 ...

  7. Java8 LocalDateTime获取时间戳(毫秒/秒)、LocalDateTime与String互转、Date与LocalDateTime互转

    本文收录在猪哥GitHub:https://github.com/pig6/Java 中,本项目收集一线大厂面试.实战.Java学习路线等. 本文目前提供:LocalDateTime获取时间戳(毫秒/ ...

  8. dedecms5.7添加栏目时以简拼作目录名 以拼音首字母作文件夹名称

    今天分享DedeCMS添加栏目的一个小技巧,添加栏目以简拼作目录名,以拼音首字母作文件夹名称,默认情况情况下,DedeCMS添加栏目时是以全拼作为文件夹名称,后台也没有提公简拼的选项,但是我们可以通过 ...

  9. 【Halcon 字符串与HTuple互转,double与HTuple互转,Mat与HObject互转】

    文章目录 1 字符串与HTuple互转 2 double与HTuple互转 3 Mat 与 HObject互转 4 HObject 转 Mat Opencv和Halcon之间有很多数据要转换,特此记录 ...

  10. 英汉互译在线翻译器如何语音互译中英文

    英汉互译在线翻译器如何语音互译中英文?我们在生活中或多或少都会遇到中英文翻译问题,特别是中英文语音互译.今天小编将要分享一个中英文在线语音互译的方法,希望可以帮助到大家. 1:在手机应用市场打开翻译工 ...

最新文章

  1. 【Qt】Qt再学习(十四):QGraphicsView
  2. 如何检查字符串是否包含特定单词?
  3. 汇编语言实验 3 编程、编译、连接、跟踪
  4. 将 ASP.NET Core 2.0 项目升级至 ASP.NET Core 2.1 RC 1
  5. [转载] JAVA 构造函数及其重载
  6. PHP 字符串编码处理 (附各语言的字符集编码范围)
  7. java 设置请求超时时间_java设置http请求超时时间
  8. 内链接和外连接的区别
  9. 汉诺塔问题的总结(1)
  10. 网络模块与RJ45水晶头接线方法
  11. vue3 vite版本 引入本地静态图片的方式
  12. 吃透Redis系列(五):RDB和AOF持久化详细介绍
  13. Python将读取到的字符串文本数据转换成数字类型列表和数组
  14. TeamSpeak 服务器LINUX下配置
  15. React的核心概念—— Jsx、 Component、 Props、 Refs、 State
  16. 用什么命令确定linux系统,在Linux系统中有哪些命令可以用于查看进程?
  17. 常见的几种距离量度(欧式距离、曼哈顿距离、切比雪夫距离等)
  18. 斐波那契1.斐波那契数列
  19. C++ - 多继承方式会产生多个虚函数表
  20. 知识从来就不是一个人的

热门文章

  1. ES安装以及基本应用
  2. R语言非度量多维标尺排序NMDS及一般加性模型GAM映射教程
  3. 崩坏3mmd中的渲染技术研究
  4. 计算机键盘最小化,电脑最小化键盘怎么按
  5. 网易公开课“Programming Paradigms” 笔记
  6. R语言:数据预处理-缺失值
  7. HDU2825 Wireless Password【AC自动机 + DP】
  8. pr剪辑打开多个项目_Pr:用Audition协作处理音频
  9. c语言 while 怎样用,C语言 while 的用法
  10. 光流法+FAST特征点