go kegg_对miRNA进行go和kegg等功能数据库数据库注释
如果大家对go和kegg等功能数据库注释有一定了解,就应该是知道kegg其实里面就记录各个物种不到一半的蛋白编码基因功能,比如人类, 约2万个蛋白编码基因,也就七千多个是有kegg功能注释的。其它物种就更是惨不忍睹,没有那么多科研经费投入进去,实际上对它们的基因功能就无从得知!
不过,哪怕是对人类来说,kegg注释的也仅仅是蛋白编码基因,但是如果你了解人类gtf文件,就应该是知道,里面有6万左右的基因,如果我们的差异分析,定位到了 lncRNA,假基因,miRNA的基因,其实就不能直接进行功能数据库注释。我们以miRNA为例,每个miRNA都是可以靶向调控数百甚至数千个蛋白编码基因,所以我们如果要对miRNA进行go和kegg等功能数据库数据库注释,就需要以靶向调控为桥梁。前面我们介绍了两次关于miRNA的靶向基因的查询工具,分别是:
- microRNAs靶基因数据库哪家强
- 使用miRNAtap数据源提取miRNA的预测靶基因结果
而且我们也多次讲解了go和kegg等功能数据库数据库注释,见:
- 从基因名到GO注释一步到位
- 3大在线分析工具:Enrichr、WebGestalt、gprofiler与R包clusterprofiler的比较
所以,理论上你能够查询到miRNA的靶向基因,就可以用靶基因作为桥梁去进行数据库注释啦!当然,如果你不想看这个中间过程,也可以自己写一个函数,或者使用造好的轮子,比如:
rm(list = ls())library(miRNAtap)library(topGO)library(org.Hs.eg.db)mir = 'miR-10b'predictions = getPredictedTargets(mir, species = 'hsa', method = 'geom', min_src = 2) rankedGenes = predictions[,'rank_product']selection = function(x) TRUE # we do not want to impose a cut off, instead we are using rank informationallGO2genes = annFUN.org(whichOnto='BP', feasibleGenes = NULL, mapping="org.Hs.eg.db", ID = "entrez")GOdata = new('topGOdata', ontology = 'BP', allGenes = rankedGenes, annot = annFUN.GO2genes, GO2genes = allGO2genes, geneSel = selection, nodeSize=10)GOdataresults.ks = runTest(GOdata, algorithm = "classic", statistic = "ks")results.ksallRes = GenTable(GOdata, KS = results.ks, orderBy = "KS", topNodes = 20)allRes[,c('GO.ID','Term','KS')]
这个topGO也是一个老牌的R包,虽然说因为Y书的原因,我们一直在强推clusterProfiler,但是并不意味着clusterProfiler 唯一的解决方案哈!
其它功能数据库同样的注释流程哈!
文末友情宣传
强烈建议你推荐我们生信技能树给身边的博士后以及年轻生物学PI,帮助他们多一点数据认知,让科研更上一个台阶:
- 生信爆款入门-全球听(买一得五)(第4期),你的生物信息学入门课
- 数据挖掘第2期(两天变三周,实力加量),医学生/临床医师首选技能提高课
- 生信技能树的2019年终总结 ,你的生物信息学成长宝藏
- 2020学习主旋律,B站74小时免费教学视频为你领路,还等什么,看啊!!!
推荐阅读
go kegg_对miRNA进行go和kegg等功能数据库数据库注释相关推荐
- miRPath:miRNA相关GO和KEGG功能分析
欢迎关注"生信修炼手册"! 对于mRNA数据,我们经常通过GO和KEGG富集分析来进行功能分析,对于miRNA数据而言,我们可以通过miRNA对应的mRNA来研究miRNA相关功能 ...
- go kegg_工具篇丨GO和KEGG富集不到通路?快试试这个超赞的功能分析工具吧
GO和KEGG富集分析是我们在筛选出差异表达基因之后,都会去做的套路性分析.然鹅--我相信,总有那么一些"倒霉孩子"会遇到跟我一样的窘境吧,好不容易筛选出来的差异基因,尝试了DAV ...
- go kegg_差异基因的GO与KEGG注释
写在前面 这个其实很简单啦!三个R包可以搞定的事情. 三个包分是:clusterProfiler,pathview,org.Hs.eg.db. clusterProfiler,pathview两个包用 ...
- miRNA数据分析专题
欢迎关注"生信修炼手册"! miRNA是一类长度在18到36bp的非编码RNA, 其功能属于转后后修饰调控,主要通过和mRNA的3'UTR区进行结合,结合区域称之为`seed`,当 ...
- PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组、新增KEGG层级
PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组.新增KEGG层级 更新时间:2021年7月8日 PICRUSt推出了近8年,引用5000余次. 现推出PICRUSt2,202年再次霸 ...
- 注释数据库介绍之GO、KEGG数据库
做过测序的小伙伴肯定都知道GO.KEGG数据库,我们想要知道基因发挥什么功能.参与什么途径,就一定要看基因功能注释的结果,而GO.KEGG这两个数据库是基因功能注释常用的数据库,也是常常出现在测序文章 ...
- mirna富集分析_miRNA富集分析数据库
1. 写在前面 对于miRNA而言.其功能的预测基本都是通过其影响的基因来进行来讲总结的.随着关于miRNA的研究过多,目前也有了关于miRNA功能注释的数据库也越来越多.这样的话,基于这样的数据库来 ...
- miRNA的特征、功能及识别方法等详解
什么是miRNA MicroRNAs (miRNAs)是一种大小约21-23个碱基的单链小分子RNA,是由具有发夹结构的约70-90个碱基大小的单链RNA前体经过Dicer酶加工后生成,不同于s ...
- KEGG注释(生信学习)
KEGC数据库:是系统分析基因功能.基因组信息的数据库 KEGC注释的工具:KofamKOALA有在线版与本地版(linux) 本次主要介绍本地版 安装 下载并解压Kofam wget https:/ ...
最新文章
- 业界丨全球AI人才只有2万多,但仅3000人在求职
- 菲律宾政府网站被黑!
- 用Anko和Kotlin实现Android上的对话框和警告提示(KAD 24)
- ubuntu-桌面版-常用设置
- Dart.Powerweb.livecontrols应用
- maven项目部署打包
- STM32 地址偏移问题及怎么运用
- yolo 视频场景行为数据集
- MapReduce 之shuffle过程
- vos3000_v7.x版本的快速安装方法
- Vulkan教程翻译之六 创建 Swapchain
- 张建宁老师主讲:计算机网络基础(笔记)
- 【laravel-admin】权限管理与实现原理
- 绝佳的3Dmax渲染技巧,这些精美的效果让人称赞不已!速看
- 架构搜索文献笔记(8):《FTT-NAS:发现容错神经结构》
- OpenCascade学习笔记-创建一个简单的OpenCascade单文档
- iThoughtsX for mac(优秀的思维导图软件)
- 它是最给力的数据分析体系,却被90%的新人忽略!
- python图片转黑白_python实现彩照转黑白以及图片转素描画
- 62. 如何通过增强(Enhancement) 的方式给 SAP ABAP 标准程序增添新功能
热门文章
- jmeter JDBC 连接数据库
- PHP获取一段时间内的每个周几, 每月几号, 遇到特殊日子就往后延
- java10 WeakHashMap
- HDU2111 Saving HDU 【贪心】
- Effective C++:条款37:绝不又一次定义继承而来的缺省參数值
- 如何检查PAL安装的功能
- TFTP服务器在Cisco设备上的应用(上传、下载IOS)
- Mint14体验报告 接近Windows的Linux
- 05_视图控制器_1
- the railway problem(the example of stack)