如果大家对go和kegg等功能数据库注释有一定了解,就应该是知道kegg其实里面就记录各个物种不到一半的蛋白编码基因功能,比如人类, 约2万个蛋白编码基因,也就七千多个是有kegg功能注释的。其它物种就更是惨不忍睹,没有那么多科研经费投入进去,实际上对它们的基因功能就无从得知!

不过,哪怕是对人类来说,kegg注释的也仅仅是蛋白编码基因,但是如果你了解人类gtf文件,就应该是知道,里面有6万左右的基因,如果我们的差异分析,定位到了 lncRNA,假基因,miRNA的基因,其实就不能直接进行功能数据库注释。我们以miRNA为例,每个miRNA都是可以靶向调控数百甚至数千个蛋白编码基因,所以我们如果要对miRNA进行go和kegg等功能数据库数据库注释,就需要以靶向调控为桥梁。前面我们介绍了两次关于miRNA的靶向基因的查询工具,分别是:

  • microRNAs靶基因数据库哪家强
  • 使用miRNAtap数据源提取miRNA的预测靶基因结果

而且我们也多次讲解了go和kegg等功能数据库数据库注释,见:

  • 从基因名到GO注释一步到位
  • 3大在线分析工具:Enrichr、WebGestalt、gprofiler与R包clusterprofiler的比较

所以,理论上你能够查询到miRNA的靶向基因,就可以用靶基因作为桥梁去进行数据库注释啦!当然,如果你不想看这个中间过程,也可以自己写一个函数,或者使用造好的轮子,比如:

rm(list = ls())library(miRNAtap)library(topGO)library(org.Hs.eg.db)mir = 'miR-10b'predictions = getPredictedTargets(mir, species = 'hsa',                                  method = 'geom', min_src = 2) rankedGenes = predictions[,'rank_product']selection = function(x) TRUE # we do not want to impose a cut off, instead we are using rank informationallGO2genes = annFUN.org(whichOnto='BP', feasibleGenes = NULL,                         mapping="org.Hs.eg.db", ID = "entrez")GOdata =  new('topGOdata', ontology = 'BP', allGenes = rankedGenes,               annot = annFUN.GO2genes, GO2genes = allGO2genes,               geneSel = selection, nodeSize=10)GOdataresults.ks = runTest(GOdata, algorithm = "classic", statistic = "ks")results.ksallRes = GenTable(GOdata, KS = results.ks, orderBy = "KS", topNodes = 20)allRes[,c('GO.ID','Term','KS')]

这个topGO也是一个老牌的R包,虽然说因为Y书的原因,我们一直在强推clusterProfiler,但是并不意味着clusterProfiler 唯一的解决方案哈!

 

其它功能数据库同样的注释流程哈!

文末友情宣传

强烈建议你推荐我们生信技能树给身边的博士后以及年轻生物学PI,帮助他们多一点数据认知,让科研更上一个台阶:

  • 生信爆款入门-全球听(买一得五)(第4期),你的生物信息学入门课
  • 数据挖掘第2期(两天变三周,实力加量),医学生/临床医师首选技能提高课
  • 生信技能树的2019年终总结  ,你的生物信息学成长宝藏
  • 2020学习主旋律,B站74小时免费教学视频为你领路,还等什么,看啊!!!

推荐阅读

go kegg_对miRNA进行go和kegg等功能数据库数据库注释相关推荐

  1. miRPath:miRNA相关GO和KEGG功能分析

    欢迎关注"生信修炼手册"! 对于mRNA数据,我们经常通过GO和KEGG富集分析来进行功能分析,对于miRNA数据而言,我们可以通过miRNA对应的mRNA来研究miRNA相关功能 ...

  2. go kegg_工具篇丨GO和KEGG富集不到通路?快试试这个超赞的功能分析工具吧

    GO和KEGG富集分析是我们在筛选出差异表达基因之后,都会去做的套路性分析.然鹅--我相信,总有那么一些"倒霉孩子"会遇到跟我一样的窘境吧,好不容易筛选出来的差异基因,尝试了DAV ...

  3. go kegg_差异基因的GO与KEGG注释

    写在前面 这个其实很简单啦!三个R包可以搞定的事情. 三个包分是:clusterProfiler,pathview,org.Hs.eg.db. clusterProfiler,pathview两个包用 ...

  4. miRNA数据分析专题

    欢迎关注"生信修炼手册"! miRNA是一类长度在18到36bp的非编码RNA, 其功能属于转后后修饰调控,主要通过和mRNA的3'UTR区进行结合,结合区域称之为`seed`,当 ...

  5. PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组、新增KEGG层级

    PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组.新增KEGG层级 更新时间:2021年7月8日 PICRUSt推出了近8年,引用5000余次. 现推出PICRUSt2,202年再次霸 ...

  6. 注释数据库介绍之GO、KEGG数据库

    做过测序的小伙伴肯定都知道GO.KEGG数据库,我们想要知道基因发挥什么功能.参与什么途径,就一定要看基因功能注释的结果,而GO.KEGG这两个数据库是基因功能注释常用的数据库,也是常常出现在测序文章 ...

  7. mirna富集分析_miRNA富集分析数据库

    1. 写在前面 对于miRNA而言.其功能的预测基本都是通过其影响的基因来进行来讲总结的.随着关于miRNA的研究过多,目前也有了关于miRNA功能注释的数据库也越来越多.这样的话,基于这样的数据库来 ...

  8. miRNA的特征、功能及识别方法等详解

    什么是miRNA    MicroRNAs (miRNAs)是一种大小约21-23个碱基的单链小分子RNA,是由具有发夹结构的约70-90个碱基大小的单链RNA前体经过Dicer酶加工后生成,不同于s ...

  9. KEGG注释(生信学习)

    KEGC数据库:是系统分析基因功能.基因组信息的数据库 KEGC注释的工具:KofamKOALA有在线版与本地版(linux) 本次主要介绍本地版 安装 下载并解压Kofam wget https:/ ...

最新文章

  1. 业界丨全球AI人才只有2万多,但仅3000人在求职
  2. 菲律宾政府网站被黑!
  3. 用Anko和Kotlin实现Android上的对话框和警告提示(KAD 24)
  4. ubuntu-桌面版-常用设置
  5. Dart.Powerweb.livecontrols应用
  6. maven项目部署打包
  7. STM32 地址偏移问题及怎么运用
  8. yolo 视频场景行为数据集
  9. MapReduce 之shuffle过程
  10. vos3000_v7.x版本的快速安装方法
  11. Vulkan教程翻译之六 创建 Swapchain
  12. 张建宁老师主讲:计算机网络基础(笔记)
  13. 【laravel-admin】权限管理与实现原理
  14. 绝佳的3Dmax渲染技巧,这些精美的效果让人称赞不已!速看
  15. 架构搜索文献笔记(8):《FTT-NAS:发现容错神经结构》
  16. OpenCascade学习笔记-创建一个简单的OpenCascade单文档
  17. iThoughtsX for mac(优秀的思维导图软件)
  18. 它是最给力的数据分析体系,却被90%的新人忽略!
  19. python图片转黑白_python实现彩照转黑白以及图片转素描画
  20. 62. 如何通过增强(Enhancement) 的方式给 SAP ABAP 标准程序增添新功能

热门文章

  1. jmeter JDBC 连接数据库
  2. PHP获取一段时间内的每个周几, 每月几号, 遇到特殊日子就往后延
  3. java10 WeakHashMap
  4. HDU2111 Saving HDU 【贪心】
  5. Effective C++:条款37:绝不又一次定义继承而来的缺省參数值
  6. 如何检查PAL安装的功能
  7. TFTP服务器在Cisco设备上的应用(上传、下载IOS)
  8. Mint14体验报告 接近Windows的Linux
  9. 05_视图控制器_1
  10. the railway problem(the example of stack)