Paper reading series -1

简介
在生物医学研究中,一些名称会随着时间发生变化,并且生物实体通常会有很多别名,另外还有一些未被命名的数据也需要准确区分。因此在各类生物医学数据库中,使用唯一ID表示数据非常重要。为了整合分析多个数据库的内容,ID转换非常有必要。比如将RefGene ID与Ensemble ID对应起来。

全面且准确的ID转换并不容易实现。这需要在数量和数据量都在不断增长的生命科学领域数据库中,准确提取并不断更新各个源数据库中的ID之间的关系。如果有一个方便可用的API,web应用开发可节省大量人力时间,且可帮助科研工作减少时间投入。

现有ID转换工具存在支持的数据库范围有限,难以加入新的ID转换,对应ID的生物意义不清晰,不提供可用API等问题。TogoID项目通过扩大数据库范围,定义本体明确描述ID之间关系,基于云托管的数据定期更新,构建了友好的web界面和API,满足了ID转换的各类需求。

支持的数据库
包含基因,转录本,蛋白,结构,化合物,信号通路,疾病和文献等48个数据库。但由于数据库ID形式多样,为了便于整合,切分为65个子数据库。

与已有ID转换工具比较
在6个维度上,TogoID是最全面的工具。

  • 支持更广泛的数据库
  • 提供API供批量转换调用
  • 跨多个数据库进行多步骤转换
  • 增加ID之间关系的语义表示
  • 可扩展支持的数据库
  • 性能稳定且可不断更新

系统和方法
配置:开发者可在github通过发送pull request扩展支持的数据库范围。在配置文件中描述各类标签和ID。

本体:当需要多个步骤转换时,对应实体在源数据库,中间数据库和目标数据库中的种类并不相同,此时需要仔细查看。为了便于解释转换过程,TogoID使用OWL定义ID关系的本体,描述各种概念和它们之间的关系。共26个层级类表示数据库的种类,77个属性表示不同实体之间的关系。

数据更新过程:比较本地文件与数据库的更新日期和文件大小,一旦发生变化则自动更新。

系统架构:基于亚马逊云。

特点

  • 该项目可通过在github上提交pull
    request来扩展支持的数据库,如果你发现有重要的数据库没有收录覆盖,那么可以通过这种方式参与该项目的完善。这种方式可增强此ID转换工具的竞争力,而不像其他转换工具推,出后不能随着生物医学数据库的更新而更新,从而被逐渐淘汰。
  • 以前的ID转换工具只是单纯的进行ID转换,转换过程并不会增加新的信息。而TogoID通过新定义的本体描述不同数据库中的实体和它们之间的关系。当ID在多个数据库中转换时,可通过关系的描述发现新的知识以及之前因为没有清晰描述而被忽略掉的信息。下表分别是TogoID
    重新整理的数据库包含的实体类型和关系。



使用
网页界面

可直接键入ID或上传ID列表,无需指定源数据库,系统可自动判断ID来自哪个数据库。当有多个可能的来源时,需要点选,然后右侧可显示目标关联数据库。

EXPLORE页面列出了所有可转换关联的数据库。如果需要经过多个步骤,涉及不同数据库才能转换,页面可显示转换过程。NAVIGATE可指定目标数据库显示。如下图所示,每个颜色标签都可点击展示详情并下载。

页面不仅展示源数据库和目标数据库,当有中间转换步骤时,可清晰显示实体之间的关系。比如Ensembl gene 和UniProt之间的关系为has gene product,而UniProt 与 GlyTouCan之间的关系为 is modified with,清楚的表示了多糖与蛋白之间是修饰关系。

不同的颜色块表示特定种类的数据库信息。

API
除了通过用户友好的网页界面使用,TogoID还提供了API可用于大规模编程查询或灵活地在各类应用中整合使用。比如在开发生物信息应用时,如果原本只支持Ensembl ID, 可通过TogoID的集成,就可增加对NCBI Gene ID或HGNC基因名称的支持。

参考
TogoID:https://togoid.dbcls.jp/
Ikeda S, Ono H, Ohta T, et al. TogoID: an exploratory ID converter to bridge biological datasets[J]. Bioinformatics, 2022.
《生信了》2022年9月

TogoID - 生物医学数据库ID转换工具相关推荐

  1. sqlite自动转mysql,Sqlite数据库转换为mysql工具SqliteToMysql使用教程

    SqliteToMySQL是一款非常好用的数据库转换工具,通过使用该工具,能够将SQLITE数据转换成MYSQL数据库,表和查询可以进行自由转换,可以保存加载会话,重复执行,而且可以在特定时间自动执行 ...

  2. 人类基因id转换的R包:GeoTcgaData

    一个非常全的人类基因id转换工具 ​ GeoTcgaData包中有一个id转换的函数:id_conversion_vector() , 它可以对人类的各种基因id进行转换.2019年9月第一次发布,目 ...

  3. mysql sqlite转换_数据库转换工具(SqliteToMysql)

    SqliteToMysql是一款用于SQLITE和MYSQL之间的数据库转换工具.它能够将SQLITE数据转换成MYSQL数据库,让用户自主配置转换条件,满足用户的数据库格式需要.. 相关软件软件大小 ...

  4. 苹果id是什么格式的_iTunes Converter mac(音频格式转换工具)

    想要转换音频格式?无论什么格式的音频文件,iTunes Converter可以在iTunes软件转换成MP3或AAC格式的你.所以这也是一个M4P / AA到MP3转换器. iTunes Conver ...

  5. GEO数据库学习二(ID转换)

    上一节记录了如何下载数据,这一节学习id转换,主要是探针对应到symbol,其中表达矩阵的行是探针id,列是样品id,ids的列是探针id和symbol,我们的目的是利用探针id,将二者对应起来. 1 ...

  6. 车载总线数据库转换工具 - INTEWORK-VDC

    车载总线数据库转换工具 - INTEWORK-VDC 随着车载总线数据库设计工具INTEWORK-VDE的推出,经纬恒润软件团队也对原HiFire.Sure软件进行了重构和升级,并重新命名为INTEW ...

  7. 11月11日在线研讨会预热 | ODX诊断数据库转换工具 — VDC(ODX)

    11月11日在线研讨会预热 | ODX诊断数据库转换工具 - VDC(ODX) 概述 INTEWORK-VDC(ODX)(Vehicle Database Convertor) 是将恒润诊断调查问卷转 ...

  8. oracle 查询变换器,万能数据库转换工具_新诚软数据转换器 V1.4 免费版

    您还在为数据在各个数据库之间转换而烦恼吗?<新诚软数据转换器>是一个万能数据库转换工具,这个数据库转换工具可以为Oracle.SQL Server.Access.DB2.InterBase ...

  9. aws mysql 升级_AWS最新核心武器:升级主数据库转换工具

    [IT168 资讯]如今,AWS不仅在公有云市场中是领军地位,在数据库市场市场中,特别是Oracle商店中同样赢得客户认可.4月16日,AWS公共云提供商在这场战斗中有一个新的武器 :一个升级的主数据 ...

最新文章

  1. 非科班出身获得软开职位
  2. 解决opencv错误AttributeError: module ‘cv2.cv2‘ has no attribute ‘xfeatures2d‘
  3. 【十大经典数据挖掘算法】Naïve Bayes
  4. 项目进度管理:定义活动
  5. js 数组遍历符合条件跳出循环体_C++模拟面试:从数组“紧凑”操作说开来
  6. python模块下载连接清华镜像的具体步骤_anaconda | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror...
  7. Docker(二十三)-Docker使用pipework配置本地网络
  8. Struts2 自定义验证器
  9. php 中文名称排序 源码,四种排序算法PHP实现类
  10. TreeMap和TreeSet在排序时如何比较元素?Collections工具类中的sort()方法如何比较元素?...
  11. python高效办公 知乎_骚操作|高效办公,Python自动化教你一键获取日志!
  12. excel 快速比对两列数据差异
  13. 开关电源中的电感电容
  14. ROS位置导航基础之坐标变换
  15. 苹果关闭iOS 16.1.2 验证通道,iPhone升级 iOS 16.2 后无法降级
  16. jQuery对象,jQuery查找标签,层级选择器,属性选择器,表单筛选器,操作节点标签事件...
  17. 叉积 微分 恒等式_不等式(O):常见符号及恒等式
  18. Does setting the following sysctl settings require a system reboot?
  19. python——列表简介、操作列表
  20. R软件R2WinBUGS程序包在网状Meta分析中的应用

热门文章

  1. 15或18位身份证号码增强校验
  2. 室内导航的突破性进展—懒图科技提供低成本的室内导航服务
  3. 利用rna计算机开展复杂的细胞逻辑运算,Nature:哺乳动物细胞的生物计算器开发为病人带来福利...
  4. JAVA基础--java 常用编辑器介绍及比较
  5. superSlide和Swiper
  6. 电影《异形》标志性雕塑将分割为500个NFT出售
  7. 微信聊天记录怎么导出?
  8. Fuzzing101 Exercise 2 - Libexif 学习笔记
  9. Android系统开发常识
  10. ATT汇编---第一个linux汇编程序