基因结构图的0_TBtools | 只有序列,怎么做基因结构图?
写在前面
这两天有看到几个用户朋友在生信札记讨论群中讨论了基因结构图的绘制。看到其他用户一直推荐 GSDS,我便也没有作声,毕竟 GSDS 确实是很优秀的网页软件。而现实情况是,近期 GSDS 网站无法访问。这或许就是网页或者在线软件的一个麻烦事。与之相比,TBtools 几乎不可能宕机,只要你手上安装了,该更新就更新。QQ群有安装软件,github也有,甚至问你身边的朋友,他们也有。类似的,其实 MEME suite 似乎也宕机了。
针对这两个分析需求,TBtools 其实早已提供可能更为便利的解决方案。
TBtools 干不了这事?
这是一个有趣的事情。几年前,我在 TBtools 上推出基因结构图绘制的时候,主要注明的优势就是,啥也不用管,用上直接下载的全基因组注释 GFF3/GTF 文件,只要感兴趣的 ID,就可以绘制基因结构图。于是,似乎所有人都觉得 TBtools 确实便利,却只能基于基因结构注释文件来绘制基因结构。
于是,总是存在部分人,不知为何,就是手上有:
- CDS序列
- DNA序列
换句话说,他们希望基于序列,绘制基因结构图。这是一个有趣的事情,因为这明显是基于序列比对,预测基因结构。或者说得更贴近基因组数据分析,那么是基于序列比对直接进行基因结构注释。了解这块的人就应是清楚,这类操作,不可能完美,多多少说会有细节上的小问题,当然几乎不可能影响具体基因结构样式。
GSDS 提供了这个操作接口;而 TBtools 确实没有。
是的,没有,但是不代表做不到。很久很久以前,TBtools中有这么一个功能
这是一个有趣的功能,可以基于输入的mRNA或CDS序列集合 以及 DNA如基因组序列,直接生成一个GFF3文件。
那么一旦有了这个GFF3文件,那不就可以直接用TBtools做下一步基因结构可视化了吗?
TBtools 怎么干这事?
说千遍,不如做一遍。此处直接拿拟南芥的序列为例,做个演示。
输出结果发现,有一个ID是NoGood,直接无视,一般这种只是小边界问题,不影响基因结构情况。
于是二十秒不到,我们就得到一个优秀的GFF3文件。
TBtools 这事干得如何?
直接上图,首先看看预测出来结果文件的样子,
是的,你输入CDS,但是我只会给出EXON,因为...确实懒得。如果你自己感兴趣,那么就直接全部文本替换为CDS就好了。
随后,我们直接拿相同的输入,分别使用:
- 真实的拟南芥 GFF3 注释信息
- TBtools基于序列抓取或预测的 基因结构注释信息
可视化,如下,
可以注意到,除了UTR确实搞不出来(因为你输入的本身就是CDS,哪来的UTR)。只看CDS,大家一模一样.....
OK,我觉得写到这里就完全足够了。
如果你再机制一点:
- mRNA序列做一个,不修改 EXON 标识
- cds序列做一个,修改 EXON 标识为CDS
然后两个文件一合并...那不就?.....
跟原始的一模一样吗?
那么问题来了,没有基因组,没有基因结构注释,你真的能拿到那么多DNA全长吗?(UTR+Exon+Intron)
写在最后
啊,东西不写出来,感觉都没人知道了。
基因结构图的0_TBtools | 只有序列,怎么做基因结构图?相关推荐
- 基因相关性心律失常_哪些心律失常可以做基因检测?
KCNQ1 ( LQT1 ) .KCNH2 ( LQT2 ) 及SCN5A( LQT3) 为常见的致病基因,约占遗传性LQTS 患者的75-80% LQT1-3 ( KCNQ1.KCNH2.SCN5A ...
- 使用gsds绘制基因结构图_使用SnapGene viewer绘制比较基因簇结构图
点击关注我 小编前期介绍了如何使用SnapGene viewer寻找酶切位点和设计引物, 你们学会了吗?(点击回顾前文) SnapGene viewer是一款专业的质粒图谱绘制软件,也可以绘制比较基因 ...
- geneHapR做基因单倍型分析
教你5分钟学会做基因单倍型分析 关键词: 基因单倍型.单倍型网络图.地理分布.连锁不平衡.主效位点 怎么做单倍型分析 一.什么是单倍型? 在单倍型分析前,首先需要明白什么是单倍型.什么是基因单倍型? ...
- metaProdigal:宏基因组序列中的基因和翻译起始位点预测
文章目录 metaProdigal:宏基因组序列中的基因和翻译起始位点预测 热心肠日报 摘要 动机 Motivation 结果 Results 可用性 Availability 主要结果 表1. 大肠 ...
- 这样做框架结构图,让你的PPT更有创意!
已剪辑自: https://zhuanlan.zhihu.com/p/58834710 嗨,各位木友们好呀,我是小木. 昨天,有个跟我一样鸟人的鸟人让我帮忙做个框架结构图: 可惜当时我不在办公室,不然 ...
- 结构matlab,MATLAB做晶体结构图(固体物理)
MATLAB做晶体结构图(固体物理).md 写在前面 最近在复习考研复试<固体物理>这一门课,去年学的内容已经忘干净了,所以就翻开前几页.突然看到了面心立方和体心立方结构图,想到了去年室友 ...
- R语者小case之——从GTF文件生成注释表格做基因ID转换
基因的注释表格是经常需要用到的,可以从GTF文件中获得.用R可以简单地实现这个功能. 简易的GTF文件实际上可以认为是用制表符分隔为9列的TSV. 第一列是seqid, 通常是染色体编号: 第二列是s ...
- 根据 基因名、bed 文件的基因位置,提取 DNA 序列 bedtools
根据 基因名.bed 文件的基因位置,提取 DNA 序列 bedtools 1.根据 Gene Symbol 查找在序列上的位置 2.根据 基因位置 提取参考上的序列 1.根据 Gene Symbol ...
- 蓝色基因 p超级计算机,世界最快超级计算机 蓝色基因登陆中国
世界最快超级计算机-蓝色基因登陆中国 12月1日,IBM在北京展示了其蓝色基因超级计算机. 蓝色基因超级计算机是目前全球速度最快的超级计算机,在全球最权威的TOP500超级计算机排行榜上,IBM的蓝色 ...
- 基因共表达网络分析java,好用的基因共表达网络分析工具
原标题:好用的基因共表达网络分析工具 基因共表达网络(GeneCo-expreesion Network)是用来展现基因间相互作用关系的一种手段,是基于基因间表达数据而构建调控网络图.今天推荐一个查询 ...
最新文章
- FTP匿名访问修复方法
- 后端架构设计,如何扛住100亿次请求?
- shell中通过sed替换文件中路径
- Error(s) in loading state_dict for ModelMain
- C语言 显示数组元素的值和地址
- OC 实例变量(instance var)与属性(@property)的关系 isa指针
- 信息安全——密码学之DES介绍
- iOS应用的真机调试
- Atitit 命令行dsl传递参数的几种模式对比 cli url模式 键值对NameValuePair urlutil 	String string = -host 101.13
- java Google图片验证码_使用google.kaptcha来生成图片验证码的实现方法
- 神经网络在线和离线的区别,神经网络网站
- JavaScript判断数组的方法
- 2021年下半年软件设计师下午真题及答案解析
- 导入以及导入模板下载
- mysql的sock文件_如何查找 mysql 的mysql.sock文件?
- Python numpy.ones_like函数方法的使用
- python自动化webdriver_轻松自动化---selenium-webdriver(python) (六)
- C盘清理的五大技巧,瞬间多出30G
- 从软件测试培训班出来后找工作的这段经历,教会了我这五件事...
- 【noip模拟赛1】古韵之鹊桥相会(最短路)