核苷酸和氨基酸蛋白序列转换的工具
在线序列转换的工具:
Nucleotide Sequence Translation
Protein Sequence Back-translation
http://bio.lundberg.gu.se/edu/translat.html
http://www.ebi.ac.uk/Tools/st/
http://www.hiv.lanl.gov/content/sequence/TRANSLATE/translate.html
Python 序列转换
beans = "TGACTGTGTTTCTGAACAATAAATGACTTAAACCAGGTATGGCTGCCGATGGTTATCTT"gencode = {'ATA':'I', 'ATC':'I', 'ATT':'I', 'ATG':'M','ACA':'T', 'ACC':'T', 'ACG':'T', 'ACT':'T','AAC':'N', 'AAT':'N', 'AAA':'K', 'AAG':'K','AGC':'S', 'AGT':'S', 'AGA':'R', 'AGG':'R','CTA':'L', 'CTC':'L', 'CTG':'L', 'CTT':'L','CCA':'P', 'CCC':'P', 'CCG':'P', 'CCT':'P','CAC':'H', 'CAT':'H', 'CAA':'Q', 'CAG':'Q','CGA':'R', 'CGC':'R', 'CGG':'R', 'CGT':'R','GTA':'V', 'GTC':'V', 'GTG':'V', 'GTT':'V','GCA':'A', 'GCC':'A', 'GCG':'A', 'GCT':'A','GAC':'D', 'GAT':'D', 'GAA':'E', 'GAG':'E','GGA':'G', 'GGC':'G', 'GGG':'G', 'GGT':'G','TCA':'S', 'TCC':'S', 'TCG':'S', 'TCT':'S','TTC':'F', 'TTT':'F', 'TTA':'L', 'TTG':'L','TAC':'Y', 'TAT':'Y', 'TAA':'_', 'TAG':'_','TGC':'C', 'TGT':'C', 'TGA':'_', 'TGG':'W'}basepairs = {'A':'T', 'C':'G', 'G':'C', 'T':'A'}def translate_frameshifted( sequence ):translate = ''.join([gencode.get(sequence[3*i:3*i+3],'X') for i in range(len(sequence)//3)])return translatedef reverse_complement( sequence ):reversed_sequence = (sequence[::-1])rc = ''.join([basepairs.get(reversed_sequence[i], 'X') for i in range(len(sequence))])return rcprint(translate_frameshifted(beans[0:])) # first frame
print(translate_frameshifted(beans[1:])) # second frame
print(translate_frameshifted(beans[2:])) # third frame
print(translate_frameshifted(reverse_complement(beans))) # negative first frame
print(translate_frameshifted(reverse_complement(beans[:len(beans)-1]))) # negative second frame
print(translate_frameshifted(reverse_complement(beans[:len(beans)-2]))) # negative third frame# This ::-1 syntax in python means reverse the string.
REF
https://www.biostars.org/p/55851/
http://www.soc-bdr.org/rds/authors/unit_tables_conversions_and_genetic_dictionaries/e5202/index_en.html
http://www.hiv.lanl.gov/content/sequence/TRANSLATE/translate.html
核苷酸和氨基酸蛋白序列转换的工具相关推荐
- 《预训练周刊》第6期:GAN人脸预训练模型、通过深度生成模型进行蛋白序列设计
No.06 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第6期< ...
- php时间序列比对,常用在线序列比对工具
从早期序列比对工具Needleman-Wunsch.Smith-Waterman到后来的Clustal算法,以及近几年的Muscle.MAFFT序列比对算法.算法在向更快.更精确.能处理更多数据这些方 ...
- 【生信MOOC】生物序列比对工具——多序列比对
[生信MOOC]生物序列比对工具2--多序列比对 文章的文字/图片/代码部分/全部来源网络或学术论文,文章会持续修缮更新,仅供大家学习使用. 目录 [生信MOOC]生物序列比对工具2--多序列比对 1 ...
- perl代码实现DNA翻译蛋白序列
#!/usr/bin/perl ##本代码用于逐条翻译fasta序列至蛋白序列,指定了起始密码子和终止密码子 use strict; use warnings; my %hash; my $id; m ...
- 机器学习从蛋白序列预测蛋白分类(二)
半路出家学机器学习,先在自己熟悉的领域尝试,每天进步一点点,记录自己成长过程(正式开始前的小叨叨) 接([机器学习从蛋白序列预测蛋白分类(一)])继续分析 三,特征提取 其实在(机器学习从蛋白序列预测 ...
- BioPython ① | 统计蛋白序列中20种氨基酸的的个数和频率
统计蛋白序列中20种氨基酸的的个数和频率 题目 MNAPERQPQPDGGDAPGHEPGGSPQDELDFSILFDYEYLNPNEEEPNAHKVASPPSGPAYPDDVLDYGLKPYSPLA ...
- 利用Transformer替代MSA从蛋白序列中学习Contact Map
点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:GoDesign --背景-- 基于深度学习的蛋白结构预测在近年来取得了不少突破, ...
- TestLink学习七:TestLink测试用例Excel转换XML工具
TestLink对于测试用例的管理来说,是蛮强大的,但是在导入导出这块,功能有点弱,本文针对测试用例的导入,转载了一个Excel转换成xml工具. 1.根据到处的测试用例xml,定义一下我的Excel ...
- 转:TestLink1.9.3测试用例:Excel转换XML工具二实现代码
TestLink1.9.3测试用例:Excel转换XML工具<二>实现代码 http://blog.csdn.net/candle806/article/details/7490599 以 ...
- TestLink测试用例:Excel转换XML工具二实现代码
以下是通过VBScript实现的Excel数据转换成XML格式,主要用于实现Testlink1.9.3-1.9.10的测试用例导入.代码实现如下: 根据到处的测试用例xml,定义一下我的Excel的格 ...
最新文章
- HTML中常见的各种位置距离以及dom中的坐标讨论
- SQL Server 2005 命令行实用工具
- .NET开发框架(九)-NLB网络负载平衡配置实战(视频)
- JAVA入门级教学之(static关键字)
- Android--手机root获取与判断应用是否获取
- Java EE重命名为Jakarta EE:Java EE Guardians与Oracle的分歧
- CDH hive的安装
- 【NOIP2005】【Luogu1051】谁拿了最多奖学金
- 龙格库塔方法在实际生活中的应用(数值计算Java)
- php手机注册和微信登录统一,微信登录和公众号授权登录开发逻辑详解
- html5 video js 播放,H5播放HLS之videojs播放视频
- STL——SET操作与并交差
- 二本跨考985计算机考研,跨专业考研经验谈:从二本到985的飞跃
- C/C++使用strcpy函数报错:“XXX处有未经处理的异常:0xC0000005:写入位置0x00000000时发生访问冲突”
- insmod lsmod rmmod
- Unity编码解析以及常用转换
- 亚马逊 广告接口对接 amazon advertising
- 转变自己的信仰——致少年的自己
- Android尺寸标注设计大全和Android切图规范
- Python 给员工发工资条