生物信息学python脚本_Python生物信息学数据管理
内容简介
本书实例意在解决生物学问题,通过"编程技法”的形式,涵盖尽可能多的组织、分析、表现结果的策略。在每章结尾都会有为生物研究者设计的编程题目,适合教学和自学。本书由六部分组成:Python语言基本介绍,语言所有成分介绍,高级编程,数据可视化,生物信息通用包Biopython,最后给出20个"编程秘笈”,范围涵盖了从二级结构预测、多序列比对到蛋白质三维结构的广泛话题。此外,本书附录还包括了大量的生物信息常用资源的信息。
教材特色
该书是面向生物学读者的编程好书之一。随着高通量技术(例如DNA微阵列或DNA/RNA测序)的改进,生物数据量正在迅速增长。管理和分析生物数据的需求越来越多,编程技术的应用将成为标准做法。Python由于其功能强大,语言优雅简单,成为提高编程技能的优秀工具!本书以Python数据管理为核心,主题广泛,结构合理,各章相互依赖程度低,便于读者自定学习的切入点。
作者清晰地诠释了Python在数据管理(解析数据记录、过滤和排序数据)与数据可视化(使用Python接口R)中的应用。本书还提供了模块化编程的描述,引导读者编写简单的函数,通过编写类而构建程序流程……一切都按照Python编码标准和易于提高的方式进行。
对于面临计算挑战的生物学家和从业者,本书既适合Python入门学习,又可助力中级Python用户学习一些新的技巧,进而在自己的代码中实现。书中实例意在解决生物学问题,通过“编程技法”的形式,涵盖尽可能多的组织、分析、表现结果的策略。在每章结尾都会有为生物研究者设计的编程题目,适合教学和自学。本书由六部分组成:Python语言基本介绍,语言所有成分介绍,高级编程,数据可视化,生物信息通用包Biopython,以及最后给出的20个“编程秘笈”。“编程秘笈”的范围涵盖了从二级结构预测、多序列比对到蛋白质三维结构的广泛话题。此外,本书附录还包括了大量的生物信息常用资源的信息和简单的UNIX教程。
前言
在几年前, 编程只是计算科学工作者的特权。虽然如此, 编程正加速变成生物等其他领域专家的一种需要。作为一个生物学研究者, 不需要对成为一个编程专家感兴趣, 但是需要把编程作为多个工具中的一种来继续科学工作。可能读者已经意识到编程技巧可以大幅地加速管理和分析数据。可能读者需要处理大规模的数据, 多次重复某种相同的分析, 或者从一个非通用格式的文件中解析数据。可以确信的是, 在所有这些情形下, 编程可以帮助你。然而, 因为读者从来没有对“枯燥无味”和“概念艰深”的计算机科学学科有很大兴趣, 就可能会感到不习惯。如果是这样的情况, 这本书是适合你的。
本书是为那些需要更多地掌控数据, 因此需要学习一些编程的生命科学工作者而写的。目标是使得那些以前没有编程经验的生物科学工作者能够自己用Python对生物数据进行分析。
在前言中, 包括全书内容的概述及编程介绍, 最后是对Python编程语言的概览。
我们希望这本编程书是为生物学工作者的读者量身定制的, 能帮助分析读者的数据, 从而尽早有所收获。
译者序
随着生命科学科研领域的需要和测序技术的发展,生物信息这个交叉学科近年来愈来愈兴旺起来,从业者也越来越多。与传统的理论和实验学科不同,生物信息是一门数据科学,这就需要从业者具备一定数据收集、管理、处理和分析的能力。在海量的组学数据面前,使用别人开发的软件及图形界面操作往往不能解决工作中的问题,而简单的编程就可能解决问题,因而编程即成为一个生物信息工作者的必备技能。这本书就是为生物信息初学者设计的编程教程。
我从事生物信息工作以来,编程语言开始一直以PERL和C为主,从2007年开始使用Python,初时也因为块缩进的问题不习惯,但很快被其可读性和开放性所吸引,喜欢上了这门语言,并作为最主要的脚本语言使用至今。回国后,发现国内大部分的生物信息工作者还是以PERL作为主要的工作语言,就想为Python在这个领域的推广做些工作,有幸得到出版社马岚老师的推荐,见到本书,就与陈一情,李少娟合作进行了翻译。
正如书中所说,编程就像写菜谱做饭或者是按流程做生物实验一样,不是一件很难的事情。对于有过逻辑训练的生物研究者只要能熟悉了编程的思想,掌握这项技能是容易的。但是如何选择一个切门点和提高途径,真正把它运用到自己的工作中就是另外一件事情,为什么推荐这本Python书作为生物信息数据管理编程的入门书呢?
Python语言提供了从入门到高手的良好的学习曲线。Python语言是至今为止最接近自然语言的编程语言,学过其它一些编程语言的学员甚至不需要太多的训练就能读写其代码;模块化和面向对象的支持使得学员能不费力地从一个只能写几行代码的操作员变成一个管理千行代码的程序员,同时书写良好可读性代码的编程习惯也会令其受益终生;丰富的标准库和第三方包使得Python语言成为当前最好的“胶水语言”,把多方资源整合到一起来解决工作中的问题。
本书的风格非常适合对编程的初学者。它从生物数据管理分析实践出发,由浅入深地介绍编程的基础知识,特别是对错误处理和程序调试等初学者常见的问题做了精辟的阐述;本书在内容上对生物信息中的经常遇到的数据整理和做图分析有较重的篇幅,还包含了大量的Python第三方工具库接口充分地体现了Python开放性“胶水语言”的特点。该书采用章节的篇幅都不长,每每切中要点,便于读者围绕主题、消化概念,且后面的练习难度适中,所以很适合作为本科生或是研究生低年级的教材;书后的编程秘诀对于进入科研实践的研究者也有颇多的参考价值。
非常感谢我的博士导师陈润生院士能在百忙中为本书作序。感谢陈一情和李绍娟以及所有参与工作的同学,陈一情翻译本书的第一到十五章,李绍娟翻译了第十六到十八章,我翻译了其它的部分并校正了本书的译稿。感谢李大伟博士对蛋白质结构翻译部分的意见。非常荣幸能得到出版社马岚老师的支持,才得以出版此书。
希望这本书能对有志于生物信息的同道有所帮助。
目录
第一部分入门第1章Python shell
第2章第一个Python程序
第二部分数 据 管 理第3章分析数据列
第4章解析数据记录
第5章搜索数据
第6章过滤数据
第7章管理表数据
第8章数据排序
第9章模式匹配和文本挖掘
第三部分 模块化编程第10章 将程序划分为函数
第11章用类化繁为简
第12章调试
第13章使用外部模块: R语言的Python调用接口
第14章构建程序流程
第15章编写良好的程序
第四部分数据可视化第16章创建科学图表
第17章使用PyMOL创建分子图像
第18章处理图像
第五部分Biopython第19章使用序列数据
第20章从网络资源中检索数据
第21章使用三维结构数据
第六部分编 程 秘 笈编程秘笈1: PyCogent库编程秘笈2: 反向互补和随机化序列
编程秘笈3: 用概率创建随机序列
编程秘笈4: 用Biopython解析多序列联配
编程秘笈5: 从多序列联配中计算共有序列
编程秘笈6: 计算系统发生树的节点间的距离
编程秘笈7: 核苷酸序列的密码子频率
编程秘笈8: 解析Vienna格式的RNA二级结构
编程秘笈9: 解析BLAST的XML输出
编程秘笈10: 解析SBML文件
编程秘笈11: 运行BLAST
编程秘笈12: 访问、 下载和读取网页
编程秘笈13: 解析HTML文件
编程秘笈14: 将PDB文件分割成PDB链文件
编程秘笈15: 在PDB结构上找到两个最靠近的Cα原子
编程秘笈16: 提取两个PDB链间的界面
编程秘笈17: 用Modeller建立同源模型
编程秘笈18: 用ModeRNA分析RNA三维同源模型
编程秘笈19: 从三级结构计算RNA碱基配对
编程秘笈20: 结构重叠的真实实例: 丝氨酸蛋白酶催化三分子
附录附录A命令概览附录BPython资源
附录C记录样板
附录D处理目录和用UNIX编程
丛书名:生命科学与信息技术丛书
著 者:(意)Allegra Via (阿莱格拉 维亚) 等
作 译 者:卢宏超等
策划编辑:马岚
出版时间:2017-01
版 次:01-01
I S B N :9787121303821
定价:¥69.00
生物信息学python脚本_Python生物信息学数据管理相关推荐
- 网页运行python脚本_python脚本和网页有何区别
Python是一种计算机程序设计语言,一种面向对象的动态类型语言,一种脚本语言.最初被设计用于编写自动化脚本(shell)的,常用于各种服务器的维护和自动化运行.它具有丰富和强大的库.它常被昵称为胶水 ...
- 手机编写python脚本_Python 脚本利用adb 进行手机控制
一. adb 相关命令: 1. 关闭adb服务:adb kill-server 2. 启动adb服务 adb start-server 3. 查询当前运行的所有设备 adb devices 4. ...
- python 脚本_python脚本如何同时运行多个
当我们想一次运行多个py脚本的时候你想到了什么应用场景了吗?当你想同时并行的处理一些对象时你有什么好方法吗?下面我就简单的总结一些这方面的小技巧,方便大家根据情况灵活处理. 1 用一个py脚本运行多个 ...
- pycharm定时运行python脚本_Python脚本用于定时关闭网易云音乐PC客户端
本文主要讲述如何使用Python在指定的秒数后关闭Windows上运行的程序(此程序以网易云音乐为例).本文的背景是昨晚发现网易云音乐的PC客户端没有定时关闭的功能,可以使用Python编写一个简单的 ...
- windows双击运行python脚本_Python脚本不能通过双击Windows来执行
对于这样的项目结构:/tumblr /tumblr /module_foo __init__.py submodule_foo.py /module_bar __init__.py submodule ...
- 自动化办公python脚本_Python自动化办公
在公司购买的OA系统上,很多功能都是软件商开发好的,如果有什么自定义的需求,也很难实现.现实情况下需要将一个工单的各类信息汇总整理为一份Excel,看似简单的需求,却需要在OA系统上反复点击多次,人工 ...
- 自动打卡python脚本_python实现腾讯文档自动打卡教程
明明365天都不得不待在家里面,居然还要天天去腾讯文档打卡,烦死人了. 天天都填一样的内容,重复无意义的事情,时间就是金钱,浪费人时间约等于谋财害命呀. 所以参考了网络上的代码,并做了改进,用pyt ...
- dnf自动刷图python脚本_python+selenium自动化登录dnf11周年活动界面领取奖励登录部分采坑总结[1]...
背景: Dnf的周年庆活动之一,游戏在6月22日 06:00~6月23日 06:00之间登陆过游戏后可以于6月25日 16:00~7月04日 06:00领取奖励 目标:连续四天自动运行脚本,自动领取所 ...
- 一元二次方程python脚本_Python实现求解一元二次方程的方法示例
本文实例讲述了Python实现求解一元二次方程的方法.分享给大家供大家参考,具体如下: 1. 引入math包 2. 定义返回的对象 3. 判断b*b-4ac的大小 具体计算代码如下: # -*- co ...
最新文章
- python搭建numpy_python开发环境搭建及numpy基本属性-【老鱼学numpy】
- Android动画之Tween动画实战
- 十八、前端必学Bootstrap美化(上篇)
- 数据包通过分层模型实现通信的过程
- java执行shell命令
- php链接远程socket,php使用socket获取远程图片
- 关系数据库——范式/反范式的利弊权衡和建议
- php dom 换行,PHP DOM XML不会在标记之后打印掉换行符
- cli php 增强包_Linux 上安装 PHP 扩展
- delphi之鼠标模拟
- 数据结构:堆栈的区别
- 实例讲解FusionInsight MRS RTD 实时决策引擎在医保行业应用
- 分布式系统之-我的书单
- 安卓手机用ADB命令打印APP的崩溃日志
- redisflush操作
- java构造方法:有参构造方法和无参构造方法区别
- 写给我的如风老男人(终结版)
- Dubbo 路由规则之条件路由
- SQL注入葵花宝典(基础篇)
- 需求分析篇|从实例分析中理解业务需求、用户需求、功能需求的转化