编辑推荐:

  斯坦福大学医学院的遗传学教授Michael Snyder及其同事利用Pacific Biosciences系统,对三个家庭成员的类淋巴母细胞转录组进行了测序,并将获得的reads与Illumina平台上获得的较短reads进行比较。通过这些转录组,他们开发出一名家庭成员的等位基因特异的全长转录组。

生物通报道 斯坦福大学的研究人员利用一种基于long-read的方法,生成了个人的转录组。这项成果于近日发表在《美国国家科学院院刊》上。

文章的通讯作者是斯坦福大学医学院的遗传学教授Michael Snyder。他的实验室主要利用各种方法来分析基因组及调控网络。他们的研究对象包括酵母和人类。Snyder教授曾在《Cell》、《Science》、《Nature》等杂志上发表了多篇具有影响力的文章。

在这项研究中,Snyder及其同事利用Pacific Biosciences系统,对三个家庭成员的类淋巴母细胞转录组进行了测序,并将获得的reads与Illumina平台上获得的较短reads进行比较。通过这些转录组,他们开发出一名家庭成员的等位基因特异的全长转录组。他们能够区分两个等位基因,即使是复杂的基因如HLA。

研究人员在文章中写道:“据我们所知,我们生成了最深且最长的单分子long-read数据集。”他们认为,这种个人的转录组,将对了解个体生物学和疾病很重要。

Snyder及其同事利用PacBio平台,对GM12878细胞系的大约711,000个环化一致分子(circular consensus read molecules)进行测序。他们产生了较长的reads(平均读长为1,188 bp),这比去年他们在《Nature Biotechnology》上展示的人体器官panel的数据集更长(平均读长为999.9 bp)。

他们也指出,尽管两个数据集都同样产生了较短的分子(长度介于0.8 kb和1.3 kb),但是现有的数据集更好地代表了长于1.7 kb的分子。

此外,这个斯坦福的团队也在Illumina的平台上对100 M个101 bp的双端reads进行测序,并利用Cufflinks开展分析。

这两种技术都发现了约99,000个带注释的外显子-外显子接头,且Illumina的reads发现了额外92,000个注释接头,而PacBio的reads发现了额外992个。此外,对于22,600个被Gencode归为蛋白编码基因或lincRNA的剪接基因,long-read的单分子测序和101 bp的双端测序同时鉴定出其中的9,200个。long-read还发现了40个基因,双端测序发现了6,400个基因,而还有7,000个基因利用两种方法都未发现。

研究人员推测,由于环状一致read的产生需要读长至少是cDNA长度的两倍,故consensus split-mapped molecules(CSMM)不包含大量较长的基因。

研究人员表示,转录组学研究的目标是能够指定表达RNA分子的等位基因。他们认为,long-read测序应该能够确定影响单个RNA分子的每个SNV。

为了追踪在GM12878子细胞系中发现的这些等位基因的来源,他们合并了GM12891和GM12892母细胞系的数据,并研究了子代中存在的SNV是否存在于亲代数据中。

通过主成分分析,他们能够分离出两个等位基因。对于166个注释有两个杂合SNP的基因,研究人员发现其中的158个有两个或以上的SNP,2个基因有一个SNP,而6个基因似乎不是杂合的。

一些基因,尤其是HLA基因,包含多个SNP,而对于它们,研究人员基本能够确定相位。“即使是复杂的基因(如HLA基因,其序列可能与参考序列相差甚远),两个等位基因通常也是清晰可辨的,”Snyder及其同事写道。(生物通 薄荷)

原文检索

Defining a personal, allele-specific, and single-molecule long-read transcriptome

Published online before print June 24, 2014, doi: 10.1073/pnas.1400447111
PNAS June 24, 2014

PNAS:利用long-read生成个人转录组相关推荐

  1. python etree创建xml_利用 Python ElementTree 生成 xml的实例

    Python 处理 xml 文档的方法有很多,除了经典的 sax 和 dom 之外,还有一个 ElementTree. 首先 import 之: from xml.etree import Eleme ...

  2. Dataset:数据生成之利用pandas自定义生成随机各自类型(离散型和连续型)的dataframe数据

    Dataset:数据生成之利用pandas自定义生成随机各自类型(离散型和连续型)的dataframe数据 目录 数据生成之利用pandas自定义生成随机数据 输出结果 实现代码 数据生成之利用pan ...

  3. 解析利用wsdl.exe生成webservice代理类的详解

    利用wsdl.exe生成webservice代理类: 根据提供的wsdl生成webservice代理类 1.开始->程序->Visual Studio 2010 命令提示 2.输入如下红色 ...

  4. 利用 51 定时器生成 PWM

    利用 51 定时器生成 PWM 1 PWM 简介 PWM(Pulse Width Modulation,脉冲宽度调制)是按一定规律改变脉冲序列的脉冲宽度,以调节输出量和波形的一种调制方式. 在控制系统 ...

  5. python内置库绘制33角形_33 python format练习题 利用format方法生成一个星号三角形...

    第十五课 练习题 ''' 1. 编写一个Python程序,从控制台输入一个字符串(保存到变量s中), 然后通过while循环不断输入字符串(保存到变量subStr中), 并统计subStr在s中出现的 ...

  6. gerber文件怎么导贴片坐标_利用Gerber文件生成贴片坐标及元件位置图的方法技巧...

    利用 Gerber 文件生成贴片坐标及元件位置图的方法技巧 利用 Gerber 文件生成贴片坐标及元件位置图的方法技 巧 2010-10-11 21:59 Gerber 文件是所有电路设计软件都可以产 ...

  7. python批量生成图片_利用Python批量生成任意尺寸的图片

    实现效果 通过源图片,在当前工作目录的/img目录下生成1000张,分别从1*1到1000*1000像素的图片. 效果如下: 目录结构 实现示例 # -*- coding: utf-8 -*- imp ...

  8. Eclipse 插件用法:Eclipse 利用 Amateras UML 生成 Java 类图、时序图和 UML 类图

    文章目录 前言 一.安装 Eclipse 官方提供的安装框架 GEF 1.1.Eclipse 中第三方插件更新/安装策略 1.2.为什么选择 GEF 框架? 1.3.GEF 框架安装 二.安装 Ama ...

  9. java后台处理excel_java后台利用Apache poi 生成excel文档提供前台下载示例

    之前在项目中会用到在java在后台把数据填入Word文档的模板来提供前台下载,为了自己能随时查看当时的实现方案及方便他人学习我写了这篇博客,访问量已经是我写的博客里第一了.于是乎我在学会用Java在后 ...

  10. python批量生成图_利用Python批量生成任意尺寸的图片

    实现效果 通过源图片,在当前工作目录的/img目录下生成1000张,分别从1*1到1000*1000像素的图片. 效果如下: 目录结构 实现示例 # -*- coding: utf-8 -*- imp ...

最新文章

  1. jquery判断方法是否存在_判断图中是否有环的三种方法
  2. C语言中文件的读写(fputc和fgetc)(putchar和getchar)
  3. python元编程详解
  4. SAP UI5的source code map(源代码映射)机制
  5. 阿里云mysql服务器太贵_阿里云数据库,跟自己在服务器安装的有什么区别?有人说安装很简单,那为什么要花钱买?...
  6. ipone怎么没有科学计算机,ipone7与ipone8其实根本没什么区别呀
  7. linux配置caffe环境,ubuntu14.04环境下配置caffe
  8. 超强干货!AI、Python、机器学习课程免费学,请尽快领取!
  9. Wide character in print at ../lib/MonWalkProc.pm line 569.
  10. linux下mysql 8.0忘记密码后重置密码
  11. 【0702作业】输出九九乘法表
  12. Java并发编程学习笔记(一)线程安全性 1
  13. 修改linux的文件时,如何快速找到要修改的内容并修改
  14. 测试方案包括哪些内容
  15. Axure RP 8的介绍
  16. uefi引导固态硬盘ssd装win10(不用U盘)
  17. SystemSoftware
  18. 端口映射工具rinetd
  19. 归并排序 (递归+非递归)
  20. Android端推送消息之极光推送

热门文章

  1. 生成xml_Java操作XML
  2. 综述:AI系统安全的实用方法介绍
  3. 14种轻量级网络综述 — 主干网络篇
  4. android 布局 站位符,基于android布局中的常用占位符介绍
  5. Spring注入---静态工厂
  6. 创建maven项目但是总是报错
  7. Anaconda | CentOS7 -解决 Python2和Python3共存
  8. RDKit | 基于随机森林的化合物活性二分类模型
  9. RDKit2018.03.3+Win10(64位):ImportError: DLL load failed: 找不到指定的模块。
  10. 【Math Time 】Mean, Median, Mode 之间的区别