利用Hi-C 技术测序时,首先空间上距离相近的染色质被甲醛分子固定在一起,然后染色体上的序列被特定的限制性内切酶剪切,产生的切割位点通过连接酶连接并进行标记,然后 DNA 分子经纯化、获取被标记位点的序列,最后经二代高通量测序就可以获得标记位点的序列(图 1-5)[1]。

通过Hi-C 测序技术可以获得同一染色体上位置相邻较远(如 1 Mb)的测序

序列对[2],也可以获得位于不同染色体上的测序序列对。通过 Hi-C 技术测得的测序序列对具有两个基本特性:

(1)同一染色体上的测序序列对的交互频率随着距离增加递减,此处交互频率指的是两处酶切位点被连接酶连接的频率。

(2)同一染色体上的测序序列对的交互频率显著大于来自不同染色体上测序序列对的交互频率[3]。

规律(1)可以用于对重叠群进行定序和定向;

规律(2)可以用于对单倍体重叠群进行聚类,将重叠群分配到不同的染色体上。

利用 Hi-C 数据的这两个基本特性,可以将 Hi-C 测序数据应用到基因组序列组装和大型结构变异检测上。

参考:

[1] Lieberman-Aiden E, van Berkum N L, Williams L, et al. Comprehensive mapping of

long-range interactions reveals folding principles of the human genome[J]. Science,

2009, 326(5950) : 289-293.

[2] Belton J-M, McCord R P, Gibcus J H, et al. Hi-C: a comprehensive technique to

capture the conformation of genomes[J]. Methods, 2012, 58(3) : 268-276.

[3] Kaplan N, Dekker J. High-throughput genome scaffolding from in vivo DNA inter-

action frequency[J]. Nat. Biotechnol., 2013, 31(12) : 1143-1147.

[4]单倍体基因组序列组装方法研究,哈尔滨工业大学,官登峰.

Hi-C测序及测序数据特征相关推荐

  1. 三代测序原理与数据文件简介(SMRT+Nanopore)

    三代测序原理与数据文件简介(SMRT+Nanopore) 一生雾梦 2019-12-03 20:48:42  1578  收藏 2 分类专栏: 前沿文献分析 文章标签: 三代测序(SMS) SMRT  ...

  2. PaSS:用于 PacBio 测序的测序模拟器

    PaSS:用于 PacBio 测序的测序模拟器 张文敏, 1 本佳, 1魏朝春1 , 2 作者信息 文章注释 版权和许可信息 免责声明 本文已被PMC 中的其他文章引用. 相关数据 补充材料 数据可用 ...

  3. PaSS: a sequencing simulator for PacBio sequencing PaSS:用于PacBio测序的测序模拟器

    背景:PacBio测序等第三代测序平台近年来发展迅速.PacBio测序产生的读取比第二代测序(或第二代测序,NGS)技术长得多,具有独特的测序错误模式.有效的读取模拟器对于评估和促进PacBio测序数 ...

  4. c语言测序,Hi-C测序

    案例一 Hi-C技术揭示CTCF位点分化与染色质结构域进化相关 Comparative Hi-C Reveals that CTCF Underlies Evolution of Chromosoma ...

  5. 智能睡眠评估系统(包含:睡眠数据特征工程、睡眠评分、睡眠聚类、睡眠可视化分析、睡眠结论存储)

    智能睡眠评估系统(包含:睡眠数据特征工程.睡眠评分.睡眠聚类.睡眠可视化分析.睡眠结论存储) 目录 智能睡眠评估系统(包含:睡眠数据特征工程.睡眠评分.睡眠聚类.睡眠可视化分析.睡眠结论存储)

  6. python使用箱图法和业务规则进行异常数据处理并检查预测使用的数据特征是否有字段缺失的情况并补齐

    python使用箱图法和业务规则进行异常数据处理并检查预测使用的数据特征是否有字段缺失的情况并补齐 关于预测或者推理的时候特征补齐的情况是这样的: 你在模型训练的时候使用了多少特征,那么在模型预测和推 ...

  7. ML之FE:对人类性别相关属性数据集进行数据特征分布可视化分析与挖掘

    ML之FE:对人类性别相关属性数据集进行数据特征分布可视化分析与挖掘 目录 对人类性别相关属性数据集进行数据特征分布可视化分析与挖掘 输出结果 实现代码 对人类性别相关属性数据集进行数据特征分布可视化 ...

  8. ML之LightGBM:基于titanic数据集利用LightGBM和shap算法实现数据特征的可解释性(量化特征对模型贡献度得分)

    ML之LightGBM:基于titanic数据集利用LightGBM和shap算法实现数据特征的可解释性(量化特征对模型贡献度得分) 目录 基于titanic数据集利用LightGBM和shap算法实 ...

  9. 数据分析(排序,数据特征、平均数、方差等,累计统计,相关分析)

    # hanbb # come on!!! import pandas as pd import numpy as np import matplotlib.pyplot as pltdf = pd.D ...

  10. 数据可视化|实验四 分析1996-2015年人口数据特征间的关系

    使用 NumPy 库读取人口数据 使用 numpy 库读取人口数据,分析 1996~2015 年人口数据特征间的关系: %matplotlib inlineimport numpy as npimpo ...

最新文章

  1. sql语句练习50题(Mysql版-详加注释)
  2. python自动化测试locksetting/gatekeeper/keymaster/vts等
  3. Java中的ExceptionInInitializerError异常及解决方法
  4. Spring boot+Spring Security 4配置整合实例
  5. C语言const关键字—也许该被替换为readolny
  6. C++拾遗(四)——顺序容器
  7. 浏览器里面看到的表单数据映射到python_python爬虫入门01:教你在 Chrome 浏览器轻松抓包...
  8. SQL查询语句 select
  9. 文远知行2020年校招 | 领航者计划
  10. python: numpy--函数 shape用法
  11. 【转】有关Oracle随机字符串的生成方法及具体应用
  12. linux内存管理:kmap、vmap、ioremap
  13. 更换Homebrew为中科大源
  14. J03-Java IO流总结三 《 FileInputStream和FileOutputStream 》
  15. “wget”不是内部或外部命令,也不是可运行的程序或批处理文件
  16. mysql第二天无法连接_jdbc 连接mysql 第二天就连接不成功,什么原因?-问答-阿里云开发者社区-阿里云...
  17. 【洛谷p1012】拼数
  18. 中国目前拥有的物种和人造卫星的作用
  19. 模压硅胶产品成型后加工工艺
  20. python3爬虫——模拟登录丁香园并提取信息

热门文章

  1. 2022安全员-C证考试题库模拟考试平台操作
  2. 【Android】debug 状态下其签名文件 debug.keystore 相关(如何获得该文件,其密码,获取其sha1、MD5等)
  3. 2015级移动本面向对象课程主页
  4. 三个字母的单词颠倒也是单词_世界上最强大的两个字母的单词
  5. 【小菜虫的学习笔记--n5x刷机root】
  6. 程序设计入门——C语言 翁恺 第3周编程练习
  7. 【CLAA系列】CLAA协议学习(CS方向)
  8. 微软宣布Azure DNS全面通用
  9. 个人域名和企业域名的区别
  10. python 创建目录时间_python实现根据当前时间创建目录并输出日志