crispr基因编辑

by Josh McMenemy

乔什·麦克梅尼(Josh McMenemy)

用CRISPR编程基因组 (Programming the genome with CRISPR)

科学家如何借助计算机编辑基因组 (How scientists edit genomes with the help of computers)

CRISPR (pronounced “crisper”) is part of a bacterial immune system evolved to ‘remember’ and remove invading viral DNA.

CRISPR(发音为“ crisper”)是细菌免疫系统的一部分,进化为“记忆”并去除入侵的病毒DNA。

Its name is short for ‘Clustered Regularly Interspaced Short Palindromic Repeats’. But despite its mouthful of an acronym and complex biological origins, its engineering application is straightforward. To get started, there is only one protein you need to understand — Cas9.

它的名称是“聚簇有规律间隔的短回文重复序列”的简称。 但是,尽管它有一个缩写词和复杂的生物学渊源,但其工程应用却很简单。 首先,您只需要了解一种蛋白质-Cas9。

Cas9 searches for a specified DNA sequence and cuts it by breaking both strands of the DNA molecule. This protein is useful to researchers because they can ‘program’ it to target any DNA sequence. A sgRNA (‘single guide’ RNA) molecule determines the sequence that Cas9 binds to. RNA is a biological molecule similar to DNA, that can bind to proteins and DNA.

Cas9搜索指定的DNA序列,并通过折断DNA分子的两条链将其切割。 该蛋白质对研究人员有用,因为他们可以对其进行“编程”以靶向任何DNA序列。 sgRNA(“单向导” RNA)分子决定了Cas9结合的序列。 RNA是类似于DNA的生物分子,可以与蛋白质和DNA结合。

sgRNAs are short sequences with a constant region and variable region. The constant region attaches the sgRNA to the Cas9 protein. The variable region causes Cas9 to bind to the DNA sequence that complements it (see the diagram below).

sgRNA是具有恒定区和可变区的短序列。 恒定区将sgRNA连接到Cas9蛋白。 可变区使Cas9与与其互补的DNA序列结合(请参见下图)。

Making sgRNA is cheap and fast. This allows researchers to quickly set up a Cas9 experiment that cuts any DNA sequence. Well, not actually any sequence. There is a small constraint: the target sequence must be flanked by the correct PAM (protospacer adjacent motif) — a short sequence of DNA.

制作sgRNA既便宜又快速。 这使研究人员可以快速建立一个可切割任何DNA序列的Cas9实验。 好吧,实际上没有任何顺序。 有一个小的限制:目标序列的两侧必须是正确的PAM(与原间隔子相邻的基序),即短的DNA序列。

Streptococcus pyogenes is an infectious species of bacteria. In the version of Cas9 it produces, the PAM motif is ‘NGG’, where N is any nucleotide (the ‘letters’ that make up DNA).

化脓性链球菌是细菌的传染性物种。 在它产生的Cas9版本中,PAM基序为“ NGG”,其中N为任何核苷酸(组成DNA的“字母”)。

Luckily, the motif ‘NGG’ occurs roughly once every 42 basepairs in the human genome. This mean that researchers can find a target site near almost every sequence of interest.

幸运的是,“ NGG”基序在人类基因组中大约每42个碱基对出现一次。 这意味着研究人员可以在几乎每个感兴趣的序列附近找到目标位置。

Depending on the experimental set up, these cuts in the DNA can either cause a random change or a precise change to the DNA sequence (more on this later).

根据实验设置,DNA的这些切割可能会导致DNA序列的随机变化精确变化 (稍后会详细介绍)。

Before jumping into writing this program, I recommend studying the Cas9 diagram below.

在着手编写此程序之前,我建议您研究以下Cas9图。

Note that DNA and RNA have a directionality based on their chemical structure. One end of the molecule is referred to as the 5` (‘five-prime’) end, and the other is referred to as the 3` (‘three-prime’) end. This is important, because the sequences 5`— AGG — 3` is not the same as 3` — AGG — 5`.

请注意,DNA和RNA基于其化学结构具有方向性。 分子的一个末端称为5`(“五引数”)末端,另一末端称为3`(“三引数”)末端。 这很重要,因为序列5`–AGG_3`与3`_AGG_5`不同。

By convention, DNA and RNA sequences are assumed to be written 5` to 3` unless otherwise marked. Sequences read in the 5` — 3` direction are called ‘forward’ sequences. Sequences read the other way (3` — 5`) are called ‘reverse’ sequences. This is an arbitrary convention.

按照惯例,除非另有说明,否则假定DNA和RNA序列写为5`至3`。 沿5`-3`方向读取的序列称为“正向”序列。 以其他方式读取的序列(3`-5`)称为“反向”序列。 这是一个任意约定。

The diagram above shows an example of Cas9 bound when the PAM is on the reverse (bottom) strand.

上图显示了当PAM位于反向(底部)链上时与Cas9结合的示例。

您的第一个CRISPR程序 (Your first CRISPR program)

场景 (The scenario)

A scientist has a DNA sequence of interest and wants a list of all CRISPR targets contained in the sequence. Finding every target by hand is tedious and error prone.

一位科学家有一个感兴趣的DNA序列,想要该序列中包含的所有CRISPR靶标的列表。 手动找到每个目标很乏味且容易出错。

The scientist wants a simple program where they can input a DNA sequence and have all possible Cas9 target sites returned. The scientist would also like the cut position and PAM sequence for each target site.

科学家想要一个简单的程序,在其中他们可以输入DNA序列并返回所有可能的Cas9目标位点。 科学家还希望每个目标位点的切割位置和PAM序列。

EXAMPLE INPUT (from Figure 1): 'CCACGGTTTCTGTAGCCCCATACTTTGGATG'
EXAMPLE OUTPUT: [{    'cut_pos': 6,    'pam_seq': 'TGG',    'target_seq': 'GTATGGGGCTACAGAAACCG',    'strand': 'reverse'  }, {    'cut_pos': 22,    'pam_seq': 'TGG',    'target_seq': 'GTTTCTGTAGCCCCATACTT',    'strand': 'forward'  }]

First, how do we find CRISPR targets in the sequence? Remember that the Cas9 protein can bind anywhere there is a ‘NGG’ motif.

首先,我们如何找到序列中的CRISPR靶标? 请记住,Cas9蛋白可以结合有“ NGG”基序的任何位置。

The first step is to loop through the sequence looking for matches. When the program finds a ‘NGG’ match, we want to subtract three positions from the start of the PAM site, since that is where Cas9 cuts the DNA.

第一步是遍历序列以查找匹配项。 当程序找到“ NGG”匹配项时,我们要从PAM站点的开头减去三个位置,因为这是Cas9切割DNA的位置。

Then, we want to record the twenty basepairs before the PAM as the target sequence. Sounds good?

然后,我们要记录PAM之前的20个碱基对作为目标序列。 听起来不错?

Well, the algorithm described above would actually miss about half of all CRISPR sites — because DNA is double stranded. This means if a ‘CCN’ is the sequence on the forward strand, then ‘NGG’ is the sequence on the reverse strand.

嗯,上述算法实际上会丢失所有CRISPR位点的大约一半-因为DNA是双链的。 这意味着,如果“ CCN”是正向链上的序列,那么“ NGG”是反向链上的序列。

The program must also search for ‘CCN’ using similar logic for the reverse strand.

该程序还必须使用与反向链相似的逻辑来搜索“ CCN”。

范例程序 (Example program)

并非所有CRISPR靶标都相等 (Not all CRISPR targets are equal)

When CRISPR was first catching on, researchers would often pull up a sequence on their computer and pick targets by hand. Designing the optimal sgRNA has now become much more complex. Below are brief introductions to this complexity.

CRISPR首次流行时,研究人员通常会在计算机上提取一个序列并用手选择目标。 设计最佳的sgRNA现在变得更加复杂。 以下是这种复杂性的简要介绍。

脱靶 (Off-targets)

Researchers soon realized that Cas9 would sometimes bind and cut at loci that did not exactly match the target sequence. These off-target cuts would cause unintended changes in a researcher’s experiment (or potentially a patient’s genome in the case of a therapy!)

研究人员很快意识到,Cas9有时会在与靶序列不完全匹配的基因座处结合并切割。 这些偏离目标的切割会导致研究人员的实验发生意外变化(在治疗的情况下可能导致患者的基因组发生变化!)

To design a good guide, a program must look at the entire genome (which is approximately 3 billion nucleotides for humans) to calculate an off-target score. Researchers have also recently engineered the Cas9 protein to have less off-target activity.

为了设计一个好的指南,程序必须查看整个基因组(人类大约30亿个核苷酸)以计算脱靶得分。 研究人员最近还对Cas9蛋白进行了改造,使其具有较少的脱靶活性。

昏死 (Knockout)

When Cas9 binds, it creates a cut by making a double strand break to the DNA molecule. Most of the time, a cell can repair this break through a biochemcial pathway (called non-homologous end joining, or NHEJ).

当Cas9结合时,它会通过使DNA分子发生双链断裂而产生切割。 大多数时候,细胞可以通过生物化学途径(称为非同源末端连接,或NHEJ)修复这种断裂。

This pathway is not always perfect, and sometimes when Cas9 cuts, the repair process makes a small insertion or deletion in the DNA sequence. In a protein-coding region of DNA, these small insertions and deletions cause a frameshift mutation — which will often disrupt the protein’s function.

该途径并不总是完美的,有时Cas9切割时,修复过程会在DNA序列中产生少量插入或缺失。 在DNA的蛋白质编码区域中,这些小的插入和缺失会导致移码突变—通常会破坏蛋白质的功能。

Researchers will often knockout a gene to figure out how a protein affects a specific cell function or phenotype. Creating a knockout edit adds extra constraints to the sgRNA design, because now the guide must land in the coding region of the gene.

研究人员通常会剔除一个基因,以弄清蛋白质如何影响特定的细胞功能或表型。 创建基因剔除编辑会给sgRNA设计增加额外的限制 ,因为现在该指南必须落在基因的编码区域。

编辑中 (Editing)

Instead of knocking out a gene, there are many times a scientist wants to make a precision edit. This is especially useful when trying to correct a disease causing a mutation. The best way to do this is still being researched. Most methods involve adding an extra donor piece of DNA.

除了敲除一个基因外,很多时候科学家还希望进行精确的编辑。 当试图纠正引起突变的疾病时,这特别有用。 最佳方法仍在研究中。 大多数方法涉及添加额外的供体DNA 。

目标得分 (On-target score)

Some sgRNA sequences will cause Cas9 to cut better than others. Researchers have compared cutting efficiency across thousands of Cas9 targets to create predictive models of a sgRNA’s cutting efficiency.

一些sgRNA序列会导致Cas9的切割效果更好。 研究人员已经比较了数千个Cas9靶标的切割效率 ,从而创建了sgRNA切割效率的预测模型。

Microsoft even supports an open source repository for ‘Machine Learning-Based Predictive Modeling of CRISPR/Cas9 guide efficiency’.

微软甚至支持开源存储库,以实现“基于机器学习的CRISPR / Cas9引导效率预测模型”。

其他CRISPR-Cas系统 (Other CRISPR-Cas systems)

Researchers have discovered CRISPR-Cas systems in other bacteria. These other systems have different PAMs.

研究人员在其他细菌中发现了CRISPR-Cas系统 。 这些其他系统具有不同的PAM。

最后的笔记 (Final notes)

Hope you learned something new! If you want to learn more about the biology, medical applications, commercial applications, or ethical implications of CRISPR-Cas genome engineering, then I recommend reading A Crack in Creation by Jennifer Doudna and Samuel Sternberg. Jennifer Doudna is one of the original discovers of CRISPR’s underpinnings.

希望你学到新东西! 如果您想了解有关CRISPR-Cas基因组工程的生物学,医学应用,商业应用或伦理意义的更多信息,那么我建议阅读Jennifer Doudna和Samuel Sternberg撰写的《 创造中的裂缝》 。 詹妮弗·杜德纳(Jennifer Doudna)是CRISPR基础的最初发现之一。

关于作者 (About the Author)

I was previously an undergraduate researcher in the Gersbach Lab at Duke University, and I am currently a Software Engineer at a Synthego.

我以前在本科研究员Gersbach实验室在杜克大学,和我目前在一个软件工程师Synthego 。

翻译自: https://www.freecodecamp.org/news/programming-the-genome-with-crispr-bd567a214e2a/

crispr基因编辑

crispr基因编辑_用CRISPR编程基因组相关推荐

  1. 【技术解读】CRISPR基因编辑技术筛选药物靶点

    在药物发现中,对新药的筛选.评估.验证等过程极其漫长和成本高昂,通常跨度十几年的时间,花费超过10亿美元,且最终只有一小部分候选药物能够真正进入市场.具有高风险.高投入.超长周期的特点.因此挖掘新技术 ...

  2. CRISPR基因编辑

    2007年,一家酸奶公司发现一种细菌拥有抵御病毒的特殊防御机制.2012年,细菌的这种机制就被科学家阐述清楚,2013年这一领域快速增长.它被视为分子生物学的一个奇迹,事实上,它并非仅对生物学家产生革 ...

  3. CRISPR基因编辑技术新进展整理

    以上为近期CRISPR基因编辑技术的进展.

  4. 利用 CRISPR 基因编辑技术,人类正在做七件“疯狂”的事

    来源:36Kr 编译:喜汤 很少有哪种现代科学创新能像CRISPR基因编辑技术一样影响深远.有了它,科学家们可以精确地改变任何细胞的DNA.CRISPR技术成为新宠,部分原因是它比早期基因编辑技术更容 ...

  5. IDT代理——北京泽平科技CRISPR基因编辑

    IDT 成立于 1989年,是基因组学领域开发的领先者,也是公认的定制核酸生产行业的领导者.IDT 凭借在 DNA 合成领域的领导能力,为基因组学应用开发了专有技术,例如下一代测序.CRISPR 基因 ...

  6. 【评测】CRISPR基因编辑新技术双淬灭探针技术解读

    PRIMETIME ™ qPCR 探针 用于 5' 端核酸酶分析试剂的双淬灭和单淬灭探针 各种实验均适用的染料和淬灭剂 北京泽平科技代理全球各大品牌单/双淬灭探针技术,搜索"泽平科技&quo ...

  7. 当基因编辑遇上艺术家,CRISPR是否还令人害怕?

    说起 CRISPR 基因编辑技术,大家脑子里的第一个反应是什么?可以说不少人是既期待又害怕,但更多的可能是似懂非懂. 硅谷洞察再简单介绍一下 CRISPR 技术.CRISPR 是存在于细菌中的一种基因 ...

  8. 【评测】CRISPR/Cas9基因编辑系统

    CRISPR/Cas9已经成为最常用的基因编辑系统.CRISPR/Cas9包括2部分:Cas9核酸内切酶和sgRNA(single guide RNA),sgRNA由天然的tracrRNA (tran ...

  9. 基因编辑新进展:利用CRISPR/Cas9和iPSC技术构建出首个急性髓系白血病进展模型

    由西奈山伊坎医学院(Icahn Mount Sinai)领导的研究小组建立了第一个用于描述急性髓细胞白血病(AML)从早期到晚期的演变过程的细胞模型. 这一研究成果公布在2月的Cell Stem Ce ...

  10. 加来道雄 基因编辑 纳米机器人_我国科研人员开发新“基因剪刀”载体 可实现基因编辑可控...

    央广网北京4月8日消息(记者朱敏 景明)据中国之声<全国新闻联播>报道,我国科研人员日前在新一期美国<科学进展>杂志上发表论文表示,他们开发出一种"基因剪刀" ...

最新文章

  1. 南云等PNAS研究论文:揭示儿童音乐学习向语言领域迁移的脑机制
  2. 251f与ips屏显示器对比_1千多元预算,2020年PS平面设计/摄影后期显示器推荐/选购指南(2k+高色域屏)...
  3. 开源网络备份软件bacula(安装bacula)
  4. 《Effective STL》学习笔记(第三部分)
  5. REVERSE-PRACTICE-BUUCTF-25
  6. 端口聚合Port-Channel
  7. 一加闷声发大财 成为今年第一季度全球高端手机市场前四
  8. 364 页 PyTorch 版《动手学深度学习》分享(全中文,支持 Jupyter 运行)
  9. vdcode C语言不能弹出运行窗口_C语言编程常见问题分析,以及错误解决办法!
  10. Linux下处理BOM头和^M的简单方法
  11. django url 路由设置技巧
  12. codeforces 446A DZY Loves Sequences
  13. AI和数学领域的咖啡甜心(一):DeepFace基础
  14. cpu空载50度_单线程性能提升超50%!Arm新款服务器CPU要靠单核打天下?
  15. C++ C1 -namespace-using-域解析符-const-引用
  16. 苹果开发者账号注册、申请续费整个流程
  17. 自动驾驶汽车也要驾考了,能否上路在此一举,老司机看了考试内容惊呆了!
  18. 计算机组成原理之MIPS汇编:冒泡排序
  19. VMware vSphere 介绍、安装 服务器虚拟化部署完整配置
  20. javaScript中console.log()的用法

热门文章

  1. 技校自我鉴定范文计算机600字,技校自我鉴定100字范文18篇
  2. 启动mongoDB服务
  3. 张朝阳5G寻路与搜狐奇兵
  4. 如何查找期刊是否被SCI收录
  5. myd加入mysql数据库_数据库是.frm,.myd,myi备份如何导入mysql (转)
  6. 照相馆、摄影工作室如何利用选片和底片下载来做微信公众号吸粉
  7. DayDayUp:2020,再见了,不平凡的一年,让我懂得了珍惜,让我明白了越努力越幸运
  8. vnr光学识别怎么打开_物流仓库安防监控系统安装的作用和功能
  9. API接口电商平台商品详情,网络爬虫数据(步骤示例,参数返回值说明)
  10. 利用动态加载实现手机淘宝的节日特效