-
基因组工程学里的三大利器
——
ZFN
、
TALEN
和
CRISPR/Cas
在过去,如果你想在模式生物中进行复杂的基因组修饰,你几乎只能选择小鼠。
首先,
你要设 计一个打靶载体,
将其引入小鼠胚胎干细胞,
并将这些经过修饰的
细胞注射到小鼠囊胚 。
接着是孕育、
出生、
筛选,
等待所需的幼崽成长到性成熟,
交配和 杂交,之后是更多孕育、更多筛选,一直下去。复杂的项目也许需要一年
或更长时间才能完成。
它几乎只对小鼠起作用。
原因还不是很清楚,
也许小鼠胚
胎干细胞有着特别活跃的同源 重组系统。
大鼠和人类则不是这样。
不过好消息是,
最近出现的新工具让研究人员能够 在几乎任何物种中实现精确的修饰,
有着核苷
酸水平的精确度,
也有着令人难以置信的 速度。
大部分是在特定的位置引入双链
DNA
断裂,然后由细胞进行修复。区别在于如 何引入断裂,以及新序列靶定的
难易程度。
锌指核酸酶(
Zinc- finger
nucleases,
ZFN
)和转录激活因子样效应因子核酸酶
(
transcription activator-like effector nucleases, TALEN
)这两种新型 的
核酸酶重新定义了传统生物学研究的界限和范畴。
这两种核酸酶都是嵌合体,
都是由经过设计的、序列特异性的
DNA
结合元件(
programmable,
sequence-specific DNA-binding modules
)和非特异 性的
DNA
切割结构域结合
而成的。
ZFN
和
TALEN< br>都可以对
DNA
进行
各种遗传修饰,这两种核酸酶的作用
机 制都是先对
DNA
双链分子进行切割,形成
DNA
双链断裂切口(
D NA
double-strand break
),然后激活细胞内的非同源末端连接修复
机制
(
nonhomologous end joining
,这是一种非 保真的、容易出现遗传突变的修复
机制),或者同源重组修复机制(
homology- directed
repair
,这是一种高保真
的修复机
制, 不容易出现突变),利用细胞自身的修复机制对
DNA
进行遗传学
修饰。接下来,
我们就将为读者介绍这种新型的、序列特异性的核酸酶,看看
它们在遗传分析和遗传
改造工作中都能发挥哪些功用。此外,我们还会重点介
绍
ZFN
和
T ALEN
在临床治疗方面的潜力,以及这些核酸酶,与包括最新出现的
RNA
介导的、 基于成簇的规律间隔的
短回文重复序列和
Cas
蛋白的
DNA核酸内
切酶(
clustered regulatory interspaced short palindromic repeat
(CRISPR)/Cas-based
RNA-guided
DNA
endonucleases
)在内的
其它核酸酶在未
来的发展潜力。
了解基因功能的传统方法和现代方法
随着全基因组测序技术(
whole-genome sequencing
)的不断发展和完善,以及
大型基因组注释项目(
genome
annotation
projects
)的实施,科研人员们已经
开始跃 跃欲试,想要将基因组研究的成果尽早地运用到基础科学研究的各个领
域,以及个性化医疗
(
personalized
medicine
)工作当中。不过海量的基 因组
信息也给科研人员们出了一个不小的难题,
那就是该如何将这些枯燥的数据转换
成 有意义的基因组功能,或者与临
床相关的信息呢?解决这个问题的核心就在
于尽快开 发出一种高效率的、可靠的方法,来帮助科研人员研究基因型
(
genotype
)< br>对表型
(
phenotype
)
的影响作用。
利用 同源重组机制
(
homologous
recombination
)对基因进行定向失活(
Targeted gene inactivation
)就是这
样一种好方法,
可以帮助科研人员明确基因的功能 。
不过在实际工作中使用这种
方法也会受到好几个因素,比如存在效率太低、
费时费力、而且有可能导致突
变等的限制。而
RNAi
(详见名词解释)等 基因靶向敲除技术则为科学家们提供
了一种快捷、廉价而且可以开展高通量研究的新方法。不过
RNAi
这种基因敲除
技术的敲除效果
还不够彻底,
每次试验以及 每个实验室的试验结果都会有差异,
另外还存在不可预知的脱靶情况(
off-target effect
),所以只能够用于需要
暂时抑制基因功能的试验当中。
这些研究手段的 种种不足都严重限制了科学家们
在探索基因型和表型关系的科研道路上前进的
步伐,
也妨碍了
RNAi
技术的实际
应用。
近 十年来出现了一种新的研究手段,
可以帮助科研人员对各种细胞和各种生物体
内的几乎任意基因 进行人工操作。
这种新技术就是我们常说的“基因组编辑技术
(
genome
editing
)”,而前面介绍过的由序列特异性的DNA
结合结构域与非特
异性的
DNA
切割结构域组合而成的人工核酸酶 就是这种基因组编辑技术的重要
组成
部分。这些嵌合式的核酸酶能够以极高的效率、 极高的精确度对基因组进
行人工修饰,其机制就是我们前面介绍过的切割
DNA
产生< br>DSB
,然后利用
NHEJ
或
HDR
等
DSB< br>修复机制完成我们所需要的各种人工修饰。由于科研人员们对锌
指蛋白和
TALE
蛋白等蛋白的
DNA
结合结构域的设计能力越来越强,所以这种基
因组编辑
技术的应用范围也一再地被拓展。这些既简单又灵活的核酸酶在遗传
工程学领域里发挥了极大的 作用,
其重要性也在与日俱增,
已经站到了遗传工程
工作的最前线。
下面我们将介绍几个最近在位点特异性核酸酶技术
(
site-specific nuclease technologies
)领域取得的最新研究成果,我们也
将就这项新 技术在基因组靶向工程学(
targeted genome engineering
)领域 的
应用,
以及在对真核细胞和模式生物的分析工作中的应用价值展开探讨。
我们还将介绍这种位点特异性核酸酶技术在临床治疗方面
的应用潜力,以及未来的发
展 趋势,比如
RNA
介导的、基于成簇的规律间隔的短回文重复序列和
Cas
蛋白
的
DNA
核酸内切酶未来的发展和应用前景等。
名词解释:
CRISPR/Cas (CRISPR associated) systems
:
CRISPR/Cas
系统
(
CRISPR
相关系统),
CRISPR
(
clustered regulatory
interspaced short palindromic repeat
)即成簇的、 规律间隔的
短回文重复序列,
是基因组中一个含有多个短重复序列的位点,
这种
位点在细菌和古细菌(
archaea
)胞内起到了一种获得性免疫
(
ac quired immunity
)
的作用。
CRISPR
系统主要依赖crRNA
和
tracrRNA
来对外源
DNA
进行序列特异性 降解。目前已经发现了
3
种
CRISPR/Cas
系统,其中在
2< br>型系统(
type II systems
)中依赖
的是
Cas9蛋白。在
RNA
的介导下,
Cas9
蛋白能够对
crRNA–
tracrRNA
识别的靶序列进行切割。
crRNA
:
CRISPR RNA
能够与
tracrRNA
配对,形成双链
RNA
结
构,这种双链
RNA
分子能够介导
Cas9
核酸内切酶对与双链
RNA
分子互补结合的
DNA
序列进 行切割。
DSB
:
ZFN
、
TALEN
以及< br>CRISPR/Cas9
系统对
DNA
双链进行切
割之后就 会形成
DNA
双链断裂缺口(
double-strand breaks
),
即
DSB
。
HDR
:同源重 组修复,
DSB
出现之后,细胞会启动这种修复机制,
以同源链为模板,对
D SB
进行修复。由于这种修复作用是以同源链
为模板,而且还有位点特异性的核酸酶(
site-specific nuclease
)
参与,
所以其保真度非常高。利用
HDR
可以插入一个或者多个基因,
也可以进行单碱基替换。
< br>NHEJ
:非同源末端连接修复机制是另外一种
DSB
修复机制,通过
这种修复可以将断裂的
DSB
末端直接连接起来。由于在这种修复过
程中不会用到同源 模板链,
所以在断裂处容易出现小的插入或者缺失
突变,常常会导致移码突变,使基因的功能遭 到破坏。
PAM
:前间区序列邻近基序(
protospacer adjacent motif
),这
是一种见于
crRNA
分子的短核苷酸 基序,可以被
Cas9
蛋白特异性
识别并切割。
RNAi
:
RNA
干扰技术,
是一种利用
RNA
分子抑制或者敲除基因表< br>达的技术。
从更广义的角度来说,
RNA
干扰技术是细胞对外源
RNA
分子的天然抑制机制,是细胞的一种自我保护行为。
TALEN
:转录激活因子样效应因子核酸酶主要由
Fok I
内 切酶结构
域和
TALE
蛋白的
DNA
结合结构域组合而成。
TALE
蛋白含有多个
33-35
个氨基酸组成的重复肽段,而每一个肽段都能够识别 一个碱
基。与
ZFN
一样,
TALEN
也能使
DNA
靶序列断裂,形成
DSB
,
进而激活
DNA
损伤修复机制,对基因 组进行定点改造。
tracrRNA
:反式激活嵌合
RNA
(
trans- activating chimeric
RNA
),这是一种非编码
RNA
,能够促进
crRNA
的形成,也是
Cas9
蛋白发挥
RNA
介导的
DNA
切割作用必不可少的辅助因子。
ZFN
:锌指核酸酶是由
FokI限制性核酸内切酶当中的非特异性的
DNA
切割结构域和锌指蛋白(
zinc-< br>?
nger protein
)组合而成的。
ZFN
二聚体(
dimers
)能够促使
DNA
断裂形成
DSB
,进而诱发
DSB
修复机制。
锌指结构域的靶向功能使
ZFN
能够对基因组中的特
定位点进行定向改造。
ZFNickases
:锌指切口酶(
zinc-finger nickases< br>)也是
ZFN
,不
过是在其中两个
FokI
限制性核酸内切酶 结构域当中的一个结构域发
生了失活突变的
ZFN
。锌指切口酶只能够形成
D NA
单链断裂
(
single-strand DNA break
),所以 只能激活同源重组修复机制,
不能激活
NHEJ
修复机制。
定制的
DNA
结合结构域
ZFN
和
TALEN
极强的“适应性”源自我们可以对这些核酸酶里的
DNA
结合结构域
进行个性 化的定制,使其能够特异性地识别各种
DNA
序列。这些
DNA
结
合结构
域能够与背景知识框
1
里介绍过的各种效应元件(
effec tor domain
),比如转
录活化因子、
转录抑制因子、
重组酶
(
recombinase
)
、
转座酶
(
transpo sases
)
、
DNA
和组蛋白甲基转移酶
(
m ethyltransferases
)以及组蛋白乙酰基转移酶
(
acetyltr ansferases
)等搭配,来对基因组进行各种改造,比如对基因
组的
结构或者基因组的功能进行改造等。
由此可以看出,
其中最关键的因素就是各种
核酸 酶对
DNA
结合的特异性和亲和力。
下面,
我们将重点介绍几个比较成功
的,
组装这些
DNA
结合结构域的方法和技术。
Cys2
–
His2
锌指蛋白
Cys2
–His2
锌指结构域是在真核生物中最常见的一种
DNA
结合基序,在人类基因组中也是编码频次排名第
2
的蛋白结构域。
一个锌指大约由
30
个氨基酸
组成,
形成了一种保守的
β
β
ɑ
结构 (图
1A
)。在锌指
ɑ
螺旋结构表面的那几个氨基
酸能够与
DNA
大沟上的
3
个碱基结合,不过这种结合的选择性会有所差异。
由
于锌指蛋白具有这种分子结构,
所以非常适于打造个性化的
DNA
结合蛋 白。
在锌
指蛋白特异性识别
DNA
序列的应用当中,
最关键的工作就 是设计出人造的、
非
天
然的组合,
比如含有
3
种 以上的锌指蛋白
DNA
识别结构域的蛋白。
高度保守的链
接序列(
l inker sequence
)的出现使这种设计成为了可能,因为有了这种链接
序列,我们 就可以设计出能够识别
9~18
个碱基长度的
DNA
序列。在一段
680
亿
个碱基组成的
DNA
序列里,
18
个碱基组成的序 列就足以成为一段特异性的序列,
所以如果能够设计出含有
3
种以上的锌指蛋白
DNA
识别结构域的蛋
白,那么就
意味着科学家们能够利用锌指蛋白识别 出人类基因组里的任意一段
DNA
序列。
虽
然这种理论在最开始还存在一定的 争议,但是后来发现,如果要识别复
杂基因
组中某一段特定序列的
DNA< br>片段,这种设计策略的确是最佳的方案。
基于前期开展的论证研究(
proof- ofprinciple
)成果,科研人员们又开发出了
好
几种新的构建锌指蛋白的策略和方法,
这些
锌指蛋白在
DNA
结合的特异性方
面都有其独
到之处。模块化组装(
modular assembly
)
策略就是其中的一种,
这种策略就是以预先
选择好的锌指蛋白模块文库
(这种预选的文
库是通过对多
个大型文库进行筛选,
或者人
工设计出来的)
为基础,
从中挑选出合适的
模块
组装出所需要的锌指蛋白。由于目前开
发的锌指结构域几乎已经可以识别所有
64
种三联核苷酸组合
(密码子)
,
所以我们完
全可以将这些锌指模块串联起来,
识别特定
的
DNA
序列。另外,也可以使用基于选择的
策略(
selection-based
approach
),比如
寡聚体化序列设计策略(
oligomerized pool engineering
,
OPEN
)
就可以从任意的文库
(这些文库会考虑相邻锌指之间与序列有关的
相互
作用)中选择出新的锌指结构域。还有
人将前面介绍的这些方法结合起来开发
出了
新的策略,
比如先预先选择出与序列有关的
(
context- dependency
)
锌指
模块,
然后将
这些模块组合在一起形成更长的锌指组合。
多
年以来,
锌指蛋白
技术一直都是打造位点特
异性的
DNA
结合蛋白或酶的唯一方法。
目前
已经有商
业化的人工锌指可供选择,比如美
国的
Sangamo Biosciences
(
Richmond, CA,
USA
)公司就已 经和美国
Sigma
–
Aldrich
(
St. Louis, MO, USA
)公司合作,开
发出了一套
名为
CompoZr
的锌指蛋白构建系统,
免去了
科研人员自己构建锌指
蛋白以及后续的验证工
作。
目前已经有数千个锌指蛋白可供我们选
择。
可以毫
不夸张地说,锌指蛋白技术可以以
任意序列为靶标。
背景知识
1
:核酸酶之外的其它工具酶:
重组酶、转座酶及转录因子
位点特异性的核酸酶(
Site- specific nucleases
)是目前被研究得最透彻,也是应用范
围最 广的一种遗传修饰工具酶,主要应用于细胞和模式生物的遗传改造
工作。不过这种酶
也有其局限性。比如,位点特异性的核酸酶的脱靶效应(
off-target effect
)就会对细胞产生
毒性,更麻烦的是我们很难预测是否会出现脱
靶效应,也几乎无法系统地监测细胞内出现
的脱靶效应,所以科学家们也陆续开发出了其它几种新型的基因组改造工具。此外,由于这
< br>些核酸酶还需要依赖
细胞自身的
NHEJ
及同源重组修复机制来完成遗传改造工 作,所以这种
技术也只能应用于某几种具备这些修复机制的细胞。为了解决上述问题,科学家 们决定
另辟
蹊径,将锌指蛋白和
TALE
蛋白与核酸酶之外的其它 几种酶结合,开发出了新的遗传改造工
具,比如位点特异性的重组酶、转座酶等。这些酶可以 使细
胞基因组
DNA
发生整合、切除或
者倒位等改变。因为这些酶 能够自动完成对
DNA
的切割和连接操作,因此核酸酶脱靶导致
的“毒性”
DSB
不太可能在细
胞内累积,也就不会对细胞造成太大的伤害。另外,重组酶和
转座酶更利于在基因组内的特定位点插入新的基因,所以能够更有目的地监测是否出现了脱
< br>靶
效应。而且重组和转座机制是不依赖于细胞自身的
DSB
修复机制的。所以这 些工具酶几乎
可以应用于任何细胞,也可以在任何细胞周期内使用。我们还可以
通过 定向进化(
directed evolution
)的方式来提高这些工具酶的催化效率。不 过要使这些重组酶和转座酶的可用性达
到核酸酶的水平,还需要对它们进行更
进一步 的改进和优化,进一步提高酶的活性和在使用
方面的灵活性。尤其是在所结合的重组酶的催化活性结构域中还保留有部分的序列特异性,
< br>所以还需要
对它们进行更进一步的改造,使其能够特异性地与我们所瞄准的靶标序列结合。
虽然转座酶与锌指等序列特异性结合蛋白融合之后表现出了极高的特异性,但
还是会表现出
比较明显的脱靶现象,所以也需要对这类蛋白进行更进一步的优化。最后再来介绍一下人工
< br>合成的锌指转录因子和
TALE
转录因子,这类蛋白
能够特异性地影响基因的表 达,这也起到了
一种基因组定向修饰的作用。综上所述,位点特异性的重组酶、转座酶及转录因子是除了位
< br>点特异性的核酸酶之
外的一大类灵活、好用的基因组修饰工具,是对位点特异性的核酸酶的良好补 充。
TALE
核酸酶
最近又发现了另外一种简单的
DNA
识别模块,那就是
TALE
核酸酶中的
DNA
识别
模 块,这无疑又给科学家们提供了另外一个平台,方便他们设计出更多的
DNA
结合蛋白。
TALE
蛋白是一种源自植物致病菌——黄单包杆菌(
X anthomonas
)
的天然蛋白,其中也含有
DNA
结合结构域(图1B
)。
TALE
蛋白中的
DNA
结合结
构域是由一 连串
33~35
个氨基酸组成的重复结构域组成的,
其中每一个结构域都
能够 识别一对碱基。
TALE
核酸酶的
DNA
结合特异性主要由两个高度
可变的氨基
酸决定,科学家们将这两个关键的氨基酸称作重复可变双氨基酸残基位点
(
repeat-variable di-residues, RVD
)。与锌指结构域一样 ,这种
TALE
重复
模块也能够串联起来,
识别一长串的
DNA序列。
不过与锌指蛋白不同的是,
针对
基因组中的某个位点,在连接
T ALE
蛋白的
DNA
识别模块时,接头没有太多的改
造空间。经过前人对锌指 蛋白开展的近
20
年的科研工作,科学家们已经发现了
大量的效应因子结构域(
effector
domain
),比如核酸酶(
nuclease
)结构域、
转录激 活因子(
transcriptional activator
)结构域、位点特异性的重组酶
(
site-specific
recombinase
)结构域等,这些效应因子结构域都可以与
TALE
蛋白
DNA
序列识别结构域搭配,
对基因组中的目标位点进行各种遗传修饰。
虽然
TALE
蛋白
DNA
序列识别结构域能够识别单个碱基对的 特性要比锌指蛋白的
3
碱
基识别更富灵活性,
在设计的时候可变性更强,但是克隆这么一大段
TALE
蛋
白
DNA
序列识别结 构域的重复编码序列也是一个不小的挑战。为了解决这个问题,
科学家们也想出了不少的办法,
现在就已经有好几种方案能够让科研人员快速地
组装出任意搭配的
TALE
蛋白
DNA
序列识别结构域。
金门分子克隆技术
(‘Golden
Gate’molecular cloning)就是其中的一种解决方案,这是一种高通量的固态
组装技术(
solid- phase assembly
),而且是一种不需要进行连接的克隆技术
(
ligation- independent cloning techniques
)。有多个使用了各种组装策略的大规模的、系统性研究项目表明,
TALE
重复识别模块可以组装在一起,识别
任何
DNA
序列。根据文献
的报道,
TALE
蛋白在识别
DNA
序列方面存在的唯一限
制就是它所识别的位点必须以
T
开始。
最近有项研究指出,
已经有人构建了一个
TALEN
文库,能够靶 向结合
18740
个人类编码基因,这说明构建
TALEN
蛋白并不
是那么困难。这项“浩大的”工程不仅能够促进科研人员利用核酸酶开
展更多
的研究 ,
同时也有利于鼓励大家开展类似的、
更大规模的工作。
目前也出现了商
业化 的人工
TALE
文库,比如法国巴黎的
Cellectis Bioresearch
公司、美国的
-
-
-
-
-
-
-
-
本文更新与2021-02-28 16:27,由作者提供,不代表本网站立场,转载请注明出处:http://www.xapfxb.com/yuer/462502.html
-
上一篇:未知基因结构和功能研究方法浅介
下一篇:女性下面痒死了怎么办