-
未知基因结构和功能研究方法浅介
摘要
: 发现一种新的基因
,
同时把其编码的新蛋白的结构与生物学功能、与生物
学和临床医学 之间的相互关系、以及新基因表达调节的机制阐明,是目前基因的
分子生物学研究领域中最具挑战性的工 作
.
首先利用酵母双杂交
(yeast twohybrid)
技术、酵母单杂交技术
(yeast one- hybrid)
、抑制性消减杂交
(SSH, suppression
subtractive hybridization)
技术、基因芯片
(DNA chip)
技术、噬菌体表面展示
(phagedisplay)
技术等获得蛋白结合 蛋白的编码基因
、
差异表达的基因
、
DNA/RNA
结合的蛋白基因 等
,
或利用生物信息学技术获得推测的编码基因
.
然后
,
利用分子
生物学技术和生物信息学技术相结合的手段,阐明新基因的功能、基因表达启动
子的结 构和调节机制基础
,
最终阐明新基因的结构和新蛋白的生物学功能
.
生物< br>信息学技术与分子生物学技术的结合
,
是目前基因的分子生物学研究领域中的重
要、有效的研究技术和方法
.
关键字:
未知基因
生物学功能
分子生物学
0.
前言
人类基因组计划
(human genome project , HGP)
是由诺贝尔奖获得者
Renato Dulbecco
于
1986
年在
Sci2ence
杂志上发表的短文中率先提出的
,
旨在阐
明人类基因组
3
×
109
碱基对的序列
,
发现所有人类基因并阐明其在染色体上的
位置
,
破译人类全部遗传信息
,
使得人类第一次在分子水平上全面认 识自我。从
1990
年正式启动以来
,
经过多国科学界的努力
,HGP
已提前完成了分辨率为
0. 7
cm
的遗传图和分辨率为
100 kb
的物理图
,
“读出”基因组全部
ATCG
语言的工
作 已进入倒计时状态
[1 ]
。生命科学界已在思考人类基因组序列结构弄清后的下
一 步工作
,
即“后基因组计划”
,
亦即基因功能的研究。它将是
21< br>世纪生命科学研
究的重要领域。
人类基因组计划完成以后,获得了大量的关于 染色体
DNA
的基因序列的信
息,这些基因序列
,
大部分
( 99 %
以上
)
是没有编码功能的重复基因序列,编码基因
序列还不到整个基 因组长度的百分之一。怎样确定编码基因序列,怎样确定新基
因编码的蛋白质的结构与功能,怎样研究编 码基因的表达与调节,等等,都是摆
在我们面前的迫切任务
[2]
。所有这些内容
,
都是后基因组计划
(post-HGP)
的基本< br>内容,也是在今后相当长的一段时间内。基因的分子生物学研究领域的主要任务
和内容
[ 3]
。目前,以基因的克隆化为主要目的综合的分子生物学技术结合生物信
息学
(bi oinformatics)
技术,是完成这一阶段性任务的重要策略,另外,生物信息
学技术 的出现,又极大地推动了分子生物学研究的快速发展
[4]
。
1.
编码基因序列的研究
在基因克隆化的创新性科研工作中,首先必须得到感兴趣的编码基因片段
.
目前有几种技术手段可以应用
.
特种组织细胞
cDNA
文库的构建 及大规模测序,
基因芯片技术高通量筛选技术的应用,既是人类基因组计划的主要工具,也是后
基因组计划必不可少的技术途径
[5]
.
但是,由大规模随机测序获得的基因序列,
一般来说得到的不是基因的全长序列,更谈不上基因的编码产物及功能
.
因此,
在人类基因组计划基本完成以后,这些技术途径已经不再是主要的技术手段
.
相
反,一些虽然不具备高通量筛选规模,但是功能筛选与基因的克隆化相耦联的研
究技 术显示出广阔的应用前景
[6]
.
例如,以研究蛋白
-
蛋白相互结合作用的酵母
双杂交技术及酵母三杂交
(yeast three-hyb rid)
技术
,
由此发展而来的哺乳动物细胞
的双杂交技术,就是研究蛋白< br>-
蛋白结合功能,同时又是克隆相关基因的技术途
径
[7-9]
.
应用这种技术
,
不仅可以获得蛋白质之间相互结合的功能研究信息
,
而且还
能获得相应的基因序列
,
因而简洁高效
.
通过这种技术途径 获得的新基因序列
,
虽
然其功能的研究还需要进行许多工作
,
但是至 少可以知道这种新蛋白与已知蛋白
之间的结合关系;而蛋白
-
蛋白之间结合的关系,是 研究新基因和新蛋白结构与
功能的重要的突破线索
.
在分子生物学研究领域
,
经常会遇到研究两个极为相似领域差异表达基因的
筛选
.
例如,肿瘤组织 和正常组织之间基因表达谱的差别,同一种细胞类型受到
细胞因子或其他刺激因素作用之后基因表达谱发 生的变化
,
一种基因转染细胞和
仅转染空白表达载体之间基因表达谱的差别
,
发育不同阶段相同组织之间基因表
达的不同,病变组织和正常组织之间基因表达的差别等
.
对于研究的基因类型没
有事先的限制和先决条件,因此可以筛选得到已知和未知功能的基 因
.
能够应用
的技术类型包括抑制性消减杂交技术
(SSH)
、任 意引物差异显示逆转录多聚酶链
反应
(AP-DD-RT-PCR, arbitrary primer differential display reverse transcription
polymerase chain reaction)
、代表性差异分析技术
(RDA, representative differential
assay)
等
[10-13]
.
随 着噬菌体表面展示技术的不断发展,以及噬菌体展示文库构建
及应用的拓展,这种技术不仅可以应用到抗 体基因的筛选、模拟表位的筛选、抗
独特型单链可变区抗体的筛选等,而且可以应用于蛋白结合蛋白的筛 选和
DNA/RNA
结合蛋白的筛选
[14-23]
.
应用上述一 些分子生物学技术筛选得到的基因
片段,虽然只是编码基因区的基因片段,但是为阐明其功能奠定了基础
.
筛选
DNA
结合蛋白的技术还包括酵母单杂交技术以及其他一些蛋白质化学技术等
.
无论采用的 是酵母双杂交技术、酵母单杂交技术、抑制性消减杂交技术、
基因芯片技术、还是噬菌体表面展示技术, 筛选得到的基因一般都是编码基因的
部分片段,要想进一步研究这些新基因的生物学功能和医学意义,必 须首先获得
编码基因的全长序列
.
获得全长编码基因的途径
,
一是 分子生物学途径
,
一是生物
信息学结合分子生物学途径
,
后者在研究 中更为有效
[24-32]
.
既往对于已知基因序列
两端未知基因序列的克隆 化,根据多聚酶链反应
(PCR)
技术的原理,设计了特殊
的技术方法,如
5
’
-cDNA
末端快速扩增法
(5'-RACE)
和
3'-cDNA
末端快速扩增
法
(3'-RACE).
这些技术在扩增
cDNA< br>片段两端的未知基因序列克隆中发挥过十
分重要的作用
.
但目前则是生物信息学分析结合分子生物学技术的时代
.
利用美
国国立生物 工程信息学中心
(NCBI)
建立的核苷酸序列数据库
,
进行同源基因序列< br>的比对,可以发现与已知功能或推断基因序列的同源基因
.
如果在这些数据库中
没有发现同源的基因序列,还可以与表达序列标签
(EST)
数据库中的序列进行比
对,可以人工拼接成为更长的
cDNA
片段
[33].
酵母双杂 交技术和噬菌体表面展示
技术中,由于文库构建过程中基因编码的框架结构是固定的,因此,结合基因序
列的比对,以及根据
Kozack
原则,很容易确定该基因的全长编码序列
.
利用
5'-RACE
或
3'-RACE
技术,或者结合生物信息学技术,首先确定新基
因片段以及新型基因全长编码序列
.
此时,对于新基因的功能,我们还是知之甚
少
.
此时,除了应用生物信息学 技术对于该基因编码的产物进行一级结构和高级
结构的预测,或者对于蛋白质分子结构中保守的功能位点 进行预测之外,还可以
应用前述的酵母双杂交技术,对于新型蛋白结合的蛋白进行筛选,获得重要功能< br>的提示,或构建真核表达载体,利用细胞转染技术,结合
DNA
芯片和
SSH
技术,
对于这种新型蛋白上调或下调的靶基因进行研究,获得新的线索,为进一步的实
验研究设计,提供理论依据,最终阐明该新基因的生物学功能和医学意义
[34]
。
如果筛选的是人的基因文库,那么首先得到的是人的
cDNA
序列
.
利用人
类基因组
DNA
序列的数据库
(htgs)
同源序列进行比对,以及依据
Chambon
原
则,可以确定其基因组
DNA
的序列结构,确定外显子
(exo n)
和内含子
(intron)
的
结构
.
同时,利用生物 信息学技术,结合分子生物学技术,设计特异性核苷酸引
物,利用逆转录多聚酶链反应
(RT- PCR)
技术获得人、小鼠、大鼠、牛等生物品系
的相应的全长编码的
cDNA
,并进行序列分析
.
同样,利用生物信息学技术,结
合分子生物学技术,设计特异 性核苷酸引物,利用
PCR
技术获得人、小鼠、大鼠
等生物品系的相应的全长的基因组
DNA
,并进行序列分析
[35]
.
这样
,
通过分 子生物
学技术及生物信息学技术,就可以发现或确定新型基因的全长编码基因序列,并
可以初步 确定这些新基因编码产物的生物学意义或医学意义
.
简单生物分子生物学的研究
,< br>也是新基因克隆化技术和思想的重要来源
.
例
如
:
美丽线虫< br>(C. Elegans)
、果蝇
(Dros. phila)
、拟介南等在西方发达国家的分子遗
传学研究中具有重要地位
. 2002
年诺贝尔医学奖的三位获得者
,
因其在细胞程序
化死亡
( programmed cell death)
,即细胞凋亡
(apoptosis)
的研究领域中成绩卓著而
获奖
.
正是这一重要领域,以美丽线虫作为研究模型,从而 为哺乳动物细胞的细
胞凋亡研究开辟了新的领域
.
首先,从美丽线虫的细胞凋亡分子调 节机制中发
现,
Ced-3
基因是促进美丽线虫细胞凋亡的重要基因,即细胞自杀基因
(suicide
gene).
利用生物信息学技术
,
对于当时 核苷酸序列数据库中收录的基因序列和结
构特点进行同源性分析
,
最终发现人白介素< br>-
1β
转换酶
(ICE,interleukin-
1β
converting enzyme)
的结构与之类似,其序列的同源性达到
26 %.
这在线虫与人
的这二种遗传背景相距甚远的生物中是绝无仅有的
.
经过 随后的一系列结构与功
能的研究,证实
ICE
基因也是主导哺乳动物细胞凋亡的基因 ,从而发现了人细
胞中的第一个自杀基因
.
类似的例子还很多
.
关于 线虫、果蝇、拟介南等生物的研
究目的也是如此
.
因此,低等、简单生物系统的分子生 物学研究,也是人类新基
因克隆化的重要思路和指示源泉
.
2
调节基因序列的研究
人类基因组计划获得大量的有关人类染色体基因序列的信息,
为编码基因序
列的确定提供了很大的帮助,同时为调节基因序列的确定也奠定了坚实的基 础
.
利用分子生物学技术结合生物信息学技术
,
可以很容易地确定编码基因 序列上游
具有调节功能的基因序列
.
调节基因序列的确定是第一步,还必须采取综合 的研
究策略,对于其调节的特点及其调节的结构基础和机制进行研究
.
因为生物信息
学技术的预测结果还是初步的,因此,其预测结果仅具有一定的参考价值
[36]
.
首先,以发现的新基因的编码基因序列作为参照,对人的基因组
DNA
序列
进行同源基因序列的比对,寻找与之同源的基因组
DNA
序列,然后根据确定的
翻译起始位点
ATG
三联体密码子,上朔约
3 000 nt
的基因序列,该基因的调节序
列,特 别是核心启动子的结构序列,基本上就位于其中
.
因为大部分的基因调节
序列都位于 翻译起始位点上游这一部分序列之中,但是也有例外,例如有些基因
的增强子
(enhance r)
调节基因序列,其位置离翻译起始位点可以很远,甚至在编
码基因序列之中
. < br>根据生物信息学分析结果,确定启动子等主要调节基因序列以
后
,
就可以着手设 计序列特异性引物
,
应用
PCR
技术扩增获得这一基因片段
. < br>然
后按照正确的方向
,
将调节基因序列插入没有启动子序列的报告基因表达载体 的
上游,构建新的报告基因表达载体,利用真核细胞的转染技术
,
证实这一段基因序列中存在的启动子序列对于下游报告基因表达的指导作用
.
但是,这种证实的
结果只是初步的,还要进行更为细致的研究
.
例如,利用 分子生物学技术,进行
系列缺失突变体的构建,结合细胞转染和报告基因表达水平的检测,阐明核心启< br>动子
DNA
序列的结构基础,为下一步更为细致的研究奠定基础
[37]
.
真核细胞基因表达的调节机制是多水平的、复杂的,但主要是转录水平的调
节
.
转录水平调节的结构基础就是启动子
DNA
序列和与之结合的蛋白质因子,
即细胞核内存在的转录因子蛋白
.
通过
DNA
序列的缺失突变体的构建,可以确
定启动子
DNA序列的基本核心结构,对于其结合的蛋白质转录因子的类型及其
作用机制,有许多研究途径
.
例如经典的研究技术就是同位素标记的
DNA
探针
与细胞核蛋白结合的 实验研究
.
这种技术涉及蛋白质的分离纯化技术,对于阐明
启动子的结合蛋白研究虽然 有用,但效率不高
.
酵母单杂交技术,在筛选启动子
DNA
结合蛋白方面更为有效,已经有许多成功的研究报道
.
另外,随着噬菌体
表 面展示技术的不断进步,结合高质量噬菌体表面展示
cDNA
文库的构建及应
用,利用 噬菌体表面展示技术研究启动子
DNA
结合蛋白业已成为可能
.
利用引< br>物合成的生物素化,配合链亲和素的固相包被,利用生物素
-
亲和素之间特异性
的结合,很容易实现启动子
DNA
的固相化,结合表达型
cDNA
噬菌体文 库的筛
选
,
可以筛选得到特定启动子
DNA
的结合蛋白,阐明特定基 因启动子序列的调节
基础
[38].
目前关于启动子
DNA
序列与转录因子蛋白结合的多样性资料已积累了
不少,并且根据这些资料建立的数据库和生物信息学技 术也已经出现,但是,由
于目前关于启动子
DNA
和转录因子蛋白之间结合的研究资料 有限,而且还因为
转录因子蛋白及其结
合的
DNA
序列的多样性, 目前根据生物信息学技术对于启动子序列与结构
的预测、潜在的结合的转录因子蛋白类型的预测结果,都 是十分初步的,仅供参
考,需要有更为合适的实际的分子生物学技术研究结果进行证实
.
研究启动子
DNA
和转录因子蛋白的结合,有用的研究技术还包括凝胶迟滞
(gel retardation)
试验
,
即电泳迁移率漂移分析
(EMSA
,
electro phoresis mobility shift assay)
,以及超
级迁移率分析
(super shift assay)
等
[39,40]
.
这些都是证实启动子
DNA
与转录因 子蛋
白特异性结合的有效技术方法
.
3
蛋白质分子结构与功能的分析
利用常规的分子生物学技术扩增、克隆一些编码基因, 甚至是采用综合的分
子生物学技术获得未知功能的新基因,目前也不是一件很难的事情
. 但是,获得
新的编码基因序列之后,新蛋白的生物学功能,甚至其医学意义的研究,目前仍
然是分子生物学研究领域中最有挑战性的任务
.
从目前可能实现的分子生物学
技术途 径来说,只能是一步一步进行研究,逐渐积累对于新蛋白功能的认识,争
取在达到一定程度时获得对于这 种新蛋白生物学功能认识的突破
.
利用
Northern
blot
杂交技术,可以阐明组织细胞的分布特点,以及生理和病理状态下这种基因
表达的方式和表达的水平< br>,
从而据此可以推测这种新基因和新蛋白的生物学和医
学意义
.
也可 以利用酵母双杂交技术,首先阐明在自然状态下,这种新型蛋白在
细内的结合蛋白对象是什么,因为细胞 内蛋白的生物学功能,蛋白与蛋白之间结
合是十分重要的基础,因此,如果可以阐明在细胞内结合蛋白的 类型,对于其生
物学功能的认识将提供十分重要的线索
.
构建这种新型基因的真核表 达载体,转
染合适的细胞系
,利用研究差异表达基因的
SSH
技术、表达谱 基因芯片技术等,
研究这种新蛋白的表达对于靶细胞中基因表达谱的影响
,
如果可以阐 明这种蛋白
调或下调的靶基因类型
,
将为研究新基因的生物学功能提供重要的线索和研 究方
向
.
建立转基因动物
(transgenic animal)
模型、基因敲除
(gene knock-out)
模型、基
-
-
-
-
-
-
-
-
本文更新与2021-02-28 16:27,由作者提供,不代表本网站立场,转载请注明出处:http://www.xapfxb.com/yuer/462501.html
-
上一篇:基因工程试卷及答案 (1)
下一篇:基因编辑技术