-
第
3
章
基因与基因组的结构
1
.主要内容
1
)断裂基因
构成
性质
2
)重叠基因
种类
3
)
C
值矛盾
4
)原核生物与真核生物基因组的区别
5
)真核生物染色体的结构
6
)真核生物
DNA
序列的
4
种类型
7
)基因家族
、基因簇、卫星
DNA
、分散重复
DNA
序列
8
)人类基因组计划
2
.教学要求
1)
掌握基因,断裂基因,顺反子,
C
值矛盾,重叠基因,基因家 族,重复序列,卫
星
DNA
等基本概念;
2)
熟悉原核生物和真核生物基因组结构特点与功能;
3)
了解人类基因组的重复顺序、人类基因组计划。
第
1
节
基因的概念
第
2
节
基因命名简介
第
3
节
真核生物的断裂基因
第
4
节
基因及基因组的大小与
C
值矛盾
第
5
节
重叠基因
第
6
节
基因组
第
7
节
真核生物
DNA
序列组织
第
8
节
基因家族
第
9
节
人类基因组研究进展
第
1
节
基因的概念
?
基
因:带有特定遗传信息的核酸分子片段。
包括
结构基因:编码蛋白质
tRNA
rRNA
调控基因:
?
基
因研究的发展
染色体
分子
反向生物学
?
基
因位于染色体和细胞器的
DNA
分子上
?
基因和顺反子
?
1955
,
Benzer
用以表述
T
4
具溶菌功能的区的
2
个亚区
: r
Ⅱ
A
r
Ⅱ
B
?
现代分子生物学文献中,顺反子和基因这两个术语互相通用。
第
2
节
基因命名简介
1
?
表示基因
3
个小写斜体字母,
lac
?
表示基因座
3
个小写斜体字母
+ 1
个大写斜体字母。
lacZ
?
表示质粒
自然质粒
3
个正体字母,首字母大写
重组质粒
在
2
个大写字母前面加小写
p
?
基因为斜体,蛋白质为正体
?
人类基因为大写斜体
第
3
节
真核生物的断裂基因
?
一、
割裂基因的发现
?
1977
,通过成熟
mRNA
(或
cDNA
)与编码基因的
DNA
杂交试验而发现
?
真核生物的基因是不连续的,大大改 变了原来对基因结构的看法,现在知道大多
数真核生物的基因都是不连续基因或割裂基因
(sp lit gene)
。
?
割裂基因的概念
— —
是编码序列在
DNA
分子上不连续排列而被不编码的序列所
隔开的基因。< br>
?
割裂基因的构成
?
构成割裂基因的
DNA
序列被分为两类:
?
基 因中编码的序列称为外显子
(exon)
,外显子是基因中对应于信使
RNA
序列的区
域;
?
不编码的间隔序列称为内含子
(int ron)
,内含子是从信使
RNA
中消失的区域。
?
割裂基因由一系列交替存在的外显子和内含子构成,
基因两端起始和结束 于外显
子,对应于其转录产物
RNA
的
5’
和
3’
端。如果一个基因有
n
个内含子,则相应地含
有
n+1
个外显子。< br>
?
割裂基因的性质
?
Splitting Gene
的普遍性
?
外显子和内含子各有特点
?
Splitting gene
概念的相对性
?
Splitting Gene
的普遍性
a)
真核生物(
Eukaryots
)中
?
绝大部分结构基因
?
tDNA,
rDNA
?
mtDNA,
cpDNA
b)
原核生物
(
Prokaryots
)中
?
SV40
大
T
抗原
gene
?
小
t
抗原
gene
?
Splitting gene
并非真核生物所特有
2
?
外显子和内含子各有特点
?
割裂基因的外显子在基因中的排列顺序和它在成熟
mRNA
产物中的排列顺序是
相同的 ;
?
某种割裂基因在所有组织中都具有相同的内含子成分;
?
核基因的内含子通常在所有的可读框中都含有无义密码子
(nonsense codon)
,因
此一般没有编码功能。
?
内含子上发生的突变不能影响蛋白质的结构,所以其突变往往对生物体是没有影
响的;
?
但也有例外,
例如一些发生在内含子上的突变可通过抑制外显 子的相互剪接阻止
信使
RNA
的产生。
?
< br>利用结构基因的特殊
DNA
限制片段作为探针,
我们可以检测基因组中与之有亲 缘
关系的序列
,结果表明一个基因的外显子常与其他基因的外显子有亲缘关系。
?
两个相关基因内含子之间的亲缘关系远远不如其外显子之间的亲缘关系紧密
。
?
这是因为在进化过程中,相关基因的内含子比外显子变化得更快。
?
Splitting gene
概念的相对性
a)Intron
并非
“
含而不露
”
Yeast
细胞色素
b
基因
Intron II
编码成熟酶
b)Exon
并非
“
表里如一
”
人类尿激酶原基因
Exon I
不编码
氨基酸序列
c)
并非真核生物所有的结构基因均为
splitting gene
Histone gene family
干扰素
Yeast
中多数基因(
ADH…
)
第
4
节
基因及基因组的大小与
C
值矛盾
?
由于割裂基因的存在,人们认识到基因比实际编码蛋白质的序列要大得多。
?
外显子的大小与基因的大小没有必然的联系。
?
< br>不同种类的生物体中外显子的大小并没有明显的不同,基因可能是由一些小的、
编码较小的独立蛋 白质分区的单位在进化过程中加合起来的。
?
基因的大小取决于它所包含的内含子的长度
?
内含子之间有很大不同,它们的大小从
200
个碱基对左右到上万个碱基对。在一
些极端的例子里,甚至有
50- 60 kb
的内含子。
?
由于基因的大小取决于内含子的长度和数目,导致酵母和高等真核生物的基因大< br>小有很大的不同。
?
大多数酵母基因小于
2 kb
,很少有超过
5 kb
的。
?
与此相反,在高等的真核生物中,开始出现长的基因,蝇类和哺乳动物基因很少
小于
2 kb
,大多数长度在
5~100 kb
之间。
3
?
但当基因的长度大到一定程度后,
DNA
的复杂性与生物体的复 杂性之间开始失去
必然的联系。
?
例如虽然属于同一个门,果蝇细胞的
DNA
总量较小而家蝇细胞的
DNA
总量却是它
的< br>6
倍。
?
基因组
?
狭义:
单倍体细胞中的全套染色体
(人:
22
条常染色体
+ X
,
Y +
线粒体
DNA
)
。
?
广义:一物种的全部遗传物质及其携带的遗传信息。
?
基因组大小与
C
值矛盾
?
一个单倍体基因组的全部
DNA
含量总是恒定的。
这是物种的一个特征,通常称为< br>该物种的
C
值。
?
不同物种的
C
值差异很大,最小的枝原体只有直
106bp
,而最大的如某些显花植
物和两栖动物 可达
lO
11
bp
。
Range of genome size in different phyla
门
植
物
动
物
真
菌
等
细
菌
?
由 图表可见,
随着生物的进化,生物体的结构和功能越来越复杂,
其
C
值就越大 ,
例如真菌和高等植物同属于真核生物,而后者的
C
值就大得多。这一点是不难理解的,因为结构和功能越复杂,需要的基因产物的种类越多,也就是说需要的基
因越多,因而
C
值越大。
?
然而另一方面,
随着进一步 的进化,
生物体复杂性和
DNA
含量之间的关系变模糊
4
了,出现了很多令人不解的现象。一些生物类群基因组大小的变化范围很窄,而
另一些类群的变化范围 则很宽。
?
突出的例子是两栖动物,
C
值小的可以低至
10
9
bp
以下,
C
值大的可以高达
10
11
bp
。
而哺乳动物的
C
值均为
10
9
bp
的数量级。
人们很难相信不同的两栖动物,
所需基因
的数量会有
100
倍的差别,而且两栖动物的结构和功能会比哺乳动物更复杂。
?
由于人们无法用已知功能来解释基因组的
DNA
含量,所以产生 了
C
值矛盾
(C
value paradox
,又称
C
值悖理
)
。
?
它表现在两个方面:一个方面是,与预期的编码蛋白质的基因的数量相比,基因
组
DN A
的含量过多。
另一个方面是一些物种之间的复杂性变化范围并不大,但是
C
值却有很大的变化范围。这些问题的解决有待于进一步的研究。
第
5
节
重叠基因
?
莲人在绿杨津
采
一
玉漱声歌新阙
?
采
莲人在绿杨津,在绿杨津一阙新;
一阙新歌声漱玉,歌声漱玉采莲人
。
一、原核生物的重叠基因
(overlapping gene)
?
在细胞基因中,
一般一段
DNA
序列只以三种蛋白质可 读框的一种被阅读,但是在
一些病毒或线粒体基因中,两个邻近的基因以一种巧妙的方式发生重叠,并以 不
同的可读框被阅读并表达,因此一段相同的
DNA
序列可以编码两个非同源蛋白质。
φ
Xl74
的
DNA
序列 组织上有重叠基因
(overlap-ping gene)
和基因内基因
重叠基因有以下几种情况:
①一个基因完全在另一个基因内部
如:
B
和
A
*
E
和
D
其读码结构互不相同
重叠基因
基因内基因
部分重叠基因
一个碱基重叠
二、真核生物的重叠基因
?
通常割裂基因的每个外显子编码一段单一的氨基酸序列,
对应于整个蛋白质上的
相应部 分,而内含子不在最终的蛋白质产物中表达,二者的作用是迥然不同的。
但是有些基因中内含子和外显子 的定义是相对的,与它表达的途径有关。
?
在这些基因中,选择性的基因表达模式引起了外显子连接途径的转变。
?
一个特定的外显子可能选择性地与不同的外显子连接形成信使
RNA
。
?
这种选择性形式产生的两种蛋白质中,一部分相同而其他部分不同。一段区域以
5
一种途径表达时作为外显子,而以另一种途径表达时作为内含子。
?
因为此时一段
DNA
序列通常以多种方式起作用,
所以 不能被简单地称为外显子或
内含子。
第
6
节
基因组
一、原核生物的染色体基因组
二、真核生物基因组
一、原核生物的染色体基因组
(一)细菌染色体基因组结构的一般特点
1.
细菌的染色体基因组通常仅由一条环状双链
DNA
分子组成,
细菌的染色体相对聚
集在一起,形成一个较为致密的区域,称为类核(
nucleoid
)。类核无核膜与胞
浆分开,
类核的中央部分由
RNA
和支架蛋白组成,< br>外围是双链闭环的
DNA
超螺旋。
染色体
DNA
通常与细胞膜 相连,
连接点的数量随细菌生长状况和不同的生活周期
而异。
l bacterial cell
?
E
.coli
genome is a single double-stranded DNA molecule of 1. 6 mm.
?
B
ut E. coli is only ~ 2
?
m in length
?
D
NA is ~ 1000 larger than the size of the cell!
?
T
his is achieved by super- coiling the DNA.
?
D
NA gyrase
旋转酶
introduces negative- superhelical twists into the DNA.
The
degree of supercoiling of the chromosome is strictly regulated.
structure of
nucleoid (
图
大肠杆菌拟核的结构
)
2.
具有操纵子
(trnascriptional operon)
结构
,
其中的结构基因为多顺反子
(polycistron)
,
即数个功能相关的结构基因串联在一起,
受同一个调节区的调节。
数个操纵 子还可以由一个共同的调节基因(
regulatorygene
)即调节子(
reg ulon
)
所调控。
?
X174 D-E-J-F-G-H mRNA
外壳蛋白
J
、
F
、
G
、
H
组装蛋白
D
裂解蛋白
E
色氨酸操纵子
9
个顺反子
9
个酶
真核很少,如
18s 5.8s
及
28s rRNA
基因
3.
在大多数情况下,结构基因在细菌染色体基因组中都是单拷贝。
4.
不编码的
DNA
部份所占比例比真核细胞基因组少得多。
5.
具有编码同工酶的同源基因(
isogene
)例如,在大肠杆菌基因组中有两 个编码分
支酸(
chorismicacid
)变位酶的基因,两个编码乙酰乳酸(< br>acetolactate
)合成
酶的基因。
6.
细菌基因组编码顺序一般不会重叠,和病毒基因组不同的。
7.
在
DNA
分子中具有各种功能的识别区域
如复制起始 区
OriC
,复制终止区
TerC,
转
录启动区和终止区等。这些区 域往往具有特殊的顺序,并且含有反向重复顺序。
6
8.< br>在基因或操纵子的终末往往具有特殊的终止顺序
,
它可使转录终止和
RNA聚合酶
从
DNA
链上脱落。例如大肠杆菌色氨酸操纵子后尾含有
40bp
的
GC
丰富区,其后
紧跟
AT
丰富区,这就是转录终止子的 结构。
图
Prokaryotic Chromosomes
?
Haploid
仅一对染色体
?
DNA is compacted
紧凑的
–
E.g. E. coli packs 1.5 mm chromosome into a cell that is only 1um in length
?
No histones or nucleosomes
无组蛋白和核小体
–
Small basic proteins MAY serve a similar function
?
Genes usually do not contain introns
?
Single origin of replication
单一复制起点
(二)质粒基因组
?
指细菌的染色体外基因组,大约几十种。
?
质粒
DNA
呈线状或环状双链结构
?
大小约< br>1
×
10
3
~300
×
10
3
bp
,相对分子质量
1
×
10
6
~200
×
1 0
6
。
?
质粒基因可通过复制、转录、翻译而赋予寄主细胞某种性状。
质粒基因组
二、真核生物基因组
(一)真核染色体
(二)真核染色体基因组
(三)线粒体基因组
(四)叶绿体基因组
(一)真核染色体
(Eukaryotic chromosome )
1.
概述
2.
组蛋白(
Histone
)
3.
核小体(
Nuclearsome
)
4.
染色体结构的形成
7
-
-
-
-
-
-
-
-
本文更新与2021-02-28 16:01,由作者提供,不代表本网站立场,转载请注明出处:http://www.xapfxb.com/yuer/462434.html
-
上一篇:基因工程重点总结(完整)
下一篇:第四章 基因与基因组学(答案)知识讲解