-
什么是一个基因家族呢由一个共同的祖先基因经过重复
(duplication)
和 突变
(mutation)
产
生的、外显子中具有相似的序列的一组相关基因被称为基 因家族
(gene family)
。基因重复
主要有三种方式:
片段复制、
串联重复和逆转录转座或其他转座事件等,
基因重复后可以彼
此形成基因簇
( gene clusters)
,同一家族中的成员有时紧密的排列在一起,成为一个基因
簇; 更多的时候,它们却分散在同一染色体的不同部位,
甚至位于不同染色体上,
具有各自
不同的表达调控模式。基因突变是基因分子进化的第一原因,由核苷酸替代、插入
/
缺失、重组和基因转换等引发的突变基因或
DNA
序列,通过群体水平的遗传漂变和
/< br>或自然选择进
行扩散,并最终在物种基因组中得以固定,这种方式产生的新基因一般拷贝数目不会 增加,
相对基因重复是非常少的,
主要是影响基因的序列以及其编码的蛋白。
基因家族 主要是指一
组功能相似且核苷酸序列具有同源性的基因,
是具有显著相似性的一组基因,
编码相似的蛋
白质产物。
有时定义基因家族,
从结构域角度来 刻画。
如:
一类基因,
其编码蛋白都含有同一个结构域,
这一类基因是一个基 因家族。比如
MADS-box
基因家族,这类基因都含有
MADS-box
结构域,
还有
SET
结构域基因家族。这个定义信息更偏向功能信息,一般来说结构域 决定某种功能,
因为结构域序列保守,
易形成稳定的三维结构。
这与共同祖先的定义有 些差别,
很多结构域
难找得到其共同祖先。
另外一个基因的共同祖先定义比较复杂的,
越是历史久远的祖先,
因
为物种的在进化过程中发生了很多丢失和增加事件。
共同祖先是个相对的概念,
比如植物的
共同祖先,一般包括藻类及其它绿色植物,而被子植物共 同祖先,根据已经测序的基因组,
一般指单双子叶之前就可以。
如果从共同祖先定义基因家族,
很多已知的基因家族就要被分
成很多个基因家族。有很多网站(数据库)专门收集结构域,比如
Pfam
和
InterPro
,这两
个数据库内容差不多。
这些数据库以
Hmmer
算法为基础,
根据
Uniprot
中包含的 蛋白,
进行
序列连配找到保守的片段
(
结构域)
,
再以这些 序列使用
Hmmer
构建种子,
保存这些种子。
一
个蛋白拿过来后,
与这些种子比对,
根据打分能判断出这个蛋白是不是含有这个结构域,
这
也是 判断一个基因编码蛋白是不是属于这个家族。
基因家族
定义
基因 组进化中,
一个基因通过基因重复产生了两个或更多的拷贝,
这些基因即构成一个
基因 家族。
是具有显著相似性的一组基因,编码相似的蛋白质产物。
在真核细胞中许多相关的基因常按功能成套组合,被称为基因家族(
gene
fam ily
)
。同
一家族中的成员有时紧密的排列在一起,成为一个基因簇;
更多的时候,
它们却分散在同一染色体的不同部位,
甚至位于不同染色体上,
具有各自
不同的表达调控模式。
一组功能相似且核苷酸序列具有同源性的基因,
可能由某一共同祖先基因经重复和突 变
产生。
多基因家族
真核基因组的特点之一就是存在多基因家族(
multi
gene
fam ily
)
。多基因家族是指由
某一祖先基因经过重复和变异所产生的一组基因。
多基因家族大致可分为两类:
一类是基因
家族成簇地分布在某一条染色体上,
它们可 同时发挥作用,
合成某些蛋白质,
如组蛋白基因
家族就成簇地集中在第
7号染色体长臂
3
区
2
带到
3
区
6
带区 域内;
另一类是一个基因家族
的不同成员成簇地分布不同染色体上,
这些不同成员编码 一组功能上紧密相关的蛋白质,
如
珠蛋白基因家族。
在多基因家族中,
某些成 员并不产生有功能的基因产物,
这些基因称为假
基因(
pseudo
gen e
)
。假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺
失,倒位或 点突变等,使这一基因失去活性,成为无功能基因。与相应的正常基因相比,假
基因往往缺少正常基因的 内含子,两侧有顺向重复序列。
人们推测,假基因的来源之一,可
能是基因经过转录后生成的< br>RNA
前体通过剪接失去内含子形成
mRNA
,
如果
mRNA
经反复转录
产生
cDNA
,再整合到染色体
DNA
中去,便 有可能成为假基因,因此该假基因是没有内含子
的,在这个过程中,可能同时会发生缺失,倒位或点突变 等变化,从而使假基因不能表达。
多基因家族的进化
在进化过程中,基因家族如编码
rRNA
的基因或编码组蛋白的基因都是从共同的祖先基因通
过重复
(duplication)
和歧化
(divergence)
进化而来的,它们具有相同或相关的功能。虽然
如此,
但它们在发育过程中并不总是同时表达 的,
不同的成员可能在不同的发育阶段和
(
或
)
不同的组织中表达,
如有些血红蛋白基因家族成员在成体中表达,
而另一些则只在胎儿期表
达,这一事实说 明在基因调控水平发生了进化歧化
(evolutionary divergence)
。
在足够时间的进化过程 中,
基因家族中某些成员的
DNA
序列可能歧化为可编码一种具有
新功能的蛋 白,例如,乳清蛋白
(lactalbumin)
基因与溶菌酶基因就属于同一个家族,前者< br>编码催化乳糖合成的酶的一个亚基,后者编码的溶菌酶能降解某些细菌细胞壁的多糖化合
物,但它 们具有一个共同的特点就是都作用于碳水化合物。
我们也已 经知道,
基因家族中的某些成员并不转录或转录本不翻译成有功能的蛋白,
即
成为基因 家族中的假基因。
研究发现,
这些无功能的假基因缺乏必要的启动序列和缺乏一个
或多 个具活性的成员中特有的内含子序列。
DNA
重复 通常是指
DNA
片段数的增加,它可以是一个完整基因的重复
(
基因重复)
、基因
的一部分重复、
一个完整染色体的重复
(
非整倍体)
、
或整个基因组的重复
(
多倍体
)
。
基因家
族是由于连续的基因重复所造成的。
非整倍体常导 致生物体的不育,
而基因组重复只是使基因增加拷贝数,
并不产生新的基
因,
对基因组的复杂性并没有改变。
从基因组进化的角度来看,
更多的是考虑单个基因或一
些基因的重复,而不是整个基因组的重复。
珠蛋白是一个多 基因家族,在人类的第
16
号染色体上发现了
7
个类
a
珠蛋 白基因,在
第
11
号染色体上发现了
6
个类
b
珠蛋 白基因,在动物甚至植物中也发现了珠蛋白基因,表
明这是一个非常古老的基因家族。在多种动物中几乎 所有有功能的珠蛋白基因结构都相同,
由
3
个外显子组成,
中间间隔着两个内 含于。
但珠蛋白基因的数量和次序在各种动物中是不
同的。
由于所有的珠蛋白基因的结 构和顺序都是相似的,
因此它们存在着一个祖先珠蛋白基
因
(
多半和现在存在 的肌红蛋白基因相关
)
。
在约
5
亿年前,
祖先珠蛋白基因经 重复和歧化产
生了原始的
a
珠蛋白基因和
b
珠蛋白基因,
再 追溯至
8
亿年前,
这个祖先珠蛋白基因本身也
是通过基因重复而产生的,它的 另一份拷贝进化为现今的肌红蛋白
(myoglobin)
基因,肌红
蛋白基因的组成 和珠蛋白基因相似,
其主要功能也同珠蛋白一样是贮存氧,
因此我们可以将
三个外显子 结构看成是它们共同的祖先。植物的豆血红蛋白
(leghemoglobin)
基因是和珠蛋
白基因相关的,
植物豆血红蛋白基因存在着很多原始的类型,
它比肌红蛋白基因多一个 内含
子,但它与肌红蛋白很相似。
某些原始的鱼类 只有单个类型的珠蛋白链,
因此它们必然是在珠蛋白基因尚未发生重复
前就歧化了出来。
在某些两栖动物中含有
a
和
b
连锁的珠蛋白基因,
这是由祖先珠蛋 白基因
重复后经突变形成的。
后来进一步重复,
在哺乳动物中形成了
a
珠蛋白家族和
b
珠蛋白家族。
重复在进化中是经常发生的,事实上,珠蛋白基因的拷 贝数在某些人类群体中是有变化的,
例如大部分人在
16
号染色体上有
2个
a
基因
(a1
、
a2
,图
12-9)
,但有些个体在此染色体上
只有
1
个,
而另一些个体有
3
个甚至有
4
个
a
珠蛋白基因。
此表明在多基因家族中基因的重
复和缺失是恒定的进行过程。重复也可以通过转座而产生。
基因组中的基因家族
(
来源于首席医学网
)
在人及高等 有机体基因组中,
有许多基因家族。
有的基因家族成员多,
有的基因家族成员少
;
有的基因家族成员功能相似,有的基因家族成员功能各异
[1]
。所谓多基因家族 是指一类具
有序列同源性及相似功能的基因
;
而基因超家族是指一类具有序列同源性而 不具相似功能的
基因。
如果一类蛋白或基因具有共同起源的一个结构域,
就属于一个基 因超家族,
同一个基
因可归属于两个或多个基因超家族。
有关基因家族的研究起始于二 十世纪七十年代,
目的是
为阐明个体或群体遗传差异与基因冗余
(gene redu ndancy)
的关系。文献表明:免疫球蛋白
基因超家族与其它多基因家族进化的分子机制相 似,染色体不等交换和基因转换
(gene
conversion)
导致了免疫球蛋 白基因的进化。为阐明基因家族进化和变异的分子机制,应同
时考虑染色体不等交换、
基因突变 、
自然选择及随机漂变等因素。
同一基因家族中不同成员
的序列同源性取决于基因突变 与染色体不等交换的频率,
也与自然选择及随机漂变有关
[1]
。
基因超家族的一个重要特点是不同成员具有不同的表达模式
(expression patt erns)
,
而同一多基因家族的不同成员往往具有相同的表达调控机制。
因此,有必要阐明基因超家族
成员其表达模式改变的诱因。一些大的基因超家族通常包括数个单基因和几个 多基因家族,
这些基因家族的形成是有机体进化的分子基础。
基因组中几乎所有的基因可归属于 一个或更
多的基因超家族。同源性比较可用于分析不同基因间的进化关系
;
系统发生分 析可剖析基因
家族不同成员的相关性
;
基因进化树可澄清基因拷贝数增加或基因重复< br>(gene duplication)
的历史,同时,为识别不同种属同源基因提供有益信息。
-
-
-
-
-
-
-
-
本文更新与2021-02-28 15:57,由作者提供,不代表本网站立场,转载请注明出处:http://www.xapfxb.com/yuer/462424.html