关键词不能为空

当前您在: 首页 > 育儿 >

基因家族的定义

作者:陕西保健网
来源:http://www.xapfxb.com/yuer
更新日期:2021-02-28 15:57

-

2021年2月28日发(作者:上海甲亢医院)
什么是一个基因家族呢由一个共同的祖先基因经过重复
(duplication)
和 突变
(mutation)

生的、外显子中具有相似的序列的一组相关基因被称为基 因家族
(gene family)
。基因重复
主要有三种方式:
片段复制、
串联重复和逆转录转座或其他转座事件等,
基因重复后可以彼
此形成基因簇
( gene clusters)
,同一家族中的成员有时紧密的排列在一起,成为一个基因
簇; 更多的时候,它们却分散在同一染色体的不同部位,
甚至位于不同染色体上,
具有各自
不同的表达调控模式。基因突变是基因分子进化的第一原因,由核苷酸替代、插入
/
缺失、重组和基因转换等引发的突变基因或
DNA
序列,通过群体水平的遗传漂变和
/< br>或自然选择进
行扩散,并最终在物种基因组中得以固定,这种方式产生的新基因一般拷贝数目不会 增加,
相对基因重复是非常少的,
主要是影响基因的序列以及其编码的蛋白。
基因家族 主要是指一
组功能相似且核苷酸序列具有同源性的基因,
是具有显著相似性的一组基因,
编码相似的蛋
白质产物。


有时定义基因家族,
从结构域角度来 刻画。
如:
一类基因,
其编码蛋白都含有同一个结构域,
这一类基因是一个基 因家族。比如
MADS-box
基因家族,这类基因都含有
MADS-box
结构域,
还有
SET
结构域基因家族。这个定义信息更偏向功能信息,一般来说结构域 决定某种功能,
因为结构域序列保守,
易形成稳定的三维结构。
这与共同祖先的定义有 些差别,
很多结构域
难找得到其共同祖先。
另外一个基因的共同祖先定义比较复杂的,
越是历史久远的祖先,

为物种的在进化过程中发生了很多丢失和增加事件。
共同祖先是个相对的概念,
比如植物的
共同祖先,一般包括藻类及其它绿色植物,而被子植物共 同祖先,根据已经测序的基因组,
一般指单双子叶之前就可以。
如果从共同祖先定义基因家族,
很多已知的基因家族就要被分
成很多个基因家族。有很多网站(数据库)专门收集结构域,比如
Pfam

InterPro
,这两
个数据库内容差不多。
这些数据库以
Hmmer
算法为基础,
根据
Uniprot
中包含的 蛋白,
进行
序列连配找到保守的片段
(
结构域)

再以这些 序列使用
Hmmer
构建种子,
保存这些种子。

个蛋白拿过来后,
与这些种子比对,
根据打分能判断出这个蛋白是不是含有这个结构域,

也是 判断一个基因编码蛋白是不是属于这个家族。





基因家族


定义




基因 组进化中,
一个基因通过基因重复产生了两个或更多的拷贝,
这些基因即构成一个
基因 家族。




是具有显著相似性的一组基因,编码相似的蛋白质产物。




在真核细胞中许多相关的基因常按功能成套组合,被称为基因家族(
gene
fam ily

。同
一家族中的成员有时紧密的排列在一起,成为一个基因簇;




更多的时候,
它们却分散在同一染色体的不同部位,
甚至位于不同染色体上,
具有各自
不同的表达调控模式。




一组功能相似且核苷酸序列具有同源性的基因,
可能由某一共同祖先基因经重复和突 变
产生。


多基因家族




真核基因组的特点之一就是存在多基因家族(
multi
gene
fam ily

。多基因家族是指由
某一祖先基因经过重复和变异所产生的一组基因。
多基因家族大致可分为两类:
一类是基因
家族成簇地分布在某一条染色体上,
它们可 同时发挥作用,
合成某些蛋白质,
如组蛋白基因
家族就成簇地集中在第
7号染色体长臂
3

2
带到
3

6
带区 域内;
另一类是一个基因家族
的不同成员成簇地分布不同染色体上,
这些不同成员编码 一组功能上紧密相关的蛋白质,

珠蛋白基因家族。
在多基因家族中,
某些成 员并不产生有功能的基因产物,
这些基因称为假
基因(
pseudo
gen e

。假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺
失,倒位或 点突变等,使这一基因失去活性,成为无功能基因。与相应的正常基因相比,假
基因往往缺少正常基因的 内含子,两侧有顺向重复序列。
人们推测,假基因的来源之一,可
能是基因经过转录后生成的< br>RNA
前体通过剪接失去内含子形成
mRNA

如果
mRNA
经反复转录
产生
cDNA
,再整合到染色体
DNA
中去,便 有可能成为假基因,因此该假基因是没有内含子
的,在这个过程中,可能同时会发生缺失,倒位或点突变 等变化,从而使假基因不能表达。


多基因家族的进化


在进化过程中,基因家族如编码
rRNA
的基因或编码组蛋白的基因都是从共同的祖先基因通
过重复
(duplication)
和歧化
(divergence)
进化而来的,它们具有相同或相关的功能。虽然
如此,
但它们在发育过程中并不总是同时表达 的,
不同的成员可能在不同的发育阶段和
(

)
不同的组织中表达,
如有些血红蛋白基因家族成员在成体中表达,
而另一些则只在胎儿期表
达,这一事实说 明在基因调控水平发生了进化歧化
(evolutionary divergence)





在足够时间的进化过程 中,
基因家族中某些成员的
DNA
序列可能歧化为可编码一种具有
新功能的蛋 白,例如,乳清蛋白
(lactalbumin)
基因与溶菌酶基因就属于同一个家族,前者< br>编码催化乳糖合成的酶的一个亚基,后者编码的溶菌酶能降解某些细菌细胞壁的多糖化合
物,但它 们具有一个共同的特点就是都作用于碳水化合物。




我们也已 经知道,
基因家族中的某些成员并不转录或转录本不翻译成有功能的蛋白,

成为基因 家族中的假基因。
研究发现,
这些无功能的假基因缺乏必要的启动序列和缺乏一个
或多 个具活性的成员中特有的内含子序列。




DNA
重复 通常是指
DNA
片段数的增加,它可以是一个完整基因的重复
(
基因重复)
、基因
的一部分重复、
一个完整染色体的重复
(
非整倍体)

或整个基因组的重复
(
多倍体
)

基因家
族是由于连续的基因重复所造成的。




非整倍体常导 致生物体的不育,
而基因组重复只是使基因增加拷贝数,
并不产生新的基
因,
对基因组的复杂性并没有改变。
从基因组进化的角度来看,
更多的是考虑单个基因或一
些基因的重复,而不是整个基因组的重复。




珠蛋白是一个多 基因家族,在人类的第
16
号染色体上发现了
7
个类
a
珠蛋 白基因,在

11
号染色体上发现了
6
个类
b
珠蛋 白基因,在动物甚至植物中也发现了珠蛋白基因,表
明这是一个非常古老的基因家族。在多种动物中几乎 所有有功能的珠蛋白基因结构都相同,

3
个外显子组成,
中间间隔着两个内 含于。
但珠蛋白基因的数量和次序在各种动物中是不
同的。
由于所有的珠蛋白基因的结 构和顺序都是相似的,
因此它们存在着一个祖先珠蛋白基

(
多半和现在存在 的肌红蛋白基因相关
)

在约
5
亿年前,
祖先珠蛋白基因经 重复和歧化产
生了原始的
a
珠蛋白基因和
b
珠蛋白基因,
再 追溯至
8
亿年前,
这个祖先珠蛋白基因本身也
是通过基因重复而产生的,它的 另一份拷贝进化为现今的肌红蛋白
(myoglobin)
基因,肌红
蛋白基因的组成 和珠蛋白基因相似,
其主要功能也同珠蛋白一样是贮存氧,
因此我们可以将
三个外显子 结构看成是它们共同的祖先。植物的豆血红蛋白
(leghemoglobin)
基因是和珠蛋
白基因相关的,
植物豆血红蛋白基因存在着很多原始的类型,
它比肌红蛋白基因多一个 内含
子,但它与肌红蛋白很相似。




某些原始的鱼类 只有单个类型的珠蛋白链,
因此它们必然是在珠蛋白基因尚未发生重复
前就歧化了出来。
在某些两栖动物中含有
a

b
连锁的珠蛋白基因,
这是由祖先珠蛋 白基因
重复后经突变形成的。
后来进一步重复,
在哺乳动物中形成了
a
珠蛋白家族和
b
珠蛋白家族。
重复在进化中是经常发生的,事实上,珠蛋白基因的拷 贝数在某些人类群体中是有变化的,
例如大部分人在
16
号染色体上有
2
a
基因
(a1

a2
,图
12-9)
,但有些个体在此染色体上
只有
1
个,
而另一些个体有
3
个甚至有
4

a
珠蛋白基因。
此表明在多基因家族中基因的重
复和缺失是恒定的进行过程。重复也可以通过转座而产生。


基因组中的基因家族
(
来源于首席医学网
)

在人及高等 有机体基因组中,
有许多基因家族。
有的基因家族成员多,
有的基因家族成员少
;
有的基因家族成员功能相似,有的基因家族成员功能各异
[1]
。所谓多基因家族 是指一类具
有序列同源性及相似功能的基因
;
而基因超家族是指一类具有序列同源性而 不具相似功能的
基因。
如果一类蛋白或基因具有共同起源的一个结构域,
就属于一个基 因超家族,
同一个基
因可归属于两个或多个基因超家族。
有关基因家族的研究起始于二 十世纪七十年代,
目的是
为阐明个体或群体遗传差异与基因冗余
(gene redu ndancy)
的关系。文献表明:免疫球蛋白
基因超家族与其它多基因家族进化的分子机制相 似,染色体不等交换和基因转换
(gene
conversion)
导致了免疫球蛋 白基因的进化。为阐明基因家族进化和变异的分子机制,应同
时考虑染色体不等交换、
基因突变 、
自然选择及随机漂变等因素。
同一基因家族中不同成员
的序列同源性取决于基因突变 与染色体不等交换的频率,
也与自然选择及随机漂变有关
[1]





基因超家族的一个重要特点是不同成员具有不同的表达模式
(expression patt erns)

而同一多基因家族的不同成员往往具有相同的表达调控机制。
因此,有必要阐明基因超家族
成员其表达模式改变的诱因。一些大的基因超家族通常包括数个单基因和几个 多基因家族,
这些基因家族的形成是有机体进化的分子基础。
基因组中几乎所有的基因可归属于 一个或更
多的基因超家族。同源性比较可用于分析不同基因间的进化关系
;
系统发生分 析可剖析基因
家族不同成员的相关性
;
基因进化树可澄清基因拷贝数增加或基因重复< br>(gene duplication)
的历史,同时,为识别不同种属同源基因提供有益信息。

-


-


-


-


-


-


-


-



本文更新与2021-02-28 15:57,由作者提供,不代表本网站立场,转载请注明出处:http://www.xapfxb.com/yuer/462424.html

基因家族的定义的相关文章