-
斌琪淋作品
生物五界:动物、植物、真菌、原生生物和原核生物;生物三界:真细菌、古细菌、真核生物
具有催化活性的
RNA
分子称为核酶(
ribozyme
)核酶催化 的生化反应有:自我剪接
、催化切断其它
RNA
、合成多
肽键
、催化核苷酸的合成
新基因的产生:
基因与基因组加倍
1
)整个基因组加倍;
2
)单条或部分染色体加倍;
3
)单个或成群基因加倍。
DNA
水平转移
:原核生物中的
DNA
水平转移可通过接合转移,噬菌体转染 ,外源
DNA
的摄取等不同途径发生,
水平转移的基因大多为非必须基因。动物中由于 种间隔离不易进行种间杂交,但其主要来源于真核细胞与原核细胞
的内共生。动物种间基因转移主要集中 在逆转录病毒及其转座成分。
外显子洗牌与蛋白质创新
:产生全新功能蛋白质的方式 有二种:功能域加倍,功能域或外显子洗牌
基因冗余
:一条染色体上出现一个基因的 很多复份
(
复本)
当人们分离到某一新基因时,
为了鉴定其生物学功能,常
常使其失活,然后观察它们对表型的影响。许多场合,由于第二个重复的功能基因可取代失活的基 因而使突变型表
型保持正常。这意味着,基因组中有冗余基因存在。看家基因很少重复,它们之间必需保 持剂量平衡,因此重复的
拷贝很快被淘汰。与个体发育调控相关的基因表达为转录因子,具有多功能域的 结构。这类基因重复拷贝变异可使
其获得不同的表达控制模式,促使细胞的分化与多样性的产生,并导致 复杂形态的建成,具有许多冗余基因。
非编码序列扩张方式:滑序复制、转座因子
模式生物海胆、果蝇、斑马鱼、线虫、蟾蜍、小鼠、酵母、水稻、拟南芥等。模式生物基因组中
G+C%
含量高
,
同时
CpG
岛的比例也高。进化程度越高
, G+C
含量和
CpG
岛的比例就比较低
如果基因之间不存在重叠顺序,也无基因内基因(
gene-within-gene
)
,那么
ORF
阅读出现差错的可能只会发生在
非编码区。细菌基因组中缺少 内含子,非编码序列仅占
11%,
对阅读框的排查干扰较少。细菌基因组的
ORF< br>阅读相
对比较简单,
错误的机率较少。
高等真核生物
DNA
的
ORF
阅读比较复杂:
基因间存在大量非编码序列
(人类占
70%< br>)
;
绝大多数基因内含有非编码的内含子。高等真核生物多数外显子的长度少于
100
个密码子
内含子和外显子序列上的差异:内含子的碱基代换很少受自然选择的 压力,保留了较多突变。由于碱基突变趋势大
多为
C-T,
故
A/T
的含量内含子高于外显子。由于终止密码子为
TAATAGTGA
,如果以内含子作为编码序列 ,
3
种读
码框有很高比例的终止密码子。
基因注释程序编写的依据 :
1
)信号指令,包括起始密码子,终止密码子,终止信号,剪接受体位和供体位,多聚
嘧啶序列,分支点保守序列
2
)内容指令,密码子偏好,内含子和外显子长短
基因功能的检测:基因失活、基因过表达、
RNAi
干涉
双链DNA
的测序可从一端开始,亦可从两端进行,前者称单向测序,后者称双向测序。
要获得大于
50 kb
的
DNA
限制性片段必需采用稀有切点限制酶。
酵母人工染色体(
YAC
)
1
)着丝粒
在细胞分裂时负责染色体均等分配。
2
)端粒
位于染色体端部的特 异
DNA
序
列,保持人工染色体的稳定性
3
)自主复制起始点(
ARS
)在细胞中启动染色体的复制
合格的
STS
要满足
2
个条件:
它应是一段序列已知的片段,
可据此设计
PCR< br>反应来检测不同的
DNA
片段中是否存
在这一顺序;
STS
必 需在染色体上有独一无二的位置。如果某一
STS
在基因组中多个位点出现,那么由此得出的作
图数据将是含混不清的。
遗传图绘制主要依据由孟德尔描述的遗传学原理,第一条定 律为等位基因随机分离,第二条定律为非等位基因自由
组合,显隐性规律
/
不完全显性 、共显性、连锁
衡量遗传图谱的水平
覆盖程度
饱和程度
基因类型:
transcribed,
translatable
gene
(
蛋白基因
)
;
transcribed
but
non- translatable
gene
(
RNA
基因
)Non-
transcribed, non-translatablegene ( promoter, operator ) rRNA
基因,
tRNA
基因
, scRNA
基因
, snRNA
基因
, snoRNA
基
因
, microRNA
基因
基因组
(genome)
:生物所具有的携带遗传信息的遗传物质总和。
< br>基因组学
(
genomic
)
:用于概括涉及基因作图、测序和整个基 因功能分析的遗传学分支。
染色体组
(
chromosome
s et
)
:不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的
全套 染色体。
比较基因组学
(
comparative genomics)
:比较基因组学是基因组学与生物信息学的一个重要分支。通过模
式生物基因组与人类基 因组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进
化提供依据。
(目标)
斌琪淋作品
RNA
世界
:
RNA
不仅可以是信息的携带者,而且还可以是功能的执行者,这使科学家们想到了原始的生物世界可< br>能是一个只由
RNA
组成的“
RNA
世界”
外显子 洗牌
:由不同基因中编码不同结构域的片段彼此连接形成的全新编码顺序称为功能域或外显子洗牌。
水平基因转移
:是指在差异生物个体之间,或单个细胞内部细胞器之间所进行的遗传物质 的交流。
基因共线性
(
syteny/colinearity
)
:不同基因组中,基因排列顺序的一致性更能够体现基因组的共同起源
,
这 种基因排列顺序的一致性称为共线性。破坏基因组共线性的因素很多
,
包括转座、插入、染色 体重排、区
段加倍和缺失。染色体重排可造成大范围基因位置的改变,但不打乱基因组某些区段的微观共 线性。
宏观共线性
系指遗传连锁图上锚定标记排列次序的一致性。
微观共线性
(
microsynteny
)则指物理图上基因顺序的一致排列。在多 数情况下
,
只有在进化距离非常近的
物种间才能保持很好的微观共线性。
基因岛
(
gene island
)
:某些区段基因密度比全基因组的平均密度高很多,形成基因岛。
直系同源集簇
(
clusters of orthologous groups< br>,
COG
)
:由一个共同的祖先基因衍生的一组基因。包括:
不同基因组中执行同一生物学功能的种间同源物
(ortholog)
;同一基因组中因基因加倍产生的种内同源物
(paralog)
,或平行基因。
基因的协同丢失和协同进化
: 执行同一生物学功能的基因有相伴丢失的趋势。与此同时,为了补偿丢失基
因所执行的功能,导致其它具 有类似功能的基因群高度分化。
这就是基因的协同丢失和协同进化。
开放读框
(
open reading frames, ORFs
)所有编 码蛋白质的基因都含有开放读框,它们由一系列指令氨基
酸的密码子组成。开放读框有一个起点,又称起 译密码,一般为
ATG
,还有一个终点,又称终止密码,分
别为
TAA
,
TAG
和
TGA
,三者含义相同。
同义密码子
(
synonym
)
:编码同一氨基酸的不同密码子称为同义密码子,其差别仅在密 码子的第三位碱基
不同。
同源查询
(
homology sear ch
)利用已存入数据库中的基因顺序与待查的基因组序列进行比较,从中查找可
与之匹配的碱 基顺序用于界定基因,这种方法称为同源查询。同源查询的依据:生物的不同种属之间具有
功能或结构相 似的直系基因成员,它们在起源上一脉相承,其间存在保守的顺序组成。待注释的
DNA
顺序< br>与已报道的其它基因序列对比,可发现其中的相似性:
1
)存在某些完全相同的序列;
2
)
ORF
读框 的排
列类似,如等长的外显子;
3
)
ORF
指令的氨基酸顺序相同;
4
)模拟的多肽高级结构相似
孤独基因
(
orphan gene
)在基因分类时,缺少同源顺序的
ORF
被称为孤独基因。
同源性
(homology):
起源于同一祖先序列发生变异的序列。直向同源基因(
orthologous ~
)不同物种间的同源基因。
共生同源基因(
paralogous ~
)同一物种的同源基因。
相似性
(similarity):
同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占比例。
可取代氨基酸:
具有相同性
质(极性)的氨基酸,代换不影响蛋白质的生物学功能
一致性
(identity):
同源
DNA
(蛋白质)序列中同一 碱基(氨基酸)位置上相同的碱基(氨基酸)成员
动物园杂交
(
Zoo-b lotting
)如果某一物种的
DNA
顺序与来自另一亲缘种的
DNA片段杂交产生阳性信号,该区段
可能含有一个或多个基因,这种方法称为动物园杂交。
< br>结构域
(
domain
)
:指蛋白质高级结构中具有相对独立的亚结构 区,通常含有数个二级结构基序,具有相对独立的
功能。
蛋白质域结构
(
domain architecture
)
:又称 蛋白质指纹,指蛋白质成员中结构域的组合形式及排列顺序。
直系同源
(
o rthologous
)这是指不同物种之间的同源基因,它们来自物种分隔之前的同一祖先。
平行同源
(
paralogous
)同一种生物内部的同源基因,它们常常是 多基因家族的不同成员
,
其共同的祖先基因可能存
在于物种形成之后,也可能出现于物种形成之前。
基因剔除
(
knock-out
)将一段无关的
DNA
片段 用来取代某一特定的基因,是最简便的使基因失活的方法。主要原
理是,在一段无关片段的两侧连接与代 换基因两侧相同的顺序,将这一构建导入目的细胞,由于同源片段之间的重
组,可使无关片段取代靶基因 整合到染色体中。
覆盖面
:指随机测序获得的序列总长与单倍体基因组序列总长之比。
染色体步移
(
chormosome
walking)
从第一个 重组克隆插入片段的一端分离出一个片段作为探针从文库中筛选第二
斌琪淋作品
< br>个重组克隆,该克隆插入片段含有与探针重叠顺序和染色体的其他顺序。从第二个重组克隆的插入片段再分 离出末
端小片段筛选第三个重组克隆,如此重复,得到一个相邻的片段,等于在染色体上移了一步,故称 之为染色体步移
顺序标签位点
(
Sequence tagged site,
STS
)是一小段长度在
100
到
500 bp
的
DNA
顺序,每个基因组仅一份拷贝,
很易分辨。顺序标签位点作图
< br>通过
PCR
或分子杂交将小段
DNA
顺序定位在基因组的
DN A
区段中。
表达顺序标签
(
EST
)
:
从
cDNA
克隆中找到的小段顺序,
cDNA
代表了
mRN A
所在细胞中表达的基因。
EST
可转
变为
STS
,条件是 这个
EST
来自单拷贝基因而非基因家族成员。
RFLP
标记
限制性片段长度多态性
,是指用某一种限制性内切酶 来切割来自不同个体的
DNA
分子,内切酶的识别
序列有差异,即是由限制性酶切位点 上碱基的插入、缺失、重排或点突变所引起的。这种差异反映在酶切片段的长
度和数目上
SSLP(Simple sequence length polymorphisms)
简单序列长度多态性,
产于重复顺序的可变排列,
同一位点重复顺序
的重复次数不同,表现出
DNA
序列的长度变化。
SSLP
有些场合又称< br>SSR
。
SSR
标记:简单序列重复,
微卫星
DN A
标记,它是指基因组中存在的由
2-5
个核苷酸为重复单位组成的长达几十
个核苷酸的串联重复序列,广泛分布于真核生物基因组中。
单核苷酸多态性
(
single nucleotide polymorphisms
,
SNP
)
:
2
个 同源
DNA
顺序中同一碱基位置含有不同的核苷酸
作图试剂
(
mapping reagent
)
:覆盖整条染色体或 整个基因组的
DNA
片段群体,用于
STS
作图。
厘镭< br>(
centiRay
,
cR
)
,其定义是
DNA分子暴露在
N
拉德
X
射线剂量下两个分子标记之间发生
1
%断裂的频率。
C
值(
C value
)
是指一个单倍 体基因组中
DNA
的总量,一个特定的种属具有特征的
C
值。
C
值悖理
(C value paradox)
生物的复杂性与基因组的大小并不完全成比例增加
为什么说
RNA
分子起主导地位?
RNA
不仅可以是信息的携带者,
而且还可以是功能的执行者,
这 使科学家们想到了原始的生物世界可能是一个
只由
RNA
组成的“
RNA世界”
。
首先,在人工模拟的原始 地球的条件下,核糖核苷酸或
RNA
要比脱氧核糖核苷酸或
DNA
相对容易形 成一些。
其次、在现代的生物系统中,合成核苷酸过程是先从糖、氨基酸、二氧化碳等小分子物质合成出
RNA
的前体;再
由核糖核苷酸经还原反应去氧生成
DNA
的前体。
因此,
认为
RNA
比
DNA
先出现是合理的。
RN A
能贮存遗传信息,
在现代生物中,仍然有少数病毒的基因组完全由
RNA
组 成。从而,认为最早的遗传物质是
RNA
也是合理的。
RNA
一般 以单链的形式存在,而单链的
RNA
可以折叠成多种多样的结构,这为
RNA
可以具有多种功能提供
了结构上的基础。现代的蛋白质酶也正是靠有多种多样的立体结构才可以担当催化 生物体内众多的新陈代谢过程的
重任。另一方面,在模拟原始地球的条件下很容易产生类蛋白,但不能通 过模拟的途径来形成具某种功能的简单蛋
白质。因此,
RNA
是先于蛋白质的生物催化 剂。
单独由
RNA
组成的原始生命的进化以不完全精确的
RNA< br>自复制为基础。从大量的
RNA
变异体中,通过不断
的选择,
可以使< br>RNA
的某种催化功能得到大大的强化,
甚至产生出具有新催化功能的
RNA< br>分子。
因此,
只由
RNA
构成的生命系统是可以进化的。
在
RNA
世界中,
RNA
本身能自我复制,并且能进行一些十分简单的生命活动:
RNA
分子内或分子间的重组
(
RNA
自剪接)
、催化一些早期的生物化学反应、
RNA
还有可 能促进
DNA
和蛋白质的产生
RNA
如何把其长期贮存遗传信息的 功能移交给
DNA
,把它的大部分催化功能移交给蛋白质?
为什么会出现
RNA
向蛋白质的转变?
一方面,蛋白质的多样性远 远超过
RNA
,因为多肽链中有
20
种氨基酸,
RNA
只有
4
种核苷酸,前者的排列组合的
方式比后者大得多,可以催化范围更广的反应;
另一方面,蛋白质的催化更为成功。因为多肽链有更大的可塑性,
而
RNA
分子中碱基配对区段则有较强物理刚性。第三,
RNA
分子的长度有限,限制了它们的催化反 应活性。
RNA
原始基因组仍处在十字路口
一方面,
R NA
扮演的主要角色是催化各种生化反应,这一点它们做得不错。另一方面,
RNA
行 使编码功能,但显
得不太适合。
由于受
2
‘
OH
基团的影响 ,
RNA
的磷酸脂键稳定性较差,
无法胜任建立稳定遗传系统的重任。
RNA
的编码功能转移到更为稳定的
DNA
是一种必然的趋势。
RNA
世界向
DNA
世界的转变
尿苷酸由其甲基化的衍生 物胸腺嘧啶取代,使
DNA
顺序具有更高的稳定性;
DNA
损伤修复系统的诞 生进一步奠定
了双链
DNA
作为编码分子的地位,使遗传信息更忠实地传递。
-
-
-
-
-
-
-
-
本文更新与2021-02-28 15:56,由作者提供,不代表本网站立场,转载请注明出处:http://www.xapfxb.com/yuer/462417.html