-
.
mRNA
(
messenger RNA
)信使
RNA
,是由编码区(
CDS
)、上游的
5
’非编码区和下游
3< br>’非
编码区组成,真核生物
mRNA
的
5
’端带有
7 -
甲基鸟苷
-
三磷酸帽子结构,
3
’端有多腺苷酸
尾巴,< br>但
NCBI
中
mRNA
序列实际上是
cDNA
序列< br>,
即经过反转录得到的与
RNA
序列互补的
DNA
序列,一般 不包括
3
’多腺苷酸尾巴。一个
cDNA
序列被称为一个
转录子,第一个碱基所在
的位置为转录起始位点
(
TSS
)
,
cDNA
都是由外显子组成,
但编码蛋白质的外显子只有一个,
即
CDS(
coding sequence
),这段序列也就是一个
ORF
区< br>,也就是这个
cDNA
的
ORF
序列
。
参与特定基因 转录及其调控的
TSS
上游序列称为启动子
(
Promoter
)< br>,
如原核生物在转录起
始位点上游
-10
有一段
TATAAT
的保守序列,有助于局部解链,在
-35
有一段
TTGACA
序列提
供
RNA
聚合酶识别信号,真核生物上游
-25
到
-30T ATA
决定起始位点,
-75
位置
CAAT
与
RNA
聚合酶,这些都是启动子,启动子的范围非常大,可以包含转录起始位点上游
2000bp
, 有
些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。
克隆
可以简单理解为复制品,例如假设通过提取
mRNA
,反转录后得到cDNA
序列,然
后将这段序列转入载体,再通过划线不断的繁殖,就会得到许多装有这段
cDNA
序列的克
隆,实验室为了方便,在给得到的这些克隆起名时,一般会取
cDNA
序列的名,但实际上
在这个克隆里面不仅包括了这个
cDNA
,还 包括了载体的
DNA
。
STS
(
sequence-tagged site
)序列标记位点,是基 因组上定位明确、作为界标并能通过
PCR
扩增被唯一操作的短的、单拷贝
DNA序列,一般长度为
200-500bp
,一个
DNA
序列要成为
STS
,
首先序列必须已知,
能用
PCR
方法检测,
第二< br>STS
必须在基因组上具有唯一的定位点。
通过
STS
可以判断在不同 条件下测序得到的
DNA
序列的准确性。
EST
(
expressed sequence tag
)表达序列标签, 是从一个随机选择的
cDNA
克隆,进行
5
’
端和
3
’
端单一次测序挑选出来获得的短的
cDNA
序列。
全基因组测序发现基因 即昂贵又费
时,
因为基因组中只有
2%
序列编码蛋白质,
因此可以对 真正编码蛋白质的
mRNA
构建
cDNA
文库,对
cDNA
进行测序,得到
EST
序列,从而发现新基因。
下面以大鼠
CTG F
基因为例子,
小写字母是转录子前后
200bp
启动子相关序列,
大写字母表
示的是
cDNA
序列,也就是转录子,其中蓝色标记的部分为
CD S
序列,湖蓝色的为转录起
始位点,即
TSS
,加粗带下划线的为起始密码子
agtgtgccagctttttcagacggaggaatgtggagtgtcaa ggggtcaggatcaatccggtgtgagttgatgaggcaggaaggtggggagg aatgcga
ggaatgtccctgtttgtgtaggactccattcagttcttt ggcgagccggccgcccggagcgtataaaagccagcgccacccgcccagtc tcacacagct
ctt
C
TCTCCAAGAAGACTCAGCCAGACC CACTCCAGCTCCGACCCTAGGAGACCGACCTC
CTCCAGACGGCAGC AGCCCCAGCCCAGTGGACAACCCCAGGAGCCACCACCTGGAGCG
TC CGGACACCAACCTCCGCCCCGAGACCGAGTCCAGGCTCCGGCCGCGCCCC TCGTCG
CCTCTGCACCCCGCTGTGCGTCCTCCTGCCGCGCCCCGAC C
ATG
CTCGCCTCCGTCGCG
GGTCCCGTTAGCCTCGCCT TGGTGCTCCTCCTCTGCACCCGGCCTGCCACCGGCCAGG
ACTGCAG CGCGCAGTGTCAGTGCGCAGCTGAAGCGGCGCCGCGCTGCCCCGCCGGCG
TGAGCCTGGTGCTGGACGGCTGCGGCTGCTGCCGCGTCTGCGCCAA GCAGCTGGGAG
AACTGTGCACGGAGCGTGATCCCTGCGACCCACAC AAGGGTCTCTTCTGCGACTTCGG
CTCCCCCGCCAACCGCAAGATTG GCGTGTGCACTGCCAAAGATGGTGCACCCTGTGTC
TTCGGTGGGTC CGTGTACCGCAGCGGCGAGTCCTTCCAAAGCAGTTGCAAATACCAGT
GCACTTGCCTGGATGGGGCCGTGGGCTGTGTGCCCCTGTGCAGCATGGA CGTGCGCC
TGCCCAGCCCTGACTGCCCCTTCCCGAGAAGGGTCAAG CTGCCCGGGAAATGCTGTGA
GGAGTGGGTGTGTGATGAGCCCAAGG ACCGCACAGTGGTTGGCCCTGCCCTAGCTGC
CTACCGACTGGAAGA CACATTTGGCCCTGACCCAACTATGATGCGAGCCAACTGCCTG
GTC CAGACCACAGAGTGGAGCGCCTGTTCTAAGACCTGTGGGATGGGCATCTC CACCC
精品
.
GGGTTACCAATGACAATACCTTCT GCAGGCTGGAGAAGCAGAGTCGTCTCTGCATGGT
CAGGCCCTGTGA AGCTGACCTAGAGGAAAACATTAAGGTAAATAAATACTCTGCCCCC
AGACACTCATTTTCACAGAATGACAGGAAAGAGAACCAGAGCTGGCTGTC TCGCCGCC
CTTCTTATTATAGGCCTGTTGTCTCCAGAAATATCTAA CCATGGAGCTGTCTGGCTAGA
ATGAGAGATGCTGTAACAGCAGCTG CCAGTTTTCCACTACAAAATTCCCCGGGGTGTT
AGTTAATACGAGA CACTCCAAACGAAGCCATGGCTATTTTTGGAAAACTGGCGAATGA
A ACTCCCAGTCTCTCTCCCCTCAGAATATAAACACAAGTCAGATGACATAG GGCTAGTC
TACAGAGGGTTGAGGAAGGCCACTCCCGTTGTAGTAAT TGCGGTGTCTCTTCTCGTCT
TCCCTTAGAAGGGCAAAAAGTGCATC CGGACGCCTAAAATTGCCAAGCCTGTCAAGTT
TGAGCTTTCTGGCT GCACCAGTGTGAAGACCTACCGGGCTAAGTTCTGTGGGGTGTG
CAC GGACGGCCGCTGCTGCACACCGCACAGAACCACCACACTGCCGGTGGAGT TCAAG
TGCCCCGATGGCGAGATCATGAAAAAGAACATGATGTTCAT CAAGACCTGTGCCTGCC
ATTACAACTGTCCCGGGGACAATGACATC TTTGAGTCCTTGTACTACAGGAAGATGTA
TGGAGACATGGCGTAA< br>精品
.
AGCCAGGGAGTAAGGGACACGAACTCATTT AGACTATAACTTGAACTGAGTTACATCT
CATTTTCTTCTGTAAAAA AACAAAAAGGATTACAGTAGCACATTAATTTAAATCTGGGT
TCCTA ACTGCTGTGGGAGAAAACACCCCACCGAAGTGAGAACCGTGTGTCATTGT CAT
GCAAATAGCCTGTCAATCTCAGACACTGGTTTCGAGACAGTTT AGACTTGACAGTTGTT
CACTAGCGCACAGTGACAGAACGCACACTA AGGTGAGCCTCCTGGAAGAGTGGAGAT
GCCAGGAGAAAGACAGGTA CTAGCTGAGGTCATTTTAAAAGCAGCGATATGCCTACTT
TTTGGAG TGTGACAGGGGAGGGACATTATAGCTTGCTTGCAGACAGACCTGCTCTAG
CAAGAGCTGGGTGTGTGTCCTCCACTCGGTGAGGCTGAAGCCAGCT ATTCTTTCAGTA
AGAACAGCAGTTTCAGCGCTGACATTCTGATTCC AGTGACACTGGTCGGGAGTCAGAA
CCTTGTCTATTAGACTGGACAG CTTGTGGCAAGTGAATTTGCCGGTAACAAGCCAGAT
TTTTATGGAT CTTGTAAATATTGTGGATAAATATATATATTTGTACAGTTATCTAAGTT< br>AATTTAAAGACGTTTGTGCCTATTGTTCTTGTTTTAAGTGCTTTTGG AATTTTTAAACT
GATAGCCTCAAACTCCAAACACCATCGATAGGAC ATAAAGCTTGTCTGTGATTCAAAAC
AAAGGAGATACTGCAGTGGAA ACTGTAACCTGAGTGACTGTCTGTCAGAACATATGGT
ACGTAGACG GTAAAGCAATGGATCAGAAGTCAGATTTCTAGTAGGAAATGTAAAATCA< br>CTGTTGGCGAACAAATGGCCTTTATTAAGAAATGGCTTGCTCAGGGT AACTGGTCAGA
TTTCCACGAGGAAGTGTTTGCTGCTTCTTTGACTA TGACTGGTTTGGGAGGCAGTTTA
TTTGTTGAGAGTGTGACCAAAAG TTACATGTTTGCACCTTTCTAGTTGAAAATAAAGTA
TATATATTTT TTATATGaaaggcttggctgctcattcttgtaaactttccttgggtttcc ctgggtgtaagcaggaagtttatatttatctta
aggtaattcacta agatgtttacaaacaactttgatgtgcatgagtcacatgaaatcaataga attttgcataagcatcccttacaccggaccaagtagaca
tgagcat caattatctacatgg
精品
.
首先
,
的先简单介绍一下
,DNA
到
protein
这个过程
.
对于一个
gene,
它除了含有翻
译成
protein
的那短序列
,
也就是
CDS (coding sequence ),
还有一些
untranslated
的部分
,
比如
promoter
等
,
就是
常说的
3'UTR
和
5'UTR .
了一个图片放在这里
:
感觉这个图有点问题
,
从
wiki
上找了个图
,
这 个是
mRNA
的结构图
精品
-
-
-
-
-
-
-
-
本文更新与2021-02-28 16:17,由作者提供,不代表本网站立场,转载请注明出处:http://www.xapfxb.com/yuer/462478.html
-
上一篇:(完整版)分子生物学与基因工程
下一篇:真核生物的基因表达调控机制