关键词不能为空

当前您在: 首页 > 育儿 >

基因序列简介

作者:陕西保健网
来源:http://www.xapfxb.com/yuer
更新日期:2021-02-28 16:17

-

2021年2月28日发(作者:打嗝是什么病)
.
mRNA

messenger RNA
)信使
RNA
,是由编码区(
CDS
)、上游的
5
’非编码区和下游
3< br>’非
编码区组成,真核生物
mRNA

5
’端带有
7 -
甲基鸟苷
-
三磷酸帽子结构,
3
’端有多腺苷酸
尾巴,< br>但
NCBI

mRNA
序列实际上是
cDNA
序列< br>,
即经过反转录得到的与
RNA
序列互补的
DNA
序列,一般 不包括
3
’多腺苷酸尾巴。一个
cDNA
序列被称为一个
转录子,第一个碱基所在
的位置为转录起始位点

TSS


cDNA
都是由外显子组成,
但编码蛋白质的外显子只有一个,

CDS
coding sequence
),这段序列也就是一个
ORF
区< br>,也就是这个
cDNA

ORF
序列

参与特定基因 转录及其调控的
TSS
上游序列称为启动子

Promoter
)< br>,
如原核生物在转录起
始位点上游
-10
有一段
TATAAT
的保守序列,有助于局部解链,在
-35
有一段
TTGACA
序列提

RNA
聚合酶识别信号,真核生物上游
-25

-30T ATA
决定起始位点,
-75
位置
CAAT

RNA
聚合酶,这些都是启动子,启动子的范围非常大,可以包含转录起始位点上游
2000bp
, 有
些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。


克隆
可以简单理解为复制品,例如假设通过提取
mRNA
,反转录后得到cDNA
序列,然
后将这段序列转入载体,再通过划线不断的繁殖,就会得到许多装有这段
cDNA
序列的克
隆,实验室为了方便,在给得到的这些克隆起名时,一般会取
cDNA
序列的名,但实际上
在这个克隆里面不仅包括了这个
cDNA
,还 包括了载体的
DNA



STS

sequence-tagged site
)序列标记位点,是基 因组上定位明确、作为界标并能通过
PCR
扩增被唯一操作的短的、单拷贝
DNA序列,一般长度为
200-500bp
,一个
DNA
序列要成为
STS

首先序列必须已知,
能用
PCR
方法检测,
第二< br>STS
必须在基因组上具有唯一的定位点。
通过
STS
可以判断在不同 条件下测序得到的
DNA
序列的准确性。


EST

expressed sequence tag
)表达序列标签, 是从一个随机选择的
cDNA
克隆,进行
5

端和
3

端单一次测序挑选出来获得的短的
cDNA
序列。
全基因组测序发现基因 即昂贵又费
时,
因为基因组中只有
2%
序列编码蛋白质,
因此可以对 真正编码蛋白质的
mRNA
构建
cDNA
文库,对
cDNA
进行测序,得到
EST
序列,从而发现新基因。

下面以大鼠
CTG F
基因为例子,
小写字母是转录子前后
200bp
启动子相关序列,
大写字母表
示的是
cDNA
序列,也就是转录子,其中蓝色标记的部分为
CD S
序列,湖蓝色的为转录起
始位点,即
TSS
,加粗带下划线的为起始密码子

agtgtgccagctttttcagacggaggaatgtggagtgtcaa ggggtcaggatcaatccggtgtgagttgatgaggcaggaaggtggggagg aatgcga
ggaatgtccctgtttgtgtaggactccattcagttcttt ggcgagccggccgcccggagcgtataaaagccagcgccacccgcccagtc tcacacagct
ctt
C
TCTCCAAGAAGACTCAGCCAGACC CACTCCAGCTCCGACCCTAGGAGACCGACCTC
CTCCAGACGGCAGC AGCCCCAGCCCAGTGGACAACCCCAGGAGCCACCACCTGGAGCG
TC CGGACACCAACCTCCGCCCCGAGACCGAGTCCAGGCTCCGGCCGCGCCCC TCGTCG
CCTCTGCACCCCGCTGTGCGTCCTCCTGCCGCGCCCCGAC C
ATG
CTCGCCTCCGTCGCG
GGTCCCGTTAGCCTCGCCT TGGTGCTCCTCCTCTGCACCCGGCCTGCCACCGGCCAGG
ACTGCAG CGCGCAGTGTCAGTGCGCAGCTGAAGCGGCGCCGCGCTGCCCCGCCGGCG
TGAGCCTGGTGCTGGACGGCTGCGGCTGCTGCCGCGTCTGCGCCAA GCAGCTGGGAG
AACTGTGCACGGAGCGTGATCCCTGCGACCCACAC AAGGGTCTCTTCTGCGACTTCGG
CTCCCCCGCCAACCGCAAGATTG GCGTGTGCACTGCCAAAGATGGTGCACCCTGTGTC
TTCGGTGGGTC CGTGTACCGCAGCGGCGAGTCCTTCCAAAGCAGTTGCAAATACCAGT
GCACTTGCCTGGATGGGGCCGTGGGCTGTGTGCCCCTGTGCAGCATGGA CGTGCGCC
TGCCCAGCCCTGACTGCCCCTTCCCGAGAAGGGTCAAG CTGCCCGGGAAATGCTGTGA
GGAGTGGGTGTGTGATGAGCCCAAGG ACCGCACAGTGGTTGGCCCTGCCCTAGCTGC
CTACCGACTGGAAGA CACATTTGGCCCTGACCCAACTATGATGCGAGCCAACTGCCTG
GTC CAGACCACAGAGTGGAGCGCCTGTTCTAAGACCTGTGGGATGGGCATCTC CACCC
精品

.
GGGTTACCAATGACAATACCTTCT GCAGGCTGGAGAAGCAGAGTCGTCTCTGCATGGT
CAGGCCCTGTGA AGCTGACCTAGAGGAAAACATTAAGGTAAATAAATACTCTGCCCCC
AGACACTCATTTTCACAGAATGACAGGAAAGAGAACCAGAGCTGGCTGTC TCGCCGCC
CTTCTTATTATAGGCCTGTTGTCTCCAGAAATATCTAA CCATGGAGCTGTCTGGCTAGA
ATGAGAGATGCTGTAACAGCAGCTG CCAGTTTTCCACTACAAAATTCCCCGGGGTGTT
AGTTAATACGAGA CACTCCAAACGAAGCCATGGCTATTTTTGGAAAACTGGCGAATGA
A ACTCCCAGTCTCTCTCCCCTCAGAATATAAACACAAGTCAGATGACATAG GGCTAGTC
TACAGAGGGTTGAGGAAGGCCACTCCCGTTGTAGTAAT TGCGGTGTCTCTTCTCGTCT
TCCCTTAGAAGGGCAAAAAGTGCATC CGGACGCCTAAAATTGCCAAGCCTGTCAAGTT
TGAGCTTTCTGGCT GCACCAGTGTGAAGACCTACCGGGCTAAGTTCTGTGGGGTGTG
CAC GGACGGCCGCTGCTGCACACCGCACAGAACCACCACACTGCCGGTGGAGT TCAAG
TGCCCCGATGGCGAGATCATGAAAAAGAACATGATGTTCAT CAAGACCTGTGCCTGCC
ATTACAACTGTCCCGGGGACAATGACATC TTTGAGTCCTTGTACTACAGGAAGATGTA
TGGAGACATGGCGTAA< br>精品

.
AGCCAGGGAGTAAGGGACACGAACTCATTT AGACTATAACTTGAACTGAGTTACATCT
CATTTTCTTCTGTAAAAA AACAAAAAGGATTACAGTAGCACATTAATTTAAATCTGGGT
TCCTA ACTGCTGTGGGAGAAAACACCCCACCGAAGTGAGAACCGTGTGTCATTGT CAT
GCAAATAGCCTGTCAATCTCAGACACTGGTTTCGAGACAGTTT AGACTTGACAGTTGTT
CACTAGCGCACAGTGACAGAACGCACACTA AGGTGAGCCTCCTGGAAGAGTGGAGAT
GCCAGGAGAAAGACAGGTA CTAGCTGAGGTCATTTTAAAAGCAGCGATATGCCTACTT
TTTGGAG TGTGACAGGGGAGGGACATTATAGCTTGCTTGCAGACAGACCTGCTCTAG
CAAGAGCTGGGTGTGTGTCCTCCACTCGGTGAGGCTGAAGCCAGCT ATTCTTTCAGTA
AGAACAGCAGTTTCAGCGCTGACATTCTGATTCC AGTGACACTGGTCGGGAGTCAGAA
CCTTGTCTATTAGACTGGACAG CTTGTGGCAAGTGAATTTGCCGGTAACAAGCCAGAT
TTTTATGGAT CTTGTAAATATTGTGGATAAATATATATATTTGTACAGTTATCTAAGTT< br>AATTTAAAGACGTTTGTGCCTATTGTTCTTGTTTTAAGTGCTTTTGG AATTTTTAAACT
GATAGCCTCAAACTCCAAACACCATCGATAGGAC ATAAAGCTTGTCTGTGATTCAAAAC
AAAGGAGATACTGCAGTGGAA ACTGTAACCTGAGTGACTGTCTGTCAGAACATATGGT
ACGTAGACG GTAAAGCAATGGATCAGAAGTCAGATTTCTAGTAGGAAATGTAAAATCA< br>CTGTTGGCGAACAAATGGCCTTTATTAAGAAATGGCTTGCTCAGGGT AACTGGTCAGA
TTTCCACGAGGAAGTGTTTGCTGCTTCTTTGACTA TGACTGGTTTGGGAGGCAGTTTA
TTTGTTGAGAGTGTGACCAAAAG TTACATGTTTGCACCTTTCTAGTTGAAAATAAAGTA
TATATATTTT TTATATGaaaggcttggctgctcattcttgtaaactttccttgggtttcc ctgggtgtaagcaggaagtttatatttatctta
aggtaattcacta agatgtttacaaacaactttgatgtgcatgagtcacatgaaatcaataga attttgcataagcatcccttacaccggaccaagtagaca
tgagcat caattatctacatgg





精品

.






首先
,
的先简单介绍一下
,DNA

protein
这个过程
.
对于一个
gene,
它除了含有翻
译成
protein
的那短序列
,
也就是
CDS (coding sequence ),
还有一些

untranslated
的部分
,
比如
promoter

,
就是

常说的
3'UTR


5'UTR .
Google
了一个图片放在这里
:




感觉这个图有点问题
,

wiki
上找了个图
,
这 个是
mRNA
的结构图

精品

-


-


-


-


-


-


-


-



本文更新与2021-02-28 16:17,由作者提供,不代表本网站立场,转载请注明出处:http://www.xapfxb.com/yuer/462478.html

基因序列简介的相关文章