
氨基酸密码子
润景园著-房子倒塌
2023年2月17日发(作者:催促的近义词)精心整理
与核苷酸序列相关的特征关键词表
关键词说明
allele相关的个体或菌株含有相同基因的稳定的其它形式,该形式区别于这一位置的现有
的序列(和或许其它序列)
attenuator存在调节转录的终止的DNA区域,它控制了一些细菌操纵子的表达;(2)位于启动子
和第一个结构基因之间,引起转录的部分终止的序列区段
C_region免疫球蛋白轻和重链的恒定区,和T-细胞受体α,β,和γ链;根据特定的链可包括
一个或多个外显子
CAAT_signa
l
CAAT盒;位于可能参与RNA聚合酶结合的真核生物转录单位的起始点的75bp上游的
保守序列的一部分;共有序列=GG(C或T)CAATCT
CDS编码序列;对应于蛋白质中的氨基酸序列的核苷酸的序列(位置包括终止密码子);
特征包括氨基酸概念上的翻译
Conflict在这一位点或区域,单独确定的“相同”序列有所不同
D-loop置换环;线粒体DNA内的一个区域,其中RNA的短的序列与DNA的一条链配对,代替
了这一区域的原始配对DNA链;也用于说明在RecA蛋白质催化的反应中,侵入的单
链替代双链DNA的一条链的区域
D-segment免疫球蛋白重链的多变区,和T-细胞受体的β链
Enhancer顺式-作用序列,它增强了(一些)真核生物启动子的作用,并能在任一方向和与启动
子相关的任何位置处(上游或下游)起作用
Exon编码剪接mRNA部分的基因组区域;可以含有5'UTR,所有CDS,和3'UTR
丙氨酸
AlanineA或Ala89.079CH3-脂肪族类
精氨酸ArginineR或Arg174.188HN=C(NH2)-NH-(CH2)3-碱性氨基酸类
天冬酰胺AsparagineN或Asn132.104H2N-CO-CH2-酰胺类
天冬氨酸AsparticacidD或Asp133.089HOOC-CH2-酸性氨基酸类
半胱氨酸CysteineC或Cys121.145HS-CH2-含硫类
谷氨酰胺GlutamineQ或Gln146.131H2N-CO-(CH2)2-酰胺类
谷氨酸GlutamicacidE或Glu147.116HOOC-(CH2)2-酸性氨基酸类
甘氨酸GlycineG或Gly75.052H-脂肪族类
组氨酸HistidineH或His155.141
N=CH-NH-CH=C-CH2-
|__________|
碱性氨基酸类
异亮氨酸IsoleucineI或Ile131.160CH3-CH2-CH(CH3)-脂肪族类
亮氨酸LeucineL或Leu131.160(CH3)2-CH-CH2-脂肪族类
赖氨酸LysineK或Lys146.17H2N-(CH2)4-碱性氨基酸类
蛋氨酸MethionineM或Met149.199CH3-S-(CH2)2-含硫类
苯丙氨酸
Phenylalanin
e
F或Phe165.177Phenyl-CH2-芳香族类
脯氨酸ProlineP或Pro115.117
-N-(CH2)3-CH-
|_________|
亚氨基酸
丝氨酸SerineS或Ser105.078HO-CH2-羟基类
苏氨酸ThreonineT或Thr119.105CH3-CH(OH)-羟基类
色氨酸TryptophanW或Trp204.213
Phenyl-NH-CH=C-CH2-
|___________|
芳香族类
酪氨酸TyrosineY或Tyr181.1764-OH-Phenyl-CH2-芳香族类
缬氨酸ValineV或Val117.133CH3-CH(CH2)-脂肪族类
精心整理
GC_signalGC盒;位于真核生物转录单位起始点上游的保守的富含GC区域,可以以多重拷贝或
任一方向存在;共有序列=GGGCGG
gene鉴定为基因的生物学意义的区域,并已经指定名称
iDNA间插DNA;通过几种重组中的任何一种能被消除的DNA
intron被转录的DNA区段,但通过同时剪接位于其两侧的序列(外显子)即可从转录本内
部将其除去
J_segment免疫球蛋白轻链和重链的连接区段,和T-细胞受体α,β和γ链
LTR长的末端重复,在确定序列的两端直接重复的序列,类型典型地见于逆转录病毒中
mat_peptid
e
成熟的肽或蛋白质的编码序列;翻译后修饰之后成熟的或最终的肽或蛋白质产物的
编码序列;位置不包括终止密码子(与相应的CDS不同)
misc_bindi
ng
不能用任何其它Binding关键词(primer_bind或protein_bind)表述的与另一个组
成成分共价或非-共价结合的核酸中的位点
misc_diffe
rence
特征序列与记载中存在的有所不同,并且不能用任何其它不同关键词
(conflict,unsure,old_sequence,mutation,variation,allele或modified_base)
表述
misc_featu
re
不能用任何其它的特征关键词表述的具有生物学意义的区域;新的或少见的特征
misc_recom
b
任何一般性的,位点特异性的或复制的重组事件的位点,该位点中有不能用其它重
组关键词(iDNA和virion)或来源关键词的修饰词(/transposon,/proviral)表述的
双螺旋DNA的断裂和愈合
misc_RNA不能用其他RNA关键词
(prim_transcript,precursor_RNA,mRNA,5'clip,3'clip,5'UTR,3'UTR,exon,CDS
,
sig_peptide,transit____peptide,mat_peptide,intron,polyA_site,
rRNA,tRNA,scRNA和snRNA)限定的任何转录本或RNA产物
misc_signa
l
含有控制或改变基因功能或表达之信号的任何区域,所述信号不能用其他Signal关
键词
(promoter,CAAT_signal,TATA_signal,-35_signal,10_signal,GC_signal,RBS,po
lyA_signal,enhancer,attenuator,terminator,和rep_origin)表述
misc_struc
ture
不能用其他Structure关键词(stem_loop和D-loop)表述的任何二级或三级结构或
构象
modified_b
ase
被指示的核苷酸是经修饰的核苷酸,并应由被指示的分子(在mod_base修饰词意义
中给出)所取代
mRNA信使RNA;包括5'非翻译区(5'UTR),编码序列(CDS,外显子)和3'非翻译区(3
'UTR)
mutation在此位置处,相关品系的序列中具有突然的,可遗传的变化
N_region在重排的免疫球蛋白区段之间插入的额外的核苷酸
Old_sequen
ce
在此位置处,所表述的序列修改了此序列以前的版本
PolyA_sign
al
聚腺苷酸化之后内切核酸酶裂解RNA转录本所必需的识别区域;共有序列=AATAAA
PolyA_siteRNA转录本上的位点,通过转录后聚腺苷酸化该位点将被加上腺嘌呤残基
Precursor_
RNA
仍不是成熟的RNA产物的任何RNA种类;可包括5'剪切区(5'clip),5'非翻译区
(5'UTR),编码序列(CDS,外显子),间插序列(内含子),3'非翻译区(3'UTR),
和3'剪切区(3'clip)
prim_trans
cript
初级(最初的,未加工的)转录本;包括5'剪切区(5'clip),5'非翻译区(5
'UTR),编码序列(CDS,外显子),间插序列(内含子),3'非翻译区(3'UTR)和3'剪切区
(3'clip)
精心整理
prim_bind起始复制,转录或逆转录的非-共价的引物结合位点;包括合成的例如PCR引物元件
的位点
Promoter参与RNA聚合酶的结合以启动转录的DNA分子区域
protein_bi
nd
核酸上非-共价的蛋白质结合位点
RBS核糖体结合位点
repeat_reg
ion
含有重复单位的基因组区域
repeat_uni
t
单个重复元件
rep_origin复制起点;复制核酸以得到两个相同拷贝的起始位点
RRNA成熟的核糖体RNA;将氨基酸装配成蛋白质的核糖核蛋白颗粒(核糖体)中的RNA
成份
S_region免疫球蛋白重链的开关区;它参与重链DNA的重排,导致来自相同B-细胞的不同免
疫球蛋白类的表达
Satellite短的基本重复单位的很多串联重复(相同或相关的);大多数具有的碱基组成或其它
性质与基因组的一般水平不同,这使得它们与大部分(主带)的基因组DNA分离开来
ScRNA小的细胞质RNA;几个小的细胞质RNA分子中的任何一个存在于真核生物的细胞
质和(有时)核中
sig_peptid
e
信号肽编码序列;被分泌的蛋白质的N-末端结构域的编码序列;此结构域涉及新
生多肽与膜的结合;前导序列
SnRNA小的核RNA;很多小的RNA种类中的任何一个都被局限于核中;几个snRNA参与剪
接或其它RNA加工反应
source鉴定序列中特定范围的生物来源;此关键词是强制性的;每一项至少要有一个跨越
整个序列的单一来源关键词;每个序列可允许有一个以上的来源关键词
stem_loop发卡结构;由RNA或DNA单链的相邻(反向)互补序列之间的碱基一配对形成的双
螺旋区域
STS序列标记位点:表述基因组上作图界标并能通过PCR检测的短的,单拷贝DNA序列;
通过测定STS系列的次序即可作出图谱的基因组区域
TATA_signa
l
TATA盒;Goldberg-Hogness盒;在每个真核生物RNA聚合酶Ⅱ转录单位起点前约
25bp处发现的保守的富含AT的七聚体,它可能涉及使酶定位以正确地起始;共有
序列=TATA(A或T)A(A或T)
terminator或者位于转录本的末端或者与启动子区域相邻的DNA序列,该序列可导致RNA聚合
酶终止转录;也可以是阻抑蛋白的结合位点
transit_pe
ptide
转运肽编码序列;核编码的细胞器蛋白质N-末端结构域的编码序列;此结构域参
与将蛋白质翻译后运送到细胞器中
tRNA成熟的转移RNA,,小的RNA分子(75-85个碱基长),介导核酸序列翻译成氨基
酸序列
unsure作者不能确定此区域的准确序列
V_region免疫球蛋白轻链和重链的可变区,和T-细胞受体α,β和γ链;编码可变的氨基
末端部分;可由V_segment,D_segment,N_region和J_segment组成
V_segment免疫球蛋白轻链和重链的可变区段,和T-细胞受体α,β和γ链;编码大多数可
变区(v_region)和前导肽的最后几个氨基酸
variation含有来自相同基因的稳定突变的相关系列(例如RFLP,多态性等),在此(和可能
其它)位置处所述相同基因与被表述的不同
3’clip在加工过程中被切下的前体转录本3'端大部分区域
3’UTP不被翻译成蛋白质的成熟转录本的3'末端区域(终止密码子之后)
精心整理
5’clip在加工过程中被切下的前体转录本5'端大部分区域
5’UTP不被翻译成蛋白质的成熟转录本的5'末端区域(起始密码子之前)
_10_signalPribnow盒;细菌转录单位起点上游约10bp处的保守区域,它可能参与结合RNA聚
合酶;共有序列=TatAaT
_35_signal细菌转录单位起点上游约35bp处的保守六聚体;共有序列=TTGACa[]或TGTTGACA[]
与蛋白质序列相关的特征关键词表
关键词说明
CONFLICT不同的论文报道了不同的序列
VARIANT作者报道存在序列变体
VARSLIC由可选择的剪接产生的序列变体的表述
MUTAGEN经实验操作已改变的位点
MOD_RES残基的翻译后修饰
ACETYLATIONN-末端或其它
AMIDATION通常位于成熟的活性肽的C-末端
BLOCKED不能被测定的N-或C-末端封闭基团
FORMYLATIONN-末端甲硫氨酸的
GAMMA-CARBOXY-
GLUTAMICACID
HYDROXYLATION
天冬酰胺,天冬氨酸,脯氨酸或赖氨酸的
METHYLATION通常为赖氨酸或精氨酸的
PHOSPHORYLATION丝氨酸,苏氨酸,酪氨酸,天冬氨酸或组氨酸的
PYRROLIDONE
CARBOXYLICACID
已形成内部环内酰胺的N-末端谷氨酸
SULFATATION通常为酪氨酸的
LIPID脂质组成成分的共价结合
MYRISTATE
通过酰胺键与蛋白质成熟形式的N-末端甘氨酸残基或内部的赖氨酸
残基结合的豆蔻酸基团
PALMITATE
通过硫酯键与半胱氨酸残基或通过酯键与丝氨酸或苏氨酸残基结合
的棕榈酸基团
FARNESYL通过硫酯键与半胱氨酸残基结合的法尼基
GERANYL-GERANYL通过硫酯键与半胱氨酸残基结合的香叶基-香叶基基团
GPI_ANCHOR
与蛋白质成熟形式C-末端残基的α-羧基相连的糖基-磷脂酰肌
醇(GPI)基团
N_ACYL
DIGLYCERIDE
原核生物脂蛋白成熟形式的N-末端半胱氨酸,所述脂蛋白具有酰胺
-键联的脂肪酸和通过酯键连接了两个脂肪酸的甘油基
DISULFID
二硫键;“FROM”和“TO”终点表示通过一个链-内二硫键连接的两
个残基;如果“FROM”和“TO”终点是完全相同的,则二硫键是链-
间键,而说明书领域示出交联的性质
THIOLEST硫醇酯键;“FROM”和“TO”终点表示通过硫醇酯键连接的两个残基
精心整理
THIOETH硫醚键;“FROM”和“TO”终点表示通过硫醚键连接的两个残基
CARBOHYD糖基化位点;碳水化物(如果已知)的性质在说明书领域给出
METAL金属离子的结合位点;说明书领域示出金属的性质
BINDING
任何化学基团(辅酶,辅基,等等)的结合位点;基团的化学性质在
说明书领域给出
SIGNAL信号序列的范围(前肽)
TRANSIT运转肽的范围(线粒体,叶绿体或微体)
PROPEP前肽的范围
CHAIN成熟蛋白质中多肽链的范围
PEPTIDE被释放的活性肽的范围
DOMAIN序列中感兴趣的区域的范围;所述区域的特征在说明书领域给出
CA_BIND钙-结合区域的范围
DNA_BINDDNA--结合区域的范围
NP_BIND核苷酸磷酸酯结合区域;核苷酸磷酸酯的特征示于说明书领域
TRANSMEM转膜区域的范围
ZN_FING锌指区域的范围
SIMILAR
与另一个蛋白质序列具有相似性的区域;与那个序列有关的精确的资
料在说明书领域给出
REPEAT内部序列重复的范围
HELIX二级结构;螺旋,例如α-螺旋,3(10)螺旋,或Pi-螺旋
STRAND
二级结构;β-链,例如氢键连接的β-链,或分离的β-桥中的残
基
TURN
二级结构转角,例如H-键连的转角(3-转角,4-转角或5-转
角)
ACT_SITE涉及酶活性的氨基酸
SITE序列中任何其它感兴趣的位点
INIT_MET已知序列以起始密码子甲硫氨酸开始
NON_TER
序列末端的残基不是末端残基;如果应用于位置1,这表示第一个位
置不是完整分子的N-末端;如果应用于最后一个位置,这表示此位
置不是完整分子的C-末端;对此关键词没有说明书领域
NON_CONS
非连串残基;表示序列中的两个残基不是连串的,在它们之间有很多
末测序的残基
UNSURE序列的不确定性;用于表述不能确定序列排列的序列区域