5UTR与基因表达的关系
摘要:基因表达调控是生物体生长发育的一个重要环节,而5UTR与基因表达的关系非常密切。5翻译区包含了保守的茎环结构参与转录后协同调控的生物路径。5非翻译区主要参与翻译调节,影响转录后的各个阶段,包括mRNA的稳定,折叠和核糖体的相互作用。
关键词:基因表达调控;5UTR;mRNA稳定性
0引言
细胞是一个高度复杂而又有序的有机体,基因表达调控是生命中最复杂的活动。真核细胞基因表达的调控是多级调控系统,主要发生在4个彼此相对独立的水平上:转录水平的调控(transcriptional-level control),决定某个基因是否会被转录,什么时候转录,并决定转录的频率;加工水平的调控(processing-level control),决定初始的RNA转录产物(hn RNA)如何剪接和加工为成熟的mRNA;翻译水平的调控(transcriptional-level control),决定某种mRNA是否会真正得到翻译,如果能得到翻译,还决定翻译的频率和时间长短;翻译后水平的调控(post transcriptional-level control),在蛋白被翻译后,选择性激活蛋白或使蛋白失活[1、2、
3]。因此基因组上基因的分布方式是非常重要的:每一基因在特定的环境和特定的水平下表达。基因应该彼此分离,它们的表达才不会干扰到相邻基因的调控[4]。基因的5非翻译区在基因的调控中似乎起重要作用[5-7],5UTR对调控中各种功能都做了贡献,包括m RNA的稳定性,折叠,核内运输相互作用,RNA加工,剪切和翻译机器,及细胞内的运输和定位等。
15UTR在真核细胞中对翻译起始的调控作用
基因组中基因的分布是为了允许适当的调控而展开的:高表达的基因往往更短,并有更长的启动子区和终止区。更长的启动子区部分是为了迎合这些基因被与启动子区域结合的转录因子紧密调控的需要;而更长的终止区是为了迎合减少相邻基因转录噪音的需要。5’非翻译区和3非翻译区可能提供了额外的调控层,3非翻译区影响RNA水平,而5非翻译区影响翻译水平。因此,基因组结构在基因表达调控中具有重要作用,并且在形成蛋白质的特点和功能中起重要作用。从真核生物mRNA5’末端的帽子到起始密码子AUG之间的序列称为5非翻译区,即5UTR(图1),它是核糖体识别元件之一[8]。在20世纪九十年代,Chen等成功构建了基于猪水泡病病毒(swine vesicular disease virus,SVDV)的5UTR的双顺反子逆转录病毒载体,并证实SVDV的5UTR具有IRES的顺式作用元件,能够高效介导蛋白表达,并比
较了同一载体在不同细胞内的表达水平;与传统的双基因表达载体比较, 双顺反子逆转录病毒载体的表达更加高效,避免了启动子干扰现象[9]。
图1 各种不同基因组合中“5端非翻译区”定义的示意图
(基因下方箭头表基因方向)
蛋白质生物合成是遗传信息的翻译过程,是基因表达的第二个阶段,整个翻译包括起始、延伸和终止3个阶段。其中起始阶段最为复杂,是调控的关键。在真核生物中,在各种起始因子的参与下,通过蛋白-蛋白和蛋白- RNA的相互作用,使40S核糖体小亚基(预起始复合物)与mRNA相互作用,形成起始复合物,再与60S大亚基相结合。蛋白质合成起始,形成肽键,从而进入延伸阶段。mRNA输出是蛋白翻译的重要步骤,这一过程有许多相关的因子参与,其中5端非编码区(5UTR)具有介导内部翻译起始的功能,也即含有内部核糖体进入位点(IRES)[10]。真核细胞具有IRES结构的5s.b.poloUTR大多具有一些共同的特征,如:序列长度都比不含IRES的5UTR要长、GC含量相对较高、通常有多个AUG位点、都有折叠成高度稳定的高级结构的趋势等。但并非所有比较长的、GC含量比较高的5UTR都会形成IRES或者依赖IRES模式来调控翻译的起始过程[11]。
总之,真核细胞主要通过高度结构化的5端非翻译区(5untranslated region,5UTR)实现mRNA翻译起始的调控,有3种主要途径:1)通过本身高度复杂的二级结构在空间上阻碍翻译起始;2)通过上游元件来抑制翻译起始;3)通过内部核糖体进入位点(IRES)元件的“非帽依赖”(cap-independent)起始途径来抑制翻泽起始[12,13]。
25UTR与mRNA稳定性
核糖体是细胞内蛋白质合成的场所,它对细胞生长、组织分化和发育都有十分重要的作用[14]。基因表达最终是通过核糖体将遗传信息表达出来,所以核糖体在整个生物体的基因表达中扮演重要的角[15]。核糖体是细胞内的大核糖核蛋白颗粒,是细胞内合成蛋白质的场所,以mRNA为模板,以tRNA携带的氨基酸为底物来合成蛋白质[16、17]。基因表达的转录后水平调控是以mRNA为中心的,因此,mRNA的结构及其稳定性对基因表达的转录调控的影响性很大。mRNA结构及mRNA稳定性与肿瘤发生发展也有一定的联系,对于癌基因,人们可以通过去除其mRNA结构中稳定信号,增加不稳定信号,使其稳定性降低,使mRNA迅速降解,从而达到抑制肿瘤生长或阻断肿瘤生成的目的。
5UTR可以影响mRNA半衰期,由此间接调控mRNA稳定性。因此,可以通过改变mRNA的5
UTR序列,影响mRNA半衰期,进而改变mRNA翻译效率。真核生物的mRNA还具有一个特殊的结构,即5帽子结构,5帽子是真核核糖体识别mRNA的结构信号。有研究报道,帽子结构的类似物(如m7GMP和 m7GDP等)会强烈抑制带帽mRNA的翻译。另外,有研究发现,在5UTR中引入一个抑制翻译的茎-环结构,这样可以改变mRNA半衰期。而且mRNA 5UTR的长度可以通过一种翻译非依赖性的方式来影响mRNA的半衰期。此外,mRNA5UTR也可能通过与某个结合蛋白相互作用来影响mRNA半衰期,进而调控mRNA稳定性[18]。
35UTR的长度与基因类别
在不同的生物和不同的基因中,5UTR的长度和碱基顺序变化很大,甚至同一基因通过不同的转录起始也有不同长度的 5UTR,它和5帽子(真核mRNA具有5帽子结构,mRNA在其 5 端通过5-5三磷酸二酯键连有N一7甲基鸟苷酸。它可能是在转录早期或转录终止前经加工而形成的。不同真核生物 的mRNA具有不同的帽子,同一种生物的mRNA也常具有不同的帽子。)均参与翻译起始并影响起始效率。近年来的研究还发现,不同的5UTR及其所含元件在不同来源的组织、细胞中表现出很大的差异,即特定的5UTR只有在特定的组织或细胞中
才能发挥最优的调控效率[19,20]。有研究显示,与信号转导路径相关的基因如与氨基酸磷酸化或信号转导相关的基因,以及与细胞壁蛋白有关的基因往往有较长的5UTR。长的5UTR在过去与翻译调节相联系:折叠的5UTR可以帮助调节接近核糖体[21,22] 。
通过观察与蛋白合成相关的基因,我们将酵母内与翻译相关的基因分为三类:1)与核糖体生物合成相关的基因,如RPS19A参与小核糖体亚基的生物合成与组装;2)与翻译效率相关的基因,如RPP1A和RPLA1参与核糖体和翻译延伸因子的相互作用;3)影响翻译精确性的基因,如RPS23A与40S亚基上的核糖蛋白28(rp28)一起影响翻译精确性[23]。据有些翻译基因可能不参与任何过程[24],有些翻译基因参与其中一个过程[25,26],有些翻译基因参与多个过程[27]。
45UTR二级结构对翻译起始的调控作用
除了5UTR的长度影响翻译起始外,它的二级结构对翻译起始也有影响。二级结构较多的5UTR有碍于核糖体的结合且不利于翻译起始,由于5UTR二级结构阻止核糖体40S亚基的迁移,对翻译起始有顺式抑制作用,而作用的强弱则取决于发夹结构的稳定性及其在5UTR中的位置。参与翻译起始的帽子结合蛋白能识别帽子结构并使5UTR二级结构解链以促进 m
RNA与40S亚基结合。有研究表明,苜蓿花叶病毒(AMV)RNA436个碱基的5UTR有提高外源基因翻译活性的功能。实验推测可能因为这种5UTR不能形成特定的二级结构,无需翻译起始因子消除二级结构而提高了翻译效率。5UTR二级结构对翻译起始既可表现出负调控效应,又可表现出正调控效应。当5UTR的序列中存在着碱基配对时,就可形成发卡式或茎环状二级结构。这类结构会阻止核糖体小亚基的迁移,对翻译起始具有顺式阻抑作用。其抑制作用的强弱取决于发卡结构的稳定性及其在5UTR中的位置。一般来说,碱基配对区愈长或G+C含量愈高,发卡结构就愈稳定。[28-31]
55UTR与无义密码介导的mRNA降解(NMD)
在真核细胞的基因表达中,转录生成的mRNA通过核膜运输到细胞质中,在细胞质中进行翻译生成蛋白质。通过以mRNA降解的方式对异常的mRNA进行及时清除,以此控制基因表达的程度和蛋白质的生成,由此保证基因的正确表达和细胞正常的生命活动。在前体mRNA的加工过程中,会有从细胞核中逃逸出来的未经剪接仍含有内含子的mRNA,这些都是在细胞中产生的异常mRNA,而这些异常mRNA可能会产生异常的蛋白质,这种蛋白质不但不具有正常蛋白质的功能,而且可能会干扰正常蛋白质的功能,从而影响细胞的正常生理活动,使
细胞的功能与表型发生改变。因此可以通过无义密码介导的mRNA降解(nonsense-mediated mRNA decay,NMD)路径来及时发现与清除细胞中产生的这些异常mRNA。也就是说NMD路径清除了细胞中的异常mRNA,确保了基因的正常表达,并有效地维持了细胞正常的生命活动。
相邻基因的转录方向不一定相同:如图1(1)同一转录方向的基因,图1(2)不同转录方向的基因,图1(3)融合基因。5UTR的位置与基因的转录方向有关,而5UTR的长度与开放阅读框的长度有关。基因越长要求越长的调控区域。基因被更多的转录因子调节,而且它们的mRNA趋向于结合更多的调控蛋白,这些特征要求更长的启动子和5UTR。开放阅读框是通过一系列潜在的转录后机制影响基因表达的水平。这些转录后机制包括NMD路径。据此推测5UTR与NMD路径有一定的关系。
6结束语
综上所述,真核生物基因的结构主要包括编码区、非编码区和一些调控元件。而它的表达调控的活动范围很广,通常包括以下几条途径:DNA水平的调控,转录水平的调控,转录后水平的调控,翻译水平的调控和翻译后水平的调控。在转录和翻译水平上,真核生物可以通过
启动子,内含子以及非翻译区域(UTR)来影响基因的表达调控。在启动子上的一些结构,如TATA box,CAAT框等区域的改变可以影响转录的效率。在翻译表达的过程中,各种不同的非翻译区域也可以影响基因的表达调控。在基因上的非翻译区主要包括5UTR和3UTR,它们通过一些调控因子的结合来对基因的表达进行调控。mRNA分子的5UTR通过其长度和碱基顺序以及二级结构等来参与表达调控。5非翻译区包含了保守的茎环结构参与转录后协同调控的生物路径。5非翻译区主要参与翻译调节,影响转录后的各个阶段,包括mRNA的稳定,折叠和核糖体的相互作用。
参考文献:
[1]    Li X,Rosenfeld M G. Transcription: origins of licensing control[J]. Nature,2004 Feb 19,427(6 976):687-688.
[2]    Bonetta L. Gene expression: an expression of interest[J].Nature,2006 Apr 27,440(7 088):1 233-1 237