miRNA的作用方式
最早被发现的两个miRNAs——lin-4 and let-7被认为是通过不完全互补结合到目标靶mRNA 3’非编码区端,以一种未知方式诱发蛋白质翻译抑制,进而抑制蛋白质合成,阻断mRNA的翻译。多个果蝇miRNAs也被发现和他们的目标靶mRNAs的3’非编码区有部分同源。由于miRNAs和其潜在的目标靶之间并非完全互补,这使得通过信息学的方法鉴定miRNA的目标靶位点变得困难。因而也无法确定miRNAs的作用方式是什么,以何种机制影响mRNA的翻译,以何种方式调控基因表达。miRNAs的作用目标靶和活性机制一直是各地的研究人员的关注热点。
在植物中目前有一个miRNA和3个潜在的目标靶基因完全互补(这些scarecrow 基因编码潜在的转录因子),尽管目前还不清楚这些基因是否就是miRNA的目标靶,这仍是第一次发现miRNA 和其潜在的目标靶完全互补,也提示miRNA可能包含和siRNA类似的作用方式。
识别 miRNAs的方法
多个研究小组采用生物化学结合是生物信息学的方法开展对miRNAs的研究工作。由于据推测都是由Dicer酶降解RNA得到的,21—23个碱基大小、有5’端磷酸基和3’羟基的RNA片断,有的实验室采用改良的定向克隆方法来筛选具有相同特征的小分子——筛选一定大小的RNA分子,连接到3’和5’的适配子(adapters),逆转录并通过PCR扩增、亚克隆并测序。miRNA前体在基因组上的定位和聚类是通过向基因组数据库查询进行。这个方法有助于判断miRNAs是否是mRNAs、tRNAs、rRNAs等分子的降解产物。
有的实验室通过一种RNA folding program ’mfold’ 来判断C. elegans 和C. briggsae 之间的高度保守区域是否含有潜在的miRNA前体,然后用Northern Blots的方法来确定这些miRNAs是否真的表达了。
尽管有数百个miRNAs通过生化或者是生物信息学的方法被鉴别出来,已经鉴别出来的miRNAs只不过是沧海一粟,由于很多已经鉴别出来的miRNAs是从单个克隆中鉴别出来的,所以可以假设还有很多miRNAs在分离和鉴定过程中被“漏掉”了,测序工作还远远不够。
1) miRNA的计算机RNA组学方法
生物信息学方法是依据在不同的物种中,其成熟的miRNA 具有较大的序列同源性以及前体的茎环结构具有相当大的保守性这一特征在基因组数据库中搜索新的miRNA 基因。该方法根据比较基因组学原理并结合生物信息软件在已测序基因组中进行搜索比对,根据同源性的高低再进行RNA二级结构预测,将符合条件的候选miRNA与已经通过实验鉴定的miRNA分子进行比较分析,最终确定该物种miRNA的分布及数量。近年来随着miRNA预测方法的不断发展,人们发现的miRNA数量呈几何级数增长。这些预测方法从简单的序列比对搜索发展到现在的机器学习算法,程序设计越来越智能化,复杂化。
随着人miRNA基因转录出的pri-miRNA迅速加工成具有茎环结构的pre-miRNA,随后被切割成miRNA:miRNA*双体,并被选择性地组合进核糖核酸沉默诱导复合体(RISC)并进行靶基因识别。在相似的物种中,miRNA是很保守的;但在相距较远的物种间,miRNA又有一定的分歧,尤其体现在pre-miRNA上。这些miRNA功能作用机制的阐明为预测软件的研发提供了理论依据,但仍需要不断修补和完善。近年来,几个基于这些规则的miRNA预测程序先后被开发(表1.1),并被广泛使用。
程序名 |
发布于 |
预测目标 |
适用方式 |
算法 |
输入序列格式 |
适用长度 |
涉及的程序 |
适用于 |
miRscan |
2003 |
Pre-miRNA |
Web |
N |
两物种比对序列 |
<100bp |
Blast |
线虫 |
miRseeker |
2003 |
Pre-miRNA |
Local |
N |
— |
— |
Mfold、AVID、Blast |
果蝇 |
ERPIN |
2001 |
Pre-miRNA |
Local/Web |
— |
Fasta序列、Fasta文件 |
— |
Blast |
动植物 |
Srnaloop |
2003 |
Pre-miRNA |
Local |
N |
Fasta序列 |
— |
RepeatMasker、Blast、RNAfold |
线虫 |
MIRFINDER |
2004 |
Pre-miRNA |
Local |
SVM |
两物种比对序列 |
— |
RNAfold、RepeatMasker、PatScan、RNAVIZ |
植物 |
PalGrade |
2005 |
Pre-miRNA |
Local |
SVM |
基因组序列 |
— |
RNAfold |
人 |
MiRAlign |
2005 |
Pre-miRNA |
Web |
N |
Fasta序列 |
50-300bp |
RNAfold、ClustalW、RNAforester |
动植物 |
microHARVESTER |
2005 |
Pre-miRNA & miRNA |
Web |
N |
pre-miRNA、miRNA |
<450bp |
RNAfold、Blast、T-Coffee |
植物 |
findMiRNA |
2005 |
Pre-miRNA & miRNA |
Local |
N |
Fasta序列 |
— |
RNAfold、Blast、mfold |
拟南芥 |
miR-abela |
2005 |
Pre-miRNA |
Web |
SVM |
Fasta序列、Fasta文件 |
<1000bp |
RNAfold、SVMlight |
动物 |
BayesMiRNAfind |
2006 |
Pre-miRNA & miRNA |
Web |
NBS |
Fasta序列 |
<500Kbp |
Mfold、BLAT |
动物 |
ProMiRⅡ |
2006 |
Pre-miRNA & miRNA |
Local/Web |
HMM |
序列(只包含A、G和C,T或U) |
70-150bp |
RNAfold、Blast、pipeline vist、HMmiRNApairwise |
动物 |
Vmir |
2006 |
Pre-miRNA |
Local |
— |
基因组序列 |
<2Mbp |
RNAfold、mFold |
病毒 |
RNAz+RNAmicro |
2006 |
Pre-miRNA |
Local |
SVM |
多物种比对序列 |
<400bp |
RNAz、libSVM |
动物 |
Microprocessor SVM |
2006 |
Drosha剪切位点 |
Local/Web |
SVM |
Fasta序列 |
<180bp |
RNAfold、ScorePin、 Gist SVM |
动物 |