高效、务实、严谨、敬业
服务目录
技术服务
技术专题
联系我们

联系我们

广州赛诚生物科技有限公司
广州市黄埔区学大道揽月路广州企业孵化器B座402
电话:020-85625352
手机:18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141

项目名称:miRNA如何预测其靶基因?

所属分类:生物信息学分析

联系电话:020-85625352

QQ:386244141

Email:servers@gzscbio.com

技术服务描述

miRNA如何预测其靶基因?


  miRNA是一类在生物体内起到重要调控作用的的小片段非编码RNA。一般认为miRNA通过和mRNA的结合,可以抑制mRNA的表达,从而影响到Gene的表达。

  目前miRNA的靶基因预测软件主要是依据miRNA与其靶位点的互补性、miRNA与其靶位点的调控关系、miRNA靶位点的保守性、miRNA-mRNA双链之间的热稳定性及附近序列的二级结构等原则设计的。 目前miRNA预测主要基于算法预测,目前也有一部分以实验结果为收集对象的数据库。使用算法预测的数据库,有如 TargetScanmiRDBRNAhybridDIANA-microT-CDS 等。以实验实验验证的收集的靶标相互作用数据库,有如 miRTarBaseTarbase v8 等。 考虑到研究时效性,我们选择基于miRbase22为基础研究的数据库,在此基础上筛选出近5年内较新的数据库。

  其中, miRDB数据库 是根据 “miRNA通过下调其靶基因的表达” miRNA主要功能特征,采用机器学习来进行模型预测得到的靶标数据库。它通过采用大量RNA数据集,使用 “过表达的miRNA“ 及 “下调的转录本” 进一步量化miRNA靶向下调的特征,采用SVM算法开发了预测模型 MirTarget。 该算法结合实验数据同时比较 TargetScanDIANA-MicroTmiRanda 和 PITA 另外四种预测算法,获得了最优表现。 该模型对于每个候选靶标基因,它都会生成由SVM计算出的概率分数,该分数反映了预测结果的统计置信度,分数越高,置信度越高。所有预测目标的目标预测分数在50到100之间,一般而言,预测得分 > 80 的预测目标具有较高的可信度。如果分数低于60,则需要谨慎选择,一般需要提供其他证据支持。

   TargetScan数据库 则基于序列互补原则,找到比对到靶 3'UTR 的保守性 8 mer、7 mer 或 6 mer 位点(seed match 序列),进一步根据热力学稳定性筛选得到 miRNA 的靶基因。 随后,对于不具备保守性的 seed match 区域计算相应的 context score。 将保守和不保守区域的 context score 进行排序即得到 context score percentile。 一般考虑 context score percentile > 90 为预测的可能具有功能的 miRNA 的靶基因。

  综上,miRDB数据库主要通过miRNA-mRNA调控关系来进行量化计算,而TargetScan通过序列互补原则筛选后再进行热稳定性量化计算,前者相较于后者更有说服力,而后者得到的数据较为全面。我们综合两者,通过标准 miRDB Score >= 80 & TargetScan context score percentile >= 90 的靶基因作为预测结果。通过预测给出的miRNA-靶基因对,用于后续进一步网络图或富集分析。


Venn 图 示例:

 

图 2.7.1. TargetScan vs miRDB 的靶基因交集veen图