高效、务实、严谨、敬业
技术服务
技术专题
联系我们

联系我们

广州赛诚生物科技有限公司
广州市天河区黄埔大道中124号2705室
电话:020-29031124
手机:18102256923
Email:servers@gzscbio.com
Fax:020-85625352
QQ:2913120624
GO(Gene Ontology)功能注释

随着新一代测序技术的不断发展,越来越多物种的基因组和转录组获得了高通量测序,给人们带来了海量的核酸序列数据,如何对海量序列中隐含的生物信息进行高通量的解读是研究者要面对的问题。序列信息解读的一个核心内容是对基因进行功能注释,具体操作上就涉及到一个概念:基因的本体论(Gene Ontology,GO)注释。大多数基因在不同生物中的同源基因拥有相同的主要生物学功能,因此,在某些物种里已知的基因功能信息可以用来解释其他物种对应的同源基因。但是这些已知的功能信息包含在先前积累的浩瀚文献之中,不同的文献会用不同的词汇来描述同一生物学功能,这为功能检索和注释带来诸多不便。

  而GO项目就是建立一套特定的词汇集合来描述生物学功能,以此对基因功能注释统一化。用于描述生物学功能的词汇必然要反映生物学功能的本质,此即本体论(Ontology)的由来。

  GO项目对基因功能进行了一致性描述,开发了可控制的词汇表,且无物种特异性。目前已经建立了三大独立的本体论词汇表:生物过程(biologicalprocess)、细胞组分(cellular component)和分子功能(molecular function)。这三大本体论词条下面又可以独立出不同的亚层次,以“有向非循环图(directed acyclicgraphs)”的方式层层向下,将每一个本体论词条串联起来形成树状结构。将GO词条分配给基因序列的行为即GO注释。目前,GO注释已经成为高通量测序序列的主要注释方法。

一个基因编码的蛋白质可以在多种水平上被赋予本体论定义,GO注释的原理就是通过计算机程序建立基因产物与用于定义它们的本体论词条之间的联系。自从1998年基因本体论项目(GeneOntology Project)创立以来,已经有多款GO 注释软件发表,实现了基因产物的标准化注释。

GO注释是对基因产物功能研究的重要手段,随着海量的基因组或转录组数据的涌现,对GO注释的通量要求也越来越高。值得一提的是,目前所有的生物信息学注释软件均不能保证完全正确。但是,我们可以通过其他互补的方法提高注释的准确度,如将序列平行地同SwissprotNr或者CDDconserved domain database)等数据库进行比对,若均有搜索到相似序列,那么这些序列的比对分值也势必较高,注释结果也越准确;或者可以采用PSIBLASTposition-specific iterated BLAST),此程序灵敏度高于BLASTP程序,对于发现远源相似蛋白或者某个蛋白家族的新成员非常有效。

目录浏览