另外一个通讯作者张戈教授说,目前疾病研究及新药开发中遇到的一个关键问题是如何确定治疗靶基因,这是药物创新的根本。但是,由于基因之间的关系异常复杂,导致在研究关键基因过程中往往顾此失彼。目前基于高通量数据的生物信息方法,固然能找到基因之间的关联关系,但通常失于准确,很难被验证,导致临床研究工作无法及时吸收与利用。相比于现有的算法,LogicTRN的长处是更加准确,而且能够定量分析,这就为临床研究人员提供一个有效的分析工具,帮助他们快速寻找复杂疾病如癌症中的关键调控路径及治疗靶基因。
论文的第一作者晏斌博士介绍说,传统上基因网络理论及算法主要着眼于建立调控因子与目标基因之间的联系。换句话说,其核心问题是如何确定一个调控因子的目标基因,或者如何确定一个目标基因的调控因子,然后将这种调控关系连接起来即可得到基因调控网络。这些算法往往基于一个共同的假设,即一个目标基因的表达是其多个调控因子的调控效果的线性叠加结果。因此,转录因子与目标基因之间的关系可以表达成一组线性方程,继而通过矩阵分解来确定。但实际上,多个转录因子在调控其共同目标基因过程中呈现出错综复杂的关系。比如,有些转录因子是独立调控其目标基因,这种情况用线性模型来描述还勉强可以。但更多情况下转录因子是通过协同或者竞争关系对目标基因进行调控,这种情况下线性模型往往无法准确描述。而LogicTRN可以确定多转录因子在调控共同基因过程中的互动关系,这特别有利于理解基因表达背后的调控机制,及确定基因表达的关键调控蛋白。
论文的共同第一作者官道刚博士说,相比于现有的基因网络算法,LogicTRN具有比较明显的优势。LogicTRN能够精细地确定基因的关键调控因子及其逻辑,根据合成的调控网络,研究者可以梳理出一个复杂过程的关键调控路径,及该路径中的关键调控因子及关键基因。LogicTRN是一个开放的模型框架,可以同时考虑各个细胞过程,如基因变异,蛋白-DNA结合,miRNA调控,蛋白翻译,及蛋白蛋白相互作用等,对基因转录的调控及影响。随着越来越多的生物过程中的数据採集和积累,基于LogicTRN的数据分析将可增进人类对细胞中各种分子活动的认知。LogicTRN的算法及软件包可从以下网址下载: http://staffweb.hkbu.edu.hk/hlzhu/ 2017LogicTRN_codes.html。
|