所有分类
卡内基梅隆大学的计算生物学家开发了一种更精确的计算方法,用于重建细胞中RNA产物的全长核苷酸序列,称为转录物,将信息从基因转化为蛋白质或其他基因产物。他们的软件称为Scallop,将帮助科学家建立更完整的RNA转录本库,从而帮助科学家更好地理解基因表达的调控。
计算生物学副教授卡尔·金斯福德和计算机科学学院计算生物学系里的研究员杨明福的Scallop报告今天由Nature Biotechnology杂志在线发表。
扇贝是一种所谓的转录组装体,它采用高通量RNA测序技术(RNA-seq)产生的称为读取的RNA序列片段,并将它们重新组合在一起,如拼图碎片,以重建完整的RNA成绩单。
“有许多现有的装配工,”邵说,“但这些现有方法仍然不够准确。”
与两个领先的汇编程序StringTie和TransComb相比,Scallop对于由多个外显子组成的转录本的准确率为34.5%和36.3% - 编码部分基因产物的基因的亚基。
与其他基于参考的汇编程序一样,Scallop首先构建一个图形来组织映射到基因DNA上相应位置的读取。然而,存在许多用于将读取连接在一起的替代路径,因此容易产生错误。扇贝通过使用新算法充分利用跨越多个外显子的读取信息来引导它到正确的装配路径,从而提高了它的几率。
Scallop在组装不太丰富的RNA转录本时证明特别擅长,将StringTie和TransComb的准确度提高了67.5%和52.3%。
研究人员已经在GitHub存储库中发布了Scallop作为开放软件。
“我们已经有超过100次下载,根据我们收到的反馈,人们真正使用它,”Shao说。“我们现在预计会有更多用户将我们的论文用完。”
我要评论