数学指出基因活动的映射速度快100倍

2019-01-23来源: 阅读量:133
0

加州大学旧金山分校的科学家们进行的新研究可以加快10到100倍的速度 - 从基因研究到如何从干细胞构建新组织到通过以下方式检测癌症或自身免疫疾病的临床努力。在一小滴血液中分析单个细胞。该研究于2016年4月27日在线发表在Cell Systems杂志上,严格证明了如何在不使用昂贵且耗时的深度测序技术的情况下,提取有关单个细胞中基因表达模式的高质量信息。该论文的高级作者是加州大学旧金山分校生物化学和生物物理学副教授Hana El-Samad博士,以及加州大学旧金山分校系统与合成生物学中心的教授Matt Thomson博士。“我们相信其影响是巨大的,因为测序深度和吞吐量或成本之间的基本权衡,”El-Samad说。“例如,突然间,人们可以想到在单细胞水平上分析整个肿瘤。”

数学指出基因活动的映射速度快100倍

研究汇集了几个学科

该研究源于共同作者之间的合作,Graham Heimberg是Thomson实验室博士生,拥有生物信息学背景,Rajat Bhatnagar博士是El-Samad实验室的博士后研究员,具有应用数学和电气学背景。工程。他们的综合专业知识使他们能够应用工程见解,了解如何从噪声信号中提取关键信息,以及如何更有效地分析大规模基因活动数据集的紧迫生物学问题。

Heimberg和Bhatnagar有一个基本的见解:因为细胞中的每个基因通常是一个或多个更大的基因程序的一部分 - 数十个或数百个相关基因的组合经常被一起激活 - 基因活动的完整读数可以通过深度实现排序充满了冗余信息。他们推断,对于基因测序的许多现代应用而言,他们更关心基因活动的模式而不是个体基因,可以从分辨率低得多的数据中提取相同的结果。

把它想象成一个城市的模糊照片。您可以选择个别建筑物并决定您是在寻找旧金山,纽约还是巴黎,但如果您想要计算建筑物中的窗户或街道上的汽车数量,那么您将失去运气。

“我们根本不会说高深度测序是无用的,”汤姆森说。“远非如此。深度测序是获取有关个体基因和基因突变的特定分子水平信息的神奇工具。我们只是指出,通过正确的分析,浅层测序可以更快,更便宜地提取细胞 - 水平基因表达信息。“为了证明他们的观点,研究人员分析了数百种来自酵母,小鼠和人类的公开可用的基因表达数据库。他们表明,对于常见的应用,如检测细胞来自何种组织或通过其基因活性的特征模式挑选出不同类型的神经元,正确的数学分析可以从10到10万个测序读数中提取必要的信息,而不是数以百万计的读数构成深度测序。

研究人员进一步推出了一个理论框架,该框架能够准确地证明测序需要多深才能获得特定细胞或组织基因活性的特定细节水平。他们说,基本结论是,数据集中给定基因程序的“优势” - 即基因组解释的数据集传播的数量 - 决定了提取它所需的序列深度。换句话说,大功能很容易挑选,但细节需要更高的分辨率。

低分辨率测序可以加速癌症检测

新论文的结果是,对于基因表达的重要特征可能是最重要的众多基因组应用,可以使测序管道的流速快几十到几百倍。这可能包括在个体细胞成为癌症的过程中筛查血液,确定控制干细胞生长的遗传途径,或构建构建人体的基因表达程序的图谱。

这是至关重要的,Thomson和El-Samad说,因为特别是对于依赖于对来自单个细胞的 DNA测序的越来越重要的技术(例如上面的癌症液体活组织检查实例),测序本身现在是一个主要的瓶颈。

例如,加州大学旧金山分校的高级技术中心(CAT)目前有一台机器可以在一天的工作中准备50,000个细胞进行测序,但即使使用CAT最先进的测序机(一天可以进行5次读取,也可以研究人员需要两周多的时间才能对这些50,000个细胞中DNA活性的完整模式进行深度排序,每个细胞读数为百万次。但是,如果研究人员能够从每个细胞的20,000个读数中提取相关信息,那么他们可以在一天之内对150,000个细胞进行测序。

以这种方式加速管道可能对许多目前被认为过于昂贵或耗时的测序的研究和临床应用具有变革性。

例如,El-Samad说,许多细胞具有非常多余的分子途径,它们似乎都在细胞内做类似的事情,但对不同的药物反应不同。

“如果你想了解不同的药物如何影响这些途径 - 根据定义由许多不同的基因组成 - 在完整测序深度测试每种基因上的每种药物将是一个巨大的浪费时间和金钱,更不用说后勤不可能,“她说。“另一方面,如果你可以通过更低分辨率的测序快速识别哪些途径被激活,这意味着你可以在合理的时间内对你可以测试的药物数量疯狂。”

他说,汤姆森研究干细胞如何分化的工作也是如此。涉及的基因数量很多,但基因通路数量要少得多,因此低分辨率测序使实验室能够快速识别哪种途径以特定方式转化细胞,之后可以进一步实验来阐明哪些基因可以被控制为这些途径的关键驱动因素。

研究人员使用他们论文中推导出的方程来创建一个读取深度计算器,以帮助其他研究人员确定他们特定应用所需的基因活动信息的解决方案,他们在Thomson实验室网站上在线发布。

“我们从所有这些数据集得到的计算结果表明,这种现象对于所有不同类型的遗传数据都是全面的,理论部分解释了为什么会这样,”El-Samad说。“但只要有一个公式就可以了,所以你不必一遍又一遍地处理数据。”

我要评论

所有评论仅代表网友意见,与本站立场无关。


i

习惯用手机看资讯?

扫描进入手机站

一键筛选来浏览

信息更精准


网站首页 | 关于我们 | 联系方式 | 使用协议 | 版权隐私 | 网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报
 
免责声明:本站有部分内容来自互联网,如无意中侵犯了某个媒体 、公司 、企业或个人等的知识产权,请来电或致函告之,本网站将在规定时间内给予删除等相关处理。