多基因风险评分和基因组预测与Stephen Hsu的问答

2019-04-02来源: 阅读量:104
0

GEN:是什么促使您开始进行基因组预测?

STEPHEN HSU:历史悠久。Laurent Tellier是首席执行官,自2010年以来我们彼此认识。我们一直在研究如何使用机器学习来查看大量基因组,然后学习从这些信息中预测表型的背景科学。

多基因风险评分和基因组预测与Stephen Hsu的问答

我们打赌基因分型的成本持续下降,并且它得到了回报,因为现在有数百万种基因型可用于分析。我们一直认为,最好和最早的应用之一就是胚胎选择,因为我们可以帮助家庭拥有一个健康的孩子。

GEN:鉴于您在物理学方面的教育背景,您是如何首先对基因组学感兴趣的?

HSU:自从我还是个孩子以来,我对遗传学和进化学,分子生物学感兴趣。我在70年代和80年代长大,当时已经有很多关注分子生物学革命,重组DNA。我们总是被告知物理学是一门非常成熟的学科,生物学是未来的主题,它最终会随着这些新的分子技术而爆发。

当我上大学并参加分子生物学课程时,我意识到很多深层次的问题 - 比如你如何实际破译基因组并找出哪些遗传密码在表型或复杂特征中有直接影响? - 不应该对那个时代的技术负责。所以我把它放在一边做了理论物理,但在我遇到Laurent的时候才重新感兴趣。我开始意识到基因分型,特别是测序的超指数成本曲线。我意识到,如果这种情况持续了十年左右,我们将能够回答自小时候以来我一直在思考的所有这些有趣的问题。

GEN:你目前在密歇根州做什么样的研究来协助基因组预测?

HSU:我们在学术实验室所做的工作是将AI和机器学习应用于大型基因组数据集。我们这里有一个超大型超级计算集群,以及具有强大计算背景的物理培训人员。我们对学术方面的兴趣是弄清楚哪些基因组正在影响哪些特征以及以何种方式影响。

人类并不够聪明,不能这样做;你真的需要AI去做。我们公布了高度和骨密度等特征的结果 - 这些是数量特征,对于常见疾病的疾病风险预测,从糖尿病到乳腺癌到甲状腺功能减退。

一旦有足够数量的数据 - 该阈值取决于我们正在研究的特定特征的细节 - 算法现在工作得非常好。我们能够构建有趣的预测因子,例如,您可以确定风险评分中人口中最高的百分之几,例如,他们的风险是典型人群患病风险的5倍或10倍。

您验证了不同人群的预测因子,而不是培训人群,并且您发现根据您的预测指标,风险最高百分之几的人患这种疾病的可能性比典型人高5或10倍。这已经进入了临床适用范围,不仅适用于胚胎,也适用于常规卫生系统中的实际成年人。Myriad [遗传学]已经在销售多基因乳腺癌预测因子。

GEN:您如何为不同的疾病产生多基因风险评分?在基因组预测网站上列出的八种疾病中,您的实验室基本上已生成该数据的那些疾病是什么?

HSU:其中许多是由我的研究小组制作的,但目前性能最佳的乳腺癌预测实际上来自一个致力于乳腺癌的大型国际财团......

我们使用人们用于GWAS [全基因组关联研究]的相同数据。例如,我们可能有20万个控制器和20或30,000个50岁和60岁的人,他们的年龄足够大,如果他们有糖尿病(或其他什么),他们就会被诊断出来。该算法知道哪些是病例,哪些是控件,并且每个人还有大约100万个SNP,通常是从Affymetrix或Illumina阵列获得的。

它是一种学习算法,试图调整其内部模型,以便最好地预测某人是某个案例还是控件。这里涉及到许多奇特的数学 - 高维优化。您基本上找到了最能预测数据的模型。

它与GWAS不同,因为GWAS非常简单 - 你看一个特定的基因或SNP,你说是否有统计证据证明这个特定的SNP与你是否患有糖尿病有关?你得到一个是/否答案。如果P值足够大,那么你说我们发现了一个命中。

这个问题在数学上与我们解决的问题非常不同。我们实际上在百万维空间中进行优化,以同时找到应在我们的预测器中激活的所有SNP。这一切都在技术杂草中,但它只是不同的数学......

我们认为通过这种高维优化可以实际预测风险。最初,人们只是觉得我们疯了。我们写了一篇理论论文,预测你需要多少数据来准确预测身高或类似的东西。

我们在五六年前写过那些论文,而GWAS的人并没有真正得到它。但后来我们实际制作了有效的预测因子,人们不得不注意。现在,这些主要的GWAS合作大多数都转向将遗传预测作为主要活动,而不仅是发现与疾病相关的第5,000个SNP,而且实际上看看是否可以将所有5,000个SNP一起用于预测风险。

在过去的一两年里,这些论文出现了巨大的飙升,结果令人印象深刻,很多卫生系统都意识到这一点并意识到这一点,他们可能会在不久之后部署广泛而廉价的产品。基因检测预测成人风险...

动物和植物育种者长期以来都知道这一切。你喝的牛奶来自通过人工授精产生的奶牛......美国农业部维护着一百万头奶牛的数据库,在这个领域[动物饲养]领域的人们进行同样的高维优化。做…

当劳伦特和我和其他人努力为人类遗传学奠定这种工作的基础时,我们总是感到震惊,我可以与一些遗传学家交谈,他们真的不知道牛,鸡或玉米育种世界的人们是什么在做。几年前他们已经有了功能预测因子。

GEN:您的任何方法是专有的还是已获专利的?任何诊所都能跟随你的领导吗?

HSU:在某种程度上,任何人都可以,我们已经发布了所有算法。所有这些方法都可供外部团体使用。对高维优化过程中发生的事情的一些概念性理解对于必须正确地进行分析是有用的。但基本算法和代码都在那里。

GEN:基因组预测是否将PRS测试作为一级测试提供,还是仅针对关注非整倍性和其他罕见单基因疾病的夫妇?

HSU:我们的基本管道使用与今天非整倍性相同的活组织检查,全世界每年大约进行一百万次活检。我们设计了这个过程,以便我们可以准确接受活检,这样任何诊所都不必改变任何操作。

GEN:谁来决定你的小组应该包括哪些疾病和/或特征?

HSU:好问题。对于疾病,它是非常明确的。ASRM(美国生殖医学学会)有一套指南。他们有道德团体和指导方针。基本问题是这些疾病是否会对生命造成严重影响。

如果对可能对您的生活产生重大影响的疾病有可靠,有效的预测因素,我们可能会将其包括在内。你可以说,牛皮癣或湿疹,痤疮怎么样,值得被包括在内?我们还没有遇到它,因为那些不是我们现在关注的“严重”疾病。

远离疾病,我们可以很好地预测化妆品特性,因此我们可以弄清楚谁是金发,红发,蓝眼睛;皮肤较浅,皮肤较黑的人......但即使对它有很高的需求,我们也不打算在基因组预测中做化妆品。非疾病特征,如身高,我想我们只会警告父母,如果孩子有特发性身材矮小的危险,这是一种疾病。

我们遵循疾病模型的一切。我们在报告中提出警告的任何内容都是医学上被归类为疾病的东西。我们只是告知医生或遗传咨询师这种胚胎患某种疾病或正常风险的风险较高。但我们不会超越这一点。

GEN:公司将永远坚持下去吗?

HSU:这是一个棘手的问题,因为显然它是未知领域。对于一家公司来说,有各种各样的驱动因素 - 科学,道德,医疗健康 - 会影响决策,因此我无法准确描述我们将做出的决定。

但我的感觉是公司不应该在社会适应之前走得太远......我们希望在社会上广泛讨论人们认为合适的事情。

ASRM非常清楚他们认为合适的内容。英国有HFEA,一个由政府管理的监管委员会,负责监管IVF中的基因检测,因此每个国家都有不同的监管计划。如果某个国家认为他们对进一步的优势感到满意,那么可能会出现一个棘手的问题 - 例如,化妆品在美国是完全允许的。我们选择不这样做。

在未来,我们可能会有一些巨大的客户,比如韩国的大诊所或者其他什么,他们要求他们想要做化妆品。他们真的想知道谁有较浅色的皮肤,谁有深色皮肤。

对我们来说这将是一个艰难的决定 - 假设我们这个庞大的客户每年要从我们这里订购100,000个测试,他们真的想要这个功能,我们可以做到,这在韩国是100%合法的。我们会做什么?我不会预先判断我们将要做什么,但如果它们在该社会中不被广泛接受并且显然是合法的,我们肯定不会做。

GEN:你在新泽西州的实验室有CLIA认证,但有没有监管机构阻止你提供智力或其他特征的增强选择?

HSU:目前在美国,我认为它是不受管制的。有ASRM指南但它们只是指导方针,它不是政府机构。从这个意义上讲,美国可能不如大多数其他国家受到监管。

GEN:即使对于像1型糖尿病(T1D)这样的常见疾病,有些人也会认为多基因风险评分不足以单独使用 - 对于人口研究而言并不适用于一个人。你会怎么回应?

HSU:这是统计学中的一个基本问题。你可能会说去年你有三张超速罚单的事实并不意味着你今年发生事故的风险更高。当然,我们只能在人口层面得出结论。保险精算师实际上得出的结论是,去年的三张超速罚单确实意味着他们应该向你收取10%以上的保单。

这是人口水平分析。但是当他们发布政策并且他们向你收取10%的费用时,他们就会做出个人决定。这种跳跃始终是如此。这就是统计数据的用途。

同样地,如果我为你开了某种抗癌药物并且我说,“我只有人口水平的数据表明这种突变的人用药物A比B更好;因此,我给你药物A.“有人可以说,”嘿,那太疯狂了,伙计。您根据人口水平数据为个体患者做出个人决策。这太疯狂了。“我只是认为这是对统计数据的误解。

您应该注意的是统计证据的强度。换句话说,如果我可以采用T1D预测器并进入与训练人群完全不同的人群 - 也许他们出生在不同的几十年或不同大陆的不同部分 - 但我发现在第二个非常相似的预测能力人口与训练人口一样,这是事实确实有效的证据......

再举一个例子,目前最好的乳腺癌预测因子是多基因评分,使用500到1,000个SNP。在该预测因子中获得前10%的女性患乳腺癌的概率为33%。如果您的风险评分在前5%,那么您有超过50%的终生患乳腺癌风险。

现在,你可以说,“等等,这是人口数据。你在哪里得到50%的数字?“好吧,我看了一群没有参加训练集的女性,我只看了那些风险得分最高的5%,然后我算了一下,是的,一半其中三分之二的人在他们的生命结束时实际上患有乳腺癌。这就是我得到概率估计的方法。

GEN:在基因组预测筛选的条件列表中,认知能力较低。如何使用PRS预测低认知能力?

HSU:自然遗传学杂志发表了一篇涉及110万人的大型GWAS。这是一个有趣的统计结果:当你测试他们的预测器,或者他们的预测器的稍微改进版本时,预测智商与人的实际智商之间的相关性约为0.3到0.4。它在数学上非常类似于SAT预测大学表现的能力。

这并不完美,但同样的方式是[大学]院长必须让他的手臂扭曲,以承认一个孩子的SAT成绩低于平均水平进入工程学院,就像我们父母可能应得警告一样发现一个胚胎具有超高的智力残疾风险......智力残疾是一种明确的医疗条件,它与低智商得分有关。

GEN:你有什么场景可以筛选出高IQ分数吗?

HSU:我们觉得社会还没有做好准备。我错了。新加坡政府可能会来找我们说:“我们希望你在新加坡开展业务,如果他们的一个胚胎可能远远高于平均水平,我们希望提醒父母。我们甚至进行了民意调查,如果他们使用IVF,86%的新加坡人会这样做......“

假设他们来到我们这里,他们说:“我们是一个社会,我们已经考虑过这个,我们想要这样做。”你可以想象一个我们说好的情景,我想在新加坡它没关系,但我们不这样做感觉美国人已经准备好了。

这是一个完全假设的。我们不知道它将如何演变。目前,我们不提供它。

GEN:另一个问题是,随着基因筛查在体外受精(IVF)中变得越来越根深蒂固,富人将摆脱疾病,而社会经济地位较低的人则不会。您是否认为疾病将成为更低端疾病的负担?

HSU:是的。我在政治上是一个中心左派,所以我不反对财富或收入或遗传资源的再分配。在以色列和英国,如果您有生育问题,IVF将受到国家医疗保健计划的保护。这些国家对不平等做出了不同于美国人的决定。在那里,我希望有一天基因组预测是这些国家的国家医疗保健系统的许可供应商,我们可以为在以色列和英国接受免费试管婴儿的人们提供这种健康风险筛查。

它不一定会加剧不平等。这取决于国家和这些国家人民对其医疗保健系统的决策。在美国,从短期来看肯定会在某种程度上加剧不平等。我不喜欢这样......但这是一个更广泛的讨论。你正在谈论正在经历体外受精(IVF)的人的这个角落,同时我们在美国有没有健康保险的人。

GEN:谁应该参与这些讨论?

HSU:这是一个非常好的问题。社会上谁应该有发言权,应该如何决定如何部署这项新技术?在拥有单一付款人国家医疗保健系统的国家中流行的一种模式 - 他们现在正在英国这样做 - 是指定一个委员会来审查每个人的标准护理基因分型。

该委员会将听取公众的意见,它将有一群着名的教授和医生,你知道,神职人员,伦理学家,哲学家被任命。在讨论之后,委员会应该向政府提出一些建议,然后系统,NHS(国家卫生系统)首席执行官和卫生部长以及其他人应该决定是否采纳这些建议。我认为这应该是怎么回事。

在美国,我不知道,因为你有私人医疗系统的拼凑。你可以让国会通过一些法律来规范它。但我所描述的系统,即芬兰,英国和其他国家正在进行的系统,对我来说是对这些事情作出理性决定的正确方法。我认为这将在未来几年内发生,既可以用于体外受精相关的事情,也可以更广泛地用于医疗保健中的基因组学。

我要评论

所有评论仅代表网友意见,与本站立场无关。


i

习惯用手机看资讯?

扫描进入手机站

一键筛选来浏览

信息更精准


网站首页 | 关于我们 | 联系方式 | 使用协议 | 版权隐私 | 网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报
 
免责声明:本站有部分内容来自互联网,如无意中侵犯了某个媒体 、公司 、企业或个人等的知识产权,请来电或致函告之,本网站将在规定时间内给予删除等相关处理。