图片来源:Darren Hopes

 

在正常人的基因里潜伏着约54个看上去好像应该会令其携带者生病或死亡的突变。不过,它们并没有。Sonia Vallabh希望,D178N是这样一个突变。

2010年,Vallabh看着她的母亲死于一种被称为致死性家族失眠症的神秘疾病。患上该疾病后,错误折叠的朊病毒蛋白会集中在一起并摧毁大脑。次年,Vallabh被检查出携带朊蛋白基因PRNP的一个拷贝,而该拷贝拥有和可能引发其母亲所患疾病的D178N突变相同的基因“故障”。这是名副其实的死刑判决:平均发病年龄为50岁,并且病情恶化得非常快。然而,这并非当时仅有26岁的Vallabh不用抗争便会乖乖就范的判决。为此,她和丈夫Eric Minikel分别放弃了在法律和交通咨询领域的事业,并成为生物学专业的研究生。他们的目标是了解关于致死性家族失眠症的一切事情以及可能采取何种措施阻止它。最重要的一项任务是弄清楚D178N突变是否明确引发了该疾病。

在若干年前,很少有人会提出这样一个问题。不过,近年来,医学遗传学经历了一些“自我反省”。自本世纪开始以来,基因组研究的快速发展使相关文献充满了上千个同疾病和残疾相关的基因突变。虽然很多此类关联证据确凿,但研究表明,大量曾被认为危险甚至致命的突变是无害的。多亏了迄今开展的最大规模遗传学研究之一 ——“外显子组聚合数据库”(ExAC),这些“披着狼皮的羊”的面具正在被揭开。

ExAC是一个简单的概念。它将来自6万余人的基因组蛋白编码区,即外显子组的序列整合进一个数据库,使科学家得以比较它们并了解它们的变异程度。不过,该资源库正在对生物医学研究产生巨大影响。除了帮助科学家剔除各种假的疾病—基因关联,它还在产生新的发现。通过更加仔细地探究不同人群的突变频率,研究人员进一步了解了很多基因所做的事情以及它们的蛋白产品如何发挥作用。

 

在挫败中诞生

ExAC在挫败中诞生。2012年,遗传学家Daniel MacArthur开始在位于波士顿的马萨诸塞州总医院(MGH)建立自己的实验室。他想发现导致罕见肌肉疾病的基因突变,并且需要两样东西:此类疾病患者的基因组序列以及未患有这些疾病的人们的基因组序列。如果和健康的对照组相比,一个突变在患有某种疾病的人群中更加常见,那么便有理由认为,该突变是一个可能的病因。

问题在于,MacArthur无法找到来自未患病人群的足够序列。他需要很多外显子组。与此同时,尽管研究人员对外显子组进行了大批量测序,但现有数据集还是不够庞大。没有人将足够多的数据集整合成一个标准化的资源库。

为此,MacArthur开始让同事与其共享他们的数据。他很适合这项任务:很早便开始使用社交媒体,生动有趣的博客文章和尖刻的推特简讯则使其享有对年轻科学家来说不同寻常的受欢迎程度和权威性。MacArthur还在基因组测序的“重镇”——马萨诸塞州剑桥布罗德研究所任职。他说服研究人员与其共享来自上万个外显子组的数据,而大多数人都或多或少地同布罗德研究所存在关联。

剩下的全部工作是分析数据,但这并不是一项简单的任务。尽管基因已被测序,但原始数据是利用各种软件进行分析的,包括一些过时的软件。如果一个集合中有人表现出罕见突变,它可能是真的,或者可能是各种程序在判断所含碱基是A、C、T还是G时因识别方式不同而导致的人工产物。MacArthur需要对这个庞大的数据集进行标准化。虽然布罗德研究所开发出基因组识别软件,但其无法应对ExAC包含的海量数据。为此,MacArthur团队同该研究所程序员密切合作,对软件进行了测试并且扩展了它的能力。“那是异常恐怖的18个月。” MacArthur回忆说,“我们遇到了能想得到的每个障碍,并且经常一筹莫展。”

 

重塑对遗传危险的理解

当这一切正在进行时,2013年4月,Vallabh正在学习如何利用MGH的干细胞,而Minikel在研究生物信息学。Minikel在吃午饭时遇到了MacArthur,并且解释了他和Vallabh关于D178N是否在健康人群中存在的好奇心。Minikel承认自己有点被MacArthur的名气吸引。“我在想,如果能让他花半个小时思考我的问题,这或许将成为我整个月里最重要的事情。” Minikel夫妻上楼,来到MacArthur的实验室。在这里,生物信息学家Monkol Lek搜索了迄今被分析过的ExAC数据——约2万个外显子组。他们并未发现Vallabh的突变。这不是个好消息,但对进一步探究这些数据持有乐观态度的Minikel加入了MacArthur的实验室。

2014年6月,MacArthur团队及其合作者拥有了来自60706人的外显子组数据集。这些人代表了各个族群,并且符合特定的健康门槛。当年10月,该团队在于加州圣地亚哥举行的美国人类遗传学协会年会上发布了ExAC。很快,研究人员和内科医生意识到,这些数据能帮助他们重塑对遗传危险的理解。

很多疾病关联研究,尤其是近年来的研究,将突变认定为具有致病性。这仅仅是因为对患有某种疾病的人群进行分析的科学家发现了看上去像是罪魁祸首的突变,但并未在健康人群中发现它们。不过,还有可能研究人员没有认真寻找,或者未对合适的人群进行分析。基础的“健康”遗传数据往往主要来自欧洲后裔人群,而这会导致结果出现偏差。

今年8月,MacArthur团队在《自然》杂志上发表了对ExAC数据进行的分析。研究发现,很多被认为有害的突变可能并非有害。在一项分析中,该团队辨认出192个此前被认为具有致病性但最终证实相对常见的变异体。科学家回顾了关于这些变异体的文章,以便寻找它们实际上会引发疾病的可信证据,但只发现了针对9个变异体的确凿证据。根据美国医学遗传学与基因组学学会设定的标准,大多数变异体其实是良性的,而且很多已被重新归类为良性变异体。

 

成为医学遗传学标准工具

ExAC正在悄然成为医学遗传学的标准工具。如今,全世界的临床实验室在告诉病人基因组中的某个特定“故障”可能导致其生病前,都会先检阅一下ExAC。如果该突变在ExAC中很常见,它不可能是有害的。美国国家人类基因组研究所遗传学家Leslie Biesecker表示,他的实验室在每天的病人护理中都会用到ExAC。“它是我们在研究每个变异体时要考虑的关键因素。”

ExAC还证实了Goldstein和其他研究人员多次阐明的一个观点:无法将来自亚洲、非洲、拉丁美洲和其他非欧洲血统的人群包括在内,正通过限制观察人类基因的多样性,妨碍着对基因如何影响疾病的理解。目前,已有科学家推动将代表性不足的群体包括进诸如美国精准医学计划等规划中的将遗传学和大规模人群的健康信息联系起来的研究。

对于Vallabh和Minikel来说,虽然ExAC提供了令人沮丧的确认信息,但也提供了一些有希望的见解。Minikel的研究发现,ExAC中有3人携带着应当会使朊蛋白基因两个拷贝中的其中一个沉默的突变。如果他们能在发挥作用的蛋白数量有限的情况下活下来,或许能生产出一种令Vallabh体内的缺陷蛋白沉默的药物,从而在不产生危险的副作用的情况下防止朊蛋白累积和疾病恶化。Minikel同其中一人取得了联系。他生活在瑞典,并且同意捐献一些细胞用于研究。目前,Minikel和Vallabh加入了布罗德研究所生物化学家Stuart Schreiber的实验室。在那里,他们正竭尽全力地寻找治疗朊蛋白疾病的药物。

 

更多精彩内容,敬请关注科学原理一点通官方微信公众平台(ID:kxylydt)

 

基因突变中那些“披着狼皮的羊”

图文简介

在正常人的基因里潜伏着约54个看上去好像应该会令其携带者生病或死亡的突变。如果和健康的对照组相比,一个突变在患有某种疾病的人群中更加常见,那么便有理由认为,该突变是一个可能的病因。