我们的生命由何决定?基因在各种生命活动中可以说占据了主导,而人类对它的探索,一经开始就从未停止过。

一枚小小的受精卵,发育成四肢健全的人体,拥有独一无二的容貌,却又经历相似的成熟、衰老……我们体内像是有一本详细的说明书,指导着生命有条不紊地推进。

这部“生命之书”写在名为DNA的遗传物质上。DNA,全称“脱氧核糖核酸”,是由含不同碱基的核苷酸分子排列组合而成的。核苷酸分子最主要的差异部分是碱基。共有4种,分别简称为A、T、C、G。其中A与T,C与G总是成对、互补地出现在DNA双链的两侧。碱基的排列顺序称为“序列”。DNA的序列是编码蛋白质的依据。能编码出完整蛋白质的序列片段就是 “基因”。如果把DNA比作一座巨大的图书馆,“基因”就相当于其中的一本本书。

图:配图来自图虫网

一套完整的DNA序列称为一个“基因组”。人类的基因组由约30.55亿个碱基对组成,包含约2.5万个基因,能指导细胞内的氨基酸组装成不同功能的蛋白质。例如,红细胞中的血红蛋白,能捕获血液中的氧分子;角蛋白可以彼此紧密连接,形成坚硬的指甲。

每个人体细胞中都有一套近乎完全相同的DNA,但有些基因只在特定器官,或特定的时间段工作。胰岛素是能降低血糖的激素,由胰脏内的胰岛β细胞分泌。它也是一种蛋白质。当血糖过度升高,血液中的信号分子会通知胰岛β细胞,打开DNA双螺旋结构的一部分,也就是胰岛素基因,合成胰岛素蛋白。一旦产生了足够的胰岛素,会有其他信号分子来通知胰岛β细胞,让胰岛素基因停止工作。这就像你从DNA图书馆里拿了一本胰岛素的书,看完了再把它放回去。

人类基因组的相似性高达99.9%,剩余0.1%的差异和环境因素共同造就了每个人独特的外貌、体质、寿命等等。人的一生中,DNA的序列也会变化。细胞复制过程中的错误,紫外线、药物等的刺激,都可能造成碱基的缺失或位置移动。如果因此导致基因改变,合成出异常的蛋白质,就可能导致疾病。如果有个可供参考的基因组序列,就能从源头上,研究个体差异和疾病的原因了。

于是,1990年,“人类基因组计划”正式启动。它的核心目的就是绘制出人类基因组的完整序列图,进而研究与生老病死相关的众多基因的差异和相互关系。第一个人类基因组的发布历时近13年,耗资超过30亿美元,集结了全球多国的努力,中国也参与其中。序列数据在网络上免费公开,极大推动了全球基因领域的研究和应用。之后,基因测序技术开始飞速发展,测序效率不断加快。如今,获得单人基因组序列的成本已降至约1000美元,结果几天内就能获取。

其实,2003年获得的序列图谱并不完整,只完成了92%。由于技术限制,有一部分未能顺利测序。要知道,人体的一套DNA分子如果完全展开,可长达2米,自然塞不进直径仅几微米的细胞里。为了节约空间,DNA分子通常缠绕、压缩成致密的染色体,藏在细胞核中。染色体中部狭窄的 “着丝粒”是细胞分裂时复制后染色体开始分裂的位置;染色体末端的“端粒”,其长度随着衰老而逐年变短。可是这两个重要部位的序列都含有大量的重复片段。当年的测序仪效率很低,并且只能读短短几百个碱基的序列,再一段段拼起来。就好比玩拼图,如果拼图很小,图案的颜色形状又非常相似,就很难判断它们的顺序了。经过近20年的探索,在高通量测序仪和能连续读取几万个碱基的测序技术的帮助下,2022年,这缺失已久的8%终于被解锁了。新版本的人类基因组扩增了约2亿个碱基,包括1956个预测基因,为研究疾病和分析人类演变提供了重要的依据。

在未来,基因探索还会给我们带来什么,它将如何拓展人类生命和认知的极限,没人知道答案。

参考文献
1.Nurk S, Koren S, Rhie A, et al. The complete sequence of a human genome[J]. Science, 2022, 376(6588): 44-53.’

本文为科普中国·星空计划扶持作品
作者:徐斯佳(京都大学 医学博士)
审核:陶宁(中科院生物物理所 副研究员)
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

来源: 星空计划

内容资源由项目单位提供