2023年度“科普中国青年之星创作大赛”获奖作品

作者:尹涛,郑李垚

基因、遗传、DNA……不知道从什么时候起,这些本来是遗传学、生命科学领域专业术语的词语,频繁出现在人们的日常对话中。

可是,你知道DNA和基因之间究竟是什么关系吗?当我们提到遗传时,我们谈论的究竟是什么?这可是你我每时每刻、一举一动背后的底层逻辑。如果没有精妙的遗传机制,生命绝对不可能演化成今天这个样子。

从蓝图到“只是蓝图”

--从DNA到基因--

1953年,詹姆斯·沃森和弗朗西斯·克里克在《自然》期刊发表文章,提出了DNA的双螺旋结构模型,这是人类认识遗传机制的重要里程碑。当然,其中还有罗莎琳德·富兰克林和莫里斯·威尔金斯的贡献,他们的早期研究为这个精妙的答案提供了关键数据。

为了帮助大众迅速、直观地理解DNA的结构,科学家借用许多日常生活中的物品来描述它。比如,DNA分子被形容成一架“绳梯”,上面的每个“梯级”代表一对按照特定规则配对的碱基。这个绝妙的比喻在信息简化过程中有所疏漏,造成了信息的缺失。比起绳梯,DNA分子其实更像是一条拉链,配对的碱基恰似互相咬合的拉链扣;对了,这条拉链还得被人从两头拿着扭转几次,才能更贴切地模拟DNA分子的螺旋状结构。

那么,什么是基因?

基因是遗传的基本单位,通常来说就是编码一个或多个特定蛋白质的核苷酸序列。(这里做了信息简化,不够严谨,请注意。)至于核苷酸,指的是DNA或RNA分子的基本组成单位,在DNA分子中是脱氧核糖核苷酸,在RNA分子中是核糖核苷酸。多个核苷酸聚合成核酸,“核酸”这个词是不是有点儿耳熟?没错,过去几年我们经常挂在嘴边的“做核酸”,就是指检测病毒的DNA或RNA分子的核苷酸序列,简称核酸检测。

--基因组:远不止是基因--

在人们的普遍认知中,由DNA组成的基因绘制了生命的“蓝图”;基因对应的DNA序列就是一套神秘的“遗传密码”,生命的全部奥秘都藏在其中。

要把这件事说清楚,我们还需要简单了解染色体和基因组。染色体是遗传物质的重要载体,可以看成由DNA和蛋白质结合而成的“小包裹”。1956年,在瑞典隆德大学遗传学研究所工作的美籍华裔遗传学家蒋有兴发表论文,称人的体细胞中有46条染色体。(在此之前,美国医生、细胞遗传学家西奥菲勒斯·佩因特得出的结论是48条。)这是人类细胞遗传学的开端。

一个人的正常细胞中有23对染色体,而基因就是染色体上的一个个片段,相互之间距离或近或远,星罗棋布。每个基因都由一段或长或短的DNA序列组成。你很可能知道,DNA的“密码本”上只有四个字母,可以用ATGC表示(算上它的“近亲”、“搭档”RNA,也不过区区五个字母,只需要在RNA分子中把T换成U就行了),对应DNA分子结构中的四种碱基。而且这些字母的配对方式非常专一,在绝大部分情况下, A只认T(U),C只会和G配对。

听起来简单到令人难以置信,对吗?如果再考虑到这样一个事实,你一定会更加震惊:这基本上是所有生命体共用的遗传密码!

如此复杂又丰富多样的生命,真的由这么简单的机制决定吗?

不如让我们从头梳理一下:DNA组成基因,对吧;那么,是不是所有的DNA都会组成基因?

当然不是。

原来如此!

那么,我们需要回答两个问题:一是不同物种的基因数量差异有多大;二是组成基因的DNA占比有多少。

这里我们要先提到基因组这个概念,基因组包括某个物种的个体发育需要具备的所有遗传信息,就人类而言可以简单认为是所有染色体上DNA序列承载的信息(此处同样有简化)。请注意,基因组的范畴要比基因大,事实上大得多。

人类只有约2万个基因。2001年,长达30亿个碱基对的人类基因组草图发布时,人们大跌眼镜,因为2万这个数字和科学家预测的约10万个基因相去甚远。换句话说,人类的基因数量和实验室常用的小白鼠差不多,甚至没比蠕虫多出太多。

至于组成基因的DNA比例,仅为人类全部DNA序列的2%!也就是说,人类基因组中有98%的DNA序列并不组成基因。

--举足轻重的“无用DNA”--

事实上,“无用DNA”具有复杂且重要的功能,并不难理解。试想,人类所具备的能力远超小白鼠,是比蠕虫复杂得多的生物,但这三个物种的基因数量差别不大;而且人类的基因中有相当一部分可以在其他生物的基因组中找到类似功能的“远亲”,那么占人类基因组容量98%的“无用DNA”举足轻重,应该说得通吧?

图源:妮莎·凯里《隐形的遗传密码》,中信出版集团2023年4月版

不过,这只是我们作为“事后诸葛亮”的后见之明。发现这些基因组“暗物质”的科学家当时应该很失望,因为他们给这些基因以外的DNA取名“Junk DNA”,翻译出来就是“垃圾DNA”或“无用DNA”,失望和困惑之情由此可见一斑。当时人们觉得,宝贵的基因就好像生活在垃圾堆里,剩下的DNA序列似乎只是基因组的“废话”,是用碱基对写成的“乱码”,没有什么实际功能。

“无用DNA”在很长时间里一直被遗忘在遗传学研究的角落,无人问津,直到有一些反常的遗传病例提醒科学家重新认识它们。比如,有一种俗称“小飞侠病”(面肩肱型肌营养不良,英文缩写是“FSHD”)的显性遗传病,科学家一直找不到对应的致病基因。这种疾病在西方人群中并不少见,发病率约为1/20 000,让人无法正常微笑,而且会使患者的肩胛骨等部位变形,看上去就像两只小翅膀。显性遗传病的特点是患者的父母中至少有一方一定患病,从某种程度上讲应该较为容易找到致病基因。科学家的确在患者的4号染色体上发现了一段超长的重复序列,可奇怪的是,这里并不是基因的安身之所。你一定猜到了,这里正是被视同垃圾的“无用DNA”序列。进一步研究显示,至关重要的是一段“无用DNA”序列的重复次数。

我们不再展开去探讨复杂的研究细节。尽管早在1885年,法国神经病学家就对FSHD患者的临床症状进行了描述,而且迅猛发展的遗传学和细胞水平研究技术已经让我们对这种疾病的认识有了长足的进步,但2010年《科学》期刊上发表的一项研究指出,这种疾病潜在的遗传机制依然难以捉摸。基因的确是一份蓝图,但它也只是一份蓝图而已。

蓝图落地,基因表达

我们的生命从一个细胞(受精卵)开始。不考虑特殊情况的话,身体的每个细胞中都有一份同样的DNA序列,尽管如此,具体到每个细胞也只有一部分基因发挥作用。这不难理解,在你的脑细胞和肌肉细胞中,发挥作用的基因肯定不太一样。基因中的DNA序列所记录的遗传密码,会由被称为RNA的信使分子传递和翻译,变成具有不同氨基酸序列的蛋白质,才能发挥作用,这个过程叫作基因表达。要是无法表达,就算拥有再精妙的遗传密码也是无用。

科学家花了几十年时间才意识到,那些曾被视同垃圾的“无用DNA”,其实在基因表达过程中起着超乎想象的重要作用。有些“无用DNA”片段是基因的开关,能决定这个基因是否发挥作用;还有些“无用DNA”片段起着修饰作用,由某项功能或某个特征相关基因写成的“语句”,到底能表达出百分之多少的原意,得听它们的。

当身体的每个细胞读取DNA序列中储存的遗传密码时,受限于细胞所处环境的不同,“无用DNA”发挥的作用不同,基因的表达受到影响,同一个剧本就在不同的场景下衍生出了不同的表演。这是一门叫作表观遗传学的新科学的研究范畴。

--从端粒到泛基因组--

如果我们问一个人的成功是先天因素还是后天因素决定的,不同的人会给出不同答案,不过应该会有相当一部分人赞同“先天+后天”这个答案。对我们的每个细胞来说,情况也差不多是这样。你可能听说过“端粒”这个词,它是一种“无用DNA”。把每条染色体看成一条鞋带的话,端粒就像是鞋带末端的金属片堵头,会随着使用年限变长而磨损。一旦金属片磨坏,鞋带就会散开,很难穿进孔里了;而端粒的磨损就意味着生命体走向衰弱。那么,端粒的健康与什么因素有关?答案是先天遗传与后天生活方式的相互作用。每个人的基因会影响出生时端粒的长度,以及它的磨损速率;你吃什么食物,每天睡眠如何,运动量怎么样,心情好不好,有没有和周围的人保持稳定的情感连接……你和外界的任何互动都会对端粒产生或大或小的影响。

2009年诺贝尔生理学或医学奖得主伊丽莎白·布莱克本与加州大学旧金山分校衰老、代谢与情绪中心主任艾丽莎·伊帕尔在合作的《端粒》一书中写道:“基因负责上膛,环境扣动扳机。”这也是一个贴切的比喻,尤其是当涉及健康与疾病时。

2023年5月,第一张人类“泛基因组”草图在《自然》期刊发布。首个人类基因组图谱发布20年之后,泛基因组将不同地域、不同种族带来的遗传多样性都纳入其中。我们有理由相信,表观遗传学对此做出了相当的贡献。

下一次看见一个婴儿在成长的不同阶段奇迹般地发展出特有的技能,能认人、跌跌撞撞地学会走路、咿咿呀呀地学说话,可别再只顾着感叹生命竟然有其内置程序了。毕竟,对于同样一种技能,不同婴儿的发育时间或早或晚;他们正在一步一步发展出自己的独特个性,每个孩子都会是独一无二的。当我们谈论生命的蓝图时,请多想一想,不只是遗传因素,你的生活方式、你所处的环境及与周围人的互动也至关重要,决定着这张蓝图能创造出怎样的作品。

参考文献:

1. 妮莎·凯里:《隐形的遗传密码》, 祝锦杰译, 中信出版集团,2023.

2. Cobb M, Comfort N. What Rosalind Franklin truly contributed to the discovery of DNA's structure. Nature. 2023 Apr;616(7958):657-660. doi: 10.1038/d41586-023-01313-5.

3. Lemmers RJ, van der Vliet PJ, Klooster R, et al. A unifying genetic model for facioscapulohumeral muscular dystrophy. Science. 2010, 329(5999):1650-1653.

4. 张成, 李欢.面-肩-肱型肌营养不良症研究进展史[J]. 中国现代神经疾病杂志, 2019 19(5):13.

5. 伊丽莎白·布莱克本, 艾丽莎·伊帕尔:《端粒》, 傅贺译, 湖南科学技术出版社, 2021.

6. Liao WW, Asri M, Ebler J, et al. A draft human pangenome reference. Nature. 2023, May;617(7960):312-324. doi: 10.1038/s41586-023-05896-x. Epub 2023 May 10.

来源: 中国科普作家协会

内容资源由项目单位提供