作者段跃初
近期,中山大学医学院施莽教授团队与阿里云李兆融团队合作,在国际知名学术期刊《细胞》(Cell)上发表了一项震撼学界的研究成果:他们借助人工智能(AI)技术,发现了180个超群、超过16万种全新RNA病毒,这一发现如同一颗重磅炸弹,在病毒学领域掀起了波澜,让我们对神秘的病毒世界有了全新的认知。
一、发现之旅:AI如何助力探索病毒“暗物质”
长久以来,传统的病毒发现方法主要依赖病毒分离和生命组学的生物信息学分析。这些方法高度依赖既有的知识体系,面对RNA病毒这种高度分化、种类繁多且极易变异的病毒时,就如同拿着一张陈旧的地图去探索未知的广袤大陆,识别效率极为低下 。RNA病毒以RNA(核糖核酸)作为遗传物质,在复制过程中,其错误修复机制的酶活性很低,这使得它们变异速度极快,与DNA病毒相比,更容易引发疾病,对宿主更致命,种类也更为多样,疫苗研制难度极大,像艾滋病病毒、流感病毒、新冠病毒等都属于RNA病毒。
此次研究中,科研团队另辟蹊径,开发出了LucaProt人工智能算法。这一算法宛如一位不知疲倦且洞察力敏锐的探险家,能够对病毒和非病毒基因组序列进行深度学习,并在海量的数据集中自主判断病毒序列。它的工作原理基于Transformer框架——这也是构建GPT等主流AI大模型的基础框架,通过向其输入蛋白质序列,算法就能预测并识别病毒的核心蛋白“RdRp”(病毒RNA复制酶),进而在大量基因组数据中搜寻未知病毒的类似蛋白序列。
科研团队利用这套强大的算法,对来自全球生物环境样本的10487份RNA测序数据展开地毯式搜索,最终发现了超过51万条病毒基因组,代表着超过16万个潜在病毒种及180个RNA病毒超群。其中,有23个超群无法通过传统的序列同源方法识别,它们就像隐藏在黑暗中的神秘宝藏,被科学家们称为病毒圈的“暗物质”,至此,这些长期被忽视的病毒终于浮出水面。
二、发现背后的深远意义
1. 大幅拓展病毒多样性认知:在此次研究之前,国际病毒分类委员会(ICTV)定义的RNA病毒种类不超过5000种,而这次新发现的病毒数量是已知种类的近30倍,这无疑极大地丰富了我们对RNA病毒多样性的认知。施莽教授表示:“我们的研究展示了病毒多样性的深度,但广度仍有待更多样本的补充。” 这表明,病毒世界的丰富程度远超我们的想象,人类目前所了解的仅仅是冰山一角,未来还有广阔的未知领域等待探索。
2. 揭示病毒基因组的奥秘:研究团队不仅发现了数量惊人的新病毒,还在病毒基因组研究方面取得了突破性进展。他们报告了迄今最长的RNA病毒基因组,长度达到47250个核苷酸;同时发现了超出以往认知的基因组结构,这显示出RNA病毒基因组进化具有超乎想象的灵活性,打破了以往病毒学家对其的认知局限。此外,团队还识别到多种与细菌相关的功能蛋白,这进一步表明还有更多类型的RNA噬菌体亟待探索。
3. 对疾病防控的重要价值:“人工智能的算法模型能够挖掘出我们之前忽略或根本不知道的病毒,这种能力在疾病防控和新病原的快速识别中尤为重要。”施莽教授强调。在疫情爆发时,时间就是生命,AI的快速和精准能够帮助科学家在最短时间内锁定潜在病原体,为疫情防控争取宝贵时间。从长远来看,对病毒多样性和演化历史的深入了解,有助于我们提前预警未来可能出现的大流行疾病,为开发更有效的抗病毒方法和疫苗奠定基础。
三、抗病毒方法:任重道远的探索之路
虽然此次发现了大量新病毒,但针对这些新病毒的抗病毒方法目前仍处于探索阶段。由于RNA病毒的高度变异性,研发通用的抗病毒药物和疫苗面临着巨大挑战。不过,此次研究成果为后续抗病毒研究提供了新的方向和靶点。例如,通过深入研究新发现病毒的基因组结构和功能蛋白,科学家们有望找到病毒的“阿喀琉斯之踵”,从而开发出特异性的抗病毒药物 。在疫苗研发方面,新的病毒序列信息也为设计更有效的疫苗提供了可能。
科学家发现16万种新病毒这一成果,是人类探索病毒世界征程中的一座重要里程碑。AI技术的应用开启了病毒研究的全新路径,让我们看到了病毒世界的复杂与多样。尽管在抗病毒方法的研究上还有很长的路要走,但每一次新的发现都让我们离战胜病毒的目标更近一步,未来,随着研究的不断深入,我们有理由期待能够更好地应对病毒带来的挑战,守护人类健康。
来源: 科普文讯