近日,ChatGPT成为全民热议的科技界“顶流”,在惊叹人工智能技术飞速发展的同时,我们不禁思考,生命科学领域会迎来怎样的新契机?
大家熟悉的蛋白质结构预测程序AlphaFold,已经预测出地球上几乎所有已知蛋白质。这种靠人力无法想象的突破,对于理解生命,对于新药开发,又究竟意味着什么?
图片来源:pixabay
一、AI技术变革新药研发模式
据统计,世界上还有30000多种疾病,尚未找到对症的药物。仅各种癌症,每年全球新发病例就高达2000万例。而如今,研发一款新药平均需要近十年的时间、超十亿美金的投入,即便如此,最终也只有极少数在研新药能够获得成功,走向临床。
人类现代医学技术的进步,已经达到了史无前例的高度,但同时也面临着越来越大的挑战和困难。从神农尝百草,到青霉素的意外发现,再到现代各种治病药物的发明,这种“大海捞针”的新药发现模式,面对更大的疾病挑战和临床需求,已经越来越落后。
于是,科学家们将目光转向了人工智能(AI)。
1981年,默克公司尝试通过计算机设计药物,标志着计算机辅助药物设计(CADD)的问世。但从计算机辅助药物设计,到真正的AI制药,还有很长的一段路要走。
2011年IBM沃森机器人的横空出世,在全球范围内迅速掀起了一股AI狂潮,通过AI征服医学、战胜疾病的号角也达到了史无前例的高潮。但AI技术的革命性进展,似乎并没有解决新药研发面临的真正挑战。那么,到底哪个环节出了问题?
二、何为AI制药?
所谓AI制药,前沿AI技术和前沿生物技术固然重要,但如何深度融合二者,亦是成败的关键。于是,近几年,“生物计算”成为AI制药领域的星星之火,愈加耀眼。
从本世纪初快速发展的基因技术,以及各种组学技术,使得生物实验数据有了史无前例的爆发。这些丰富的生物数据中,蕴藏着无限的生命奥秘和未知线索,但是面对这些待开发的宝藏,传统实验方法和人力,显得有些力不从心。
以人体高度复杂的免疫系统为例,数十种疾病,包括肿瘤、自身免疫性疾病等都与免疫功能的异常息息相关。但是科学家们发现,免疫细胞的种类多达数十种,在不同组织器官环境下,这些免疫细胞族群又有不同特征。而每个免疫细胞上又有着数以万计的、决定其不同功能的蛋白质。
可以说,这种超级复杂的功能调控网络,决定了每一个个体都不完全相同的疾病发生、进展过程和治疗效果。
如果不考虑这些数据所蕴藏的线索,传统模式下开发免疫调控药物,只能靠“大海捞针”碰运气,而且得到的药物也往往只针对通用人群、单一或少数靶点进行调控。这就造成了传统药物的安全性、有效性,特别是长期有效性的巨大挑战。
三、AI制药何以实现?
近年来,随着算力的提升、AI模型的精进,让我们看到了生物计算技术在面对千丝万缕的生物数据时,所迸发出的活力,更让我们看到了从大海捞针到按图索骥的新药研发新思路。
那么,按图索骥的AI制药,究竟如何实现呢?
首先,作为数据科学时代研究复杂问题的全新技术,图谱在高度复杂的生命科学问题上充分发挥了其用武之处。图谱技术能够将原本散落在不同研究、实验、专家的知识汇集起来,并基于人工智能算法进行误差消除、去重去歧,形成统一的知识体系。
有了海量的生物数据,并通过图谱技术对数据进行梳理,接下来,再利用AI大规模预训练模型进行高速分析,在计算机的世界里,对人体复杂机制进行模拟实验。
放眼全球,除了DeepMind,前沿科技巨头、跨国大药企和学界大牛纷纷踊跃布局AI制药,大批创业公司也在近几年间爆炸式增长。据不完全统计,目前全球数十家AI制药公司已开展近百个AI药物管线。与此同时,全球计算生物学的市场规模有望从2021年的53亿5,000万美元,达到2028年的147亿美元,年复合成长率高达19.9%。
可以看到,面对目前已陷入窠臼的传统药物研发模式,AI制药正在提供全新的方向和希望,甚至革命性的改变,一些传统医学方法、生物学方法无法解答的问题,在生物计算时代,也正变得柳暗花明。
文章由科普中国-星空计划(创作培育)出品,转载请注明来源。
作者:管心宇 科普作者
审核:于旸 腾讯玄武实验室负责人
来源: 星空计划
内容资源由项目单位提供