生物技术初创公司 A-Alpha Bio 发布世界上最大的蛋白质相互作用数据库 AlphaSeq,包含超 7.5 亿条测量结果,并且每个月以 3M-50M 数据点的速度快速扩展,解决数据集匮乏问题。

蛋白质-蛋白质相互作用 (Protein-Protein Interactions, PPI) 是细胞生命活动的重要组成部分,在调控和维持细胞的生理功能中(如细胞的信号传导、代谢反应和基因表达)发挥着不可或缺的作用。

然而目前 PPl 数据库中的数据相对较少,最新的结合亲和数据集 (PDBbind+) 只有 3,176 个数据。

Dyno Therapeutics 的高级机器学习工程师 Abihishaike Mahajan 在其文章「Wet-lab innovations will lead the AI revolution in biology」中指出,AlphaFold 所取得的革命性进展是极难复制的,最重要的原因是数据,「我们几乎用尽了所有预先存在的数据,未经训练的蛋白质 结构 和序列正在枯竭」。

他还介绍道,生物学领域高质量数据的特点是具有复杂的潜在分布,与重要的生理现象高度相关,适合大规模收集。但是,「满足上述 3 个要求的数据类型已经被挖掘殆尽」。

文章地址:
https://www.owlposting.com/p/wet-lab-innovations-will-lead-the

生物技术初创公司 A-Alpha Bio 试图解决这一数据短缺问题,发布了世界上最大的蛋白质相互作用数据库 AlphaSeq 。该数据集包含了超过 7.5 亿条测量结果,并且每个月以 3M-50M 数据点的速度快速扩展。

AlphaSeq 数据集的「前世今生」
AlphaSeq 所用的方法,起源于 David Baker 实验室在 2017 年发表的一篇题为「High-throughput characterization of protein–protein interactions by reprogramming yeast mating」的研究论文,A-Alpha Bio 的成立便是这一研究成果的转化。

该论文首次介绍了 A-Alpha Bio 大规模收集蛋白质-蛋白质相互作用数据的方法,说明了 SynAg 能够在完全确定的细胞外环境中,以库对库的规模对蛋白质-蛋白质相互作用网络进行高通量定量表征。该方法与正式命名的 AlphaSeq 高度类似,因此,Mahajan 在其博客中将这种方法称为 AlphaSeq 。

论文地址:
https://www.pnas.org/doi/10.1073/pnas.1705867114#sec-2

2022 年,A-Alpha Bio 在「A dataset comprised of binding interactions for 104,972 antibodies against a SARS-CoV-2 peptide」研究论文中正式介绍了 AlphaSeq 数据集。这是一个由 104,972 种抗体,与 SARS-CoV-2 肽结合相互作用组成的公开数据集,包含抗体序列、抗原序列和结合得分的定量测量,是评估机器学习中抗体特异性表示模型的基准。

论文地址:
https://www.nature.com/articles/s41597-022-01779-4

在最新的研究中,A-Alpha Bio 研究人员利用 AlphaSeq 平台(该平台可实现蛋白质-蛋白质相互作用的库对库筛选)生成亲和力失调的细胞因子治疗候选物和针对小鼠的替代物,用于与靶向免疫细胞亚群的抗体融合。以 IFNA2 和 IL-21 为例,研究发现 AlphaSeq 可用来鉴定数百种分别与 IFNAR2 和 IL21R 受体具有广泛亲和力的失谐细胞因子变体。

论文地址:
https://www.aalphabio.com/static/7a44b7b5f69a3e05eb02829a9278c470/ICIS_2023_poster_final.pdf

作为实验平台,AlphaSeq 还能够同时定量测量数百万个 PPI 的结合亲和力,并快速得出结果,完美满足了规模化扩展的需求。

根据 CTO Randolph Lopez 的说法,他们目前每月执行约 30 次 AlphaSeq 检测,每次可以得到 100k~5M 个交叉点。这意味着,AlphaSeq 数据库还在以每月 3M~50M 的速度快速扩展。

A-Alpha Bio:专注于 PPI 的生物技术公司
A-Alpha Bio 成立于 2017 年,总部位于美国西雅图,由华盛顿大学蛋白质设计研究所 (IPO) 和合成生物学中心的生物学家成立,是一家利用合成生物学和机器学习来测量、预测和设计蛋白质-蛋白质相互作用的生物技术公司。

该公司搭建了实验平台 AlphaSeq 和计算平台 AlphaBind 。 AlphaSeq 用于定量和多重表征蛋白质-蛋白质相互作用,利用合成生物学方法大规模生成高质量的蛋白质结合数据。而这一过程建立在蛋白质-蛋白质相互作用强度以及酵母杂交之间的联系之上。

AlphaBind 则利用积累的数据,训练能够预测蛋白质序列结合的机器学习模型,通过实验测试模型并快速迭代改进,从而加速药物发现并设计更好的治疗方法。


A-Alpha Bio 技术平台

现阶段,AlphaSeq 能够通过一次实验同时快速定量测量数百万个蛋白质-蛋白质结合亲和力,经过训练的 AlphaBind 能够根据序列预测结合强度。

A-Alpha Bio 基于 AlphaSeq + AlphaBind 技术平台,在抗体发现和优化、分子胶靶标发现、机器学习模型开发等多个领域开展业务。同时,公司还开发了内部治疗管线。自研管线主要包括免疫细胞因子治疗管道和分子胶靶标发现管线两部分,在药物研发领域展现出巨大的发展潜力。

因此 A-Alpha Bio 成为了资本「热捧」的对象。

A-Alpha Bio 内部治疗管线

据公开资料显示,截止目前,A-Alpha Bio 共完成 8 轮融资,最高融资达 2,240 万美元。今年 5 月份,A-Alpha Bio 宣布获得美国国防部 1,450 万美元的额外资金,以进一步扩大其与联邦资助的研发中心劳伦斯利弗莫尔国家实验室 (LLNL) 的合作关系。

图源官网新闻稿

据悉,A-Alpha Bio 与 LLNL 的合作始于 2022 年,双方利用合成生物学和机器学习加速发现针对 COVID-19 变体的治疗性抗体。当时,A-Alpha Bio 凭借这一合作获得了 100 万美元资金。到 2023 年,双方扩大了合作规模,共同开发靶向多个相关的病原体家族,该公司再获 240 万美元。

如今,该公司已经与多家企业、实验室达成合作伙伴关系:如与 Bristol Myers Squibb 进行蛋白质相互作用研究;与 Gilead Sciences 合作进行 HIV 治疗探索;以及与 Kymera Therapeutics 合作发现并表征新型 E3 泛素连接酶,并针对高价值治疗靶点理性设计分子胶等等。

David Baker 任科学顾问
A-Alpha Bio 由两位华盛顿大学的生物工程博士 David Younger 和 Randolph Lopez 共同创办,旨在通过解析蛋白质-蛋白质间相互作用加速药物发现。

左为 David Younger,右为 Randolph Lopez

图源 A-Alpha Bio 官网

David Younger 曾是 David Baker 实验室的一名博士研究生,读博期间主要专注于高通量蛋白质相互作用分析及其在生物工程和临床治疗中的应用。他开发了基于酵母双杂交系统的创新技术,特别是通过重编程酵母交配 (yeast mating) 来表征蛋白质-蛋白质相互作用,极大地提高了蛋白质-蛋白质相互作用筛选的效率,也为 AlphaSeq 的研发提供了强大的支持。

A-Alpha Bio 的另一位创始人 Randolph Lopez,主要从事合成生物学和计算机科学工作。此前他还曾担任 Illumina 的工艺开发工程师,负责提高质量、控制效率并推动产品走向规模化生产,为 AlphaSeq + AlphaBind 的开发和实现提供了全面的基础。

值得一提的是, A-Alpha Bio 的科学顾问是蛋白质折叠领域的明星学者、享誉世界的生物计算大牛 David Baker 。他带领的团队在蛋白质工程和结构生物学领域成果颇丰,开发了 RoseTTAFold 、 ProteinMPNN 、 RFdiffusion 等蛋白质结构预测、设计工具,还曾荣获包括诺贝尔生理学化学奖提名在内的多项奖项。


A-Alpha Bio 科学顾问(图源官网)

与此同时,A-Alpha Bio 还聘请 Recursion 制药公司的联合创始人兼首席执行官 Chris Gibson 、华盛顿大学电气工程教授 Eric Klavins 、 Brainstorm Cell Therapeutics 公司的董事会成员 Tony Polverino 以及华盛顿大学医学院蛋白质设计研究所 (IPD) 的首席战略与运营官 Lance Stewart 担任公司科学顾问。

截止目前,虽然 A-Alpha Bio 尚未发布 AlphaSeq 的最新论文,AlphaBind 模型的详细信息也尚待披露,但根据 Mahajan 博客分析,AlphaSeq 平台在药物研发领域的应用前景十分广阔。

随着 AlphaSeq 数据库的不断扩展,我们坚信 A-Alpha Bio 未来会有更多药物研发领域的突破,为人类的生命健康保驾护航。

* A-Alpha Bio 官网地址:

https://www.aalphabio.com/

参考资料:
1. https://www.pdbbind-plus.org.cn/yuan
2. https://www.owlposting.com/p/wet-lab-innovations-will-lead-the
3. https://www.owlposting.com/p/creating-the-largest-protein-protein
4.https://www.vbdata.cn/companyDetail/9c03eefc878f2b4363d42bc9f84a97bc
5.https://bydrug.pharmcube.com/news/detail/dc7555da11321e7a5b5e3653fe46cf20
6.https://mp.weixin.qq.com/s/ve061fKiRi9Wbsvk8qvNag

来源: HyperAI超神经