近年来,脑疾病研究领域涌现了一批大规模神经影像开放数据和国际合作计划。他们在脑疾病神经机制探索、疾病早期识别和个体化精准治疗研究中扮演了重要作用。相较于小样本研究,脑影像大数据能极大地提高统计效力,降低研究发现的假阳性率,并促进新研究范式的发展。然而,影像大数据时代也面临着跨站点数据标准化、隐私保护和数据共享等诸多挑战。
近日,中国科学院心理研究所严超赣研究组系统梳理了神经精神疾病领域的开放神经影像大数据和国际合作计划,介绍了脑影像大数据在疾病神经机制研究、基于影像的早期诊断、疗效预测和精准治疗方面的应用,并总结和展望了神经影像大数据面临的挑战和有潜力的研究方向。相关综述论文以“The power of many brains: Catalyzing neuropsychiatric discovery through open neuroimaging data and large-scale collaboration”为题发表在Science Bulletin。The power of many brains既指代海量脑影像大数据推动疾病研究的“众脑之力”,也指推动大规模国际合作的相关领域研究者的“众脑之力”。
该综述首先系统梳理了ENIGMA、UK Biobank、ANDI、ABIDE、DIRECT (REST-meta-MDD)等神经精神疾病各领域脑影像的开放神经影像数据库,并总结了目前相关影像大数据在纵向数据、样本代表性、质量控制等方面的缺陷和不足。基于影像大数据,以规范化建模(normative modeling)为代表的创新研究方法能够超越传统case-control研究范式,挖掘更为敏感和稳健的生物标志物,在个体水平进行推断,有望推动脑影像走向临床。此外,开放科学框架下的标准化数据格式、数据处理平台、研究合作架构和研究者社区能够更好的促进可重复的脑疾病影像学发现。
表1. 神经影像公开数据集
图1. 当前脑影像大规模数据集的不足
神经影像技术提供了一种非侵入性的方式来观察大脑结构和功能及其与疾病相关的异常模式。基于开放神经数据集的大规模合作研究为我们提供了关于抑郁症、双相情感障碍、精神分裂症和自闭症谱系障碍等神经精神疾病的神经生物学基础的新见解。脑影像大数据集允许研究人员确定具有临床意义的疾病亚型,识别跨诊断神经异常回路,并开发更准确的诊断算法。基于大数据的深度学习算法已显示出预测治疗效果和指导个体化干预的潜力。
图2. 基于大数据的重性抑郁障碍神经影像学发现
图3. 基于脑影像的重性抑郁障碍个体化精准治疗概念图
但是,充分实现神经影像大数据的潜力也面临着诸多挑战。设备、扫描参数、质控等因素导致的数据异质性,即“站点效应”,是多中心影像研究中的一大难题。解决方案包括前瞻性实验设计、标准化预处理、事后统计校正以及机器学习算法等。此外,有效管理海量神经影像数据集也是一项挑战,需要开发标准化的元数据模式、数据管理协议和索引系统,并采取严格的数据保护措施。FAIR指导原则(可找到性、可访问性、互操作性和可重用性)虽然实施成本较高,但有助于提高科学数据的有效共享和重用性。此外,不同国家和地区指定了不同的数据安全政策,但这些规定需要在保障患者的隐私和高效利用数据间进行更好的平衡。中国研究者正在着力构建大规模脑影像常模,结合回顾性和前瞻性设计,建立多样化的多中心数据集,致力于探索神经精神疾病个性化的客观诊断和精准治疗的潜在途径。
了解详情,请阅读原文
Lu, B., Chen, X., Castellanos, F. X., Thompson, P. M., Zuo, X. N., Zang, Y. F., & Yan, C. G. (2024). The power of many brains: Catalyzing neuropsychiatric discovery through open neuroimaging data and large-scale collaboration. Science Bulletin. doi:10.1016/j.scib.2024.03.006
来源: 《中国科学》杂志社