乳腺癌是女性最常见的恶性肿瘤,被誉为“红颜杀手”,尽管随着科技的发展,乳腺癌治疗手段有了显著提高,但依然存在术后复发和转移的风险。
然而复发时间和转移范围,决定了患者的预后可能完全不同。
因此,是否能综合各方面影响因素, 进而提出一种可长期、动态追踪的乳腺癌术后复发预测模型,是目前乳腺癌研究的重要方向之一。
美国斯坦福大学医学院研究人员分析了数千名乳腺癌患者的临床数据,建立了一个多状态统计模型,模拟疾病不同预后状态,以及各类影响死亡率的已知因素,对远期、远端复发风险等进行评估预测,为乳腺癌复发后治疗提供新的思路和方向。
文章《Dynamics of breast-cancer relapse reveal late-recurring ER-positive genomic subgroups》近日发表于Nature杂志。
研究团队获取了1977至2005年被诊断为乳腺癌的3,240例患者资料,平均随访14年, 其中1,980例患者资料中包含分子数据。通过分析患者数据,研究人员基于马尔可夫链原理开发出一种多状态统计模型,该模型可模拟乳腺癌术后的不同预后状态(局部复发、远处复发、乳腺癌相关死亡及其他原因死亡),以预测复发风险及复发时间。模型中同时包含年龄、肿瘤大小与级别等影响乳腺癌生存的临床变量,实现了复发风险预测的个体化。
根据已有临床数据,研究人员将病例中的乳腺癌分为复发风险不同的多种亚型:免疫组织化学(IHC)亚型(即ER + / HER2 +,ER + / HER2-,ER- / HER2 +和ER- / HER2-亚型);5个内在基因表达亚型(即PAM50亚型);11个综合(IntClust)亚型,依据为不同的基因拷贝数和基因表达谱。
~以下为该研究的几点重要发现~
1
根据免疫组化亚型进行分类评估: 主要依据免疫组化标志物雌激素(ER)和人表皮生长因子受体-2(HER2)分型。研究发现ER阴性的乳腺癌术后5年内复发风险较高, 其后则急剧下降; 而ER阳性的乳腺癌术后10年内始终存在相对较低但持续上升的复发风险。
2
根据PAM50划分:在5种基因表达亚型中,三阴性乳腺癌与HER2单阳性乳腺癌呈现出与上述ER阴性乳腺癌类似的复发风险走向。
3
基于IntClust的乳腺癌分子亚型: 将乳腺癌细分为11个亚型,精确展示了不同乳腺癌不同的复发风险,其中尤以ER阳性的乳腺癌最为显著,其中4种亚型呈现较好预后,而另外4种则存在远期复发的风险。这4种亚型属于ER阳性和HER2阴性的肿瘤,术后20年内复发风险为47%~62%。
4
ER阴性/ER阳性患者中不同器官的转移风险与发病率:ER状态不同,则不同器官的转移累积发生率和转移数量会有显著不同。
ER阴性患者出现内脏转移的情况显著多于ER阳性者(脑/脑膜:27% vs 11%;肺部:50% vs 41%);
ER阳性患者中骨转移更常见(71% vs 43%),累积发生率基本相似, 且ER阳性者首次转移常常为骨转移(76% vs 61%), 远处转移的差异非常显著。
ER阴性患者在术后的早期会出现一系列复发转移;而大多数ER阳性者仅发生一次早期复发转移(通常为骨转移),如果发生第2次复发,那么出现第3次、第4次复发的可能性则大大增加。
重要的是,ER阳性患者的复发可能长达20年,长期随访不容忽视。
三阴性乳腺癌在术后2~5年内复发风险相对较高,安然度过5年后,后续复发风险则相对较低。
本研究的优势 1 以往对于乳腺癌复发的预测研究仅限于使用无病生存期(disease-free survival, DFS)或总生存期,而这些生存期分析往往只选择特定疾病死亡(disease-specific death, DSD)的案例而排除了其他因素致死的情况。 本研究则从复发的时间和部位、术后时间、复发范围, 并根据不同类别分子信息的复发时空模式(免疫组化亚型、PAM50亚型、IntClust亚型),开发出一种多状态统计模型,模拟乳腺癌术后不同预后状态(局部复发、远处复发、乳腺癌相关死亡和其他原因死亡),预测复发风险以及复发时间。 2 本研究分析了1977~2005年间,确诊为乳腺癌后,随访中位时间长达14年的3,240例患者,其中1,980例患者有分子分型数据。临床随访时间长,案例人数多,具有大量临床诊断及分子层面信息,是该研究的优势之一。 本研究的局限性 该研究通过分析3,240例乳腺癌患者的临床数据建立模型,预测复发风险,但并未完全区分测试集和验证集,且预测模型也仅与已发表的一种预测工具PREDICT进行比较。因此,尚需更多样本作为验证集,并与更多工具进行比较分析,以确定该预测模型的精准度。 本期知识点 马尔可夫链原理 本研究中数学模型的建立主要基于马尔可夫链原理。马尔可夫链(Markov Chain, MC)是概率论和数理统计中具有马尔可夫性质且存在于离散的指数集和状态空间内的随机过程。 马尔可夫链被应用于蒙特卡罗方法中形成马尔可夫链蒙特卡罗方法,也被用于诸多其他领域的数学建模。 在物理学和化学中,马尔可夫链被用于对动力系统进行建模,形成了马尔可夫动力学(Markov dynamics)。 在排队论(Queueing theory)中,马尔可夫链是排队过程的基本模型。 在信号处理方面,马尔可夫链是一些序列数据压缩算法,例如Ziv-Lempel编码的数学模型。 在金融领域,马尔可夫链模型被用于预测企业产品的市场占有率。 此外,作为结构最简单的马尔可夫模型,诸多机器学习算法,包括隐马尔可夫模型、马尔可夫随机场和马尔可夫决策均以马尔可夫链为理论基础。 本期嘉宾 生物信息学,北京大学硕士、博士。北京协和医院-中心实验室-统计与生信平台。 北京协和医院-中心实验室-统计与生信平台基于循证医学、医学统计学、生物信息学(基因组、转录组、表观遗传组、微生物)等前沿技术,在院内开开展方法学咨询与大数据分析技术支持。从疾病的病因、诊断、治疗、预后等多角度开展临床研究,为疾病的预防、早期干预、新药和新治疗方法的临床应用提供科学的证据支持,促进转化医学发展与科研成果转化。 欢迎有兴趣的同道与我们联系,联系方式:pumchstat@126.com。 栏目策划 北京协和医院骨科教授、博导、中心实验室副主任、实验动物管理委员会主任、骨骼畸形的遗传学研究北京市重点实验室副主任、北京市生物医学工程高精尖中心学术委员会委员、医工整合联盟副理事长、中华医学会骨科分会基础学组委员。 协和医学杂志倡导尊重和保护知识产权。欢迎转载、引用,但需取得本平台授权。如您对文章内容版权存疑,请发送邮件medj@pumch.cn,我们会与您及时沟通处理。本站内容及图片仅供参考、学习使用,不为盈利且不作为诊断、医疗根据。