随着新兴网络信息技术的迅速崛起,特别是大数据和云技术的应用带来了一场关于疾病预防控制策略和手段的革命。这就对传统公共卫生工作提出了新挑战。传统传染病研究基于时间、空间和人间的“三间分布”,侧重于时间、空间、人群、疾病四个维度的结构化数据;而大数据的疾病研究则是多维的,其数据构成也是多样的,包括结构化、半结构化和非结构化数据。传统的疾病预测要求数据准确,侧重于事物发展的因果性;而大数据的预测允许不准确,侧重于事物之间的相关性。我们可以利用疾病大数据,分析和预测传染病的传播状况;通过对社会、经济、环境、居民生活方式和行为模式大数据的研究,有效评估人群健康状况,应对健康风险。

今天,大数据的思维已经在公共卫生领域扎根萌芽。我省区域性健康大数据收集和研究工作已经开展。通过12年的建设,以法定传染病网络直报系统为核心业务的26个疾控业务信息系统实现了疾病的监测和报告。随着卫生信息化水平的不断提高,业务需求的不断增长,从2014年开始,山西省疾病预防控制中心建成了全国较为先进的省级疾控信息平台中心机房,大大提升了系统的安全性。建成了覆盖全省的免疫规划信息系统、食源性疾病监测系统、卫生应急作业平台,开展了疾控信息网络舆情监测工作。2016年,中心建成了数据交换平台,实现了人口数据与免疫规划等数据的共享与交换。通过利用基于无线及物联网、传感器技术的可穿戴健康设备,以及职业病体检信息系统,我省已经开展收集职业人群健康数据的工作。目前,我省疾病预防控制信息系统已经存储了几千万条传染病、慢性病、肿瘤、死亡、食源性疾病、预防接种等个案信息、以实验室为基础的生物与环境信息、以组织机构为基础的管理信息,这些数据为全省疾病防控、研究工作提供了基础资料和决策依据。我省重点传染病如麻疹、布病、肺结核、乙型肝炎、手足口病的发病率呈逐年下降趋势。

“没有全民健康,就没有全面小康。”健康“蓝海”的入口在哪里?各界专家和学者不约而同的想到了大数据。据麦肯锡预测,未来中国大数据产品的潜在市场规模有望达到1.57万亿元,全球科技巨头都在潜心研发基于大数据的人工智慧。企业参与大数据争夺的趋势愈演愈烈。但思路大多局限在数据之“大”,却忽视数据之“真”。没有公共卫生和医疗的基础数据,健康大数据就无从谈起。如何获得真正具有价值的数据,如何开展大数据分析并对发现的相关性建立模型,然后再探索发掘出具有创造性的运行模式,将医疗价值从治疗为主转向预防为主,这才是卫生和健康大数据研究运用的目标。

我省疾控领域正在规划整合信息系统,建设统一疾病预防控制信息平台。以地理信息为基础,进一步拓展数据收集渠道,通过对区域性环境、季候、气象、河流、水质、食品、交通、通讯、人口、基因、生物样本、疾病和治疗、药物、媒介等多源大数据分析,探索之间的相关性。并以数据的相关性为基础,寻找经常出现的模式,研究相应的模型和算法。为疾病的筛选、诊断、预防、控制以及治疗提供较为准确和可靠的预测方法、决策依据,对病患个体提供较为精确的治疗方案。

通过对与健康和医学相关的大数据进行分析和研究,未来疾病预防控制应当实现对疾病的可靠预测,并对疾病的精确防控和智慧医疗提供辅助甚至指导的作用,为人民健康谋福祉,推进健康中国的建设。

(作者:山西省疾病预防控制中心主任 陈利民)

运用大数据探索健康的“蓝海”

图文简介