“用望远镜观测太空已经过时”,这话虽然略有夸张,但不无道理——对许多天文学家来说,现在研究的第一步不是“看到”,而是“计算”。如今,天文学家已经更多利用网络来调度观测,远程控制位于沙漠或偏远地区的望远镜,下载相关的观察结果,然后利用计算机进行分析。
不仅仅是天文学,生物信息学、计算语言学以及粒子物理学等学科,从某种程度上,都依赖于通过计算模拟对世界进行建模,并对观测数据进行探索分析——今天的科学正在发生以数据为驱动的深刻转变。
17世纪的科学是经验主义科学。其时,大家普遍认为人类可以用感官来收集尽可能多的数据,通过这些数据最终了解整个世界。基于此,科学发现具有偶然性也被大家广泛接受。但科学发展、新科学仪器的使用,让科研数据量呈几何级数增长。这种情况让以往的经验变得不再适用——仅靠感官,人类已经无法处理和掌握这些数据,必须利用计算机进行分析;同时,探索和挖掘数据的方式甚至能够让科学家们“计划偶然性”。以天文学为例,在寻找新的天文现象上,大数据极可能会产生意想不到的结果:天文学家邓肯·洛里默发现了快速无线电脉冲、本科生克莱·奥法发现了地球电离层中的等离子管。
当今的科学研究形式是:许多科学家一起合作,设计能够一次服务于多种项目的实验,并测试不同的假设。因此,编程、计算、统计等与计算机相关的关键技术在科学研究中变得极为重要,例如,为了设计合理的实验,选择可靠的样本,科学家需要优秀的统计学技能。为了确保数据驱动的实验和探索是严格的,科学家们需要掌握足够的统计学内容。
不仅如此,科学家还需要开发计算思维。这不仅仅是编码,科学家需要创造性地思考和编写新的算法,并且使用复杂的技术来挖掘和收集数据。即使拥有10000个核心超级计算机的强大功能,将简单的算法应用于海量数据集仍然是无效的。面对一个科研目标,从计算机科学到更复杂的技术,软件的运行速度需要提高几个数量级。
但与现实不相符的是,目前许多高中和大学的科学、技术和工程学科仍然把这些必要的技能作为次要科目。因此,我们或许应该考虑如何设计新的教学方法,将数据驱动和计算方法视为当代研究的重要工具。
目前,国外许多大学已经开设数据科学课程和学位,将统计学和计算机科学与科学或商业相结合。例如,悉尼大学副教授塔拉·墨菲推出了一个关于数据驱动的天文学在线课程,在天文学的背景下教授学生数据管理和计算机学习等技能。新的澳大利亚数字技术课程将编码和计算思维作为第二年教学大纲的一部分。这将开发学生的重要技能,下一步是将现代方法直接融入科学课堂。
半个多世纪以来,计算一直是科学的重要组成部分,数据爆炸正在使其变得更为重要。只有认真地将计算思维作为科学的一部分,才可以确保未来的创新能力,做出更多伟大的科学发现。
(本文由科学媒介中心提供 王雷编译)