电脑将分析卫星图像中的道路和屋顶,确定当地的经济状况。

  研究人员让计算机学习分析白天、夜间的卫星图像以及实地调查数据。

通过夜间灯光卫星图,我们很容易判断某个国家或地区的财富。不过,夜间灯光卫星图无法告诉我们,哪些区域的居民处于极端贫困状态,而这却是决策者在实施经济发展计划中最需要的信息。

为了解决这个难题,美国斯坦福大学最近开发出一种计算机学习算法,让计算机学习分析白天、夜间的卫星图片以及实地调查数据,精确地判断出某个地区的家庭消费与资产财富。(灵犀)

据《科学》期刊报道,在一些数据难以收集或不公开的区域,国际组织将利用一个更高效的系统来判断这些地区的贫穷程度。

这个复杂的系统由美国斯坦福大学开发,研究人员创建了一个机器学习运算系统,让计算机学习侦查数百万幅卫星图像中可识别的贫困迹象(如道路或房屋),从而准确识别出一些非洲国家的经济状况。“在过去,我们通过家庭调查来收集贫困信息,如今我们可以用数据来指导我们的扶贫行动,”斯坦福大学研究员玛莎·伯克说,“而且,在往常难以收集数据的地区,这个系统将发挥大作用。”

以非洲为例,根据世界银行的数据,在21世纪第一个十年里,59个非洲国家中只有39个开展过贫困调查,而且均不多于两次;还有14个国家从未开展过任何调查,这使得外界不可能了解非洲的贫困状况。“这就要求我们发起‘数据革命’,变革收集数据的方式。”伯克指出。

 

计算机自主学习判断

 

夜间卫星图片被认为是辨别某地区是否贫困最好的方法,灯火明亮的地方往往开发程度较高。世界银行先前也用“夜间灯光”地图来测量非洲各地区的贫富情况。不过,斯坦福大学电气工程研究员奥尼尔·吉恩指出,夜间卫星图片可能存在欺骗性。“有可能贫穷人口聚集的地方反而灯火通明,而富人会选择住在人口稀少的区域”。

因此,吉恩的团队开发了一种比现有方法能更准确判断贫穷与否的机器学习运算。首先,他们将谷歌的白天卫星照片、从美国国家海洋和大气管理局拿到的夜间卫星数据以及从世界银行拿到的实地调查数据输入电脑。实地调查数据包括家庭消费支出与汽车、电视机等资产财富。

接着,吉恩用“移转学习法”训练计算机运算:先分析道路和屋顶等信息更明显的白天卫星照片,计算机会自动绘制道路、城市、水道、农地分布,根据这些信息来初步判断该地区的经济情况;接着,计算机将结合夜间卫星数据,进一步判断该地区的贫困程度;紧接着,计算机将消化实地调查数据,和之前的调查结果对照核实,比如汽车较多的地方可能就是实地调查中家庭收入更高的地方;最后,计算机将综合所有资料,配合地图作出预测,补足数据漏洞。

“只要向计算机提供足够多的数据,计算机就会找出我们想要的东西,”吉恩说,“我们拥有海量的卫星图,需要做的就是让计算机学习从这种非结构化的数据中提取有用的信息。”

 

有效节省经费和时间

 

此前也有科学家通过数据分析的方式来判断某地区是否贫困。加州大学伯克利分校的数据科学家约书亚·布拉门斯托克就曾和世界银行合作,通过分析卢旺达等国家居民的手机呼叫模式,判断贫困社区中多少居民有工作。总部位于纽约的一家非营利机构也通过矿业卫星图像来决定谁更应该拿到捐款,他们在研究中发现住在茅草屋顶下的人比住在铁皮屋顶下的人更穷。

不过,斯坦福团队的算法更全面。第一,他们使用的都是公开的数据,不需要再花费成本收集;第二,他们对一个地区是否处于贫困的判断并非单单基于计算机算法从白天的卫星照片中辨别出的一两个贫困元素。“相对于挨家挨户地进行田野调查,这个系统将有效地节省调查时间和经费,”布拉门斯托克说,“而相对于完全依靠夜间卫星图片或手机数据的调查方式,吉恩的方法更有利于准确判定哪些地区处于贫困状态。”

关于需求的准确信息将直接影响国际机构的援助方向,决定在哪些地区建设道路或医院。从更深远的层面上说,该计算机算法还能帮助国际机构在未来追踪扶贫举措是否达到效果。

 

判断准确率超过50%

 

迄今为止,在评估某些地区的家庭消费与资产财富时,这种计算机算法的准确率已经超过50%。研究人员目前正在分析尼日利亚、坦桑尼亚、乌干达、卢旺达和马拉维等5个国家的贫困程度,他们希望之后将评估范围扩大到撒哈拉以南的非洲地区,甚至所有的欠发达国家。

不过,这种计算机算法在被使用前还需要进一步提升。接下来,吉恩的团队将试图从不同分辨率的照片中提炼更多信息——从低分辨率的图片中分析出大的结构,从高分辨率的图片中找出屋顶和道路。

吉恩的团队还将着眼于某些区域过去的卫星图像,让计算机学习预测该区域未来经济可能的发展情况。“如果有一天我们能用计算机算法为这个世界建立一个模型,那就太酷了。”吉恩说。

 

 

用卫星图像识别贫困 数据不全也能做得到

图文简介

通过夜间灯光卫星图,我们很容易判断某个国家或地区的财富。不过,夜间灯光卫星图无法告诉我们,哪些区域的居民处于极端贫困状态,而这却是决策者在实施经济发展计划中最需要的信息。