首页 文章 个人博客 基于机器学习的灾害救援损害评估

基于机器学习的灾害救援损害评估

发布时间:2021-09-22编辑:RainNight阅读(73)

地震、飓风和洪水等自然灾害影响大片地区和数百万人,但应对此类灾害是一项巨大的后勤挑战。危机响应者,包括政府、非政府组织和联合国组织,需要在灾难发生后快速获得全面和准确的评估,以规划如何最好地分配有限的资源。为此,超高分辨率 (VHR) 卫星图像,高达0.3 米分辨率正成为危机响应中越来越重要的工具,为响应者提供了前所未有的关于地形、基础设施和人口如何因灾害而变化的视觉信息。

然而,仍然需要大量的体力劳动才能从原始卫星图像中提取与运营相关的信息——倒塌的建筑物、桥梁的裂缝、人们设立临时避难所的地方。例如,对于 2010 年海地地震,分析人员仅在太子港地区就手动检查了 90,000 多座建筑物,并以五分制对每座建筑物造成的损坏进行了评级。许多手动分析需要专家团队数周才能完成,而最需要的是在灾难发生后 48-72 小时内做出最紧急的决定。

为了帮助减轻此类灾难的影响,我们提出了“使用卷积神经网络在卫星图像中进行建筑物损坏检测”,其中详细介绍了自动处理卫星数据以生成建筑物损坏评估的机器学习 (ML) 方法。我们与联合国世界粮食计划署 ​​(WFP) 创新加速器合作开发,我们相信这项工作有可能大大减少时间以及危机工作人员制作损失评估报告所需的努力。反过来,这将减少向受灾最严重的地区及时提供灾害援助所需的周转时间,同时增加此类关键服务的整体覆盖范围。

方法

自动损坏评估过程分为两个步骤:建筑物检测和损坏分类。在建筑物检测步骤中,我们的方法使用对象检测模型在图像中的每个建筑物周围绘制边界框。然后,我们提取以每个检测到的建筑物为中心的灾前和灾后图像,并使用分类模型来确定建筑物是否损坏。

file

分类模型由一个卷积神经网络组成,其中输入两个 161 像素 x 161 像素的 RGB 图像,对应于 50 mx 50 m 的地面足迹,以给定的建筑物为中心。一张图片是灾前,另一张是灾后。该模型分析两幅图像的差异并输出 0.0 到 1.0 的分数,其中 0.0 表示建筑物未损坏,1.0 表示建筑物损坏。

因为前后图像是在不同日期、一天中的不同时间拍摄的,并且在某些情况下是由不同的卫星拍摄的,所以可能会出现许多不同的问题。例如,图像的亮度、对比度、色彩饱和度和光照条件可能存在显着差异,并且图像中的像素可能未对齐。

为了校正颜色和光照的差异,我们使用直方图均衡化对前后图像中的颜色进行归一化。我们还通过在训练期间使用标准数据增强技术(例如随机扰动图像的对比度和饱和度)使模型对微不足道的颜色差异更加鲁棒。

训练数据

这项工作的主要挑战之一是组装训练数据集。此应用程序中的数据可用性本质上是有限的,因为只有少数灾害具有高分辨率卫星图像,而具有现有损害评估的灾害数量更少。对于标签,我们使用由在该领域运营的人道主义组织手动生成的公开可用的损害评估,例如UNOSAT和REACH。我们获取进行人工评估的原始卫星图像,然后使用Google Earth Engine在空间上将损坏评估标签与卫星图像连接起来,以生成最终的训练示例。用于训练模型的所有图像均来自商业来源。

file

结果

我们针对过去发生的 3 次大地震评估了该技术:2010 年海地地震(7.0 级)、2017 年墨西哥城地震(7.1 级)以及 2018 年印度尼西亚发生的系列地震(5.9 - 7.5 级)。对于每个事件,我们在受地震影响的地区的建筑物上训练模型,并在该地区的另一部分的建筑物上对其进行测试。我们使用由 UNOSAT 和 REACH 执行的人类专家损害评估作为评估的基本事实。我们使用真实准确度(与专家评估相比)和ROC曲线下面积(AUROC)来衡量模型的质量,该曲线捕获模型的真阳性率和假阳性率之间的权衡当测试数据集中的正负示例数量不平衡时,这是一种衡量质量的常用方法。AUROC 值为 0.5 意味着模型的预测是随机的,而值为 1.0 意味着模型非常准确。根据危机响应者的反馈,70% 的准确率是在灾难发生后的前 72 小时内做出高层决策所需的阈值。

下面积

事件 准确性 ROC曲线

2010年海地地震 77% 0.83

2017年墨西哥城地震 71% 0.79

2018年印度尼西亚地震 78% 0.86

file

未来的工作

虽然当前模型在对来自同一地区(例如,同一城市或国家)的建筑物进行训练和测试时运行得相当好,但最终目标是拥有一个模型,可以准确评估发生在世界任何地方的灾害的建筑物损坏,并且不仅仅是那些看起来与模型训练过的那些相似的。这是具有挑战性的,因为过去灾难的可用训练数据的多样性本质上仅限于发生在少数几个地理位置的少数事件。因此,将可能发生在新地点的未来灾难推广到我们的模型仍然是一个挑战,也是正在进行的工作的重点。我们设想了一个可以交互式训练、验证、并由专家分析员部署,以便重要的援助分配决策始终由经验丰富的危机响应人员进行验证。我们希望这项技术可以帮助社区在最迫切需要的时候及时获得所需的援助。

网盘推荐

微信公众号

书籍标签