利用机器学习进行洪水预测与水位预报

利用机器学习进行洪水预测与水位预报
2022年11月16日 17:33 科技细则说

洪水是地球上最常见的自然灾害,影响着全球成千上万人的生活,每年造成约100亿美元的损失。在本周早些时候,Google宣布Google近期对洪水的预测,扩大覆盖范围达250多万人次,并提供了前所未有的交货时间,精确度和清晰度。

为了实现这些突破,Google设计了一种新的淹没建模方法,称为形态淹没模型,该方法将基于物理的建模与机器学习(ML)结合起来,以在实际环境中创建更准确和可扩展的淹没模型。此外,Google新的警报目标模型允许使用端到端机器学习模型和全球公开可用的数据,以前所未有的规模识别有洪灾风险的区域。

预测水位洪水预报系统的第一步是确定河流是否会发生洪水。

洪水预报系统的水文模型组成部分使覆盖7500万人的地区的洪水预警的前置时间增加了一倍。这些模型不仅增加了交货时间,而且还提供了空前的准确性,在Google覆盖的所有盆地中均达到99%以上,并预测90 cm内误差在15 cm范围内的水位。一旦预测到河流将达到洪水位,生成可行警告的下一步就是将河流位准预测转换为洪水泛滥将如何受到影响的预测。

形态淹没模型

Google基于卫星图像开发了高质量的高程图,并运行了基于物理的模型来模拟这些数字地形上的水流,Google现在已经将海拔图扩展到了数亿平方公里。但是,为了将覆盖范围扩大到如此大的区域,同时仍保持高精度,Google不得不重新发明如何开发淹没模型。

淹没模型估计将淹没哪些区域以及水深。该可视化从概念上显示了如何模拟淹没,如何定义风险水平(用红色和白色表示)以及如何使用模型来识别应警告的区域(绿色点)

大规模的淹没建模面临三个重大挑战。由于涉及的面积较大,并且此类模型需要分辨率,因此它们必然具有很高的计算复杂性。此外,大多数全球高程图都不包括河床测深图,这对于精确建模很重要。最后,需要理解和纠正现有数据中的错误,其中可能包括仪表测量错误,高程图中缺少特征等。要纠正此类问题,可能需要收集其他高质量数据或手动修复错误数据,但两者均无法很好地扩展。

Google的淹没建模新方法(Google称为形态模型)通过使用一些创新技巧解决了这些问题。除了实时模拟水流的复杂行为外,Google还对高程图的形态进行计算,以使人们能够使用简单的物理原理来模拟淹没。

首先,Google训练一个纯ML模型(缺乏基于物理学的信息),以根据量规测量值估算一维河流剖面。该模型将河流特定点(水位计)的水位作为输入,并输出河流轮廓,即河流中所有点的水位。Google假设,如果水位计增加,水位将单调增加,即河流其他点的水位也会增加。Google还假定河流剖面的绝对高程向下游减小(即,河流下坡)。

然后,Google使用此学习的模型和一些启发式方法来编辑高程图,以大致“抵消”如果该区域被淹没时将存在的压力梯度。此新的合成高程图为Google使用简单洪水预测模型建模洪水行为提供了基础。最后,Google将生成的淹没图与基于卫星的洪水范围与原始流量表的测量结果进行匹配。

这种方法摒弃了传统物理学模型一些现实约束,但是在现有方法当前难以解决的数据稀缺地区,其灵活性使模型可以自动学习正确的测深法并修复基于物理的模型敏感的各种错误。这种形态学模型将准确率提高了3%,可以显着改善大面积区域的预测,同时还可以通过减少对手工建模和校正的需求来加快模型开发的速度。

针对警报的定位

许多人居住在形态淹没模型未涵盖的区域,但是仍然迫切需要获得准确的预测。为了覆盖这一人群并提高洪水预报模型的影响力,Google设计了一种端对端基于ML的方法,该方法几乎使用了全球公开可用的几乎所有数据,例如水位计测量,公共卫星图像和低水位。分辨率高程图。Google训练模型以使用其接收到的数据直接实时地推断淹没图。

从实时测量到淹没的直接ML方法。

当模型仅需要预测先前观察到的事件范围内的事件时,此方法“开箱即用”效果很好。推断到更极端的条件更具挑战性。但是,正确使用现有的海拔图和实时测量值可以使警报比当前更准确的警报,这些警报未包含在更详细的形态淹没模型所覆盖的区域。由于该模型具有高度可扩展性,因此Google仅需花费几个月的工作便能在印度各地启动该模型,并且希望很快将其推广到更多国家/地区。

改进水位预报为了继续改进洪水预报,Google开发了 HydroNets —一种专门用于水位预报的专业深度神经网络体系结构,它使Google能够在实际操作中利用基于ML的水文学的一些令人振奋的设置。它的两个突出特点使其与标准水文模型有所区别。首先,它能够区分能够很好地概括站点之间的模型组件,例如降雨径流过程的建模,以及特定于给定站点的模型组件,例如评级曲线,将预测的排放量转换为预期的水位。这使模型可以很好地推广到不同的站点,同时仍然可以针对每个位置微调其性能。其次,HydroNets通过训练大型结构(实际上是由较小的神经网络组成的网络)来考虑要建模的河网的结构,每个神经网络代表沿河的不同位置。这允许对上游站点进行建模的神经网络将以嵌入形式编码的信息传递给下游站点的模型,以便每个模型都可以知道其所需的一切,而无需大幅增加参数。

下面的动画说明了HydroNets中信息的结构和流程。上游子流域建模的输出被组合成给定流域状态的单个表示。然后,它由共享模型组件处理,并由网络中的所有流域通知,然后传递给标签预测模型,后者计算水位(和损失函数)。然后,将网络迭代的输出传递给下游模型,以此类推。

HydroNets体系结构的插图。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部