导读 近十年来,慕尼黑路德维希马克西米利安大学 (LMU) 和慕尼黑工业大学 (TUM) 的研究人员促进了地球物理学家和计算机科学家之间的健康合作

近十年来,慕尼黑路德维希马克西米利安大学 (LMU) 和慕尼黑工业大学 (TUM) 的研究人员促进了地球物理学家和计算机科学家之间的健康合作,试图解决人类最可怕的问题之一。尽管近几十年来取得了进展,但研究人员在很大程度上仍无法预测地震可能发生的时间和地点。

在适当的情况下,几分钟的剧烈震动可能预示着更大的威胁——海底某些类型的地震会迅速取代大量的水,从而产生巨大的海啸,在某些情况下,这些海啸只会在几分钟内到达地震本身结束后造成严重破坏 。

不过,极端剧烈的地震并不总是会引发海啸。相对温和的地震仍有可能引发危险的海啸情况。LMU 地球物理学家决心通过更好地了解导致这些事件的基本动力学来帮助保护脆弱的沿海人口,但他们认识到来自海洋、陆地和大气传感器的数据不足以描绘整个画面。因此,该团队在 2014 年转向使用建模和仿真来更好地了解这些事件。具体来说,它开始在莱布尼茨超级计算中心 (LRZ) 使用高性能计算 (HPC) 资源,该中心是组成高斯超级计算中心 (GCS) 的三个中心之一。

“HPC 硬件的发展首先使这项工作成为可能,”LMU 教授兼该项目研究员 Alice-Agnes Gabriel 博士说。“我们需要了解大型逆冲断层系统如何工作的基本原理,因为它将帮助我们评估俯冲带的危害。目前尚不清楚哪些地质断层实际上可以产生 8 级及以上地震,以及产生海啸的最大风险。”

通过在 LRZ 多年的计算工作,该团队开发了对先前剧烈地震海啸事件的高分辨率模拟。LMU 研究人员整合了许多不同类型的观测数据,现已确定了在确定地震引发海啸的可能性方面发挥重要作用的三个主要特征——沿断层线的应力、岩石硬度和沉积层强度。LMU 团队最近在Nature Geoscience上发表了其研究结果。

过去的教训

该团队之前的工作对过去的地震海啸事件进行了建模,以测试模拟是否能够重现实际发生的情况。该团队花费了大量精力来模拟 2004 年苏门答腊-安达曼地震——这是有记录以来最猛烈的自然灾害之一,包括 9 级地震和高达 30 多米的海啸波。这场灾难造成近 100 万人死亡,并造成数十亿美元的经济损失。

模拟这样一个快速移动的复杂事件需要大量的计算能力。研究人员必须将研究区域划分为一个细粒度的计算网格,他们在其中求解方程以确定每个空间中水或地面(或两者)的物理行为,然后非常缓慢地及时推进他们的计算,以便他们可以观察如何和当发生变化时。

尽管处于计算建模工作的最前沿,但该团队在 2017 年使用了 SuperMUC 第二阶段的绝大多数,当时 LRZ 的旗舰超级计算机,并且只能以高分辨率对单个地震模拟进行建模。在此期间,该小组与TUM 的计算机科学家合作开发了一种“本地时间步进”方法,该方法实质上允许研究人员将时间密集型计算集中在快速变化的区域上,同时跳过事情发生变化的区域。在整个模拟过程中不变。通过采用这种本地时间步进方法,该团队能够在 14 小时内运行其苏门答腊-安达曼地震模拟,而不是之前需要 8 天。

该团队继续改进其代码以更高效地运行,改进输入/输出方法和节点间通信。同时,LRZ 于 2018 年安装了其下一代 SuperMUC-NG 系统,比上一代功能强大得多。结果?该团队不仅能够将地震模拟本身与构造板块运动以及岩石如何破碎和滑动的物理规律统一起来,而且还能够真实地模拟海啸波的生长和传播。Gabriel 指出,如果没有像 LRZ 那样的 HPC 资源,这些模拟都是不可能的。

“这确实是我们正在利用的硬件感知优化,”她说。“计算机科学成就对于我们推进计算地球物理学和地震科学至关重要,这些科学数据越来越丰富,但模型仍然很贫乏。随着进一步优化和硬件进步,我们可以执行尽可能多的这些场景,以允许敏感性分析找出哪些初始条件对理解大地震最有意义。”

在获得模拟数据后,研究人员开始着手了解哪些特征似乎在使这次地震具有如此破坏性方面发挥了最大作用。在确定应力、岩石硬度和沉积物强度在确定地震强度及其引发大海啸的倾向方面发挥最大作用后,该团队帮助将 HPC 纳入科学家和政府官员的跟踪、缓解和准备手册中为地震和海啸灾难向前发展。

HPC时代的紧急计算

Gabriel 表示,该团队的计算进步完全符合 HPC 社区中的一种新兴意识,即这些世界级资源需要在灾难或紧急情况下以“快速响应”的方式提供。由于与 LRZ 的长期合作,该团队能够快速模拟 2018 年尼西亚苏拉威西岛附近的帕卢地震和海啸,造成 2,000 多人死亡,并提供有关发生情况的见解。

“我们需要了解水下断层系统如何工作的基本原理,因为它将帮助我们评估它们的地震以及级联次生灾害。具体来说,帕卢地震的致命后果让科学家们完全感到惊讶,”加布里埃尔说。“我们必须拥有基于物理的 HPC 模型来进行快速响应计算,这样我们才能在发生危险事件后快速做出响应。当我们对帕卢地震进行建模时,我们已经准备好第一个数据融合模型来尝试解释在几个周。如果科学家们知道哪些地质结构可能导致地质灾害,我们可以相信这些模型中的某些模型能够为危险评估和操作危险缓解提供信息。

除了能够以略有不同的输入运行相同场景的许多排列之外,该团队还专注于利用新的人工智能和机器学习方法来帮助梳理团队在模拟过程中产生的大量数据订单有助于清理来自团队模拟的不相关且可能分散注意力的数据。

该团队还参与了 ChEESE 项目,该项目旨在为 exascale 系统或下一代系统准备成熟的 HPC 代码,每秒可进行 10 亿次计算,或者是当今最强大的超级计算机 Fugaku 的两倍以上的制度。