新算法将运行最复杂气候模型的时间缩短了 10 倍

图片[1]-新算法将运行最复杂气候模型的时间缩短了 10 倍-DG城市
2022 年 9 月 26 日飓风伊恩的航拍图像。气候模型预测,随着气候变化,飓风将变得更加强烈。

气候模型是有史以来最复杂的软件之一,能够模拟整个系统的大量不同部分,例如大气或海洋。几十年来,数百名科学家已经开发了许多技术,并不断被添加和完善。它们可以运行超过一百万行计算机代码 – 数万个打印页面。

气候建模需要这么长时间的一个原因是,模拟的一些过程本质上是缓慢的。海洋就是一个很好的例子。水从地表循环到深海再循环需要几千年的时间(相比之下,大气的“混合时间”为数周)。

自从1970年代开发出第一个气候模型以来,科学家们就意识到这将是一个问题。要使用模型来模拟气候变化,它必须从工业化导致温室气体释放到大气中的条件开始。

为了产生这种稳定的平衡,科学家们通过让它运行直到它停止变化来“旋转”他们的模型(系统是如此复杂,以至于在现实世界中,总是存在一些波动)。

具有最小“漂移”的初始条件对于准确模拟人为因素对气候的影响至关重要。但是,由于海洋和其他缓慢的组件,即使在大型超级计算机上,这也可能需要几个月的时间。难怪气候科学家称这一瓶颈是他们所在领域的“重大挑战”之一。

不能只是把更多的计算机扔到这个问题上

你可能会问,“为什么不使用更大的机器呢?不幸的是,这无济于事。简单地说,超级计算机只是数千个单独的计算机芯片,每个芯片都有数十个处理单元(CPU或“内核”)通过高速网络相互连接。

其中一台机器我使用的内核超过 300,000 个,每秒可以执行近 20 万亿次算术运算。(显然,它是由数百名用户共享的,任何一次模拟都只会使用机器的一小部分。

气候模型通过将地球表面细分为更小的区域(子域)来利用这一点,并在不同的 CPU 上同时执行每个区域的计算。原则上,您拥有的子域越多,执行计算所需的时间就越少。

在某种程度上确实如此。问题在于,不同的子域需要“知道”相邻子域中发生的事情,这需要在芯片之间传输信息。这比现代芯片执行算术计算的速度要慢得多,计算机科学家称之为“带宽限制”。(任何试图通过缓慢的互联网连接流式传输视频的人都会知道这意味着什么。因此,将更多的计算能力投入到这个问题上的回报是递减的。海洋模型尤其受到这种糟糕的“缩放”的影响。

速度快十倍

这就是我开发并发表在《科学进展》上的新计算机算法的用武之地。它有望大大减少海洋和地球系统模型其他组成部分的旋转时间。在对典型气候模型的测试中,该算法平均比当前方法快约十倍,将时间从几个月缩短到一周。

这可以节省气候科学家的时间和精力,这本身就很有价值。但是,能够快速启动模型也意味着科学家可以根据我们所知道的现实世界中实际发生的情况来校准它们,提高其准确性,或者更好地定义其气候预测中的不确定性。旋转非常耗时,目前都不可行。

新算法还将使我们能够在更详细的空间上进行模拟。目前,海洋模型通常不会告诉我们任何关于经度和纬度宽度小于 1º 的要素(赤道处约 110 公里)的信息。但是,海洋中的许多关键现象发生在更小的尺度上——几十米到几公里——更高的空间分辨率肯定会导致更准确的气候预测,例如海平面上升、风暴潮和飓风强度。

运作方式

像许多“新”研究一样,它基于一个旧的想法,在这种情况下,这个想法可以追溯到几个世纪前的瑞士数学家莱昂哈德·欧拉。称为“序列加速”,您可以将其视为使用过去的信息来推断“更好”的未来。

在其他应用中,它被化学家和材料科学家广泛用于计算原子和分子的结构,这个问题恰好占用了世界上一半以上的超级计算资源。

当一个问题本质上是迭代的时,序列加速很有用,这正是气候模型的旋转:您将模型的输出作为模型的输入反馈。冲洗并重复,直到输出与输入相等,并且您找到了平衡溶液。

在 1960 年代,哈佛大学数学家 D.G. Anderson 想出了一种巧妙的方法,将多个先前的输出组合到一个输入中,这样您就可以以更少的重复次数获得最终解决方案。当我将他的方案应用于旋转问题时,我发现的大约少了十倍。

开发新算法是最容易的部分。让其他人使用它通常是更大的挑战。因此,英国气象局和其他气候建模中心正在尝试它。

IPCC的下一份重要报告将于2029年发布。这似乎还有很长的路要走,但考虑到开发模型和执行模拟所需的时间,准备工作已经在进行中。在一个名为“耦合模型比较项目”的国际合作的协调下,这些模拟将构成报告的基础。想到我的算法和软件可能会做出贡献,真是令人兴奋。

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容