集合預報毫無疑問是未來天氣和氣候預報的趨勢。集合預報的關鍵是采樣問題💎,包括對初始場不確定性和模式不確定性的采樣。初始采樣的目的是生成初始集合擾動對分析誤差的統計特征進行描述🏃♂️➡️。針對這一問題,在理論✹、方法和業務實踐上已經經歷了近半個世紀的研究和發展。沐鸣2青年研究員馮傑(第一作者)和美國國家海洋和大氣管理局科學家 Zoltan Toth(通訊作者)最新的綜述文章(Feng et al., 2024, QJRMS)重新從理論上回顧和審視了集合采樣的根本問題,並對未來集合預報的發展做了一些展望👩🦯。
一個很有趣的現象是特定階段的集合預報的主流思想和當時的預報手段及硬件條件密切相關👃🏼📝。(1)從概率預報走向集合預報。20世紀60年代早期提出的概念是概率預報,而非集合預報。其思想是通過求解Liouville方程得到變量的概率密度函數(PDF)的演化。後來由於其理論求解的困難及數值模式的發展,70年代開始才逐漸提出用預報集合表征概率分布的思想👴🏼。(2)由初始隨機擾動走向初始動力擾動。由於計算資源的限製,僅能生成有限個集合☘️,這就要求集合擾動要具有代表性。這推動了大氣系統誤差增長動力學的發展。基於動力理論生成的具有代表性的擾動替代了代表性較差的初始隨機擾動集合🖐🏿。(3)由統計預報向動力集合預報轉變◾️。集合預報提出後🪙,很多科學家嘗試在控製預報上結合歷史預報數據提取出來的變量概率信息得到預報的集合(所謂的“dressing”,見圖2)。但後來隨著數值預報模式性能和計算資源的提升,表現更好的純模式積分得到的動力集合預報成為了主導⛹️。
此研究對當今主流業務集合預報系統的采樣表現進行了評估和理論分析。得到的主要結論是即使利用流行的EnKF生成初始集合,用先進的動力模式進行集合積分🫅🏼,集合預報的內核仍然是“隨機性”。動力模式的作用是讓這些隨機性更符合大氣的物理和動力特征。主要體現在初始集合擾動的隨機性。由於“curse of dimensionality”,對高維系統的初始采樣只可能是“隨機采樣”。這並不是指集合擾動是隨機的白噪音😬,而是指高維空間通過采樣分析誤差讓擾動集合更接近真值的概率極小(如圖1)。當系統維數高於30,這種概率已經低於千分之一。動力模式在其中的作用是讓“隨機擾動”具有更符合物理的空間結構。其次,區域表現的隨機性🌩。由於2.1中的整體隨機性,區域來看,某一集合成員可能在A區域表現最好♿️,但在相鄰的B區域表現則最差👩🏽💻,這是隨機的📒。第三,時間表現的隨機性。某個成員可能在第一天的預報中是所有集合中最好的🤦♂️,但第4天🦴🧵,它就有可能是最差的🎰,這是隨機的。
AI方法和技術的發展給集合預報帶來了新的挑戰和機遇📬。集合預報框架和概念可能也需要發生轉變。比如:(1)集合預報回到概率預報🏃♂️➡️。生成模型技術的融入,可能讓集合預報再次回到以直接得到概率預報👩🏿🏭,或者簡單說是得到變量PDF為核心目標。這或許可以讓傳統的“dressing”的思想重新復活。畢竟集合只是得到概率的手段之一。(2)代表性擾動的作用減弱🈁。當機器學習模型可以快速生成成千上萬個集合預報,我們可能就不應該將初始集合擾動約束在較小的特定的子空間中,而是應該增加其可能覆蓋的子空間。這樣可以得到更多的預報可能性▪️,得到更好的概率統計特征🚣。(3)部分替代動力模型📺。大氣中較小尺度的結構需要高分辨率動力模型去識別🤵♀️🏃➡️,這裏動力模型實際上是一種有效但費時的“隨機擾動”生成器。這部分能否利用機器學習模型學習並生成值得研究🛒。
不管如何,如今機器學習模型的優秀表現讓我們重新審視集合預報的發展方向。鑒於集合預報的內核是隨機性,統計手段應當更多地融入集合預報方法中去🛥。


論文信息🧂:
Feng, J., Z. Toth, J. Zhang, and M. Pena, 2024: Ensemble forecasting: A foray of dynamics into the realm of statistics. Quart. J. Roy. Meteor. Soc., DOI: 10.1002/qj.4745