難以捕捉的蝴蝶
(資料圖片)
世界范圍內(nèi)通行的對天氣預(yù)報的方法被稱為數(shù)值計算,采集足夠多、足夠豐富的氣象數(shù)據(jù)后,把它們代入復(fù)雜方程,得到的結(jié)果就是所謂預(yù)測,重復(fù)這個過程,預(yù)測就連續(xù)了起來。
這些方程背后是一些堅固的理論,比如流體運(yùn)動方程,熱力學(xué)方程和不同介面,氣、水、陸冰物質(zhì)能量交換方程等等,它們代表的物理、化學(xué)規(guī)律是經(jīng)過嚴(yán)密的計算和驗(yàn)證的。
但天氣預(yù)報依然做不到*的準(zhǔn)確。這種數(shù)值預(yù)測,是通過已經(jīng)發(fā)生的氣象要素的變化推測未來的趨勢,它的準(zhǔn)確程度嚴(yán)重受到觀測數(shù)據(jù)精度的影響。
更何況,隨著時間、空間尺度的變化,氣象系統(tǒng)的復(fù)雜性將會劇烈增長,分析氣象的成因時一方面會掛一漏萬,另一方面數(shù)據(jù)的誤差也會更多,這又反過來影響了預(yù)測的結(jié)果。
而當(dāng)尺度大到一定程度時,氣象會進(jìn)入一種混沌狀態(tài)。這不是比喻,氣象系統(tǒng)是典型的混沌系統(tǒng),混沌理論最早就是氣象學(xué)家在1963年提出的。
混沌系統(tǒng)意味著系統(tǒng)非常小的擾動也可能造成巨大差別的后果——它的另一個名字叫蝴蝶效應(yīng),加利福尼亞的蝴蝶扇動翅膀,德克薩斯和墨西哥灣將掀起一場風(fēng)暴。
這就要求對數(shù)值最開始的測算必須非常精確,然而我們都知道*的精確是不存在的,更何況面對如此復(fù)雜的氣象運(yùn)動,要采集的數(shù)據(jù)種類和數(shù)量實(shí)在太多。
人類對天氣的預(yù)測就像努力學(xué)習(xí)蝴蝶的翅膀同風(fēng)暴眼移動軌跡之間的關(guān)系那樣,既壯麗,有時又有些絕望,甚至還帶有一種玄奧的成分。
一面在精確度上構(gòu)建越來越復(fù)雜的函數(shù)方程組,盡可能收集更多、間隔更短的數(shù)據(jù),另一面則依賴一種近乎是“直覺”的經(jīng)驗(yàn)。
時至今日,所有的天氣預(yù)報結(jié)果依然由兩部分決定——數(shù)值計算的結(jié)果,加上預(yù)報員的判斷。天氣預(yù)報依然高度依賴人的經(jīng)驗(yàn)。
某種程度上,人類在用自己的感覺,對抗大自然的混沌。
超級計算機(jī)
因此氣象預(yù)測呈現(xiàn)出一種詭異的特質(zhì)——因?yàn)橹灰揽咳祟惖慕?jīng)驗(yàn)感覺,那么總會遇到失靈的時候,在一些極端氣候中更是如此,因?yàn)橛嘘P(guān)極端氣候的數(shù)據(jù)太過稀少,導(dǎo)致人對它無法形成連貫的經(jīng)驗(yàn)。
但隨著數(shù)值預(yù)測精度幾十年來的提升,目前的天氣預(yù)報在許多時候已可以達(dá)到相當(dāng)準(zhǔn)確的程度,中期可用性預(yù)報時效已經(jīng)接近10天,而短期的預(yù)測——比如說冷空氣什么時候到來,會降溫多少度,人類已能判斷的十分精準(zhǔn)。這是因?yàn)楸M管總體上全球的氣候環(huán)境變化是混沌的,但在許多微觀層面,比如氣團(tuán)的形成,氣壓的變化,云層運(yùn)動的軌跡,正在被越來越多的函數(shù)和公式形象而準(zhǔn)確的描述。
比如最近在京津冀肆虐的暴雨。
7月29日到8月1日,臺風(fēng)杜蘇芮帶著豐富的水汽北上,在華北遭到高壓攔截,京津冀地區(qū)出現(xiàn)了歷史罕見的極端暴雨。
極端體現(xiàn)在幾個方面,首先是量大。河北邢臺臨城縣降雨量超過1000毫米,也就是1米,等于這里原本兩年降水量的綜合。其次是時間長,從7月29日開始一直綿延了近四天,連北京都連續(xù)下了83小時的雨。河北、陜西、河南等地也連續(xù)兩天出現(xiàn)大暴雨。最后是影響范圍廣,整個華北都被陰雨籠罩。
天氣預(yù)報幾乎完全準(zhǔn)確地預(yù)告了這場極端降雨的到來。這背后是天氣預(yù)報幾十年來的巨大進(jìn)步——數(shù)值計算已經(jīng)從簡單的方程組發(fā)展成世界上最復(fù)雜的算法之一,畢竟,對莫測的天氣的捕捉,數(shù)據(jù)和算法都是越多越好,而為了處理這海量的數(shù)據(jù)和復(fù)雜的算法,超級計算機(jī)被引入。
許多人可能對氣象數(shù)據(jù)的龐大沒什么概念,在這里可以舉一個數(shù)字:每一天,中國的氣象數(shù)據(jù)增長高達(dá)40TB。我國建立的一整套立體的天氣觀測網(wǎng)絡(luò),有7萬多個氣象觀測站覆蓋全國99.6%的鄉(xiāng)鎮(zhèn),這些數(shù)據(jù)傳輸?shù)臅r間從過去的1小時近年來縮短為1分鐘。
如此巨量的數(shù)據(jù)本身處理起來就已頗有難度,而把它們同數(shù)值計算的方程結(jié)合起來,則幾乎是不可能完成的任務(wù)——復(fù)雜的偏微分方程和浮點(diǎn)計算都需要消耗大量的算力,特別是天氣預(yù)報還要求極高的時效性,種種條件約束下,只有超級計算機(jī)能夠滿足需求。
所幸,中國在這方面走在世界前列。
超算一直是一張中國名片,比如全世界最快的500臺超級計算機(jī),中國就占了162臺;再比如我過三次獲得國際超算應(yīng)用最高獎——戈登·貝爾獎,其中的兩次獲獎內(nèi)容“大氣動力框架”和“地震模擬”都和氣象有關(guān)。
目前中國使用的超算名叫“派—曙光”,它峰值運(yùn)算速度達(dá)到每秒8189.5萬億次,存儲能力達(dá)到23088TB,這套完全國產(chǎn)的超算2018年開始服務(wù)后,我國高性能計算機(jī)系統(tǒng)總體規(guī)模已經(jīng)躍居氣象領(lǐng)域世界第三位。
這還不算完,隨著數(shù)據(jù)量快速增長和硬件的磨損,超算的服役年限多在6到8年,因此在“派—曙光”之后,新的超算也在陸續(xù)上馬,今年*批新國家級高性能計算(HPC)子系統(tǒng)1已經(jīng)安裝建設(shè)完成,它的性能相比“派—曙光”進(jìn)一步提升,達(dá)到13PFlops,儲存能力也增長到了76PB。
更多的超算還在路上。
國產(chǎn)高性能計算機(jī)系統(tǒng)“派—曙光”概念圖,圖片來自國家氣象信息中心。
“停滯”與新路
總的來說,成百上千顆CPU組成的超算構(gòu)成了天氣預(yù)報堅實(shí)的基礎(chǔ),但它仍有不能做到、或者很難做到的事情。
比如臺風(fēng)。我們對臺風(fēng)杜蘇芮的預(yù)測,遠(yuǎn)沒有達(dá)到對特大暴雨預(yù)測的精準(zhǔn)程度。國際上主流的臺風(fēng)預(yù)測方式均采用了動力模型,它根據(jù)大氣物理定律,包括流體動力學(xué)和熱力學(xué)等來模擬大氣運(yùn)動,進(jìn)而預(yù)測臺風(fēng)的變化。
動力模型有許多不準(zhǔn)確之處,這讓大家一開始對杜蘇芮的路徑預(yù)測五花八門,這個領(lǐng)域公認(rèn)比較權(quán)威準(zhǔn)確的歐洲中期天氣預(yù)報中心一度認(rèn)為杜蘇芮會直沖珠三角。
事實(shí)上,臺風(fēng)預(yù)報一直是個世界性難題,因?yàn)榕_風(fēng)在很短時間內(nèi)可以發(fā)生劇烈的強(qiáng)度變化,而它的路徑又由于處于非常大的時空尺度上,受多種因素影響而顯得變幻莫測。
它是一個典型的混沌系統(tǒng)。
由此數(shù)值預(yù)測為主的天氣預(yù)報成為了一種矛盾的綜合體,這讓它能提升的空間盡管巨大,但又十分受限——人們逼近準(zhǔn)確性的方法除了積累經(jīng)驗(yàn),只有盡可能多地收集數(shù)據(jù)和構(gòu)建越來越復(fù)雜的函數(shù),但它的邊際效益正在越來越強(qiáng)的顯現(xiàn),更多的數(shù)據(jù)并不能大幅度、全面地提升天氣預(yù)報在宏觀和微觀尺度上的準(zhǔn)確性,而通用計算的成本卻在持續(xù)增長。
到此處,情況仿佛陷入了一個僵局。海量數(shù)據(jù),復(fù)雜算法以及高算力需求,讓數(shù)值計算某種程度上走向瓶頸,但這三個條件看上去是不是有點(diǎn)眼熟?
似乎有點(diǎn)像大模型的三個要素?
實(shí)際上,在品玩看到的某個氣象技術(shù)內(nèi)部研討會資料上,有專家直接宣稱:人工智能和氣象工作在方法論上是相通的。
既然數(shù)值計算的公式實(shí)際上并不能窮盡整個混沌系統(tǒng)里的所有因果,為什么不用神經(jīng)網(wǎng)絡(luò)的方法,把海量的數(shù)據(jù)導(dǎo)入其中,讓計算機(jī)自己來尋找和學(xué)習(xí)其中的規(guī)律?
這看上去像是一種不可言說,又異常玄妙合理的解釋。
人類的*臺電子計算機(jī)ENIAC埃尼阿克和*臺根據(jù)馮·諾依曼結(jié)構(gòu)打造的計算機(jī)EDSAC實(shí)際上都用來進(jìn)行過氣象學(xué)相關(guān)的科學(xué)計算,氣象學(xué)的發(fā)展始終和計算機(jī)科學(xué)的進(jìn)步緊密連接——高性能計算推動了氣象科學(xué)的復(fù)雜問題的解決,而跳出通用計算的思路后,神經(jīng)網(wǎng)絡(luò)和大模型看上去是氣象學(xué)和天氣預(yù)報的一個非常有趣且合情合理的方向。
實(shí)際上,這次對杜蘇芮臺風(fēng)軌跡的預(yù)測,中央氣象臺就參考了人工智能大模型的結(jié)果。
另辟蹊徑
氣象大模型并不是隨著去年底生成式AI的火爆才出現(xiàn)的,一直以來利用強(qiáng)大算力、巨量數(shù)據(jù)和各種深度學(xué)習(xí)架構(gòu)來預(yù)測天氣的大模型就有很多,在國外比較有名的有英偉達(dá)FourCastNet,DeepMind和谷歌的GraphCast以及微軟的ClimaX,國內(nèi)最近出圈的則是華為盤古大模型和上海風(fēng)烏大模型,后者來自上海人工智能實(shí)驗(yàn)室。
盤古和風(fēng)烏都使用了歐洲氣象中心名為ERA5的氣象再分析數(shù)據(jù)集,它提供了過往60余年,覆蓋地表37個等壓面的各種氣象數(shù)據(jù)共2000TB。
這些數(shù)據(jù)給大模型提供了發(fā)揮的空間——不再使用精準(zhǔn)對應(yīng)的數(shù)值計算,而是讓AI更靈活地去挖掘數(shù)據(jù)之間的各種復(fù)雜關(guān)系。
盤古構(gòu)建了一個3D transformer 結(jié)構(gòu),讓海洋、大氣和陸地的復(fù)雜交互物理過程融為一體,而過往的氣候大模型,比如英偉達(dá)的FourCastNet則都采用的2D結(jié)構(gòu)——每個等壓面為一層,顯然,2D平面沒有辦法更好反應(yīng)氣象變化的過程。
根據(jù)品玩看到的材料,華為在這個3D 結(jié)構(gòu)中使用了*位置編碼,由此明顯加速了模型的收斂,此外,華為訓(xùn)練了四個基礎(chǔ)模型分別對應(yīng)1小時、3小時、6小時和24小時的預(yù)測,通過時域融合的方法顯著減少了過往模型中由于小步長、多次迭代造成的誤差。
對于預(yù)測老大難臺風(fēng),盤古使用了平均海平面氣壓作為預(yù)測基準(zhǔn),其結(jié)果比歐洲氣象局更好。
風(fēng)烏大模型的思路則是用6個獨(dú)立的編碼器對不同的氣象參數(shù)(濕度、風(fēng)、溫度等)進(jìn)行編碼解碼,不同變量之間用獨(dú)立的transformer網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。
同華為時域融合減少誤差的方式不同,風(fēng)烏設(shè)計了一個緩存空間用來儲存和回放訓(xùn)練過程中的結(jié)果,以讓神經(jīng)網(wǎng)絡(luò)適應(yīng)其誤差,從而實(shí)現(xiàn)了更好的預(yù)測效果。
這些新的氣象大模型預(yù)測的效果,盡管目前的成果還很初步,公布的成績也是在一些具體指標(biāo)上好于傳統(tǒng)數(shù)值預(yù)測方法,尚需全面的測試和優(yōu)化,但毋庸置疑它們代表了一種迥然不同于傳統(tǒng)氣象預(yù)測的新范式。
目前,華為的盤古大模型已經(jīng)在歐洲中期天氣預(yù)報中心實(shí)現(xiàn)了初步業(yè)務(wù)運(yùn)行,而風(fēng)烏則宣稱是目前最精準(zhǔn)的全球高分辨率AI氣象預(yù)報模型,提前24小時對杜蘇芮預(yù)測的誤差值為38.7公里,精確度優(yōu)于歐洲中期氣象預(yù)報中心的54.11公里。
漫漫前路
變革即將來臨。氣象大模型在許多方面都很有可能顛覆氣象預(yù)報模式,比如說速度。風(fēng)烏用一張GPU在1分鐘內(nèi)就能生成未來14天全球所有地區(qū)37個層級高精度高分辨率氣象預(yù)報結(jié)果,而盤古的7天天氣預(yù)報生成時間只需要9.8秒。
為數(shù)值計算所建立的實(shí)時天氣數(shù)據(jù)傳輸系統(tǒng)和通用算力基礎(chǔ)設(shè)施將會因此改變。根據(jù)品玩了解到的氣象局內(nèi)部人士觀點(diǎn)認(rèn)為,盡管短期內(nèi)還僅僅作為一種預(yù)報參考,但中長期看,氣象大模型潛力無疑十分巨大。
現(xiàn)在,這些氣象大模型主要面對的問題或許有兩個方面,首先是調(diào)優(yōu)。極端氣候等數(shù)據(jù)如何在大模型中被正確標(biāo)注是一個問題,AI模型的擬合能力很強(qiáng),因此在長期預(yù)報中有可能出現(xiàn)錯誤,這或許可以稱之為氣象大模型的“幻覺”。
另外,目前的大模型還沒有更深的行業(yè) know how 儲備,模型的構(gòu)建都由計算機(jī)科學(xué)家,而不是氣象專家完成,也就是說這些垂直大模型還缺乏“人類反饋”調(diào)優(yōu)。
另一個問題則是老生常談的算力,雖然我國在超級計算機(jī)發(fā)展方面位居世界前列,但大模型所使用的并不是傳統(tǒng)超級計算機(jī)的通用算力,深度網(wǎng)絡(luò)的運(yùn)行需要大規(guī)模的并行計算,也就是高性能GPU,在這方面我們?nèi)蕴幱诳ú弊訝顟B(tài)。
所幸氣象大模型所直接涉及的算力成本并不高,根據(jù)品玩了解到的情況,幾十張英偉達(dá)顯卡(甚至不需要*進(jìn)型號)就可以在幾周,至多2個月的時間內(nèi)完成模型的訓(xùn)練。這也成為它相較于傳統(tǒng)數(shù)值預(yù)測模式的一個優(yōu)勢。
在氣象大模型加持下,“天有不測風(fēng)云”這句話或許很快將成為一個偽命題,而有一天,或許我們真的可以同時預(yù)測那扇動的蝴蝶與狂暴的颶風(fēng)究竟來自何處,又要去往何方。
相關(guān)推薦
- (2023-08-14)有了超算和大模型,就能預(yù)測任何一場氣象災(zāi)害了?
- (2023-08-14)沒人要了?消息人士:熱刺方面否認(rèn)了對盧卡庫的興趣
- (2023-08-14)與“地表最強(qiáng)遛娃神車”的0距離接觸 TA們秒被圈粉
- (2023-08-14)創(chuàng)業(yè)板指跌幅擴(kuò)大至2% 寧德時代跌超4%
- (2023-08-14)午評:三大指數(shù)均跌超1% 汽車、房地產(chǎn)板塊領(lǐng)跌
- (2023-08-14)濰縣署中寄舍弟墨第一書主旨(濰縣署中寄舍弟墨第一書)
- (2023-08-14)價格崩了!Corsair光速艦隊(duì)MP600 Pro NH固態(tài)硬盤到手價7319
- (2023-08-14)小米紅米Note 12最常見問題的解答
- (2023-08-14)今年上半年冷鏈物流持續(xù)企穩(wěn)回升 支持行業(yè)發(fā)展的積極因素不斷增多
- (2023-08-14)世博如意金條價格今天多少一克(2023年08月14日)
- (2023-08-14)廣佛肇東高速興業(yè)收費(fèi)站西行出口開通
- (2023-08-14)A股汽車整車板塊震蕩走低,長安汽車跌近7%
- (2023-08-14)知識產(chǎn)權(quán)保護(hù)概念震蕩走強(qiáng) 安妮股份漲停
- (2023-08-14)中際旭創(chuàng):AI大客戶已明確提出1.6T光模塊的需求
- (2023-08-14)《GT賽車:極速狂飆》曝導(dǎo)演特輯 大銀幕體驗(yàn)人車合一的震撼視聽
- (2023-08-14)金龍魚大跌超10% 股價創(chuàng)上市新低
- (2023-08-14)麥玲玲:楊偲泳命帶“紅艷煞”,感情方面變化波折較多
- (2023-08-14)綿竹云蓋村:“煙火氣”催開“民宿花” 實(shí)現(xiàn)生態(tài)與經(jīng)濟(jì)效益“雙豐收”—中國新聞網(wǎng)·四川新聞
- (2023-08-14)汾陽:2023酒博會籌備工作有序推進(jìn) 精彩值得期待
- (2023-08-14)【楚天評】東湖評論:以東坡廟會出圈推動文旅融合發(fā)展出彩
- (2023-08-14)杭州亞運(yùn)會迎來倒計時40天 來看體育場路上的體育風(fēng)景
- (2023-08-14)景點(diǎn)及旅游板塊異動拉升 桂林旅游漲超5%
- (2023-08-14)2023世界機(jī)器人大會即將舉辦 相關(guān)股
- (2023-08-14)廣州浪奇剝離日化業(yè)務(wù) 轉(zhuǎn)投文創(chuàng)園區(qū)運(yùn)營能否改善公司業(yè)績?
- (2023-08-14)大白菜u盤裝系統(tǒng)教程 大白菜u盤裝系統(tǒng)官網(wǎng)
- (2023-08-14)年輕人互開特產(chǎn)“盲盒” 驚喜還是驚嚇
- (2023-08-14)興證全球品質(zhì)甄選混合基金擬任基金經(jīng)理葉峰:現(xiàn)在或許是做投資最好的時點(diǎn)
- (2023-08-14)興縣探索“1234”新模式 打造村改社區(qū)“興”格局
- (2023-08-14)8月14日滬深公司公告及相關(guān)利好、利空消息一覽
- (2023-08-14)國產(chǎn)半導(dǎo)體設(shè)備嶄露頭角 全年訂單有望穩(wěn)步增長
每日推薦
- ETF聯(lián)接基金是什么意思?ETF基金和ETF聯(lián)
- 貨幣基金的收益高嗎?貨幣基金一般年收益
- 基金賣出了怎么還有收益顯示?基金已經(jīng)贖
- 投資的基金買了幾天可以賣掉?基金入手多
- 基金終于回本了該不該贖回?基金終于回本
- 二月出境復(fù)飛航線超40條 節(jié)后部分機(jī)票價
- 重大事項(xiàng)變更!網(wǎng)易寶獲批增加注冊資本至
- 信達(dá)證券上市首日漲幅44%
- 總投資約486億元 北京今年首批50個重大
- 新年北京首月二手住宅網(wǎng)簽量再探底 價格
- 股價大漲 博云新材股東高創(chuàng)投擬趁機(jī)減持
- 2019華人歌曲音樂盛典在澳門舉行
- 喜迎十九大?歡度中秋節(jié)—傳統(tǒng)文化進(jìn)社區(qū)
- 突發(fā)!吳敏霞夫婦挑婚戒被曝光!兩百萬鉆
- 《鐘山說事》 熱點(diǎn)聚焦:胡鵬飛的最美鄉(xiāng)
- 湖南御福天益生物公司被指涉嫌傳銷進(jìn)行非
- 大同市城投公司劉建婷遭群眾舉報
- 魯能集團(tuán) “一帶一路”履責(zé)行動暨“海南
圖片新聞
48小時頻道點(diǎn)擊排行
-
0
1有了超算和大模型,就能預(yù)測任何一場 -
0
2濰縣署中寄舍弟墨第一書主旨(濰縣署 -
0
3今年上半年冷鏈物流持續(xù)企穩(wěn)回升 支 -
0
4《GT賽車:極速狂飆》曝導(dǎo)演特輯 大 -
0
5綿竹云蓋村:“煙火氣”催開“民宿花 -
0
6杭州亞運(yùn)會迎來倒計時40天 來看體育 -
0
7年輕人互開特產(chǎn)“盲盒” 驚喜還是驚 -
0
8助力涿州災(zāi)后心理援助 -
0
9茶咖出海:倫敦喜茶排隊(duì)7小時,庫迪 -
0
10湖北宜昌:三峽秭歸旅游港換乘中心即 -
0
11花都網(wǎng)絡(luò)推廣 花都網(wǎng)絡(luò)公司 -
0
12傻妞歸來演員表(關(guān)于傻妞歸來演員表 -
0
13蔣家城遺址(關(guān)于蔣家城遺址簡述) -
0
14大眾汽車雖然品牌好,但七速雙離合真 -
0
15今年秋天流行的裙子更長更漂亮,選擇 -
0
16莊河防汛應(yīng)急響應(yīng)提升至Ⅱ級 -
0
17太湖縣多措并舉推進(jìn)藥品集采落地惠民 -
0
18欠房租房東換鎖是否犯法 -
0
19認(rèn)購書的定金退還技巧(認(rèn)購書) -
0
20歌頌?zāi)笎鄣拿浴窘?jīng)典10篇】