?

國家自然科學基金大氣科學學科二級申請代碼下設研究方向與關鍵詞解讀:D0510 大氣數據與信息技術

2023-03-14 08:33黃小猛鄭飛楊犇穆斌周勇羅京佳
大氣科學 2023年1期
關鍵詞:代碼大氣方向

黃小猛 鄭飛 楊犇 穆斌 周勇 羅京佳

1 清華大學地球系統科學系, 北京 100084

2 中國科學院大氣物理研究所, 北京 100029

3 南京大學大氣科學學院, 南京 210023

4 同濟大學軟件學院, 上海 200092

5 中國氣象局氣象發展與規劃院, 北京 100081

6 南京信息工程大學大氣科學學院, 南京 210044

1 引言

2021 年以來,作為國家自然科學基金委員會(簡稱自然科學基金委)的改革試點,根據“源于知識體系邏輯結構、促進知識與應用融通、突出學科交叉融合”的原則,對接地球科學部倡議的“宜居地球”頂層戰略,堅持“問題導向”,大氣科學學科(簡稱大氣學科)進行了資助布局改革。大氣數據與信息技術研究是發展大氣科學的重要“支撐技術”,為了促進科技創新、落實改革要求、優化學科布局,自然科學基金委對“D0510 大氣數據與信息技術”(簡稱D0510)的研究方向及關鍵詞進行了優化調整,重點提高了申請代碼的包容性和覆蓋面,強調“卡脖子”關鍵技術和潛在“顛覆性”引領技術的創新(劉哲等, 2020)。

本文對新編D0510 研究方向及關鍵詞進行解讀,旨在幫助相關領域科研人員選報項目、開展合作,共同致力于大氣數據與信息技術學科方向新技術新方法的研究,激勵原始創新,拓展科學前沿,促進交叉融合,對接國家需求。

2 大氣數據與信息技術學科的重要性與發展機遇

近些年來,在衛星/雷達觀測、超級計算、云計算和物聯網等信息技術的推動下,大氣數據呈現爆炸式增長,數據資源的內涵不斷豐富、外延不斷拓展,數據向精細化、體系化、集約化、智能化發展的趨勢日益明顯。2022 年4 月,國務院印發的《氣象高質量發展綱要(2022~2035 年)》中提出“加強人工智能、大數據、量子計算與氣象深度融合應用”,為大氣學科未來發展指明了方向(國務院, 2022)。

數據、算法和算力是大氣數據與信息技術研究的三條主線。當前,數據研究的重點是如何提高數據資源的共享訪問和服務能力,如歐洲中期天氣預報中心(ECMWF)正在推動“數字孿生地球”建設,開發高精度地球數字模型,為用戶提供高質量數據服務;美國國家海洋和大氣管理局(NOAA)啟動大數據項目(Big Data Project),與Amazon、Microsoft 和Google 等云服務提供商合作將關鍵數據存儲在云中,無需進一步分發即可直接在數據上進行計算。算法的研究重點是如何開展人工智能技術在天氣預報、氣候預測、仿真研究和圖像識別與處理等領域的應用,如NOAA 出臺人工智能戰略、ECMWF 加快開展“全工作流”人工智能應用等。算力的研究重點是如何提高各種類型計算設備和器件運行氣象軟件的效能。當前,國家大力推進高速泛在、天地一體、集成互聯、安全高效的信息基礎設施建設(新華社, 2021),緩解我國科學研究面臨的數據和算力瓶頸,必將推動大氣數據與信息技術邁向新高峰。

大氣數據與信息技術研究呈現五大趨勢。一是學科交叉融合更加緊密。大氣科學與信息技術、自然科學與社會科學為學科發展開創了新空間, 在科技創新和產業升級中的提效增能作用廣受學術界和企業界認同(Faghmous and Kumar, 2014; Guo et al.,2016; Baumann et al., 2016; Ford et al., 2016; Bracco et al., 2018; Reichstein M et al., 2019; Ham et al.,2019)。二是知識與應用融通更加廣泛。大數據、云計算和人工智能等技術,使大氣數據在“生命安全、生產發展、生活富裕、生態良好”各領域應用不斷推陳出新。三是支撐學科發展的資源更加豐富。國家“基建”將促進數據中心、超算中心等國家信息基礎設施的建設,為大氣學科發展提供更加豐富的計算、存儲和數據資源。四是科技焦點更加清晰。人工智能已明顯成為跨學科、跨領域的研究焦點,而且在今后若干年內還會保持這一態勢(Hsu et al.,2014; Apte et al., 2017; Jiang et al., 2018)。五是潛在顛覆技術涌現。雖然還處于探索性研究階段,但量子計算技術無疑會對大氣科學帶來巨大影響,需要積極開展前瞻性研究(Gourianov et al., 2022)。在當前日益復雜的國際背景下,提升大氣數據與信息技術自主創新能力尤為重要,自然科學基金委對此給予了充分重視(國家自然科學基金委員會,2019a, 2019b; 劉哲等, 2021)。

新型信息技術可對大氣科學大數據進行更加集中和智能化地處理分析,通過這一過程發掘大氣數據中的潛在信息,使得大氣數據的處理更加科學化。一方面新型信息技術需要大量數據作為基礎,另一方面大數據也需要新型信息技術和顛覆性技術進行數據價值化操作,兩者相輔相成。而我國大氣數據存在質量參差不齊、時空一致性較差、數據標簽滯后、數據實時性不足等問題,利用大氣數據和信息技術創新大氣科學研究在數據、算法和算力方面依然面臨嚴峻挑戰。

3 大氣數據與信息技術研究方向與關鍵詞的構成及內涵

依據現階段大氣學科申請代碼設置的“支撐技術”板塊,D0510 作為其中的“數據技術”鼓勵先進技術與方法的創新,服務于大氣學科基礎理論與技術的發展。該方向不僅包括傳統的大氣數據分析技術,更強調在大氣數據處理分析中利用大數據和人工智能等新興技術(郭華東等, 2014)。因此,如表1 所示,D0510 目前下設四個研究方向:多源數據融合與再分析、大氣數據分析、人工智能與大氣科學大數據、新型信息技術發展與應用。

表1 大氣數據與信息技術(申請代碼D0510)研究方向及關鍵詞Table 1 Research directions and keywords for D0510 atmospheric data and information technology

3.1 研究方向結構框架

在D0510 的四個研究方向中,多源數據融合與再分析研究方向主要側重發展大氣再分析資料和數據產品的核心技術與方法,支撐國產數據研制。大氣數據分析研究方向包容傳統方向,側重基于現代統計學的手段和方法,用于對于不同時空尺度和多變量數據的分析。人工智能與大氣科學大數據研究方向覆蓋深度學習、因果推斷等新興技術,實現對大氣科學大數據的深度挖掘。新型信息技術發展與應用研究方向側重于突破關鍵技術,特別是具有“超前”意義的未來技術,在大氣科學數據分析和預報中實現落地應用。D0510 主要引導廣大科研人員開展學科交叉融合和原創性研究,形成具有中國自主知識產權的新型支撐技術和方法。

3.2 研究方向1——多源數據融合與再分析

D0510 下設的第一個研究方向“多源數據融合與再分析”主要是針對大氣多源數據的有效整合和實際應用開展研究。依照來源和整合方法,該研究方向主要包括了大氣多源數據、多源數據融合與反演、數據同化、和數據誤差分析四方面的關鍵詞。大氣多源數據包含的關鍵詞有基準氣象數據、遙感數據產品和再分析資料三類,囊括針對這三類大氣主要數據開展的研究;多源數據融合與反演包含的關鍵詞有資料融合、數據反演、多維時空數據建模、降尺度和遙感反演,側重于多源大氣數據的融合方法和遙感等數據的反演方法;數據同化包含的關鍵詞有最優插值、變分同化、卡爾曼濾波和集合同化,包含了目前大氣數據同化領域主流的一些同化方法及其應用研究;數據誤差分析則是針對以上三方面的研究內容,從質量控制、誤差溯源和偏差訂正角度來保證大氣多源數據質量并開展相應的研究,同時針對大氣數據的長期一致性和不確定性等開展均一化、不確定性分析以及相關的評估分析。多源數據融合與再分析將大氣基礎數據、融合與同化方法和誤差分析等研究內容有機結合,各研究內容之間相輔相成,為D0510 其它三個研究方向提供基礎的國產數據支撐。

3.3 研究方向2——大氣數據分析

D0510 下設的第二個研究方向“大氣數據分析”主要是基于現代統計學的手段和方法,對多圈層、多時空尺度和多變量大氣科學數據進行分析,提高對天氣—氣候過程與機理的認知。依照分析對象和分析方法,該研究方向主要包括了大氣科學的研究對象、關鍵科學問題、研究手段和方法三個方面。其中,研究對象包含氣象災害、氣候變化、空氣污染、強對流等關鍵詞;關鍵科學問題包含多圈層相互作用、機理認知、可預報性、不確定性、時空異質性、能量收支等關鍵詞;研究手段和方法包含統計建模、時間序列分析、相關性分析、貝葉斯網絡、歸因分析、參數優化等關鍵詞。該方向鼓勵利用傳統統計學方法,譬如采用經驗正交、奇異值分解等分析空間特征的統計方法,采用傅里葉變換、小波分析、功率譜分析等分析時間序列特征的手段,以及多元線性回歸建模方法等,開展動力方法和統計方法的融合研究,促進對大氣現象的機理、因果關系及其可預報性的分析研究。以上三個方面形成了大氣數據分析的有機整體,既為第一個研究方向中的國產大氣數據資料研制提供技術支撐,也為第三個研究方向中的人工智能方法創新提供基礎平臺和參考基線。

3.4 研究方向3——人工智能與大氣科學大數據

D0510 下設的第三個研究方向“人工智能與大氣科學大數據”主要依托先進技術與方法提升氣象預報預測技巧。該研究方向主要包括了研究對象、手段和方法、關鍵科學問題三個方面。研究對象包含災害天氣、極端氣候、臺風、降水、短臨預報、延伸期預報等關鍵詞,力圖完善集智能識別、智能同化、智能模式和智能預測于一體的智慧氣象體系。手段與方法包含深度學習、機器學習、數據挖掘等關鍵詞。智能模型依賴的深度神經網絡目前的“黑箱”特性被廣泛詬病,提升智能模型的可解釋性與適用性成為亟需解決的關鍵科學問題。該方向鼓勵從大數據之間的相關關系和因果推斷出發,融合動力方程、守恒性、對稱性、時空不變性等增強智能模型的可解釋性和適用性。該方向以大氣數據為支撐,服務于國產高分辨率數據資料的重建,拓展大氣數據分析方法,促進新型信息技術的應用與發展。

3.5 研究方向4——新型信息技術發展與應用

D0510 下設的第四個研究方向“新型信息技術發展與應用”主要是引導新型支撐技術與大氣學科的交叉融合,從一定程度上擴展大氣學科的內涵。依照技術內涵和應用領域,該研究方向主要包括了計算方法、數據管理、顛覆性技術三個方面。計算方法包含云計算、邊緣計算、邊云協同等關鍵詞,鼓勵在模式發展中融通新型計算形態,提升模式計算性能;數據管理包含無人機遙感、區塊鏈、物聯網、5G 傳輸等關鍵詞,倡導在數據采集、管理、應用、服務過程中運用新設備和新方法,豐富和完善大氣實況數據及分析產品的展現形式,促進對大氣科學數據的理解和價值發現;顛覆性技術包含量子計算、量子模擬等新型量子信息技術,這已經成為全球發達國家在科技領域關注的戰略方向,規劃布局和投資力度正在迅速加大。新型信息技術發展與應用研究方向涵蓋了大氣數據的采集、管理、計算、呈現的全過程,所取得的突破與創新將為其它三個研究方向提供新的研究方法與手段。該方向需要結合分支學科的基本理論和經驗規律,吸收大數據和人工智能的科技進步紅利,探索未來大氣數據與信息技術在應用領域創新的各種可能。

4 基于文獻計量法的統計分析

上文介紹了各研究方向并梳理了關鍵詞的邏輯關系,為增進申請人對D0510 發展趨勢和研究方向的理解,以下進一步地對近兩年D0510 各方向關鍵詞的基金申請和文獻使用情況進行統計分析。

自2021 年D0510 申請代碼使用新的研究方向分類以來,每年面上項目、青年科學基金項目(簡稱青年基金)和地區科學基金項目(簡稱地區基金)的申請項目總數為60 余項(圖略),其中面上項目與青年基金的申請項目數量相當,各為30 項左右,而每年地區基金申請數量僅為兩項。四類科學問題屬性申請項目中C 類(需求類)項目數量最多,所占比例接近所有項目總數的50%,高于D05 的平均占比40.3%(何建軍等, 2021),D 類(交叉類)申請項目的所占比例僅次于C 類,達到了25%,遠高于D05 申請代碼7.4%的平均占比;B 類(前沿類)申請項目占比低于20%,與D05的平均占比47.9%有較大落差。A 類(原創類)申請項目占比最低,與D05 其它申請代碼的整體申請情況類似。以上數據說明相比于D05 其它申請代碼,D0510 申請代碼申請項目更側重于不同學科間的交叉。

D0510 申請代碼不同研究方向的申請項目數量之間有較大差別,近兩年平均有59%的項目選擇了“人工智能與大氣科學大數據”研究方向,23%的項目選擇了“多源數據融合與再分析”研究方向,15%的項目選擇了“大氣數據分析”研究方向,而選擇“新型信息技術發展與應用”研究方向的項目占比僅為3%。

圖1 列出了2021~2022 年D0510 出現頻次最高的十個關鍵詞,排名第一的是深度學習,出現頻次達到了48 次,即所有申請項目中有約40%選擇了這一關鍵詞。其次是機器學習、人工智能與資料融合,分別達到了28 次、21 次和21 次。十個高頻關鍵詞中八個與研究方法或數據相關,而降水和災害天氣是近年來的兩個熱點研究對象。

圖1 2021~2022 年D0510 申請代碼十個熱門關鍵詞的出現頻次Fig.1 Occurrence frequency of ten popular keywords under D0510 application code from 2021 to 2022

進一步利用Web of Science 等文獻計量學分析工具,對大氣科學領域(Meteorology & Atmospheric Sciences)涉及D0510 申請代碼關鍵詞論文的發表情況進行了統計和分析(圖2)。從圖2a 可知,2021 年度“多源數據融合與再分析”研究方向中,數據誤差分析方面的關鍵詞質量控制、不確定性和評估的出現頻次較高,均超過4000 次,其次是再分析資料和數據同化,均超過1000 次。降尺度、數據反演和偏差訂正的出現頻次也超過了500 次。

“大氣數據分析”研究方向中(圖2b),不同關鍵詞的出現頻次存在明顯差異。其中,屬于研究對象的氣候變化和空氣污染這兩個關鍵詞出現頻次均超過10000 次。方法類關鍵詞中,排名前三的統計建模、相關性分析和時間序列分析出現頻次均超過2000 次,而參數優化、歸因分析和貝葉斯網絡的出現頻次為100 至300 多次不等。

“人工智能與大氣科學大數據”研究方向中(圖2c)屬于研究對象的降水、空氣質量、極端氣候等關鍵詞的出現頻次較高,例如降水的出現頻次超過了15000 次。除此之外,多個方法類關鍵詞的出現頻次也超過300 次。其中,機器學習的出現頻次最高,為1832 次,排名第二和第三的分別是人工智能的808 次和數據重建的801 次,而適用性和深度學習的出現頻次也超過了600 次。相比較而言,智能預測、智能識別和智能同化這些研究目的較明確的關鍵詞出現頻次普遍不高。

圖2 2021 年度D0510 申請代碼不同研究方向關鍵詞大氣科學領域論文在Web of Science 中的收錄情況Fig.2 The collection situation of the papers of research directions and keywords under D0510 application codes of the atmospheric sciences in 2021

“新型信息技術發展與應用”研究方向中(圖2d),數據管理的出現頻次遠高于其它關鍵詞。雖然很多關鍵詞涉及到新型信息技術,但云計算、可視化、可視化建模和無人機遙感這些關鍵詞的出現頻次也達到了100 次以上。

圖3 總結了2001 年以來D0510 申請代碼申請項目中十個高頻關鍵詞(圖1)相關論文的逐3 年變化情況??梢钥吹剑▓D3a),除了降水和質量控制,其余關鍵詞在2010 年以前出現頻次均較低,近幾年才得到了快速增長,尤其是機器學習、人工智能和深度學習這三個關鍵詞。其中,深度學習在近3 年的增長速度最快,展現了很好的發展趨勢。

在這20 年期間,中國學者論文的所占比例也發生了明顯變化(圖3b)。在2007 年以前,除了災害天氣和大數據,其余關鍵詞中國學者論文占比大多維持在20%以下,而在2015 年之后,中國學者論文占比已基本超過20%。與其它關鍵詞不同,中國學者災害天氣和大數據相關論文的占比從2001 年開始出現了先上升后下降的趨勢,占比峰值出現在2011 年前后。此外,可以發現,自深度學習2016 年在全球范圍內流行以來(圖3a),中國學者在這一方面的論文占比就超過了20%(圖3b),說明中國學者在一些新興技術領域不存在起步晚的劣勢。

圖3 2001~2021 年D0510 申請項目中十個高頻關鍵詞相關論文Web of Science 收錄情況的逐3 年變化:(a)收錄數量(單位:a-1;2010 年后與關鍵詞降水相關的論文數量超過6000 篇/年);(b)中國學者論文所占比例Fig.3 Three-year variations of the collection situation of papers related to ten popular keywords under D0510 application code in “Web of Science”database from 2001 to 2021: (a) Number of collections (units: a-1; number of papers related to the keyword “precipitation” exceeds 6000 a-1);(b) proportion of Chinese scholars’ papers

5 研究方向和關鍵詞選擇的注意事項與建議

從2021~2022 年D0510 的研究方向和關鍵詞申請情況統計結果來看,目前針對D0510 學科的申請存在總量偏少、原創類申請項目占比較低、關鍵詞使用集中于熱門方向、少數關鍵詞使用率偏低、前沿類申請稀缺等問題。在D0510 中選擇合適的研究方向和關鍵詞,需要先厘清所申請的研究方向是屬于“分支學科”“支撐技術”還是“發展領域”,并且深入理解大氣學科“支撐技術”板塊中設置D0510 申請代碼的初衷。特別需要明確的是,純技術應用類研究并不適合填報D0510 申請代碼,而應從“分支學科”或“發展領域”中選擇對應的申請代碼(劉哲等, 2020)。

在研究方向的選擇上,根據近兩年項目申請情況來看,申請人容易混淆“支撐技術”中的D0510 大氣數據與信息技術和“發展領域”中的D0515 應用氣象學這兩類申請代碼,同時在方法上與D0509 大氣觀測、遙感和探測技術與方法上有所重疊,造成難于選擇。D0510 鼓勵大氣科學家和具有數據與信息背景的技術人才深度合作,突破大氣科學基礎研究中的“卡脖子”問題和“顛覆性”技術,實現大氣學科基礎理論和研究手段的創新。D0510 側重于數據與信息與大氣科學的交叉,而D0509 側重觀測、遙感和探測,D0515 側重應用研究與基礎研究的融合,申請人應結合研究主題進行針對性的選擇。

在關鍵詞的選擇上,申請人應當特別注意粗粒度與細粒度關鍵詞結合使用,選擇過粗會造成評審專家匹配范圍太廣,而選擇過細會造成滿足條件的評審專家太少,需要保證關鍵詞粗細適度以提升智能輔助匹配系統的效率。當前,D0510 中關鍵詞使用集中于深度學習、機器學習、人工智能等熱門方向以及降水、災害天氣等焦點領域,意味著這些領域競爭激烈,建議申請人避開紅海,積極探索新的交叉融合問題。

綜上,合適的研究方向和關鍵詞選擇將有利于對項目進行精準評估,使得人工智能系統能夠精確匹配到相應的評審專家,確??茖W基金申請書函評和會評的公平公正性,輔助學科整體情況的分析決策,從而對項目進行更加合理的定位與分類,提高項目的評審效率,強化資助的合理性與導向性(鄭鈞正, 2013)。

6 總結與展望

在大氣學科申請代碼調整的大背景下,“申請代碼和關鍵詞”戰略研究工作組對D0510 申請代碼不斷進行梳理和調整。自2019 年11 月以來,依托各類學術年會和戰略研討會,通過“自上而下”與“自下而上”開展論證,形成了D0510 從“二級學科申請代碼”到“研究方向”再到“關鍵詞”的完整鏈條,對于傳統方向的包容性和新興技術的覆蓋性均得以提高,對于“卡脖子”和“顛覆性”技術的重視程度也得到加強。

近3 年申報D0510 的項目質量穩步上升,D0510 在引導支撐技術服務大氣學科方面激勵了技術人才與大氣科學家開展深度合作,培養了更多高質量的復合型創新人才。但D0510 也仍然存在一些問題亟待改進,如:少數關鍵詞重疊、使用頻率不高、各研究方向關鍵詞分布不均,以及對申請代碼調整改革的目的和趨勢宣傳介紹不夠,導致部分申請人對研究方向和關鍵詞認識不足。今后,還需持續跟蹤國際前沿動態,廣泛聽取大氣科學和相關交叉學科專家意見,不斷修訂完善并加強宣教,擴大D0510 影響力,以充分發揮科學基金對大氣科學技術創新的引領作用。

致謝衷心感謝國家自然科學基金委員會“申請代碼和關鍵詞”戰略研究工作組D0510 小組的朱江、龔威、楊廣文、鄧科峰、付遵濤、耿冠楠、李慶祥、劉青山、王亞強、武炳義、徐喆、張寧參加研討,特別感謝清華大學的向妍霏和李佳皓,本文的研究成果離不開他們大量細致的調研和數據統計分析工作。本次申請代碼調整工作自始至終都得到了國家自然科學基金委員會分管委領導、地球科學部領導一如既往的關心和悉心指導,作者在此一并表示誠摯的感謝!

猜你喜歡
代碼大氣方向
2022年組稿方向
宏偉大氣,氣勢與細膩兼備 Vivid Audio Giya G3 S2
2021年組稿方向
2021年組稿方向
創世代碼
創世代碼
創世代碼
創世代碼
大氣古樸揮灑自如
大氣、水之后,土十條來了
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合