2019年,科技部和有關部門立足前期工作基礎,在高能物理、基因組、氣象、地震、海洋等領域組建了20個國家科學數據中心。在實現數據共享、支撐科技創新、加強國際合作方面,這些數據中心成為了重要的基礎設施和載體。
近日,高能同步輻射光源(HEPS)首臺科研設備開始安裝,國家高能物理科學數據中心為高能光源研究開發的科學數據管理服務系統也取得重要進展??茖W數據管理服務系統的測試平臺開始運行,實現了從數據獲取、傳輸、分析、長期保存到成果發布的全生命周期的數據服務。
2019年,科技部和有關部門立足前期工作基礎,在高能物理、基因組、氣象、地震、海洋等領域組建了20個國家科學數據中心。在實現數據共享、支撐科技創新、加強國際合作方面,國家高能物理科學數據中心、國家對地觀測科學數據中心、國家地球系統科學數據中心、國家海洋科學數據中心、國家冰川凍土沙漠科學數據中心等成為了重要的基礎設施和載體。
工作前移打通數據共享堵點
科學數據共享是我國國家科技創新體系建設的重要內容,也是大數據時代科技創新和經濟社會發展的重要基礎。
在高能物理領域,大部分項目涉及國家重大科技基礎設施及大型實驗。這些項目往往周期很長,并且數據量巨大,需要進行大規模的數據共享傳輸和數據處理。
國家高能物理科學數據中心在項目建設之初就開始參與數據產生、數據處理、數據匯交與共享、軟件工具等方面的設計和規劃,與科學家(數據生產者和數據用戶)共同協商確定數據的格式、存儲訪問模式以及數據長期保存的策略、數據共享的機制等,同時根據數據使用特點設計和建立數據處理所需的計算資源平臺以及數據傳輸共享所需的高速網絡鏈路。工作的前移,確保了科學項目從一開始就將數據生產、數據匯交和數據服務形成一個整體。
2019年度,國家高能物理科學數據中心在專家委員會指導下,組織高能物理領域相關學科專家,對比國際相關數據中心的發展方向,根據國內高能物理領域實驗裝置特性,評估并建設國家高能物理科學數據中的數據資源目錄體系。數據資源包含了高能物理數據、中子科學數據、光子科學數據、天體物理數據4個主要部分。根據合作組研究統計,國家高能物理科學數據中心直接或間接服務科研機構和團隊來自74個國家,超過1000家,為發現迄今為止人類觀測到能量最高的光子、破解快速射電暴的起源之謎及新材料研發等提供了重要支撐。
與此同時,國家高能物理科學數據中心與國內外同行合作,建立了分布式的數據管理和共享系統。針對大型強子對撞機LHC的實驗數據,與國際上100多個數據中心聯合建立了數據網格。
為科學研究提供充足“糧食”
為提升科學數據資源和共享服務能力,建立科學數據共享的可持續發展機制,為科學研究提供基礎支撐,科學數據中心作為公益性的國家級科學大數據設施按不同領域陸續成立。
國家地球系統科學數據中心主要為地球系統科學的基礎研究和學科前沿創新提供科學數據支撐和數據服務。截至2020年12月底,國家地球系統科學數據中心已開放共享數據集3.6萬余個,數據資源量超過2.14PB,為9935個重大科研項目/課題提供了數據服務。
從服務的科研產出來看,數據開放共享主要服務于科研項目(課題)、學術論文、專著與圖集等,也包含支撐軟件著作權專利、獲獎、標準規范等相關成果。如2018—2019年期間,中國工程院劉旭院士的科研團隊面向兩山理論實踐、發展環境綜合治理等區域關鍵問題開展戰略研究,國家地球系統科學數據中心持續跟蹤項目進展,協助團隊完成構建生態資源資產核算指標體系等研究,支撐項目出版專著5部。
國家對地觀測科學數據中心依托中國科學院空天信息創新研究院組建,由十幾個國家級和行業性遙感數據中心共同參與建設,目前有18個數據資源分中心單位,基本覆蓋了我國規模以上的民用、商用、科研類衛星數據管理和信息產品生產單位,初步建立了覆蓋遙感數據全生命周期的數據治理和服務規范體系。
國家對地觀測科學數據中心和國家綜合地球觀測數據共享平臺發起和主導的國際重大災害數據援助機制(CDDR),協調我國民用和商業高分辨衛星資源,在2020年對伊朗洪澇、烏茲別克斯坦潰壩、黎巴嫩貝魯特港口爆炸、哥倫比亞洪澇、斐濟亞薩臺風等國際重大災害開展應急響應,得到國際社會的高度關注和評價;2020年我國洪澇災害期間啟動了數據應急響應工作,快速組織了基礎地理數據、社會經濟本地數據、災前遙感數據等100多個數據集,并協調多個衛星機構動態提供了大量災后遙感數據。
為應對新冠肺炎疫情,國家對地觀測科學數據中心和武漢大學等聯合開展了“武漢封城76天遙感紀實”工作,協調組織和整理了30多顆衛星在封城期間開展120次觀測,為武漢抗疫工作提供了大量決策數據支撐;對接地球觀測組織(GEO)的抗疫號召,標準化整理和發布了我國科學家基于空間技術開展的15個科研團隊的抗疫成果。
為科技創新提供精準數據
在海洋科學數據共享方面,國家海洋科學數據中心整合了海洋水文、氣象、生物、化學等9大學科實測數據,研制了海洋環境統計分析、實況分析和再分析等數據產品,以及海洋經濟、海域海島、海洋災害等專題信息產品,空間覆蓋全球海域,數據類型齊全。
在服務科學研究方面,國家海洋科學數據中心研制了全球高分辨率冰—海耦合再分析系統CORA2.0,制作了全球9000米水平分辨率的氣候態海面高、三維溫鹽和海流產品,為把握海洋氣候變化規律、減輕海洋災害風險提供了科學支撐。在服務海洋資源開發利用方面,研制的“知海寶近海水環境在線監測系統”已完成第三代升級,具有垂向海溫數據剖面連續、無間斷監測等特點,為海洋漁業養殖生產提供便捷服務;依托上百個海上平臺觀測平臺,開展長時序精細化海流、海浪和臺風現場觀測和預報產品研發,為海上石油平臺生產、船舶通航提供精準服務。在支撐政府決策方面,研制了東海區海上風電項目數據集,反映了風電站建造、運行、退役全生命周期軌跡信息,為政府部門發展利用海上風能提供決策依據。
國家海洋科學數據中心團隊負責人姜曉軼說:“通過建設運行海洋科學數據中心,整合盤活了各類海洋信息資源,大幅提升了科技資源的應用服務成效,為海洋高質量發展提供了有力支撐服務?!?/span>
我國約2/3的國土面積為具有冰川、凍土、沙漠、荒漠、鹽湖、綠洲、草地等地表特征的寒區旱區,這一區域既是連接我國內陸與中亞國家的戰略要地,也是水資源、能源、礦產資源的后備基地,生態環境極度脆弱區,是我國脫貧攻堅、生態文明和鄉村振興戰略的關鍵區。國家冰川凍土沙漠科學數據中心在服務包蘭鐵路、青藏鐵路和黑河重大研究計劃等項目同時,也為“渝昆高速鐵路選線”提供基礎數據和科學決策,為“中巴經濟走廊災害機理研究和觀測預警”和“黃河上中游水土保持與治理”提供專題數據服務,為科技創新、經濟社會發展和國家戰略提供了重要的支撐。