科學數據是國家科技創新和發展的基礎性戰略資源,增強數據資源利用至關重要。
8月9日,從中科院青藏高原所獲悉,我國研究人員發表評論文章分析我國科學數據共享的現狀,總結了我國在科學數據共享方面取得的成功經驗,并呼吁對數據共享給予政策支持,對數據貢獻者予以激勵,從而實現更廣泛的數據共享。相關研究成果在線發表于《自然·地球科學》雜志。
數據流動和信息共享對人類科技進步至關重要,數據中心是促進科學數據開放共享的重要載體。近年來,我國在促進科學數據共享方面出臺了一系列舉措。2018年,國務院辦公廳印發的《科學數據管理辦法》中指出,數據開放將是受政府預算資金資助研究項目的基本原則;2019年,國家青藏高原科學數據中心、國家人口健康科學數據中心、國家天文科學數據中心等第一批20個國家數據中心上線。
然而,最近的一項超過2000名我國研究學者參與的調查顯示,我國的研究學者雖有分享研究數據的意愿,但也擔心數據的誤用及版權和許可受到侵犯。在我國,與同事和合作者私下共享數據的情況更為普遍,而不是更廣泛的公開共享。“可見,要增加新建科學數據中心的影響力,并在我國研究人員中更為廣泛地樹立數據共享的信心,仍需大量工作?!敝袊茖W院青藏高原研究所研究員、國家青藏高原科學數據中心主任李新坦言。
為了推動我國科學數據廣泛共享,國家自然科學基金委在地學領域的兩個重大研究計劃——“中國西部環境與生態科學研究”和“黑河流域生態—水文過程集成研究”中提出了新要求:受資助項目得到的科學數據都必須在國家自然科學基金委地球科學數據中心公開共享;在項目的年度評估、中期考核及最終評估環節,數據提交共享和數據質量都是被評定的內容。
同時,這項機制還明確了數據共享者的貢獻,并給予他們激勵。迄今為止,已有2500多篇科學論文引用了這些數據集?!斑@兩個重大研究計劃強調數據共享的強制性,以及對數據共享者的肯定和對知識產權的尊重。”李新說。
更令人欣慰的是,中國科學院近期發起了地球大數據科學工程專項,該項目旨在構建一個地球科學數據的信息基礎設施。通過收集來自專項的各類數據,地球大數據平臺目前已存儲超過5PB的數據,其下載已經超過50萬次。
基于此,專家呼吁,我國還要在政策、管理、技術和國際化等方面采取更為具體的行動,以更大的力度和措施提高科學家共享數據的意愿,提高我國科學數據中心的影響力,推動更為廣泛的科學數據共享。
李新表示,在政策方面,要進一步明確敏感數據及其使用界線;在管理方面,可將科學數據質量等指標納入評價機制,數據中心也可通過推進數據引用、利用數據重用指標來量化每個數據集的影響,以激勵數據貢獻者;在技術方面,數據中心可以通過提供數據集成與包括機器學習等技術在內的平臺、數據搜索引擎、智能數據處理工具等措施,更為有效地為用戶和機器提供更加友好、智能的服務;在國際化方面,鼓勵以中英文雙語發布元數據和數據,并積極參與國際認證,以增強中國數據中心的國際影響力。