當前,納米材料在電子機械、醫療化工、能源環境等諸多領域的研究、應用迅速發展,但納米材料的環境效應預測存在高內涵數據庫缺乏、環境轉化情景遺漏、模型普適性弱等問題,嚴重制約了國家對危害性納米材料的風險防控。
科技日報記者7月18日從南開大學獲悉,該校環境科學與工程學院胡獻剛教授團隊在拓展機器學習算法預測納米材料的生物效應,以及通過增強機器學習的可解釋性,從而探索納米材料生物效應的機理方面取得了突破,為上述問題的解決提供了新的研究思路。相關論文發表在國際知名期刊《科學進展》上。
據介紹,為有效控制和削減環境污染物, 必須首先了解污染物的產生源頭、分布特征、轉化規律以及毒性效應, 進而對污染進行治理或修復,這就需要對化學品進行環境效應預測。這是國家對危險化學品進行風險防控的重要手段,也是當前毒理學研究的重要方向。在2005年發生的松花江污染事件、大氣霧霾成因等重大環境問題上,環境生物效應預測發揮了不可替代的作用。
目前,在對納米材料的環境生物效應預測中,機器學習模型已廣泛應用,但是受限于機器學習的可解釋性,利用機器學習模型揭示復雜納米毒理的機制仍具有很大的難度。
胡獻剛教授團隊在前期工作基礎上創建了納米材料—生物效應數據庫,構建了納米材料—生物效應回歸模型,并提出了一個基于樹的隨機森林特征重要性和特征網絡交互分析框架(TBRFA),該框架通過多指標重要性分析方法,克服了小型數據集導致的特征重要性分析偏差,并利用隨機森林的工作機制建立了特征交互網絡,揭示了潛在的影響納米材料生物效應的交互因素。
TBRFA包含重要性分析與特征交互網絡分析。TBRFA重要性分析采用多個重要性指標,以平衡傳統的單一指標帶來的偏見,并識別出暴露恢復時間、材料比表面積以及材料尺寸是影響納米材料誘導生物效應的重要因素。TBRFA特征交互網絡分析通過解析隨機森林的樹結構,計算出兩兩特征之間的交互作用系數,并識別出材料的比表面積與表面電荷、比表面積與長度、長度與直徑之間在誘導生物效應過程中如何相互制約與影響。
胡獻剛表示,這項研究對研發環境友好型納米材料具有一定的指導作用,將為納米材料的生態環境安全性評估提供新的策略;該機器學習算法除了適用于納米材料環境效應分析,也可用于重金屬、有機物污染等環境生物效應的預測、評估。