近日,由英國華威大學的大衛·阿姆斯特朗(David Armstrong)領導的研究團隊開發了一項新的機器學習算法,可以從NASA的舊數據中識別出系外行星——即太陽系外的行星。該團隊已通過這一工具對一批潛在行星進行了識別,并從這些天體中確認出了50個新的行星。該研究的論文發表在《皇家天文學會月刊》上。
天文學家有2種方法可以用來探測系外行星。一種是徑向速度方法,它用來監測恒星是否有行星引力引起的小反運動。第二種是更敏感的技術, 也是凌日系外行星巡天衛星和開普勒采用的技術, 它主要依靠宿主星的亮度變化。如果一個恒星系的平面對準正確,從我們的角度看,它的行星就會在恒星前面過境。通過監測這些亮度的變化,我們可以很有把握地推斷出系外行星的存在。問題是,第二種方法產生了大量恒星的亮度數據,其中許多恒星不會有可見的系外行星。這就需要計算機分析和人工相結合,才能確定候選星并確認它們的存在。
論文作者在摘要中寫道:“我們的模型只要短短幾秒就能對數千個肉眼看不見的候選行星進行識別,確認其是否真的是行星。”考慮到許多天文學數據庫的規模都大得驚人,該方法有望大大提高人們探索世界的效率。
這一算法的原理是將真假行星區分開來。阿姆斯特朗在一份聲明中說:“我們現在不僅能說哪些候選行星‘更可能’是行星,而是可以用確切的數據說明這種可能性有多大:如果候選天體是‘假行星’的可能性小于1%,就可以被確認為是真正的行星。”
研究人員并不是隨便打開一個開關,就能讓人工智能通過數據篩選來發現行星。他們必須用已確認的系外行星和假陽性的數據來訓練神經網絡,這樣它才能在新的數據中識別出那些明顯的跡象。華威大學確認的50顆系外行星中,從海王星大小的氣體巨行星到比地球還小的巖石世界,無所不包。而使用傳統方法確認較小的行星存在一定困難,這也說明了人工智能在確認較小行星方面的潛力。
根據新的研究,在所有確認的系外行星中,大約有三分之一是用單一的分析方法確認的,這并不理想。科學家們說,即使現有的技術能夠發現所有可觀測到的系外行星,我們也應該有更多的選擇。他們希望新的機器學習系統在檢測更多行星的過程中不斷發展,成為系外行星探索過程中的重要組成部分。