美國研究人員使用人工智能(AI)來設計超越自然界的新蛋白質。他們開發的機器學習算法,可生成具有特定結構特征的蛋白質,這些蛋白質可用于制造具有特定機械性能(如剛度或彈性)的材料,從而取代作為原料的石油或陶瓷。研究論文發表在最新一期《化學》雜志上。
麻省理工學院、IBM沃森AI實驗室和塔夫茨大學研究人員采用了一種生成模型,其與DALL-E 2等AI系統中使用的機器學習模型架構相同,但研究人員調整了模型架構,以預測實現特定結構的蛋白質的氨基酸序列。
這一模型學習控制蛋白質形成方式的生化關系,產生超越自然界的新蛋白質,從而實現獨特應用,例如,該工具開發的食品涂層可使農產品保鮮時間更長,同時保證食用安全。該模型還可在幾天內就生成數百萬種蛋白質,為科學家迅速提供可供探索的新可能。
研究人員此次構建了兩個機器學習模型,以預測各種新氨基酸序列,這些氨基酸序列形成滿足結構設計目標的蛋白質。一種模型在蛋白質的整體結構特性上起作用,另一種模型在氨基酸水平上起作用。兩種模型都通過組合這些氨基酸結構來產生蛋白質。
這些模型與預測蛋白質折疊的算法相關聯,研究人員使用該算法來確定蛋白質的3D結構。然后,他們計算其結果屬性,并根據設計規范檢查這些屬性。測試顯示,其與現有氨基酸序列存在部分重疊,在大多數情況下約有50%—60%,但也有一些全新的序列。相似程度表明,AI生成的許多蛋白質是可合成的。