加拿大多倫多大學研究人員開發了一種人工智能系統,可以使用生成擴散來創建自然界中不存在的蛋白質。該系統有望使治療蛋白的設計和測試更加高效和靈活,從而加速人類藥物開發。研究發表在最新一期《自然·計算科學》雜志上。
蛋白質由氨基酸鏈組成,氨基酸鏈折疊成的三維形狀反過來又決定了蛋白質的功能。這些折疊的三維形狀經過數十億年的發展,多種多樣且復雜,但數量是有限的。因此研究人員開始嘗試設計非自然界產生的折疊模式。
這一研究的主要難題是對折疊的“想象”,因為很難預測哪種折疊是真實的,并在蛋白質結構中起作用。通過將基于生物物理學的蛋白質結構表示與圖像生成空間的擴散方法相結合,科學家找到了解決這個問題的途徑,創建了被稱為ProteinSGM的新系統。
該模型從圖像表示(圖像信息在計算機中的表示和存儲方式)中學習,并以非常高的速度生成全新的蛋白質。研究人員表示,除了優化圖像生成過程存在挑戰外,對系統產生的蛋白質進行驗證也很困難,因為該系統產生的許多結構與自然界中發現的任何結構都不同。
根據指標,幾乎所有產生的結構看起來都合理,但研究人員需要進一步的證據。他們轉向求助于人工智能“歐米伽折疊”(深度思維公司“阿爾法折疊2”的改進版本),測試后確認,幾乎所有的新序列都折疊成了所需的新蛋白質結構。再輔以實驗室的物理測試,研究人員最終確信這些都是正確的蛋白質折疊。