2020年,谷歌下屬“深度思維”公司開發的人工智能(AI)工具“阿爾法折疊”橫空出世,向世人展示了其高精度預測蛋白質三維(3D)結構的超強能力。
此后,又有多款預測蛋白質結構的AI工具面世,鑒于大多數藥物通過與蛋白質上的不同位點相結合來發揮作用,而此類工具可預測以前所知甚少的蛋白質結構,因此化學家們對使用AI程序更快、更低成本地發現藥物充滿期待。
英國《自然》網站在近日的報道中指出,AI預測蛋白質雖然還無法代替實驗,但無疑給蛋白質研究領域帶來了新的助力。但類似“阿爾法折疊”等預測蛋白質結構的AI工具能否真正撼動制藥行業,仍有待時間的檢驗。
AI工具競相推出
2020年底,“深度思維”公司首次宣布,他們研發出一種工具——“阿爾法折疊”來精準預測蛋白質的折疊結構。2021年中,“阿爾法折疊”已繪制出人體中98.5%的蛋白質的結構圖。2022年,該公司發布了2億多種蛋白質的結構,全球公認的蛋白質數據庫UniProt中收錄的所有蛋白質幾乎都在其中。蛋白質的3D結構決定了其在細胞中的功能,明確蛋白質的結構信息,在藥物研發等領域十分重要。
今年7月,美國生物技術公司Recursion宣布,他們已計算出360億種潛在的藥物化合物如何與“阿爾法折疊”預測的15000多種人類蛋白質結合。為完成大規模計算,該公司利用了自己開發的AI工具MatchMaker,以預測蛋白質組水平上小分子之間的相互作用。
除上述工具外,預測蛋白質結構“賽道”上的另一位“網紅”RoseTTAFold也不容小覷。其由華盛頓大學蛋白質設計研究所科學家主導開發,能“繪制”或“想象”出自然界中尚不存在的蛋白質結構,這是繼“阿爾法折疊”之后蛋白質研究中的又一個里程碑。RoseTTAFold目前已創造出一些原始化合物,用于工業反應、癌癥治療以及開發預防呼吸道合胞病毒(RSV)的候選疫苗。
預測助推藥物研發
美國南加州大學計算生物學家弗謝沃洛德·卡特提克指出,借助AI工具,制藥公司可能只需要在實驗室中測試幾百種而非數千種化合物,這不僅可節省數百萬美元的成本,而且能在幾年而非幾十年內將化合物推向市場。
藥物研發之所以燒錢且耗時,是因為要找到管用的藥物就像大海撈針。以靶向藥物為例,在人體細胞表面有很多藥物接收站——受體,藥物分子(如咖啡因、多巴胺等)只有與各種受體相結合才能發揮作用。據估計,世界上類藥物分子數量高達10^60個,但只有很少的分子能與受體結合,在細胞內產生期望的化學反應。
歐洲生物信息學研究所指出,“阿爾法折疊”和RoseTTAFold等工具,在預測蛋白質3D結構方面非常出色,在其預期的2億個蛋白質結構中,35%的結構的準確性可與實驗確定的相媲美;另外45%的結構的準確度足以用于某些應用,因此有望進一步動搖制藥行業。
效果仍待時間檢驗
對于“阿爾法折疊”等AI工具是否能徹底改變藥物發現,并非所有人都持樂觀態度。在今年8月發表于《eLife》上的一篇論文中,美國斯坦福大學的瑪莎·卡特里娜等人指出,像“阿爾法折疊”這樣的模型在預測蛋白質結構方面確實表現優異,但需要思考如何將它們用于藥物發現。
其他接受《自然》雜志采訪的科學家也認為,“阿爾法折疊”等工具提供了大量令人印象深刻的數據,但其質量如何仍是未知數。
英國帝國理工學院的基思·威利森指出,雖然“阿爾法折疊”等工具往往極其精準,但其繪制的結構圖始終是預測結果,而非經過明確計算的結果。而且,預測出來的結構可能不具有藥物開發人員需要的原子級分辨率(使其能確定最強結合可能發生在哪里)。美國加州大學舊金山分校的藥物化學家布萊恩·肖伊切特則表示,預測的化學藥物與蛋白質之間的相互作用數量極多,意味著即使是很小比例的假陽性也可能讓科學家付出高昂的時間代價。
總部位于倫敦的查姆制藥公司首席執行官兼聯合創始人拉克西·薩尼與卡特里娜都認為,RoseTTAFold和“阿爾法折疊”在確定小分子對接時表現不佳。鑒于此,查姆公司正在嘗試一種不同的評估蛋白質—藥物結合的方法。該技術使用名為DragonFold的蛋白質—配體共折疊,模擬結合在一起的蛋白質和配體的3D形狀,使研究人員能夠解釋與配體結合時蛋白質形狀的變化,并對潛在的藥物進行修飾,以產生更緊密、更有選擇性的結合,從而加速開發針對癌癥和其他治療領域以前難以靶向的小分子治療藥物。