據《自然》雜志23日發表的論文,美國杰克遜實驗室、麻省理工學院和哈佛大學布羅德研究所以及耶魯大學的團隊利用人工智能(AI)技術設計出數千個新的DNA開關。這些新設計的元件能夠精準控制基因在不同類型細胞中的表達,為人類健康與醫學研究提供了前所未有的可能性。
盡管近年來,基因編輯和其他基因治療手段已讓科學家能夠在活細胞中修改基因,但要在不干擾整個生物體的情況下,只對某一類型的細胞進行基因干預,依然存在挑戰。這主要是因為對于控制基因開啟和關閉的DNA開關——順式調節元件(CRE)的理解還不夠深入。此次創新的核心在于,新方法可以針對特定的細胞類型來提高或降低基因表達,卻不會影響到身體其他部分。
團隊采用了深度學習算法,基于數十萬個人類基因組中的DNA序列訓練了一個模型。通過這個模型,他們可在實驗室環境中測量3種細胞(血液、肝臟和大腦)中CRE的活性。該AI模型可預測任意序列的活性,從而揭示了DNA中新的模式以及CRE序列的語法是如何影響RNA生成量的。
基于上述發現,團隊構建了名為CODA(計算優化DNA活性)的平臺。通過結合實驗數據和計算建模的迭代過程,該平臺不斷改進其預測CRE生物學效應的能力,成功設計出了自然界中未曾出現過的CRE。
經過測試,新設計的合成CRE表現出了比天然存在的CRE更優異的細胞類型特異性。它們不僅包含了促進目標細胞類型中基因表達的序列,還含有抑制非目標細胞類型中基因表達的元素。目前,團隊已在斑馬魚和小鼠身上驗證了幾種合成CRE序列的有效性。
這一突破性進展意味著,未來可能實現更加精確和個性化的基因療法,為預防和治療疾病開辟了新途徑。
在生物體內,并不是所有基因都會在合適的細胞和合適的時間點發揮作用。CRE的功能,就在于確保適當的基因在正確的時間、正確的地點被激活。譬如,避免皮膚細胞使用了大腦所需的基因,或是防止成人體內激活僅在早期發育階段需要的基因。此次團隊不僅合成了全新的CRE,還展示了如何使用這些CRE選擇性地激活大腦、肝臟或血液細胞中的基因,同時確保這些基因在其他類型的細胞中保持沉默。這在生物醫學和技術上具有雙重重要意義。