據發表在最新一期《自然·生物技術》雜志上的新研究,美國研究人員開發了一種人工智能模型,可預測RNA靶向CRISPR工具的脫靶活性。該模型可精確地設計向導RNA并調節基因表達,這些精確的基因控制可用于開發基于CRISPR的新療法。
美國紐約大學、哥倫比亞大學工程學院和紐約基因組中心研究人員進行的這項研究,將深度學習模型與CRISPR篩選相結合,以不同的方式控制人類基因的表達,類似于輕按電燈開關將其完全關閉,或通過調光旋鈕調低電燈亮度。
CRISPR基因編輯技術通常使用Cas9酶來靶向DNA。近年來,科學家發明了另一種類型的CRISPR,它使用Cas13酶來靶向RNA。研究人員此次創建了一個使用Cas13進行RNA靶向CRISPR篩選的平臺,以更好地了解RNA調控并識別非編碼RNA的功能。
該研究的一個關鍵目標是最大限度地提高RNA靶向CRISPR對預期靶標RNA的活性,并最大限度地減少可能對細胞產生有害副作用的其他RNA的活性。
研究團隊在人類細胞中進行了一系列RNA靶向CRISPR篩選。他們測量了20萬個針對人類細胞中必需基因的向導RNA的活性,包括“完美匹配”向導RNA和脫靶錯配、插入和缺失。
研究人員設計了一個深度學習模型TIGER(通過向導RNA設計靶向抑制基因表達),該模型根據CRISPR篩選的數據進行訓練。將深度學習模型生成的預測與實驗室的人體細胞測試進行比較,TIGER能夠預測在靶和脫靶活動,這也是人類擁有的第一個能預測脫靶的工具。
RNA靶向CRISPR具有廣泛應用,包括RNA編輯、調低RNA阻斷特定基因的表達,以及確定候選藥物的高通量篩選。為了更好地掌握RNA調控與功能,科學家設計了TIGER脫靶預測,其通過部分抑制基因表達,實現精確調節基因劑量。在臨床上,這可能對諸多基因拷貝過多的疾病有用,例如唐氏綜合征、某些形式的精神分裂癥,甚至異常基因表達可能導致的癌癥。