人類基因組計劃完成20多年后,美國懷特黑德研究所喬納森·韋斯曼及其同事展示了在人類細胞中表達基因的第一份綜合功能圖譜。6月9日在線發表于《細胞》雜志上的項目數據,將每個基因與其在細胞中的功能聯系起來,這是多年來基于單細胞測序方法Perturb-seq的重大合作研究成果。數據可在韋斯曼實驗室網站上獲得,供其他科學家使用。
兼任麻省理工學院生物學教授和霍華德休斯醫學研究所研究員的韋斯曼說:“有了這張基因型—表型關系圖譜,你可以進入并篩選數據庫而無需進行任何實驗?!?/span>
該圖譜使研究人員能深入研究各種生物學問題。研究人員可用它來探索功能未知的基因對細胞的影響,研究線粒體對壓力的反應,并篩選導致染色體丟失或獲得的基因,這種表型在過去被證明是難以研究的。
借助CRISPR構建圖譜
該項目利用的Perturb-seq方法,能以前所未有的深度跟蹤基因打開或關閉時產生的影響。Perturb-seq方法使用CRISPR/Cas9技術將基因變化引入細胞,然后使用單細胞RNA測序來捕獲變化引起的表達RNA信息。由于RNA控制細胞行為的所有方面,這種方法可幫助解碼遺傳變化的許多細胞效應。
在這項新成果中,研究人員將該方法擴大到整個基因組。他們使用人類血液癌細胞系以及來自視網膜的非癌細胞,對超過250萬個細胞進行了Perturb-seq測序,并使用這些數據構建了一個將基因型與表型聯系起來的綜合圖譜。
挖掘未知功能
完成篩選后,研究人員決定使用他們的新數據集來檢查一些生物學問題。最明顯的應用是首先研究具有未知功能的基因。
由于新測序讀出了許多已知基因的表型,研究人員可使用這些數據將未知基因與已知基因進行比較,并尋找相似的轉錄結果,這可能表明基因產物會作為更大復合體的一部分協同工作。
一個名為C7orf26的基因的突變尤為突出。研究人員注意到,去除導致相似表型的基因是稱為整合子的蛋白質復合體的一部分,該復合物在產生小核RNA中發揮作用。整合子復合體由許多較小的亞基組成,之前的研究表明有14種單獨的蛋白質,研究人員此次證實C7orf26是復合體的第15個組成部分。
他們還發現15個子單元在更小的模塊中協同工作,以在整合子復合體中執行特定功能。
篩選正確分離DNA的因子
Perturb-seq的另一個好處是,由于該分析側重于單細胞,研究人員可使用這些數據來查看更復雜的表型,這些表型在與來自其他細胞的數據一起研究時通常會變得混亂。
研究人員發現,導致細胞間不同結果的基因子集是染色體分離的原因。這種分離會導致細胞丟失一條染色體或獲得一條額外的染色體,這種情況稱為非整倍性。
韋斯曼表示:“你無法預測失去這個基因的轉錄反應是什么,因為它取決于你獲得或失去的染色體的次要效應。我們意識到,這個局面其實是可以扭轉的,創造這種復合表型,尋找獲得或丟失的染色體特征。通過這種方式,我們對正確分離DNA所需的因子進行了第一次全基因組篩選?!?/span>
仍有懸而未決的問題
研究人員還使用數據集研究了線粒體如何應對壓力。從自由生活的細菌進化而來的線粒體在其基因組中攜帶13個基因。在核DNA中,大約1000個基因與線粒體功能有關。研究人員發現,當他們擾亂不同的線粒體相關基因時,核基因組對許多不同的基因變化的反應相似。然而,線粒體基因組反應的可變性要大得多。
為什么線粒體仍然有自己的DNA?這仍是一個懸而未決的問題。新研究的一個重要結論是,擁有單獨的線粒體基因組的好處之一,可能是針對不同的壓力源要進行局部或非常特定的基因調控。如果有一個線粒體被破壞,而另一個線粒體以不同的方式被破壞,那么這些線粒體可能會作出不同的反應。
未來,研究人員希望將Perturb-seq用于研究癌細胞系之外的不同類型的細胞。