日前,中國科學院青島生物能源與過程研究所單細胞研究中心正式發布首個微生物組大數據搜索引擎——MSE(Microbiome Search Engine; http://mse.single-cell.cn),使得以整個微生物組為分析單元的智能搜索和大數據挖掘成為現實。
微生物組,又稱“菌群”。人體微生物組也被稱為每個人的“第二基因組”。一個“第二基因組”可由數百萬個微生物基因組成,其數據量是一個人類基因組的成百上千倍。根據人類已經積累的海量微生物組數據,尋找“結構”或“功能”類似的菌群樣本,從而實現對未知功能菌群的解讀和挖掘,以及對整個已知微生物組數據空間的全局性思考,一直是微生物組業界的關鍵瓶頸之一。對海量微生物組“大數據”的搜索、挖掘與機器學習,能夠幫助人們了解微生物組與相關疾病之間的關系,從而利用人體各個部位的共生菌群實現個體化的精準健康、精準護理與精準營養。
MSE通過建立針對微生物群落的超高速比對算法和數字索引機制,為海量的樣本列出基于菌群結構或功能相似性的“目錄”。當輸入未知樣本時,引擎能夠根據這一帶有菌群相似性信息的“目錄”從浩瀚的微生物組大數據海洋中迅速自動選取與該樣本最為相似的匹配。
配合該搜索引擎,單細胞研究中心還發布了分析軟件Parallel-META 3 ,可以將數量龐大的未知微生物組樣本進行結構與功能解析,可以與其數據庫搜索匹配結果進行更深入的比對分析。