購物、出行、旅游……人們產生的每一條數據,都存儲在數據庫里。數據庫和芯片、操作系統并列現代信息技術領域的三大核心基礎?!皵底謺r代,數據是生存要素,數據庫是基礎支撐。”11月16日,在OceanBase2023年度發布會上,中國工程院院士沈昌祥表示,數據庫的安全、穩定、可靠、性能、容量等對國計民生有根本性影響,也直接影響數字經濟發展和數字化轉型進程。
在OceanBase2023年度發布會上,OceanBase CEO楊冰推出了分布式數據庫性能新標準、容災新標準、高可用新標準及架構新標準這四項新標準。
OceanBase是由螞蟻集團完全自主研發的國產原生分布式數據庫,始創于2010年。根據《2022—2023中國平臺軟件市場研究年度報告》,在平臺軟件需求增長最快的金融行業,OceanBase在國產分布式數據庫市場占有率上位列第一?!拔ㄓ型耆匝胁拍苷嬲莆蘸诵拇a,主導產品發展,建成國際一流的數據庫系統?!監ceanBase首席科學家陽振坤表示。
需求牽引OceanBase自主研發
作為技術開發的重要領域,數據庫具有諸多細分類別:關系型數據庫、非關系型數據庫、分布式數據庫等?!皵祿毂旧硎且粋€場景驅動的技術。使用場景上沒有形成代際躍遷的變化,也就無法對現有數據庫的能力提升和架構升級產生太大推動力?!睏畋忉尩?。
在中國,移動互聯網技術的發展帶來前所未有的海量數據和高并發場景。這催生了國內對分布式數據庫的巨大需求,也為科技企業創造了打磨數據庫產品的機會。
時間回到2009年,“雙十一”開幕,指數級增長的成交額給支撐用戶搶購的交易系統帶來了嚴峻的壓力。這要求數據庫不僅需要應對流量峰值、保障系統平穩運行,更要在降本增效的同時服務業務發展。當時,支付寶原本的集中式數據庫系統已不足以應對上述情況,自研一款彈性伸縮、高可用的分布式數據庫迫在眉睫。
2010年,OceanBase研發項目正式啟動。這個為支撐“雙十一”爆炸式增長的海量數據而生的數據庫,在十三年的自研過程中不斷優化增強,在性能、高可用、性價比和單機分布式一體化架構上達到技術新高度。
2022年,OceanBase發布業內首個單機分布式一體化架構的數據庫——小魚,這意味著用戶不再需要在集中式和分布式數據庫中“二選一”。小到個人站點、大到銀行核心系統、巨型電商網站,用戶都可以在業務發展的不同階段選擇適配自身的高性價比數據庫方案。
楊冰回憶,2020年是OceanBase商業化的第一年,那時,OceanBase只有18個客戶。現在,70%的千億資產規模以上的銀行、75%的頭部證券機構、65%的頭部保險機構、45%的頭部基金公司都選擇了OceanBase進行核心系統升級。
同時,OceanBase的應用場景也從金融行業向千行百業邁進。2021年12月28日,江西省成為全國首個接入養老保險全國統籌信息系統的省份,這背后就有OceanBase核心數據庫的支撐。如今,江西省全省機關養老、企業養老、工傷保險等都在OceanBase上穩定運行。
標準助推數據庫能力升級
“我們正在邁向基于數據的智能時代。這個過程中,數據的業務化是核心,數據庫升級是關鍵?!眹H數據公司(IDC)中國副總裁兼首席分析師武連峰表示。他分享了一組數據:到2027年全球新產生的數據將達到291ZB,80%的企業要管理10種類型的數據,全球每年因數據丟失和宕機導致的損失達到2萬億美元,100%的企業遇到數據庫轉移兼容問題……在武連峰看來,對下一代數據庫至少有七大方面要求:彈性擴展、穩定可靠、極致性能、融合分析、平滑遷移、多模能力、AI融合。
楊冰表示,中國數字經濟的蓬勃發展催生了對分布式數據庫的強大需求。這種需求牽引了OceanBase的自主研發,從而推動四項新標準的樹立,以滿足中國場景對分布式數據庫的需求。
在性能標準方面,OceanBase通過技術創新,使得數據庫發生故障時的恢復時間短于8秒,讓故障恢復進入秒級時代,并且能夠做到數據不丟失。
在容災標準方面,OceanBase通過“三地五中心”的模式(即在三座城市部署五個機房,一旦其中一個或兩個機房發生故障,底層技術系統會將故障城市的流量全部切換到運行正常的機房),可以在一分鐘內自動恢復任意機房/城市級故障,做到零數據丟失。
在高可用標準方面,OceanBase可以在高并發場景下按需實現不停機、不改應用的擴縮容和性能的線性增長,同時實現一份數據同時支持事務處理與實時分析。據了解,OceanBase也是首個刷新TPC-C、TPC-H“數據庫世界杯”測試紀錄的分布式數據庫。
在架構標準方面,OceanBase首創的單機分布式一體化架構,可使數據庫滿足用戶在不同階段的需求,減輕企業在業務發展過程中切換數據庫的麻煩,一個數據庫用到底。
在數字化熱潮中迎來新機遇
在數據庫的實際應用中,用戶往往面臨著業務規模增長、業務場景變多、IT架構應用日益復雜的情況,這會造成數據庫越用越多、越用越復雜的后果。而一體化設計的數據庫有望解決相關問題。
楊冰介紹,一體化設計追求的是數據庫在分布式架構下的極致性能與最佳成本。這種設計下的數據庫,既能在同等硬件條件下擁有比主流單機數據庫更好的性能,也能在分布式架構下達到事務處理和實時分析的最佳性能。此外,統一的技術棧也大大降低了管理、架構、存儲、運維等成本。
從2010年起,OceanBase就在逐步進行工程一體化、單機分布式一體化等一體化設計?,F在,OceanBase可滿足用戶80%的數據庫場景需求。OceanBase2023年度發布會上,OceanBase還發布了一體化數據庫的首個長期支持版本OceanBase4.2.1LTS,這標志著OceanBase一體化數據庫進入可規?;暇€使用的長期支持階段。
國際咨詢機構Forrester在《OceanBase總體經濟影響報告》中發布的數據顯示,采用OceanBase后,企業數據存儲空間可節省約70%、服務器資源可節省約85%、平均每注冊用戶數據庫成本可節省約50%。
始于20世紀末的中國數據庫產業,在近十年快速發展,并伴隨數字化熱潮迎來新機遇?!稊祿彀l展研究報告(2023年)》顯示,從市場來看,2022年全球數據庫市場規模為833億美元,其中中國數據庫市場規模為59.7億美元,折合人民幣約為403.6億元,占全球的7.2%。
當下,人工智能爆火,海量數據價值的挖掘和應用,成為推動創新的重要力量。這對數據存儲和計算的性能成本提出更高要求。
“數據庫既要功能強大,又要簡單好用,還要有可擴展性。當然,最重要的是穩定,最好還能兼容?!痹谖溥B峰看來,基于數據的智能時代對數據庫的要求越來越苛刻,這對國內數據庫產品和數字科技企業來說既是挑戰,更是前所未有的發展機遇。