最近的數據庫行業(yè)熱鬧非常。
一邊是國產數據庫崛起的聲音?!?020網信自主創(chuàng)新調研報告》顯示,國產數據庫在國內的市場份額提升至8%-10%,在黨政、金融、電信等多個關鍵領域開始規(guī)模化應用。在Gartner發(fā)布的2020 年度全球數據庫魔力象限中,中國數據庫首次進入第一象限。
在數據庫于金融、電信這些“重”、“大”領域馳騁的同時,一些聲音被忽略了——“自建數據庫的成本大嗎?有沒有必要選擇自建數據庫?”它們來自中國大量的中小企業(yè),對它們來說,這些問題相當迫切,也相當普遍。
9月11日,全球創(chuàng)業(yè)者峰會上有人將這兩種“聲音”聚合到了一起。螞蟻集團旗下獨立的數據庫公司北京奧星貝斯(OceanBase)發(fā)布了“創(chuàng)計劃”,首期全免費為100家中小企業(yè)提供數據庫升級服務。
在數據庫的國產化之路上,中小企業(yè)們從不是無關緊要的角色,甚至是重要的推動者,OceanBase明白這個道理。
開放者
9月10日、11日,全球創(chuàng)業(yè)者峰會在北京召開。就在這個會議的前兩天,北京市召開優(yōu)化營商環(huán)境“十四五”規(guī)劃新聞發(fā)布會,講述了一系列對中小企業(yè)的扶持計劃。時間再往前,是扶持“專精特新”中小企業(yè)的北交所成立。
在這個意義非凡的大會上,一家剛成立一年名為OceanBase的數據庫企業(yè)被邀請參加主論壇發(fā)言。9月11日,OceanBase(以下簡稱“OB”)的CEO楊冰發(fā)布了一個相當“大膽”的計劃,免費幫中小企業(yè)提供數據庫服務,首期開放100個名額。
在他的計劃中,這只是OB創(chuàng)計劃的首期,希望通過首期這100個樣本總結出一套為中小企業(yè)技術服務的模版,從而在接下來二期三期中更好地服務更多的中小企業(yè)。
數據庫同芯片、操作系統(tǒng)一道,都是相當重要的IT軟件,甚至有人說“沒有數據庫,就沒有企業(yè)的根本”。但在這個投資人眼中快公司才有價值的年代,對創(chuàng)業(yè)者和中小企業(yè)來說,底層技術的搭建注定漫長,從0開始難于登天,很多人只能求助于開源或免費數據庫。
OB的創(chuàng)計劃,針對的就是這些中小企業(yè)。除了1T數據量以外,這個計劃沒有門檻,“只要報了名說是我們的開源客戶,希望得到幫助,我們就會派出專業(yè)的人員去做架構咨詢,去教如何使用,幫助客戶上線后也會再提供一些售后保障機制”,楊冰向《一點財經》表示。
其實,早在3個月前,OB還做了一件大事,那就是開源。
今年6月1日,OB采用木蘭協(xié)議全面開放內核,在Gitee、Github上進行代碼托管,同時成立OceanBase開源社區(qū),300萬行核心代碼向社區(qū)開放。以此,OB從閉源軟件走向了開源。
在開源、創(chuàng)計劃連續(xù)兩個動作背后,OB正在走出螞蟻,變得越來越開放。它開放的底氣何在?
革命者
“看著同樣是車,但其實特斯拉和油車不是一個時代的產物,未來特斯拉可能就沒有方向盤了”,9月10日,楊冰在北京新國展附近向《一點財經》如此通俗地解釋OB的分布式數據庫與其他數據庫質的不同。
OB成立得比特斯拉還早,至今已有十一年的時間,但同特斯拉一樣,OB生于“不滿足”。那時,淘寶還沒有騰飛,螞蟻還在初創(chuàng),但一些東西正在悄悄萌芽,其中就有2010年成立的OB。
當時的數據庫有兩個背景:第一,數據庫技術本質上受場景驅動,上世紀開始IT行業(yè)最先發(fā)展起來的美國也最先發(fā)展起了數據庫,隨后幾乎壟斷了全球數據庫行業(yè)。第二,隨著21世紀以來中國計算機行業(yè)的快速發(fā)展乃至超越,中國有了革新數據庫的行業(yè)基礎和訴求。
淘寶是做電商的,隨著電商業(yè)務的推進,曾任淘寶高級研究員的陽振坤發(fā)現(xiàn)了一個現(xiàn)象:傳統(tǒng)數據庫處理的是封閉物理世界的場景,但像淘寶這樣的線上商城沒有物理邊界,無論是數據量、請求量、訪問用戶都是天南地北不被限制的,因此必須打破并重新設計數據庫。
“做這個的初心其實是做一個未來的數據庫,陽老師(陽振坤)認為現(xiàn)在的數據庫技術很難去適應未來的時代。第二也是有情懷在,總覺得在中國的軟件領域也應該有一些比較硬核的自主品牌出現(xiàn),而數據庫是軟件當中除操作系統(tǒng)以外最難的。”楊冰如此解釋OB的由來。
一開始,他們想基于一個開源數據庫去重新設計,但對市面上的數據庫摸了一圈之后,發(fā)現(xiàn)找不到符合自己要求的,頂層設計不一樣,所以開始從0開始設計出OB。它基于Paxos 協(xié)議和分布式架構,構建在通用服務器集群上,不依賴特定硬件架構。
重新設計的OB,可能使用感跟傳統(tǒng)數據庫一樣,但內核里已完全不同,楊冰用“scale out”(線性擴展)和“scale up”(增大)兩個詞匯來描述兩者的差異。
傳統(tǒng)數據庫像一輛燃油車一樣,當覺得馬力不足的時候可以scale up,裝更多的配件,從8缸到12缸,但再怎么多裝,都只能在車的容限里。而OB可以scale out實現(xiàn)線性擴展,能力不夠了可以加服務器,單個硬件本身的能力沒那么強,但整合起來沒有天花板。
“我們用分布式數據庫通過了傳統(tǒng)集中式數據庫最嚴苛的測試標準,甲骨文做到了每秒鐘3000萬,而我們做到7.07億,成為唯一在事務處理和數據分析兩個領域測試中都刷新世界記錄的中國自研數據庫。”全球創(chuàng)業(yè)者峰會上,楊冰介紹道。
生長土壤的根本性差異,決定了OB的革命性不同。與傳統(tǒng)數據庫相比,OB能夠幫企業(yè)降低50%-80%的成本,規(guī)模越大,降低效果越明顯。
走出螞蟻
對分布式數據庫來說,一致性是重要考驗,而OB通過采用Paxos 協(xié)議解決了一致性問題。Paxos這個理論最早由科學家Lamport提出,后來Google的工程師基于此做了分布式數據庫?,F(xiàn)在OB基于金融級場景的打磨會在一致性和延遲方面做的更極致。
螞蟻做的是支付,谷歌做的是搜索場景,也就無法在金融這樣的場景中將一致性做到極致。“我們用了同樣一套論文里面的理念,用自己的方式重新再實現(xiàn)一遍,雖然參照一樣的東西,但放在支付寶這種場景里就可以模擬出來,可以做得更強”,楊冰表示。
雖然現(xiàn)在分布式數據庫成為行業(yè)公認的未來,成為兵家必爭之地,但其實一開始,哪怕在螞蟻內部,對數據庫應該怎么走,哪個方向才是未來這些問題都是有疑惑的,在阿里和螞蟻內部,做數據庫的團隊也不只一個。OB就是在這種千軍萬馬過獨木橋的氛圍中一路走過來,研發(fā)最艱難的時候,幾乎就沒有人敢用OB,團隊也經歷過至暗時刻,但最終還是熬出來了,并最終取得了勝利。
除了技術先進性和路線的正確性,OB的發(fā)展還離不開螞蟻等業(yè)務場景的支持。一開始淘寶收藏夾最先表達了對OB的支持,但當時的OB還沒有那么強,找到一兩個場景后無法繼續(xù)推廣了,陽振坤向阿里云計算創(chuàng)始人王堅求助,后者幫忙說服了當時的螞蟻集團CTO程立。
那時,螞蟻集團可以說是當時中國使用Oracle最多的一家互聯(lián)網公司,而螞蟻又在實行去IOE(Oracle 的標配是 IBM 的小型機和 EMC 的存儲硬件)戰(zhàn)略,需要找到替代的數據庫,尤其是自己的數據庫。
OB第一次在螞蟻的亮相可謂完美。螞蟻原本計劃給OB 1%的業(yè)務量,但預估之后發(fā)現(xiàn)Oracle扛不住,最后給了OB10%的業(yè)務量。“這個時候OB也沒有別的選擇,就來吧,結果OB頂過去了,一戰(zhàn)成名,走過了至暗時刻”,楊冰回憶道。
OB的發(fā)展到可以分為三個階段,1.0時代是從2010年成立到找到淘寶收藏夾,再轉戰(zhàn)支付寶第一個核心交易系統(tǒng)上線;2.0時代是在支付寶內部不斷打磨金融場景,實現(xiàn)支付寶核心業(yè)務對Oracle的替換,得到外部客戶的認可;3.0時代是正式走出螞蟻。
2020年6月,隨著內部打磨和考驗的完成,OB開始走出螞蟻,在北京成立獨立公司,除了螞蟻時期就十分上手的金融企業(yè),還開始接觸運營商、能源電力等傳統(tǒng)企業(yè),以及跨境電商等互聯(lián)網企業(yè),甚至開始有海外企業(yè)合作。
在楊冰看來,過去十年OB是通過內部 “喂”出來、磨出來的,未來隨著走出螞蟻,進一步打磨OB的產品成熟度,把它推向世界。
數據庫國產化野心
陽振坤常常提到一個說法,一個技術產品要長遠發(fā)展,必須“頂天立地”,所謂“頂天”,是技術先進性,所謂“立地”,是產品化、商業(yè)化、通用化。毫無疑問,OB是“頂天立地”的信奉者。
OB走出螞蟻的過程,其實就是它產品化、商業(yè)化的過程。
對一個以技術為基石的企業(yè)來說,這無疑是相當有挑戰(zhàn)性的??钙餙B產品化、商業(yè)化重任的楊冰,就直言經歷了一兩年的過渡期。“從去年成立一個商業(yè)化團隊之后,我們在決策導向和引導導向上強調客戶第一,讓大家做事情不要自high。”
原來,技術埋頭做技術就好,但現(xiàn)在,他們不得不更多地聽來自外界的聲音,走出辦公室,去客戶企業(yè)里聽從他們的需求和聲音,在客戶要求下做產品的改進。曾經技術為主的30人團隊,如今發(fā)展成500人,其中有專精技術的,也有既懂技術也懂產品的復合型人才。
OB策略一開始是高舉高打,樹立標桿,它合作的企業(yè)中有銀行、證券、石油、電力、運營商等企業(yè),都算是大型企業(yè),也是對數據和技術要求高的企業(yè)。截至目前,OB合作了上百家企業(yè)。
隨著今年開源和“創(chuàng)計劃”的實施,OB的步子越邁越大。楊冰向《一點財經》透露,明年OB計劃推出4.0版本,其特性是輕量化更好,會更適合中小微企業(yè)。“到時,OB會像金箍棒一樣,能長就長,能短就短。”
通過一高一低兩端共同推進,OB在做大企業(yè)時,爭取更多的認同者、追隨者,在中國乃至全球進行分布式數據庫布道,共同推進國產分布式數據庫的發(fā)展,改變數據庫為外國企業(yè)引領乃至占據的局面,這是OB的數據庫國產化夢想。
近二三十年,數字世界欣欣向榮,無論個人還是企業(yè)都放棄了紙筆,將電腦和軟件作為了生產工具,在持續(xù)的產業(yè)數字化背景下,數據庫的重要性不言而喻。自一開始就生于“不滿足”的OB,想做得更“出格”一點。
要實現(xiàn)這個終極目標,推動國產數據庫,首先要做的是長期保持技術的先進性。據楊冰所說, OB是產品先行,會長期遵行技術優(yōu)先。
結語
操作系統(tǒng)、芯片、數據庫,是IT三大重要部分,也是中國創(chuàng)新企業(yè)發(fā)展的三大攔路虎。曾經,它們的共同特性是被國外廠商所占據,中國企業(yè)只能在此基礎上做優(yōu)化和調整。如今,操作系統(tǒng)和芯片國產化已經在路上,數據庫國產化正在崛起。
中國全球領先的互聯(lián)網、數據產業(yè),為數據庫的國產化提供了天然土壤。彎道超車,最有可能在這里實現(xiàn)。