在數(shù)據(jù)庫領域,萬里數(shù)據(jù)庫已經(jīng)默默耕耘了16年,如今,萬里數(shù)據(jù)庫已經(jīng)悄然走向了前臺,開始嶄露頭角。
近日,賽迪顧問發(fā)布了《“十四五”關鍵應用領域之數(shù)據(jù)庫市場研究報告》。賽迪直屬工業(yè)和信息化部中國電子信息產(chǎn)業(yè)發(fā)展研究院,所以,能拿到一些媒體拿不到的官方數(shù)據(jù),比如:關鍵應用領域數(shù)據(jù)庫部署情況等,因此,有一定參考價值。
值得關注的是,此次報告中,萬里數(shù)據(jù)庫進入領導者象限,成為最大黑馬。
按賽迪報告對領導者象限廠商的定位:企業(yè)產(chǎn)品技術路線符合市場需求、市場占有率較高,且技術具有領先性,在某些方向具有一定的領導力。而且公司產(chǎn)品安全性高,符合關鍵應用領域需求。
萬里數(shù)據(jù)庫入圍領導者象限是否實至名歸?說實話,閱讀報告前,我其實有些不以為然。但仔細閱讀報告后,我意識到之前的判斷可能有些草率和片面了。萬里數(shù)據(jù)庫的異軍突起,還是有一定數(shù)據(jù)與事實支撐的。當然,這是建立在特定市場與特定條件的基礎之上。
賽迪報告評價模型采用競爭力四象限圖模型,從技術先進性和產(chǎn)品安全性兩個維度對企業(yè)展開評估。從象限圖中可以看到,萬里數(shù)據(jù)庫處于領導者象限的中間位置,在產(chǎn)品安全性和技術先進性方面,與國內(nèi)熟知的一些數(shù)據(jù)庫廠商位于同一領先水平。
報告開篇就強調(diào):
“本報告主要研究在關鍵應用領域中應用的數(shù)據(jù)庫產(chǎn)品,涉及的數(shù)據(jù)庫均為商業(yè)發(fā)行版。”
這句話,我理解有兩層意思:其一,調(diào)研對象僅針對數(shù)據(jù)庫商業(yè)發(fā)行版,排除了開源版(社區(qū)版)產(chǎn)品,這或許就是為什么有些數(shù)據(jù)庫廠商并未出現(xiàn)在這份報告中的原因;其二,報告針對的并非全市場,而是關鍵應用領域市場。那么,什么是關鍵應用領域?
報告給出的定義是:
關鍵應用領域是指面向公眾提供網(wǎng)絡信息服務或支撐能源、通信、金融、 交通、公共事業(yè)等重要行業(yè)運行的信息系統(tǒng)或工業(yè)控制系統(tǒng)。毫無疑問,關鍵應用領域其實就是國產(chǎn)化替代首當其沖的產(chǎn)業(yè)。
為什么評估模型要基于技術先進性和產(chǎn)品安全性這2個維度?這2個維度又具體包含哪些因素?該報告也給出了原因。這與在“十四五”關鍵應用領域建設過程中,對數(shù)據(jù)庫的要求直接相關:
一、對數(shù)據(jù)庫安全性要求更高
關鍵應用領域被視為重要的信息基礎設施與行業(yè),因為它們的中斷或破壞將對重要的社會功能產(chǎn)生嚴重影響。這些系統(tǒng)一旦故障,會影響重要行業(yè)的正常運行,對國家政治、經(jīng)濟、科技、社會、文化、國防、環(huán)境以及人民生命財產(chǎn)造成嚴重損失。
據(jù)報告介紹,安全性這項指標主要考慮:公司股權結構、產(chǎn)品安全等級、客戶類型等因素。
二、對數(shù)據(jù)庫技術架構先進性要求更高
為什么關鍵應用領域?qū)?shù)據(jù)庫技術架構先進性要求更高?報告指出,這取決于現(xiàn)階段,數(shù)據(jù)庫產(chǎn)品面臨兩大技術挑戰(zhàn):
1、支撐云計算時代新的技術要求
依托公有云的存儲和計算資源,云數(shù)據(jù)庫實現(xiàn)了存儲和計算的完全解耦,在提供近乎無限的延展性和高彈性的同時,亦保障了數(shù)據(jù)的一致性,并支持結構化和半結構化數(shù)據(jù)的處理。同時,云數(shù)據(jù)庫平臺作為服務整體交付,節(jié)約了用戶管理基礎架構所需的成本、時間和資源。目前,數(shù)據(jù)庫管理軟件向云端的遷移亦成為明確趨勢。
2、滿足數(shù)據(jù)量劇增背景下,如何高效穩(wěn)定地使用數(shù)據(jù),支撐業(yè)務發(fā)展
隨著計算載體的迭代與業(yè)務需求的相互促進,傳統(tǒng)數(shù)據(jù)庫在某些伸縮性強的業(yè)務場景中已難以滿足市場需求,分布式數(shù)據(jù)庫在這些場景中的優(yōu)勢便顯現(xiàn)出來。在數(shù)據(jù)量劇增的背景下,集中式數(shù)據(jù)庫顯現(xiàn)出了存儲建設成本高、擴展性較差等問題。分布式數(shù)據(jù)庫則通過資源池化管理,實現(xiàn)物理或邏輯層的相互隔離和資源的自由伸縮,具備彈性擴張、HTAP事務、多租戶管理、高可用等能力,與云計算場景需求相匹配。同時,分布式數(shù)據(jù)庫對多種數(shù)據(jù)類型的兼容,可以實現(xiàn)對存儲于不同物理服務器、不同格式的數(shù)據(jù)進行結構與算法的優(yōu)化,突破服務器類型的限制,為上層不同類型的應用提供多模式的數(shù)據(jù)服務。
因此,基于以上2大挑戰(zhàn),云數(shù)據(jù)庫及分布式架構成為現(xiàn)階段最熱門的技術路線。數(shù)據(jù)庫產(chǎn)品是否考慮到新的技術要求并與新興技術融合,就成為了一項重要指標。
當然,技術先進性這項指標也并不僅限于此。據(jù)該報告介紹,這項指標主要考慮:產(chǎn)品架構、技術路線、服務體系、應用案例等因素。
搞明白了產(chǎn)品安全性及技術先進性兩個維度所包含的具體指標,萬里數(shù)據(jù)庫憑什么能進入領導者象限,就可以一一對應進行分析了。
從公司股權結構看,萬里數(shù)據(jù)庫算是國內(nèi)較早一批從事分布式數(shù)據(jù)庫研發(fā)的廠商,成立于2000年10月24日。據(jù)工信部數(shù)據(jù)庫發(fā)展白皮書2021顯示,國產(chǎn)數(shù)據(jù)庫企業(yè)成立年限超過10年的不足50%,而成立20年以上的數(shù)據(jù)庫企業(yè)只有十四家,萬里數(shù)據(jù)庫就屬于其中一家。
從天眼查可以查到,萬里數(shù)據(jù)庫是一家背景“清白”的獨立數(shù)據(jù)庫企業(yè),并沒有外資背景,也沒有與任何一家云廠商綁定。這對于企業(yè)多云異構的復雜環(huán)境有適用性、中立性。國外當紅炸子雞Snowflake,已經(jīng)證明了中立性的價值。
“未來,國內(nèi)數(shù)據(jù)庫市場會形成至少2個梯隊。第1梯隊是互聯(lián)網(wǎng)巨頭,萬里數(shù)據(jù)庫的目標是做第2梯隊領頭羊。為什么除了互聯(lián)網(wǎng)巨頭之外,還能有第2梯隊?因為,客戶替換是為了避免被外資大廠綁定,同樣,也不愿意接下來被另外的巨頭綁定,這就給萬里數(shù)據(jù)庫這樣的獨立數(shù)據(jù)庫廠商提供了市場空間。”
這是去年,萬里數(shù)據(jù)庫聯(lián)合創(chuàng)始人林韶賓在接受我的采訪時說過的一段話。其中就提到了中立性這點。
天眼查顯示,萬里數(shù)據(jù)庫旗下有且僅有唯一一個全資子公司,即北京拓林思軟件有限公司(Turbolinux),是國內(nèi)最早一批從事Linux產(chǎn)品化的公司。
這說明,萬里數(shù)據(jù)庫在基礎軟件領域很早就開始布局國產(chǎn)替代市場,有著較深的技術積累和國內(nèi)商業(yè)化的認知,否則不會存活到現(xiàn)在。這與近幾年跟隨風口瘋狂入場的一些新興數(shù)據(jù)庫公司,有著本質(zhì)區(qū)別。
從產(chǎn)品安全等級看,萬里數(shù)據(jù)庫是否符合國產(chǎn)化要求?具體到行業(yè),如:萬里數(shù)據(jù)庫是否符合金融國產(chǎn)化要求,相關資質(zhì)是否齊全?
從公眾號、網(wǎng)站等公開資料可以了解到,萬里數(shù)據(jù)庫自2018年開始與國產(chǎn)芯片、操作系統(tǒng)、服務器、中間件等國產(chǎn)軟硬件開展兼容適配。目前,萬里的數(shù)據(jù)庫已兼容所有主流的國產(chǎn)軟硬件。
萬里數(shù)據(jù)庫先后通過了中國人民銀行、中國電科院、中國軟件評測中心等行業(yè)及業(yè)內(nèi)權威的安全等級測試認證,并且產(chǎn)品在金融、運營商、能源等行業(yè)有較大規(guī)模的落地。
這說明萬里數(shù)據(jù)庫滿足國家安全標準與用戶安全標準。通過安全等級測試是一方面,更具說服力的是在金融、運營商、能源等行業(yè)頭部企業(yè)中有較大規(guī)模的落地實踐,這能說明很多問題。
從客戶類型及應用案例看,客戶類型及案例能有效證明產(chǎn)品的安全性。賽迪報告中雖未直接披露廠商和產(chǎn)品,但從案例架構圖中,不難找到萬里數(shù)據(jù)庫的身影?陀^地說,對于沒有國家隊背景的萬里數(shù)據(jù)庫而言,活著且越活越好,并不是一件容易的事。
雖然,萬里數(shù)據(jù)庫的商業(yè)模式與大部分數(shù)據(jù)庫廠商沒有區(qū)別,主要以售賣License為主。但萬里數(shù)據(jù)庫針對頭部客戶采用靈活的聯(lián)合研發(fā)模式,我認為,這才是萬里數(shù)據(jù)庫能夠敲開金融、運營商、能源等行業(yè)客戶,并迅速鋪開的主要原因。
聯(lián)合研發(fā)的案例并不難發(fā)現(xiàn)。2019年,萬里數(shù)據(jù)庫與國家電網(wǎng)聯(lián)合發(fā)布“思極有容”數(shù)據(jù)庫。2020年,又與聯(lián)通沃音樂聯(lián)合研發(fā)海納數(shù)據(jù)智能平臺uniBase。
售賣License的案例,如2020年,萬里數(shù)據(jù)庫中標了中移動OLTP數(shù)據(jù)庫聯(lián)合創(chuàng)新項目,在業(yè)內(nèi)一鳴驚人。
毫無疑問,萬里數(shù)據(jù)庫的主要用戶都是國內(nèi)關鍵應用領域中的頭部企業(yè)。如前所述,如果萬里數(shù)據(jù)庫的產(chǎn)品不符合國家電網(wǎng)、中國移動等行業(yè)巨頭的應用標準,它憑什么中標?沒國家隊身份的它又憑什么活著?
從產(chǎn)品架構看,去年,我對萬里數(shù)據(jù)庫聯(lián)合創(chuàng)始人林韶賓的專訪中已經(jīng)提及(詳情見《萬里數(shù)據(jù)庫是一家怎樣的公司?》)
GreatDB采用原生分布式架構、基于多數(shù)派協(xié)議+數(shù)據(jù)冗余實現(xiàn)高可靠,基于兩階段提交協(xié)議+DTM實現(xiàn)分布式事務ACID、集群架構全組件按需高可擴展。 GreatDB還針對中國企業(yè)級市場的需求改進了事務模型,從吞吐和延時兩個維度改進了性能。從用戶角度出發(fā),對原生分布式數(shù)據(jù)庫進行了增強。
因此,從產(chǎn)品架構上,萬里數(shù)據(jù)庫的原生分布式架構具有一定技術領先性。
從技術路線看,萬里數(shù)據(jù)庫基于MySQL技術路線進行自主研發(fā),這與其技術優(yōu)勢直接相關。萬里數(shù)據(jù)庫技術團隊為前MySQL中國研發(fā)中心及服務中心,先后與MySQL AB、SUN、Oracle合作研發(fā)過MySQL核心代碼。
萬里數(shù)據(jù)庫對MySQL主要有以下貢獻:Replication功能開發(fā)、NDB Cluster功能開發(fā)、Bug修復、中文手冊編譯等。顯然,在MySQL技術路線上,萬里數(shù)據(jù)庫有很深的技術積累而非浮于表面,這是其核心競爭力的體現(xiàn)。
眾所周知,國產(chǎn)數(shù)據(jù)庫多數(shù)基于MySQL和PostgreSQL二次開發(fā)而來,利用開源技術縮短與國外頭部企業(yè)的差距無可厚非。事實上,不僅在國內(nèi),國外也一樣。以下列出的都是基于MySQL開發(fā)的產(chǎn)品,其中就包含大眾所熟知的國外的AWS Aurora。
(來源:Database of Database 網(wǎng)站)
但是,如我一直強調(diào)的,利用開源技術不等于完全依靠開源技術,應該在開源技術上有著自己的創(chuàng)新。掌握核心能力,不是在開源技術上穿個“衣”帶個“帽”就號稱自研、自主可控。
這點,萬里數(shù)據(jù)庫相比國內(nèi)其它一些廠商的含糊其辭,要實在些,并不掩飾自己產(chǎn)品基于MySQL技術路線的事實,想必這份自信也是源于其多年自主研發(fā)經(jīng)驗及對MySQL核心技術的掌控。并且,萬里數(shù)據(jù)庫還兼具目前流行的開源技術路線。2021年,萬里數(shù)據(jù)庫將其多年技術積累進行了開源,推出GreatSQL社區(qū)。
基于國內(nèi)已經(jīng)形成龐大的圍繞MySQL軟件生態(tài)和人才生態(tài)的事實,搭建一個獨立自主的國內(nèi)MySQL分支社區(qū),其現(xiàn)實意義已在業(yè)界形成廣泛共識。當然,分支社區(qū)搭建容易搞活難,GreatSQL社區(qū)未來發(fā)展還有待觀察,但GreatSQL社區(qū)2021年已被評為“Gitee最有價值開源項目”,可見其潛力還是被業(yè)內(nèi)認可的。目前,國內(nèi)數(shù)據(jù)庫分支社區(qū)做的成功的不是沒有,比如openGauss就做得風生水起,不過它是基于PostgreSQL技術路線。
從服務體系看,服務很重要。因為,大部分應用企業(yè)在MySQL數(shù)據(jù)庫方面的故障解決能力、企業(yè)級數(shù)據(jù)服務支撐能力是不足的,維護團隊規(guī)模也不大。
從趨勢看,專業(yè)化服務是當前數(shù)據(jù)庫市場的主要發(fā)展趨勢。什么是專業(yè)化服務?舉個例子,雖然Oracle貴,服務也貴,但絕對是專業(yè)服務的典范。一個電話過去,Oracle派團隊過來駐場一個月,調(diào)試-測試-出報告,甚至會將配置哪里錯了、哪里可以優(yōu)化、哪些工具可以用來繼續(xù)監(jiān)測等都講得清清楚楚。甚至不是Oracle的問題,也會順手提出來,這就是專業(yè)化服務。
但是,專業(yè)化技術服務能力并不等于“搬磚”能力,其源動力是企業(yè)的技術能力水平。解決當前國產(chǎn)化替換的關鍵是技術掌控,而不是堆人。當然,堆人是一種態(tài)度,也能解決表面問題,但最核心的仍是對技術的掌控。
萬里數(shù)據(jù)庫是少數(shù)幾家接受我采訪時,主動談到測試方法論和工具的廠商。數(shù)據(jù)庫研發(fā)過程中最大的痛點不是解決問題,而是發(fā)現(xiàn)并重現(xiàn)問題。
如何保障產(chǎn)品的穩(wěn)定性?涉及分布式產(chǎn)品的測試,與以往單機不同。分布式架構有許多故障組合,尤其是機器多了以后,計算、存儲節(jié)點包含對上下游工具的兼容等都會導致一系列行為的不同。為此,萬里數(shù)據(jù)庫倒騰出了一個厲害的東西“混沌測試工具DBomb”。這個東西,我只有在采訪高斯實驗室和Oracle時才聽過。所以,萬里數(shù)據(jù)庫在解決產(chǎn)品技術問題方面是有其獨到之處的,這不是剛剛成立三五年的數(shù)據(jù)庫廠商可以做到的。
綜上所述, 無論是從公司技術團隊背景、產(chǎn)品、成功案例可移植性以及技術服務能力,萬里數(shù)據(jù)庫都表現(xiàn)得全面且均衡。因此,能進入到領導者象限,也就不難理解了。 該文觀點僅代表作者本人,如有文章來源系網(wǎng)絡轉(zhuǎn)載,本網(wǎng)系信息發(fā)布平臺,如有侵權,請聯(lián)系本網(wǎng)及時刪除。
|