作為中國最早一批研發(fā)空間數(shù)據(jù)庫的技術(shù)人員,陳應(yīng)東認(rèn)為,空間數(shù)據(jù)庫將在未來的5G、物聯(lián)網(wǎng)、人工智能的推動下迎來全新的發(fā)展機(jī)遇。采訪過程中,他提出的兩個比喻讓記者印象深刻,一是數(shù)據(jù)庫就像是硬件中的芯片,雖然處于底層但至關(guān)重要。二是數(shù)據(jù)庫就像是圖書館里的管理員,藏書再多也要能夠找得到才管用。
本期《時空》對話北京博陽世通信息技術(shù)有限公司總經(jīng)理陳應(yīng)東,探尋作為數(shù)據(jù)時代底層基礎(chǔ)設(shè)施的數(shù)據(jù)庫,究竟在發(fā)揮著怎樣的作用?獨特的空間數(shù)據(jù)庫又在經(jīng)歷著怎樣的轉(zhuǎn)變?
《時空》:博陽世通名字的由來?
陳應(yīng)東:博陽是我們?nèi)∽杂⑽摹癇eyond”的諧音,寓意是通過我們的自主研發(fā)超越現(xiàn)有技術(shù)和產(chǎn)品。世通則是“世界通用”的簡寫,當(dāng)時我們希望我們的數(shù)據(jù)庫能夠被所有人使用。兩個詞合起來,就是說我們想要做出讓全世界人都使用的,領(lǐng)先的數(shù)據(jù)庫,即博陽世通。
《時空》:能否簡單的解釋一下,數(shù)據(jù)庫、數(shù)據(jù)管理平臺以及數(shù)據(jù)中心,這三者之間的區(qū)別和關(guān)系是什么?
陳應(yīng)東:數(shù)據(jù)庫本質(zhì)上其實就是一種用于儲存數(shù)據(jù)的基礎(chǔ)性軟件。而數(shù)據(jù)管理平臺,大家可以簡單理解為是在數(shù)據(jù)庫的基礎(chǔ)上加入了一些管理功能的軟件系統(tǒng),更加方便用戶的使用。
但數(shù)據(jù)中心和前兩者的定義就不太一樣了,一般我們將數(shù)據(jù)中心更多的定義成為是一個實體的事物,可以是一棟樓或者是一個機(jī)構(gòu)或部門,但不是信息化和軟件的概念。
在這我想舉個例子大家更容易理解。數(shù)據(jù)中心就好比是一座圖書館(沒有電腦),它既代表著一個實體建筑,也代表了一個單位或者是一項業(yè)務(wù)。這座圖書館里的書架數(shù)量以及能夠存放書籍的空間,其實就相當(dāng)于是現(xiàn)在我們用的機(jī)房和服務(wù)器,屬于硬件設(shè)施。
而數(shù)據(jù)庫,其實就是傳統(tǒng)圖書館中的圖書管理員,他們負(fù)責(zé)把這些書籍(數(shù)據(jù))分門別類的存放好,并且能夠整理成目錄方便以后及時找到。再說數(shù)據(jù)管理平臺,則相當(dāng)于是圖書館中設(shè)立的服務(wù)窗口,負(fù)責(zé)借閱、歸還等服務(wù)。
其實用的還是管理員(數(shù)據(jù)庫),但是它又實現(xiàn)了一些除了儲存以外的其他功能,比如調(diào)取、錄入、管理等等。為的就是能夠讓不熟悉圖書館書籍存放方式(數(shù)據(jù)庫軟件)的人也能快速找到想要的書(數(shù)據(jù))。
《時空》:作為這個領(lǐng)域的專家,您如何定義空間數(shù)據(jù)與空間數(shù)據(jù)庫?而空間數(shù)據(jù)庫與主流的數(shù)據(jù)庫究竟又有哪些區(qū)別?
陳應(yīng)東:其實,隨著時代的發(fā)展大家對這些定義的理解也發(fā)生了很大變化。以前我們認(rèn)為,空間數(shù)據(jù)實際上就是地理空間數(shù)據(jù),講的就是通過測繪在地球表面所獲取的數(shù)據(jù),經(jīng)緯度坐標(biāo)或者是帶坐標(biāo)的影像。
但現(xiàn)在普遍的共識是,只要是帶有空間屬性的數(shù)據(jù),都可以認(rèn)為是空間數(shù)據(jù)。這樣判斷的話,幾乎百分之百的數(shù)據(jù)都帶有一些時間或空間屬性。那么,能夠?qū)臻g數(shù)據(jù)進(jìn)行儲存和計算的數(shù)據(jù)庫,或者是以處理空間數(shù)據(jù)為主的數(shù)據(jù)庫,我們就會稱之為是空間數(shù)據(jù)庫。
空間數(shù)據(jù)庫與主流數(shù)據(jù)庫最主要的區(qū)別,就體現(xiàn)在針對空間數(shù)據(jù)的存儲能力和計算能力上。就目前來講,空間數(shù)據(jù)庫在這兩方面占有絕對的優(yōu)勢。
這主要源于空間數(shù)據(jù)庫內(nèi)核算法中就支持對空間數(shù)據(jù)以及非結(jié)構(gòu)類數(shù)據(jù)的運(yùn)算處理,而大多數(shù)主流數(shù)據(jù)庫采用的是外部連接空間引擎的方式,這使得后者的流程繁復(fù)以至于效率明顯低于空間數(shù)據(jù)庫。
這里也舉個例子,比如我想要調(diào)取某一時段在北京某個小區(qū)發(fā)生的交易數(shù)據(jù)。主流數(shù)據(jù)庫會通過空間引擎查詢所有數(shù)據(jù)的空間位置信息,計算是否匹配該小區(qū)的坐標(biāo)范圍,然后找出坐標(biāo)對應(yīng)的數(shù)據(jù)。
而空間數(shù)據(jù)庫,因為自身就支持空間分析能力,所以直接用該小區(qū)的空間范圍與數(shù)據(jù)庫中的數(shù)據(jù)做一個簡單的拓?fù)浞治,即可快速找到被該小區(qū)覆蓋的所有數(shù)據(jù)點。兩者之前的底層算法可能是一樣的,但是對于空間的理解不同,所以體現(xiàn)在空間數(shù)據(jù)的處理能力上也就自然天差地別。
《時空》:空間數(shù)據(jù)庫與主流數(shù)據(jù)庫,未來兩者會以什么樣的關(guān)系繼續(xù)發(fā)展?
陳應(yīng)東:這其實是我們一直也在討論的一個問題,即空間數(shù)據(jù)庫以及數(shù)據(jù)庫未來會如何發(fā)展?數(shù)據(jù)庫技術(shù)從上世紀(jì)60年代誕生至今,發(fā)展出了包括關(guān)系數(shù)據(jù)庫、對象數(shù)據(jù)庫等多種類型,每一類數(shù)據(jù)庫也都有各自的優(yōu)勢和不足。
對于未來的數(shù)據(jù)庫形態(tài),我個人比較傾向于相信它會向著高度融合的方向發(fā)展,無論是現(xiàn)在主流的關(guān)系型數(shù)據(jù)庫,還是空間數(shù)據(jù)庫,未來或許都會結(jié)合成一體、各取所長。因為我們認(rèn)為,純粹一種數(shù)據(jù)庫是不可能滿足所有的需求的。所以將來的一個數(shù)據(jù)庫或者數(shù)據(jù)管理平臺,可能會用到很多種數(shù)據(jù)庫,這其中自然也包括空間數(shù)據(jù)庫。
《時空》:目前看來,在整個空間信息產(chǎn)業(yè)鏈中數(shù)據(jù)庫只占了很小的產(chǎn)值份額,您對這種情況怎么看?您認(rèn)為空間數(shù)據(jù)庫應(yīng)該在這個產(chǎn)業(yè)中發(fā)揮什么樣的作用?
陳應(yīng)東:我個人認(rèn)為,目前無論是在國內(nèi)還是國外,數(shù)據(jù)庫的發(fā)展都還是非常健康的。數(shù)據(jù)庫的產(chǎn)值或者是市場規(guī)模,這跟它的自身定位與商業(yè)模式有關(guān),但不能代表數(shù)據(jù)庫在整個信息時代的價值和重要性。
我常用的一個比喻就是,數(shù)據(jù)庫在軟件中的地位,其實就相當(dāng)于芯片在智能硬件中的地位。它直接關(guān)系到后端的軟件系統(tǒng)好不好用,以及整個信息化工作能否穩(wěn)定安全的運(yùn)行。
所有的信息化軟件都離不開數(shù)據(jù),所以,所有的信息化也都離不開數(shù)據(jù)庫。再細(xì)點說,現(xiàn)在我們經(jīng)常講的大數(shù)據(jù)、云計算、智慧城市、人工智能、物聯(lián)網(wǎng),哪一項不跟數(shù)據(jù)有關(guān)。
這些數(shù)據(jù)都不是寫著紙上記在腦子里的數(shù)據(jù),而都是儲存在數(shù)據(jù)庫的數(shù)據(jù),這樣才能夠被檢索、調(diào)取、分析。所以,所有的信息化工作,背后其實都有著數(shù)據(jù)庫的支撐。但它真正能賣多少錢,或許還真的不多,甚至?xí)刃酒谟布械恼急冗低,但它依舊不可或缺。
《時空》:作為數(shù)據(jù)庫廠商,如何打破數(shù)據(jù)庫的天花板?
陳應(yīng)東:數(shù)據(jù)庫的商業(yè)模式存在很強(qiáng)的特殊性,特別是在國內(nèi)。目前主要表現(xiàn)為兩點:一是國外數(shù)據(jù)庫產(chǎn)品通過先發(fā)優(yōu)勢造成了壟斷,二是用戶對數(shù)據(jù)庫的產(chǎn)品需求逐漸轉(zhuǎn)化為服務(wù)需求。
像Oracle、SQL Serve、DB2這樣的老牌數(shù)據(jù)庫產(chǎn)品,由于推出時間早,打下了堅實的用戶基礎(chǔ),甚至在一定程度上成為了行業(yè)的標(biāo)準(zhǔn)。就像Windows系統(tǒng)在PC領(lǐng)域的地位一樣,后來者很難超越,所以這也就是國內(nèi)數(shù)據(jù)庫廠商難做的主要原因。
其次,因為數(shù)據(jù)庫這個東西它不能直接產(chǎn)生信息化結(jié)果的,本質(zhì)上它是一個配套性的、基礎(chǔ)性的軟件。所以,現(xiàn)在的用戶對數(shù)據(jù)庫產(chǎn)品的需求越來越弱,反之則對服務(wù)的需求逐漸增強(qiáng)。
以博陽世通近兩年的銷售情況為例,單純通過銷售數(shù)據(jù)庫產(chǎn)品獲得的收入,占總體的比重已經(jīng)非常小了,反倒是通過承接整體的信息化項目的營收也快速增長。
如今市面上也很少能夠見到某一家企業(yè)或者是政府單位單獨采購一套數(shù)據(jù)庫,基本上都是一整套信息化項目的招標(biāo)。所以對于數(shù)據(jù)庫廠商來說,以數(shù)據(jù)庫當(dāng)作基礎(chǔ),逐漸將業(yè)務(wù)延伸至應(yīng)用前端,或許會是打破企業(yè)天花板的重要方式之一。
《時空》:AI、大數(shù)據(jù)分析大行其道的今天,空間數(shù)據(jù)庫的發(fā)展趨勢有哪些?博陽世通又為此做了哪些準(zhǔn)備?
陳應(yīng)東:未來,5G時代以及物聯(lián)網(wǎng)時代的到來,會使得AI和大數(shù)據(jù)分析越來越普及。與此同時,可預(yù)料的是需要儲存和處理的數(shù)據(jù)量會急劇增加,對于數(shù)據(jù)庫的需求和要求也會再提升一個量級,我們也面臨著相應(yīng)的機(jī)遇與挑戰(zhàn)。
其中挑戰(zhàn)主要是對于數(shù)據(jù)庫自身技術(shù)的要求,這方面博陽世通自2010年成立以來一直堅持自主研發(fā),積累了許多的技術(shù)經(jīng)驗,也為應(yīng)對海量數(shù)據(jù)的精細(xì)化處理做好了充足的準(zhǔn)備。而在我看來,未來的5G時代對于我們來說可能是機(jī)遇大于挑戰(zhàn),機(jī)遇就在于我們掌握著對于空間數(shù)據(jù)處理的優(yōu)勢。
在現(xiàn)在的這個數(shù)據(jù)體量下,很多時候空間計算的能力還顯現(xiàn)不出來。但當(dāng)5G、物聯(lián)網(wǎng)這個時代真正到來的時候,數(shù)據(jù)中空間屬性的重要性就會越來越高,對于空間數(shù)據(jù)處理能力的需求也會越來越大。屆時,具備強(qiáng)大空間數(shù)據(jù)處理能力的數(shù)據(jù)庫產(chǎn)品的價值就會顯現(xiàn),而忽視這方面能力和積累不足的數(shù)據(jù)庫產(chǎn)品一定會死掉,這就是大勢所趨。
當(dāng)然,已經(jīng)有很多人意識到空間數(shù)據(jù)的重要性,比如阿里巴巴和京東,他們都已經(jīng)在自己的數(shù)據(jù)庫中加入了空間分析的模塊,并且在基礎(chǔ)架構(gòu)設(shè)計中就已經(jīng)開始重視空間屬性的作用。
所以,對于空間數(shù)據(jù)的處理能力,一定將會幫助博陽世通在未來的時代占據(jù)一席之地,我們也在期待著那個時代盡快到來。