不同于歷史上的黃金和石油,數(shù)據(jù)成為了我們新的寶藏,一個驅(qū)動社會進(jìn)步、催生創(chuàng)新的無盡源泉。然而,這些形式各異、復(fù)雜紛繁的數(shù)據(jù)需要一個管理者,一個保險庫,一個解析者,這就是數(shù)據(jù)庫的角色。
為了更系統(tǒng)、深入的梳理數(shù)據(jù)庫的發(fā)展脈絡(luò)和最新進(jìn)展,數(shù)據(jù)猿采訪了達(dá)夢數(shù)據(jù),探尋數(shù)據(jù)庫的價值和未來。
站在歷史的瞭望臺上,我們可以看到數(shù)據(jù)庫技術(shù)如何順應(yīng)時代的潮流,從過去到現(xiàn)在,逐漸形成一個輝煌的脈絡(luò)。在這條道路上,每一次技術(shù)創(chuàng)新和應(yīng)用的飛躍,都代表了對歷史的繼承和超越。而今,我們正站在一個新的起點,數(shù)據(jù)庫的發(fā)展已經(jīng)步入一個全新的階段。
辨析數(shù)據(jù)庫的兩個關(guān)鍵問題
走到歷史的分叉口,我們需要對一些關(guān)鍵問題找到合理的答案。目前,數(shù)據(jù)庫領(lǐng)域有兩個問題亟需找到答案:分布式數(shù)據(jù)庫最終會一統(tǒng)天下,還是會與集中式數(shù)據(jù)庫長期并存;數(shù)據(jù)庫類型越來越多,最終是走向?qū)鞂S?,還是多模融合?
達(dá)夢數(shù)據(jù)認(rèn)為,“分布式數(shù)據(jù)庫會是很重要的方向之一,但分布式數(shù)據(jù)庫有其適用的特定場景,在很多領(lǐng)域仍然可能采用更通用的集中式架構(gòu)數(shù)據(jù)庫。因此我們認(rèn)為集中式和分布式是兩個賽道,雖然這兩個賽道互相之間可能會有一些競爭,但原則上是兩個互補的東西。
分布式和集中式實際上并非完全對立的兩條技術(shù)路線,也沒有誰更優(yōu)于誰的概念,只是使用業(yè)務(wù)場景不同,匹配的技術(shù)架構(gòu)也就有所不同。客戶在選擇分布式數(shù)據(jù)庫的時候,應(yīng)該綜合考慮業(yè)務(wù)模型、技術(shù)棧選型、運維成本、產(chǎn)業(yè)供應(yīng)商體系等因素。此外,分布式數(shù)據(jù)庫是重量級的技術(shù),對用戶的使用門檻是比較高的,這一點用戶也應(yīng)該綜合考慮。
總的來說,我們認(rèn)為客戶在選型時應(yīng)該不拘泥于數(shù)據(jù)庫的類型,而是選擇以實際需求、痛點為導(dǎo)向,尋找能夠滿足自己實際需求和技術(shù)指標(biāo)的產(chǎn)品解決方案。比如,在客戶需求層面,不論客戶定義實現(xiàn)其所需功能的數(shù)據(jù)庫為分布式還是集中式,客戶在項目實施過程中都可基于通用達(dá)夢數(shù)據(jù)庫,按自身實際需求和技術(shù)指標(biāo),采用不同的系統(tǒng)配置和不同的集群軟件搭配方案來構(gòu)建集中式、分布式或混合搭配使用的數(shù)據(jù)庫實例。”
面對越來越多的數(shù)據(jù)庫類型,人們不禁要問,以后是每種業(yè)務(wù)類型實現(xiàn)專庫專用,還是這些數(shù)據(jù)庫會走向融合統(tǒng)一,最終用一種通用數(shù)據(jù)庫來滿足多樣化的數(shù)據(jù)需求?
達(dá)夢數(shù)據(jù)認(rèn)為,“就目前來講,專庫專用,其實是一種發(fā)展趨勢,因為場景不同,特定數(shù)據(jù)庫的使用效果相差很大;但是否要融合,其表現(xiàn)出的是一個技術(shù)發(fā)展方向的問題,但問題的本質(zhì)卻是在需求側(cè)關(guān)注的幾個重點方向:降本增效、數(shù)據(jù)安全以及數(shù)據(jù)庫對于新技術(shù)的支撐作用。從這個角度來講,是否會走向融合,還是要看需求側(cè)的變化,技術(shù)和產(chǎn)品的發(fā)展還是要圍繞需求進(jìn)行演化。”
未來的發(fā)展方向
需要指出的是,數(shù)據(jù)庫雖然有幾十年的發(fā)展歷史,但并不意味著他進(jìn)入遲暮之年了。正相反,數(shù)據(jù)庫本身正處于快速發(fā)展過程中,新技術(shù)、新理念層出不窮。
那么,數(shù)據(jù)庫要進(jìn)一步發(fā)展,未來核心的突破方向有哪些呢?
達(dá)夢數(shù)據(jù)告訴數(shù)據(jù)猿,“目前,數(shù)據(jù)庫技術(shù)快速發(fā)展,很多技術(shù)方式都值得關(guān)注,例如HTAP技術(shù)、云化技術(shù)、人工智能的技術(shù)、新型硬件設(shè)備技術(shù)等等?,F(xiàn)階段達(dá)夢重點關(guān)注分布式數(shù)據(jù)庫、HTAP和云數(shù)據(jù)庫技術(shù)。AI for DB、多模數(shù)據(jù)庫等趨勢仍然需要一些時間。”
AI尤其是大模型與數(shù)據(jù)庫的融合方面,達(dá)夢數(shù)據(jù)指出,“大模型的建立和訓(xùn)練、以及推理應(yīng)用,是基于海量的數(shù)據(jù)基礎(chǔ)之上才能做到的,數(shù)據(jù)庫系統(tǒng)作為數(shù)據(jù)存儲、管理的核心軟件,在這個技術(shù)架構(gòu)中占據(jù)重要的地位;如何提高對各種大模型數(shù)據(jù)類型的支持程度、海量數(shù)據(jù)處理效率、向量數(shù)據(jù)庫技術(shù)、模型數(shù)據(jù)安全性、生態(tài)適配,降低海量數(shù)據(jù)存儲成本,給數(shù)據(jù)庫系統(tǒng)提出了挑戰(zhàn)的同時,也帶來了機遇。目前的數(shù)據(jù)庫系統(tǒng)作為傳統(tǒng)數(shù)據(jù)和大數(shù)據(jù)的重要載體,在大模型領(lǐng)域也有涉及和應(yīng)用,隨著大模型的迅速發(fā)展,也會拉動數(shù)據(jù)庫的迅速發(fā)展。”