作為將數據價值轉化為產能能效的“核心大腦”,數據庫的發展依然處于加速期,面向不同數據類型的數據庫類型也在不斷增加。
在眾多細分領域數據庫類型中,伴隨制造業數字化轉型的行業趨勢和多項政策推動,賦能智慧工業管理的時序數據庫愈發受到關注。
對于數據庫的概念大家應該并不陌生,但是‘時序’是什么?時序數據庫有哪些特點,基本架構是什么,市面上又有哪些產品類型?
本文將一一為你解答上述問題。
01 什么是時序數據
時序數據庫顧名思義,是“管理時序數據的數據庫”,所以在了解時序數據庫之前,首先需要了解什么是時序數據。
時序數據是按時間維度,記錄系統、設備狀態變化的數據類型。它的基本結構特點就是數據中自帶數據產生的時間,也就是數據帶有時間戳。在網絡良好的情況下,時序數據是以時間順序上報的。

時序數據舉例
物聯網、工業物聯網、金融、醫療等領域各種類型的設備和傳感器網絡都會產生海量的時序數據,時序數據的應用場景主要分為兩個目的:
降本:面向生產設備進行狀態監控、實時告警、故障預測,降低系統運維成本與故障風險。
增效:面向工藝步驟、生產流程展開深入分析,加快工藝改進,提高生產效率。
因此,時序數據為企業提供的新的利潤增長點是非常可觀的。
以風機運行場景為例,測風儀可能隨著環境因素(震動,腐蝕等)出現偏差,主控系統依據錯誤風向數據偏航導致迎風角錯誤,將會導致風機發電效率衰減,影響產能。
此時如果實現了對風機時序數據的全量存儲與充分分析,及時判斷是否需要對測風儀誤差進行補償,每臺風機每年即可多發電數萬元,每年可能為業主帶來上億元經濟收益。
可以說,數字化的基礎是對聯網設備進行狀態檢測,而產生的時序數據就是機器設備的“心電圖”。
02 時序數據庫的特點
時序數據庫是一種專門用于存儲、管理和處理時序數據的數據庫管理系統。因為時序數據一般存在采樣頻次高、實時性強、數據量大等顯著特點,導致寫入要求高、存儲代價大、處理難度高,一旦時序數據體量增加,單靠傳統數據庫可能力不從心。
而時序數據庫在管理時序數據方面就存在很多性能優勢,主要包括:
高吞吐寫入能力:時序數據往往體量龐大,并可能存在高頻數據上報。時序數據庫通過優化數據結構和存儲機制,可以在高并發的情況下保持高效的寫入性能。
高壓縮存儲能力:使用傳統方法的情況下,海量時序數據的存儲往往占用空間大、存儲成本高。而時序數據庫可以通過時序數據處理的相關技術,來大幅減少存儲空間。
低延遲查詢能力:時序數據時間屬性強,時序數據庫能夠支持用戶用更簡單的代碼邏輯,實時進行基于時間范圍的多類查詢,方便靈活地獲取所需結果。
支持多維數據分析和數據可視化:管理時序數據的目的是監控設備狀態、優化生產流程。時序數據庫通過工具/組件,支持數據大屏、報表等多形式的可視化成果,實現數據實時監控,并結合機器學習等前沿技術,進一步完成數據結果的深入分析。
高可擴展性:工業場景中伴隨業務發展,設備數量往往將不斷增加。時序數據庫底層架構易于擴展建模,以管理更多設備數據。
靈活、安全的數據傳輸:工業場景中,設備一般在多個場站持續上報時序數據,在場站初步處理后,往往需要匯總至中心/集團側進行進一步分析。同時,生產網、辦公網可能相互隔離并搭建單向網閘,因此,支持靈活、簡便、安全的數據同步方案對于時序數據庫至關重要。
03 時序數據庫中的基本概念
講完時序數據庫的整體側重點,下面以時序數據庫 IoTDB 為例,為大家介紹幾個時序數據庫數據模型的基本概念:
設備/實體(Device/Entity):實際場景中擁有物理量的設備或裝置,可以是一個物理設備、測量裝置、傳感器集合等。
時間戳(Timestamp):代表數據點到來的時間。
物理量/測點/字段(Measurement/Meter/Field):實際場景中設備所記錄的測量維度,例如傳感器上報的溫度、濕度等,記錄隨時間戳而變化的數據。
數據點(Data Point): 一個“時間戳-值”對,也就是一個時間點,一個設備上報的一個數據值,或重新二次計算的一個數據值,稱為一個數據點。
可以看到,設備/實體上報的時序數據涵蓋實時時間戳、多個物理量和不斷變化的數據點,而多個時序數據可被高效管理于時序數據庫中。
不同的時序數據庫也可能根據自己的數據模型衍生出其他概念。比如 IoTDB 采用了樹形模型,按照物聯網實際管理層級(集團層-廠站層-實體層-物理量層)組織數據,以從根節點 ROOT 到物理量葉子節點的路徑(Path)來命名一個時間序列,如 root.ln.wf01.wt01.status。IoTDB 也支持用戶將任意前綴路徑,比如 root.ln 設置成數據庫(Database),方便數據的物理隔離。

IoTDB 樹形模型
04 時序數據庫的類型與產品
從 1999 年出現 RRDtool(Round Robin Database Tool)提出了專門面向時序數據存儲、處理的方法開始,時序數據庫發展至今已超過 20 年。
在沒有專門管理時序數據的數據庫之前,人們通常使用關系型數據庫管理時序數據,因此部分時序數據庫的架構是基于關系型數據庫進行優化的。
還有一類基于 KV (key-value)存儲的時序數據庫,通過擴展 NoSQL 數據庫實現時序數據存儲,并使用分布式文件系統保障其擴展性。
隨著大數據時代到來,2010 年之后,時序數據爆發式增長,時序數據庫的發展走上了“快車道”。為了適應更多的場景,實現更好的性能,面向時序數據存儲全新研發的原生時序數據庫也越來越多。
目前,市場上已有多種時序數據庫產品,對應上述的不同架構類型,典型代表列舉如下:
TimescaleDB:TimescaleDB 基于 PostgreSQL 的時序數據庫擴展,兼具關系型數據庫和時序數據庫的特點。通過在 PostgreSQL 的查詢計劃器、數據模型和執行引擎添加鉤子,TimescaleDB 可以構建高度定制化的擴展層,并可以利用 PostgreSQL 豐富的第三方工具。
OpenTSDB:OpenTSDB 是一款基于 HBase 的分布式時序數據庫,采用鍵值對的數據模型,運用針對寫入密集的工作負載優化的 LSM-tree 結構,OpenTSDB 能夠應對時序數據高通量寫入的應用場景,并能保障擴展性。
InfluxDB:InfluxDB 在其類似 LSM-tree 的 TSM-tree 結構中,引入了 series-key 的概念,根據時間特征對數據進行分類,從而減少冗余存儲,提高數據壓縮率,并支持設置標簽(Tag)和字段(Field),方便用戶進行多維度查詢。
IoTDB:IoTDB 是一款國產全自研、低成本、高可用的時序數據庫產品。以自研的時序數據標準文件格式 Apache TsFile 為基底,合并亂序數據處理、時序大模型、端邊云同步方案等多項技術,保障時序數據庫的高吞吐、高壓縮、低延遲查詢性能,并提供豐富的數據分析功能與低流量、高安全性的數據同步功能。同時,IoTDB 實現了單機版、分布式版、邊緣版等多類形態部署,數據模型具有高擴展性,能夠有效滿足企業在多種計算資源條件下、多種終端配置下,構建物聯網時序數據管理解決方案的需要。
05 總結
作為全面數字化、服務轉型升級的基礎,時序數據管理對于工業、金融等領域至關重要。由于時序數據的特性與管理難點,時序數據庫成為了構建智能化、一體化時序數據解決方案的重要一環。
隨著物聯網、云計算、大數據等技術的發展,時序數據庫在未來將迎來更多的發展機會和挑戰。在實時數據處理、智能分析、跨平臺兼容性、數據安全性等方面,時序數據庫還在持續創新。
之前的文字中,我們對于時序數據庫的發展過程、選型指標和分類對比都進行了詳細梳理,并歸納了時序數據庫 IoTDB 的主要功能,歡迎各位擴展閱讀并和我們討論!
更多內容推薦:
? 了解如何使用 IoTDB 企業版
? 了解更多 IoTDB 應用案例