首頁
>
資源
>
用戶案例

替換OpenTSDB和HBase,寶武集團使用IoTDB助力鋼鐵設備智能運維

時序數據庫 IoTDB 應用于寶武集團全基地鋼鐵時序數據管理,激活數據資產,賦能大型設備智能運維。

1. 背景概述

寶武裝備智能科技有限公司(以下簡稱:寶武智維)是中國寶武設備智能運維專業化平臺公司,30 余年始終專注于鋼鐵行業設備技術服務,逐步打通檢測、診斷、檢修、制造等設備服務環節,形成系統解決方案服務模式,希望為用戶提供穩定可靠、智能高效的設備運行保障。

隨著工業物聯網的迅速發展,面向鋼鐵領域設備的智能運維成為大數據、人工智能等先進技術重要的應用方向之一。鋼鐵產線設備大型化、復雜度高,設備之間相互耦合,現場問題定位和修復難度非常高。同時,鋼鐵設備通常處于連續運轉狀態,出現異常對于產線產能影響可觀,實現設備的實時性、預防性維護對于保障產線效能、實現企業降本增效均十分重要。

為實現鋼鐵產線設備智能運維這一項極具挑戰的復雜系統創新工程,寶武智維基于海量工業時序數據積累及其豐富的應用場景,自主構建具備低成本、大規模接入能力的設備遠程智能運維平臺,并于 2023 年全面融合國產時序數據庫 IoTDB,作為該平臺管理寶武全集團時序數據的核心組件。

通過 IoTDB,寶武智維得以“激活”時序數據價值,大幅提升寶武集團、基地側智能化數據寫入、存儲、分析、傳輸性能,并為下游設備故障排查業務場景提供了堅實的數據支撐,形成了面向鋼鐵全流程,一個平臺、一個專家系統、一套標準化體系的智能設備運維新模式。

寶武用戶案例圖1-20241112.png

2. 選型痛點

在全面接入 IoTDB 之前,寶武智維已經經過多年探索,并使用基于 Hadoop 的 HBase 和 OpenTSDB 作為鋼鐵設備的時序數據管理架構。業務初期,該架構應用效果較好,但隨著更多數據量的接入,其慢慢成為了制約發展的底層瓶頸,主要體現在兩個大方面:“慢”和“難”。

  • 寫入慢:常規情況下,舊版架構勉強能夠達到寫入性能要求,但后續業務的擴張伴隨設備、數據量的激增,結合基地網絡資源的有限性,寫入性能逐漸捉襟見肘。如果碰到網絡斷線等異常場景,往往大量消息、數據出現堵塞,網絡恢復后需要快速地進行消費,但舊版架構也無法支撐消費速度要求。

  • 查詢慢:寶武集團查詢數據跨度可能以年為單位,并要求大跨度數據實現查詢秒級響應,而在數據量增加后,舊版架構僅能實現 5-30 秒內返回,對于業務平臺使用效果與實時監控設備狀態的目的實現存在較大影響。

  • 加工慢:數據寫入存儲后,需要使用聚合函數等方法實現多類數據加工,但基于舊版架構其速度非常有限,且很容易導致整體數據架構不穩定。

  • 抽取慢、匯聚難:當進行集團-基地數據資產整合時,往往需要不斷地將基地存儲數據抽取至集團側。舊版架構對于數據的實時傳輸支持不足,對持續的傳輸過程穩定性影響較大。

  • 清理難:基于舊版架構的數據清理、刪減主要依靠 TTL,過程復雜且靈活度較低。寶武集團實踐時,曾出現磁盤將滿情況下,定好的數據需要寫程序進行導出,再導回系統的情況,數據運維工作十分繁瑣。

  • 備份難:龐大的數據體量下,基于舊版架構的策略化備份實現非常困難,基本無法備份,只能選擇部署 3 節點集群以響應備份需求。

耗費大量成本獲取的海量高價值數據,卻變成了深不見底的數據黑洞。隨著數據量不斷增長,運行效率卻無法提升,數據反而成為拖累,下游應用系統、團隊的施展空間很低,無法將數據價值真正轉化為業務價值。

寶武用戶案例圖2-20241112.png

因此,寶武智維的時序數據庫選型標準可以概括為:

  • 能夠寫入海量并發數據;

  • 能夠用更低成本存儲全量數據、高頻數據;

  • 能夠實時查詢、分析數據,實現高效的數據清理與備份;

  • 能夠實現集團側-基地側數據實時同步、匯聚的易用方案。

3. 部署方案

2023 年開始,IoTDB 全面替換 OpenTSDB,成為寶武集團時序數據湖的數據底座。運用 IoTDB 為時序數據管理核心的寶武智維云平臺,已部署至寶武集團全部生產基地,并逐步擴展至集團外,負責接入寶武全集團所有基地內的所有設備數據,并進行在線狀態監測與設備智能運維業務。

目前,寶武智維云全面覆蓋寶武集團 21 大生產基地,接入 27 個子平臺、60 萬以上設備、240 萬以上數據項,總數據量超 5 PB。平臺配置規則超 10 萬條,已沉淀智能模型超 40 大類,平臺用戶數超 1 萬。

寶武用戶案例圖3-20241112.png

從以 IoTDB 進行重構的全新架構來看,寶武超大規模分布式數據湖由1 個 E4-IoTDB 集團數據湖和 N 個 E3-IoTDB 基地數據湖集群組成。多個 E3-IoTDB 基地數據湖負責存儲管理該基地的設備數據,而寶武集團層的 E4-IoTDB 數據湖主要覆蓋常態數據的降頻存儲和故障相關數據的原始頻率存儲。同時,集團層可以通過下發任務方式,從各個基地抽取所需數據并進行存儲,用于模型訓練及定制化數據任務。

寶武集團與基地之間的數據同步方式目前有兩種。第一種為通過 Pipe 使用 IoTDB 自研的時序數據標準文件格式 TsFile 進行高效傳輸,不需要數據的重新組織和重復寫入,可實現數據端到端的直接使用。另一種為使用全貫通的 Kafka 數據總線進行數據上傳,能夠滿足寶武各基地及集團的數據防火墻傳輸要求。

寶武用戶案例圖4-20241112.png

實現數據的高性能寫入、存儲,并打通數據抽取、傳輸鏈路后,寶武集團成功構建了 E4 集團數據湖與 E3 基地數據湖。集團數據湖包括一個主庫、N 個功能庫和一個備份庫,功能庫又包括故障特征庫與 AI 訓練庫。故障特征庫包括所有基地的設備故障特征,各基地一天幾十條至幾百條不等的故障事件所涉及到的相關數據均會上傳并進行存儲,方便集團集中分析故障趨勢與原因。各基地數據湖則包括一個主庫、一個功能庫和一個備份庫,功能庫主要做為同步庫使用。

寶武用戶案例圖5-20241112.png

使用 IoTDB 后,寶武集團時序數據管理效果提升非常明顯,實現性能提升 1 個量級,存儲成本大幅下降,運維手段豐富,數據資產匯聚,AI 模型訓練加速等有效成果。

存儲成本方面,通過實踐,基于 IoTDB 可實現 10 倍數據壓縮比,并能夠用少量服務器存儲集團規模數據。對于鋼鐵領域最重要的數據類型之一——信號數據的存儲成本也得到大幅降低。

運維手段方面,相比舊版架構僵化、暴力的數據清洗處理方式,寶武集團成功基于 IoTDB 實現備份、清理的靈活策略化,能夠積累豐富的指標、監測信息,幫助運維人員實現對設備狀態的更好理解。

性能指標方面,IoTDB 寫入速度可實現千萬點/秒,可以長時間穩定寫入高頻數據;基地上報的秒級數據及邊緣側上報的毫秒級數據,一年數據量查詢可實現秒級返回,并能夠覆蓋長達十年、數百萬點的設備數據降采樣分析,性能獲得用戶認可。同時,IoTDB 提供了豐富的聚合函數,有效拓寬寶武集團的數據加工場景,加速原始數據加工,并通過上述數據傳輸方案提升數據匯聚速度,方便數據真正形成模型,實現規模化運用。

與前文中的選型要求對照可見,IoTDB 在寫入、存儲、查詢、分析、運維、匯聚等方向,均契合了寶武智維的時序數據庫選型標準,從根源處解決了 OpenTSDB 與 HBase 架構的多個性能與功能實踐痛點。

寶武用戶案例圖6-20241112.png

4. 應用場景舉例

場景一:波形信號數據處理

鋼鐵行業中,設備實時上報的振動波形數據是最可靠的時序數據資產之一,能夠有效反映設備的運行狀態。寶武集團的振動波形數據一般分為兩類,一類是通過 PLC、DCS 采集上報的工藝量數據,一類是通過加裝大量傳感器,如溫振傳感器采集上報的振動波形數據。各類傳感器安裝數量龐大,因此后一類數據的體量十分可觀。

舊版架構中,以上兩類數據基本通過對象存儲方式存入 HBase,存儲量占比在某些基地達到 1:20。一個基地的數據中,20 份為振動數據,1 份為工藝量數據,可見振動傳感器上傳的時序數據體量十分龐大,存儲管理的成本,以及后續使用處理的難度可想而知。

引入 IoTDB 之后,參考 IoTDB 團隊所在的天謀科技技術人員的建議,寶武智維不再將振動波形數據作為對象進行存儲,而是直接將數據拆散之后,以納秒級精度存儲到 IoTDB,這樣能夠有效提升該類數據的存儲壓縮比,大幅降低其存儲成本。同時,存儲模式發生變化后,應用模式也隨之發生變化。寶武智維可以直接在 IoTDB 層面對振動波形數據進行處理,為后續的數據加工工作提供了有力支撐。寶武智維表示該項改良是“非常顛覆性的設計”。

寶武用戶案例圖7-20241112.png

場景二:結合 AI 的創新應用

IoTDB 有效解決了數據的抽取、存儲、處理、上傳問題后,豐富的時序數據資產被徹底激活,寶武智維也就能夠拓寬目前應用數據的模式與發展空間。其 AI 團隊成功從“找數據”改變為“要數據”,能夠發散更多有想象力的創新應用場景,面向多設備、長周期數據進行進一步歸納與分析。衍生場景包括但不限于:

  • 通用數據集的自動構建、自動標簽化:基于反饋(誤報和漏報) 和閉環進行標簽化。

  • 同類故障的數據集的構建:故障記錄和多源數據的匹配映射,基于故障記錄和故障匹配的數據對故障類型、故障程度進行標簽化。

  • 同類設備的數據集的構建:同類設備數據的歸并和映射,基于設備基準、設備參數信息,對同類、同部件同型號進行匹配和標簽化。

  • 振動信號的特征提取:時域信號分段特征的提取、長周期信號特征的提取、頻域特征的提取。

  • 趨勢特征的提取:長周期數據特征的提取,月度或年度數據特征的提取;生產周期的劃分,周期性生產過程特征的提取。

  • 數據對齊和數據融合:工況數據的匹配,多源異構數據(時序、文本、人工輸入數據)的匹配。

  • 文本對象數據集的構建:文本數據信息的抽取、實體的匹配。

  • AI 平臺與 IoTDB 的雙向通訊:數據集映射、抽取至 AI 平臺,實現存儲處理與深度分析的一體化融合。

寶武用戶案例圖8-20241112.png

5. 未來展望

寶武智維計劃未來在與 IoTDB 深度融合的更多方面進行研究,包括但不限于:

  • 視圖功能:切實結合業務需求,實現測點數據扁平化。圍繞生產、質量、運維等不同角度,結合 IoTDB 自帶的時序數據樹狀模型,運用視圖功能組織、復用數據資產,從業務方向組織成不同視角的數據樹狀架構,進一步降低團隊運維學習成本。

  • 中臺功能:基于 IoTDB 進行通用數據 API 與專用數據 API 的研發,形成數據資產管理,并在該數據中臺之上進行 APP 輕量化,以及數據可視化的自主探索。

  • UDF 函數:目前,IoTDB 主要用于構建寶武智維平臺中的數據存儲、處理底座,未來希望針對振動波形、信號數據、長周期趨勢分析等關鍵場景,通過研發 UDF 自定義函數并內嵌至數據湖中,替代原有的外掛 Python 程序調用,結合數據 API、AI 模型,全面提升寶武集團工業數據應用分析能力。

  • AINode:通過引入 IoTDB 內生支持的機器學習智能節點,替代原有的數據再抽取、單獨外部訓練模式,支持使用已有模型直接在 IoTDB 內部進行推理,針對鋼鐵領域數據預測、異常檢測等方面進行預制模型訓練和加載,達到無需導出數據,直接使用內置模型進行數據推理的目標,實現端到端的數據深度分析。

以數據為牽引,以平臺化為手段,IoTDB 將繼續與寶武智維深度合作,更好地串聯產業鏈上下游數據資源,共建鋼鐵生態圈智能運維服務生態,讓數據賦能鋼鐵產業價值。

更多內容推薦:

? 了解更多 IoTDB 應用案例