12 月 3 日,2023 IoTDB 用戶大會在北京成功舉行,收獲強烈反響。本次峰會匯集了超 20 位大咖嘉賓帶來工業(yè)互聯(lián)網(wǎng)行業(yè)、技術(shù)、應用方向的精彩議題,多位學術(shù)泰斗、企業(yè)代表、開發(fā)者,深度分享了工業(yè)物聯(lián)網(wǎng)時序數(shù)據(jù)庫 IoTDB 的技術(shù)創(chuàng)新、應用效果,與各行業(yè)標桿用戶的落地實踐、解決方案,并共同探討時序數(shù)據(jù)管理領域的行業(yè)趨勢。
我們邀請到昆侖智匯數(shù)據(jù)科技(北京)有限公司董事長陸薇參加此次大會,并做主題報告——《IoTDB 在先進制造領域數(shù)據(jù)資源管理運營中的應用》。以下為內(nèi)容全文。
首先非常感謝大會的邀請,今天有這個機會跟與會的各位嘉賓來做一個交流。早上在 Mohan 教授“憶當年”的那一頁 PPT 當中,還很高興的看到了十年前我自己更年輕的一個身影。也很高興看到,在過去這十年的時間,IoTDB 從當時的一個想法,經(jīng)過這么多年的發(fā)展之后,先是一個 Apache 社區(qū)的小項目,最后變成一個頂級的項目(TLP),到現(xiàn)在成功畢業(yè)之后,有了這么壯大的一個社區(qū),能夠在各行各業(yè)都得到非常廣泛的應用,真的是特別特別的開心。
今天我跟大家分享的內(nèi)容是《IoTDB 在先進制造領域數(shù)據(jù)資源管理運營中的應用》,大概是這幾部分內(nèi)容。首先,因為在座的我想大部分都是來自于工業(yè)界,但是不見得都是來自于跟先進制造相關(guān)的領域,所以我會先簡單介紹一下先進制造領域的一些特點,和在這個領域里面一些典型的數(shù)智化場景。另外會跟大家分享一下,我們現(xiàn)在看到在工業(yè)領域,特別是在先進制造領域,其實工業(yè)數(shù)智化已經(jīng)開始從淺水區(qū)逐步地走到深水區(qū),那走到深水區(qū)的時候,其實是會面臨非常多的挑戰(zhàn)的。在這樣的一個時期,對于工業(yè)企業(yè)來說,它如何建立起高效地管理和利用它的現(xiàn)場數(shù)據(jù)資源的一套體系,其實這是現(xiàn)在所有的工業(yè)企業(yè)在走向深水區(qū)的時候,必須要克服的一個挑戰(zhàn),那它們應該怎么做呢?我們也會把我們的一些思考,當然還有一些行業(yè)的實踐案例跟大家做一個分享。最后會簡單介紹一下昆侖數(shù)據(jù)和工業(yè)大數(shù)據(jù)創(chuàng)新中心。
01 先進制造領域特點與典型數(shù)智化場景
首先跟大家分享一下先進制造領域的一些特點。在這里我們講的先進制造領域就是兩類,一類是一些高端精密的產(chǎn)品制造業(yè),這個大家比較容易理解,比如說芯片、顯示面板、一些高端的電子器械等等,基本上我們把手機打開,50% 以上的器件都是落到這樣的一個領域里面的。還有一些可能傳統(tǒng)上大家不會認為它是先進制造,但其實也是。我們看到在傳統(tǒng)的一些制造領域,比如說鋼鐵冶金、化工、機電設備等等,這些大家覺得好像是非常傳統(tǒng)的工業(yè)制造領域,但是在這些領域里面也有一些高端的產(chǎn)品。比如在化工領域里面可能有一些精細化工的產(chǎn)品,比如為半導體行業(yè)服務的光刻膠等類似的產(chǎn)品;比如在鋼鐵冶金行業(yè)里,一般的建筑鋼材、型材可能不算是非常高質(zhì)量的產(chǎn)品,但是我們高鐵的軌梁就是一個非常高質(zhì)量的產(chǎn)品,它對產(chǎn)品的整體品質(zhì)、生產(chǎn)過程的工藝控制等等要求都是非常高的。所以基本上這兩類其實都是我們這里在講的先進制造領域,大家也非常容易理解,這個領域確實也是中國制造要由大變強,走向高質(zhì)量發(fā)展的一個非常關(guān)鍵的主戰(zhàn)場。
在先進制造領域,其實它有非常典型的特點。第一個特點就是它的生產(chǎn)工藝是非常非常復雜的,一個是它的各種工藝控制的尺度上的精度要求非常地高,包括它的物理尺度、化學尺度,電磁的尺度等等。比如大家經(jīng)常在講到半導體生產(chǎn)的時候都要講到納米,是吧?都是在納米級的精度。那我們看到顯示面板是在微米級的精度,所以基本上都是在毫米以下的這樣一些精度。它的物理精度,當然還有一些化學精度,包括材料的純度,以及如果是電子器件,它對電流電壓的敏感度等電磁方面的精度,要求是非常非常高的。這就導致它的工藝控制的復雜性以及對工藝穩(wěn)定性也是要求非常高,就是在整個生產(chǎn)過程中,需要能夠扛得住各種情況,包括因為原材料帶來的因素、因為環(huán)境的因素、因為人的因素、因為設備機差的各種因素,帶來的種種潛在可能對穩(wěn)定性造成挑戰(zhàn)的一些情況,都要能夠很好的處理。
另外還有一個特點,就是它的工藝過程非常的復雜,可能都要經(jīng)過若干個工藝段。比如說我們要做一個 CPU 的生產(chǎn),大概有 400 個工藝段,從最早的原料到最后的晶圓,完成各種生產(chǎn)可能需要好幾個月的時間。在每個工藝段上,可能有非常多的工藝的設備、檢測的設備等等,它的工序非常的多,流程也非常的長,而且每個工序段的控制參數(shù)其實也都非常多。大家想象一下,比如做光刻,光刻機就有上萬個控制參數(shù),但這只是其中的一個環(huán)節(jié),我們?nèi)绻堰@幾十、上百個環(huán)節(jié)合在一起,它的整個控制參數(shù)的空間非常多,基本上會達到上萬、幾十萬的控制參數(shù)的空間,所以大家可以想象一下,這個控制過程是非常復雜的。而且還有一個事情,它帶來的復雜度的提升就在于,中間有些生產(chǎn)過程的機理其實不是那么的清晰,因為它可能有機械的、物理的、化學的,各種不同的加工過程。有一些是相對來說簡單的加工過程,它可能生產(chǎn)機理相對比較清楚;但有些確實相對來說比較復雜,比如一些物理、化學的過程,它的反應機理有的時候也不是那么的清晰。這些原因就導致先進制造領域的生產(chǎn)過程很長,控制很復雜,同時有些機理還不是非常的清楚,因此生產(chǎn)過程確實非常復雜。
還有一個特點就是它對于設備的依賴度是非常非常高的。大家可以想象一下,這種比較先進精密的產(chǎn)品的制造,其實很難靠人來控制設備,基本上都是高度依賴自動化的設備,無論是現(xiàn)場的工藝生產(chǎn)的設備,還是現(xiàn)場的檢測設備,甚至有的時候是現(xiàn)場物流搬運的設備,其實都是高度自動化的。而且走到一個這樣的廠里,你會發(fā)現(xiàn)它的設備的種類非常的多,可能有上千種不同的設備,而每個設備本身也是非常的復雜,設備本身的機理也是非常的復雜。那么對設備的可靠性的要求也很高,因為本身工序就非常多,環(huán)節(jié)就非常長,每一個環(huán)節(jié)里面哪怕只有一點點的誤差,累積下來的誤差就會非常的大,所以對每個環(huán)節(jié)設備的可靠性和精度的要求都是非常高的。
還有一個很重要的特點,也是現(xiàn)在這個行業(yè)里面臨很大挑戰(zhàn)的,就是它對專業(yè)人員的依賴度非常高。就是因為前面的工藝復雜、生產(chǎn)過程復雜、設備復雜,就導致現(xiàn)場對人的經(jīng)驗的依賴非常大。雖然我們聽到比如說富士康搞了個“黑燈工廠”,但是大家知道黑燈工廠只是說整個生產(chǎn)過程已經(jīng)全自動化控制了,并不等于現(xiàn)場是完全沒有人的。現(xiàn)場其實有非常多的人,但是這些人不是產(chǎn)線上的操作工,而是現(xiàn)場有非常多的白領,有大量的設備工程師、工藝工程師、質(zhì)量工程師等等。這些人在現(xiàn)場就是準備處理各種異常的情況,因為所謂的自動化生產(chǎn)只是按預設的工藝過程的要求,可能能夠去做自動的生產(chǎn),但是自動不等于智能。實際過程中會有非常多異常情況的發(fā)生,所以現(xiàn)場還是需要有非常多的人來做干預,一方面是解決一些異常的情況,另外一方面其實是在現(xiàn)場做很多的改善,包括設備可靠性的改善、生產(chǎn)供應控制的改善、產(chǎn)品質(zhì)量的改善等等,所以現(xiàn)場其實人是非常非常多的。而且對這些人的專業(yè)性要求、技能要求、經(jīng)驗要求也是非常高的,所以對很多先進制造業(yè)的企業(yè)來說,有一個非常頭痛的問題是這種人特別難招募,而且這種人的培養(yǎng)所需要的時間、精力、投入也是非常大的。所以如果說一個企業(yè)業(yè)務發(fā)展好的時候,背后潛藏的另外一個挑戰(zhàn)就在于擴產(chǎn)能的同時對人的需求,怎么找到這么多的人,這就是一個非常大的挑戰(zhàn)。
其實也就是因為有這樣的挑戰(zhàn),就帶來了在先進制造領域里面,其實我們看到數(shù)字化有非常大的價值。另外一方面,也是因為在這樣的生產(chǎn)領域里面,它的自動化的程度高,大部分都是依賴于自動化的設備,所以現(xiàn)場的數(shù)據(jù)也相對來說是比較連續(xù)完整的,即使這些企業(yè)有的時候不是連續(xù)制造的,而是離散制造業(yè),但是它現(xiàn)場的數(shù)據(jù)也是比較連續(xù)完整的。那么我們可以基于這些數(shù)據(jù),來替這個領域里面的這些企業(yè)創(chuàng)造非常多的價值。

其實有幾大類,是我們在先進制造領域里面看到的,通過數(shù)據(jù)和數(shù)智化的技術(shù),可以替企業(yè)去創(chuàng)造的價值。第一類就是提升它的產(chǎn)品的質(zhì)量。因為對這種企業(yè)來說,它的質(zhì)量、它的產(chǎn)品的良率基本上就等同于這個企業(yè)的利潤率,而且因為它的工藝復雜、控制過程復雜,這些企業(yè)基本上都面臨各種各樣的良率的問題。那我們用好數(shù)智化的技術(shù),一來可以幫助它來做工藝的優(yōu)化,做工藝的穩(wěn)定性的提升,也可以做到整個產(chǎn)品質(zhì)量的全程的追溯。如果發(fā)生了不良,我們可以通過數(shù)智化技術(shù)幫它來分析這個不良發(fā)生的根本原因到底是為什么。如果發(fā)生質(zhì)量的波動,那波動性的預測,甚至提前的控制,也是可以通過數(shù)智化技術(shù)來幫助它的。當然還有一方面,如果能夠把設備的可靠性、把設備的劣化趨勢能夠控制得比較好,肯定也是對產(chǎn)品的質(zhì)量有非常好的幫助作用。
在提升產(chǎn)品質(zhì)量之外,其實還有一方面,就是如何提升效率。提質(zhì)增效是工業(yè)里永遠的話題,無論是原來自動化的時代、信息化的時代,到現(xiàn)在數(shù)字化的時代,其實大家都是在用不同的手段幫助企業(yè)實現(xiàn)同樣的業(yè)務目標。從降本增效的角度,其實也有非常多我們可以利用數(shù)據(jù)、利用數(shù)智化技術(shù)來做的事情,比如說我們可以優(yōu)化它設備的 OEE,就是優(yōu)化設備綜合效率/稼動率,可以提高設備資產(chǎn)的利用率;我們也可以用數(shù)智化的技術(shù)幫助企業(yè)提升整體的生產(chǎn)效率和產(chǎn)能,讓它在不增加設備投入的情況下,能夠產(chǎn)出更多的產(chǎn)品。同時,剛剛講到,因為現(xiàn)場有非常多的工程師,那怎么能夠管好這些工程師,提升工程師的人效,把所謂的現(xiàn)場人機比進行優(yōu)化,對于企業(yè)來說也是有非常大的降本增效的作用。還有,對于一些高能耗或者是高物耗的企業(yè),如果我們能夠把能耗和物耗做很好的管控和優(yōu)化的話,其實也是可以幫助企業(yè)來降本增效的。
除了提質(zhì)增效這兩方面,還有兩類是數(shù)智化技術(shù)可以幫助企業(yè)來實現(xiàn)的。一類是幫它們提升客戶的滿意度,特別是對很多企業(yè)來說,如果它服務的是像蘋果或者華為這樣的大客戶,那客戶滿意度是非常非常重要的一個事情。甚至蘋果或者華為供應鏈上的這些廠商會比拼自己的技術(shù)能力和生產(chǎn)過程管控的能力,來爭取到更多的訂單,然后廠商可以跟它的大客戶說:“你看,我的生產(chǎn)能力比它強,我的現(xiàn)場的控制能力比它強,那你是不是明年可以把更多的訂單給到我?”還有,如果企業(yè)的客戶提交了一個客訴,提出某一批產(chǎn)品有問題,那么能在多快的時間內(nèi)響應這個客訴,告訴客戶這個問題是什么原因造成的、整改措施是什么,這對于提高客戶的滿意度是非常重要的。
還有一方面可能并不直接的產(chǎn)生經(jīng)濟效益,但長期來說,它對于企業(yè)內(nèi)部的競爭力的提升是非常重要的,就是如何能夠在企業(yè)內(nèi)部加快創(chuàng)新的過程。在先進制造業(yè)里面的創(chuàng)新,包括新產(chǎn)品的研發(fā),通過小試、中試,再到批量生產(chǎn)、量產(chǎn),這個過程能不能通過數(shù)智化的技術(shù)幫助加速?再比如要上線一個新的生產(chǎn)工藝,那這個新的生產(chǎn)工藝的研制過程是不是可以通過數(shù)智化的技術(shù)來加速?對于工廠來說,其實一直要做永無止境的精益化的改善,那么是否可以通過數(shù)智化的技術(shù),在原來傳統(tǒng)的、可能是靠現(xiàn)場的很多經(jīng)驗之外,能夠通過數(shù)據(jù)的手段更快的發(fā)現(xiàn)問題,更好的解決問題,其實這些都是在企業(yè)內(nèi)部能夠幫助它加速創(chuàng)新,提升長期的企業(yè)競爭力的非常有價值的一些做法。
這是我們在先進制造領域能看到的,我們可以通過數(shù)智化的手段幫助它們,增加它們的競爭力的一些典型的場景。

其實我們也看到,有很多先進的企業(yè),包括國際的、國內(nèi)的一些企業(yè),普遍已經(jīng)在全面地擁抱數(shù)智化,并且有些企業(yè)已經(jīng)有非常現(xiàn)實的一些收益。比如我們比較熟悉的“寧王” 寧德時代,寧德時代最近投建的新工廠基本上都是按照全數(shù)字工廠的標準來建設的,所有設備生產(chǎn)過程中的數(shù)據(jù)是全采集的,而且這些數(shù)據(jù)他們也在用不同的手段在做數(shù)據(jù)價值的挖掘和利用,以幫助他們不斷地改善工廠內(nèi)部的運營和提質(zhì)增效。
當然還有一些企業(yè),比如日月光其實是中國臺灣的企業(yè),它是全球最大的做半導體封測的企業(yè),這個企業(yè)也是在行業(yè)內(nèi)非常早地,大概是十年以前,已經(jīng)開始嘗試使用一些數(shù)智化的手段,用數(shù)據(jù)的深度分析和他們的生產(chǎn)工藝、設備等等進行緊密的結(jié)合,幫助他們提升產(chǎn)能、提升效率、推出新產(chǎn)品等等。
因此我們已經(jīng)看到,其實這是一個非常明確的能夠幫助客戶創(chuàng)造價值,而且一些先進的企業(yè)已經(jīng)獲取了價值的領域。

02 高效管理和利用數(shù)據(jù)資產(chǎn)是工業(yè)企業(yè)走入數(shù)智化深水區(qū)的必修課
毋庸置疑,“數(shù)智化”這件事應該要做了,那下面的問題就是怎么做?也就是對于一個工業(yè)企業(yè)來說,它怎么高效地管理和利用它的數(shù)據(jù)資產(chǎn),能夠讓這些數(shù)據(jù)資產(chǎn)解決它現(xiàn)場的一些問題,替它來創(chuàng)造價值,這個顯然是現(xiàn)在工業(yè)企業(yè)要走入數(shù)智化深水區(qū)的一個必修課。
圖中是一個市場研究公司,它給出的各個行業(yè)的數(shù)字化轉(zhuǎn)型進程的波次。我們看到,今天講的制造業(yè)其實是在中間這一條,中等灰度的這一條。那么好處在于哪呢?好的一點在于,制造業(yè)如果采用了數(shù)字化之后,其實能夠產(chǎn)生的行業(yè)的增加值是最高的,也就是圖中的縱軸值是最高的。但是不好的一點是,如果我們看橫軸就會發(fā)現(xiàn),雖然在這個行業(yè)里面應用數(shù)字化能產(chǎn)生非常高的、比其他行業(yè)都高的行業(yè)的增加值,但是它從產(chǎn)業(yè)進程的角度,目前相對來說不算是非常先進的。比較先進的還是像圖中的信息密集型的,像金融保險、信息通訊這樣的行業(yè),可能數(shù)字化程度會更高一些。制造業(yè)相對于這些行業(yè)的領先者來說,其實目前進程還是相對落后,還是在一個追趕的過程當中。從我們自己的實踐中看,確實也是這樣,即大家是擁有一個產(chǎn)業(yè)的共識,就是我們都要全面擁抱數(shù)智化,但是從實際的進展的角度來說,確實現(xiàn)在還是只有少數(shù)先進行業(yè)的先進企業(yè)在開始做這樣的工作。
就制造業(yè)來說,目前的主流其實還是在做“兩化”的補課,也就是在做自動化和信息化的補課,以及在上物聯(lián)網(wǎng)的系統(tǒng),能夠把數(shù)據(jù)先收上來,先有淺度的一些利用,可能下一步才會考慮怎么深度地利用這些數(shù)據(jù),目前正在這樣的一個過程當中。

之所以在制造業(yè)中數(shù)智化的進程不是非常的領先,其實主要的挑戰(zhàn)在于現(xiàn)在在很多工業(yè)的現(xiàn)場,它的數(shù)據(jù)資源化的程度不高,利用率也相對來說比較低,同時價值挖掘確實也會比較難。
在工業(yè)現(xiàn)場的數(shù)據(jù)資源化的程度不高,主要是兩方面的體現(xiàn),一方面就是數(shù)據(jù)集成度不高。大家都知道,數(shù)據(jù)其實是來自于有些業(yè)務線上化了之后,就開始產(chǎn)生數(shù)據(jù),比如說控制過程用的自動化系統(tǒng)線上化了;整個經(jīng)營管理的過程,通過 MAS、ERP 這樣一些信息化的系統(tǒng)線上化了,就開始有數(shù)據(jù)。這些數(shù)據(jù)其實都是通過這些設備和業(yè)務系統(tǒng)來產(chǎn)生的,但是現(xiàn)在的情況下,這些數(shù)據(jù)本身跨業(yè)務系統(tǒng)的整合其實做得不是很好,很多數(shù)據(jù)還是從單個的業(yè)務系統(tǒng)里面出來的,可能支持的僅僅就是這個領域的一些應用。目前做全企業(yè)跨領域的、跨業(yè)務系統(tǒng)的數(shù)據(jù)整合,其實整體做的是不太好的,甚至在很多企業(yè)還會出現(xiàn)同樣的一個數(shù)據(jù),在不同的業(yè)務系統(tǒng)的口徑不一樣,就造成我們想要對數(shù)據(jù)進行綜合利用的時候,沒有很好的原始資料,需要做很多的數(shù)據(jù)治理的工作。
所以一方面是工業(yè)現(xiàn)場數(shù)據(jù)集成度不高,即跨業(yè)務系統(tǒng)的集成度不高,另外一方面,其實它的業(yè)務集成度也是不高的。我們講的業(yè)務集成度,其實是在講數(shù)據(jù)的應用和業(yè)務的集成的深度。我們會看到現(xiàn)在有很多淺度的數(shù)據(jù)應用其實已經(jīng)非常普遍了,比如做物聯(lián)的接入、實時的展示、控制、歷史數(shù)據(jù)報表的分析等等,這些都已經(jīng)非常普遍了。但是另外一方面,我們會看到數(shù)據(jù)在工業(yè)領域里面的一些深度的應用,相對來說還是比較缺乏的。最主要的問題就在于,工業(yè)數(shù)據(jù)要深度應用,就需要跟這些工業(yè)的機理,比如說設備的運行原理、生產(chǎn)的工藝,深度結(jié)合才能夠做好,但是這中間有非常多的技術(shù)和非技術(shù)的挑戰(zhàn),導致現(xiàn)在做得并不好。
我們看這個矩陣圖,如果只是針對單業(yè)務系統(tǒng)和一些淺度的業(yè)務方向,那這個市場已經(jīng)是紅海了,各種應用非常的多。但是我們稍微往遠處再展望一下就會發(fā)現(xiàn),其實有非常多的藍海,還有很多的數(shù)據(jù)和數(shù)智化可以去發(fā)揮價值的空間,其實并沒有得到很好的探索。所以今年工信部出了 2023 年度的智能制造解決方案揭榜掛帥的項目申報,中間列了有 21 個題目,這 21 個題目都是現(xiàn)在公認的,在這個領域里非常急需又亟待解決,但是目前還沒有解決得很好的問題,第 18 個題目其實就是數(shù)據(jù)資源的管理和應用解決方案。它一開篇就指出問題是什么:現(xiàn)在工業(yè)數(shù)據(jù)的利用率低、價值挖掘比較難,所以大家還是公認這是一個沒有被很好地解決的問題。

那下面大家肯定要問了,如果我們想解決這樣的問題,應該怎么辦呢?在講技術(shù)怎么辦之前,我們先要講講人的問題。因為所謂“事在人為”,事都是由人來做的,所以我們現(xiàn)在也來分析一下做這個事需要一些什么樣的人。
其實釋放工業(yè)數(shù)據(jù)的深度價值,是需要工業(yè)專家和數(shù)字化、信息化專家的深度協(xié)同和配合的。左邊這個圖是一個標準的關(guān)于數(shù)據(jù)科學的定義。從數(shù)據(jù)科學來說,它是三個領域的交叉點,一個領域是所謂的 Domain Expertise,如果放在工業(yè)里面,那就是工業(yè)技術(shù),Operational Technology。另外一塊是數(shù)學,Mathematics,就是這些有數(shù)學、運籌學專業(yè)背景,搞算法的這些專家。還有一個領域,Computer Science,就是計算機科學,比如 IoTDB 解決的就是 Computer Science 的問題,數(shù)據(jù)接、存、管、用的整個過程當中都有非常多的計算機科學的技術(shù)。整個數(shù)據(jù)科學其實就是在中間這個三元交匯的地方。
但是我們很難期待有一個“超人”,一個超級的數(shù)據(jù)科學家,在這三個領域都是專家,又非常地懂領域知識,又非常地懂數(shù)學,在計算機科學方面也很專業(yè)。如果我們有這樣一個超人型的數(shù)據(jù)科學家,那我就可以“從頭打到尾”了,但事實上在現(xiàn)實中,這是非常罕見的事情。更普遍的是有一些人可能是工業(yè)專家,有工業(yè)領域知識;有一些人可能是數(shù)學專家,在算法方面比較有研究;有一些人可能是計算機科學專家,比如對數(shù)據(jù)庫技術(shù)、網(wǎng)絡、低代碼開發(fā)等等技術(shù)掌握得比較好。其實是需要有不同背景、不同專長的人,大家融合在一起協(xié)同地工作,才能夠做好這件事情。
而在這三類人當中,工業(yè)里面的工業(yè)領域?qū)<移鋵嵲谶@中間是扮演了一個非常引領性的角色。其實別的領域也一樣,因為領域?qū)<抑绬栴}是什么,也知道根據(jù)領域知識,解決這個問題的大致思路可能是什么。只是他可能沒有辦法把這個思路寫成,比如一個 Python 的算法,能夠在現(xiàn)場實時大數(shù)據(jù)上運行得很好,所以他需要其他人的配合,但是領域?qū)<以谥虚g確實是起到了一個非常重要的引領性的作用。所以我們認為這些現(xiàn)場的業(yè)務專家,這些懂現(xiàn)場的設備的、懂現(xiàn)場的工藝的專家,他是數(shù)智化業(yè)務創(chuàng)新的主角,但是只有他是不夠的,他還需要跟另外兩類人一起來配合。

所以我們要想做好工業(yè)現(xiàn)場的數(shù)據(jù)的管理,特別是它的深度利用的話,其實我們是需要有一套支持不同領域的專業(yè)人員能夠高效協(xié)同工作的方法和工具。在創(chuàng)新的領域里,有個標準的創(chuàng)新模型叫做雙鉆石模型。第一個鉆石其實就是定義問題,大家先發(fā)散有哪些問題,然后再聚攏,確定這是一個焦點的問題,要去解決。第二個鉆石就是再去發(fā)散這個問題可能有哪些解決的方式,最后聚焦到一個比較好的解決方案,大家齊心協(xié)力,按照這個方案把它解決了。這個是在創(chuàng)新領域的一個標準的創(chuàng)新過程的模型。
那我們把它套到工業(yè)數(shù)智化這個領域里面,其實就是如何能夠把 IT/ OT/ DT 這三類專家套到這樣一個創(chuàng)新的雙鉆石模型當中,讓他們能夠非常好地去協(xié)同的工作。

其實我們昆侖數(shù)據(jù)在過去這些年一直在做的事情就是,我們希望能夠打造一套可以傳授給工業(yè)專家的,端到端的工業(yè)數(shù)據(jù)智能應用研發(fā)的方法。今天因為時間有限,這個方法我沒有辦法展開了,如果大家有興趣的話,可以去看我們研究院院長田春華博士的專著,叫《工業(yè)大數(shù)據(jù)分析實踐》,還有一本叫《工業(yè)大數(shù)據(jù)分析算法實戰(zhàn)》。《工業(yè)大數(shù)據(jù)分析實踐》是在講整個的方法體系的,這也是我們過去這十多年以來的現(xiàn)場實踐的一個總結(jié)。我們是希望這件事情不只是像我們這種計算機背景的人自己來干,而是我們真的能夠把數(shù)智化技術(shù)應用的門檻降下來,變成可以給到工業(yè)現(xiàn)場的這些工業(yè)專家的一套方法,這些專家可能是學機械的、學化工的、學精密儀器的,但他們也能夠有效地應用這么一套方法,再加上學計算機、學數(shù)學的一些專家的配合,最終能夠把一個現(xiàn)場問題解決。
這個方法我們基本上分成四個環(huán),第一個環(huán)是一個場景定義的過程,就是如何在現(xiàn)場去發(fā)掘和定義一個值得用數(shù)據(jù)來解決,而且也有比較好的基礎,可以用數(shù)據(jù)和算法來解決的場景,因為好的開題就是成功的一半嘛,這其實是比較重要的一件事情。因為傳統(tǒng)的很多方法基本上都是“隨機訪談型”,但實際上這是非常不系統(tǒng)的,而我們是有一套比較系統(tǒng)的方法,按照工業(yè)的智能階梯和應用的場景,可以比較系統(tǒng)化地去拆解和定義。特別是這套方法可以讓業(yè)務專家,他即使一點數(shù)智化技術(shù)都不懂,也可以比較有效地參與定義出過程,然后能夠定義出場景。
如果我們定義出一個值得去解,也有條件、有技術(shù)可行性去解的問題,那具體怎么解其實又分成了三個環(huán)。第一個環(huán)其實是模型算法的研發(fā),包括我們怎么樣去理解詳細的業(yè)務問題,怎么樣去找到相關(guān)的數(shù)據(jù),怎么樣去看數(shù)據(jù)的特征,怎么樣根據(jù)數(shù)據(jù)特征去匹配合適的算法,包括對合適算法的參數(shù)調(diào)優(yōu)等等,這個是模型算法研發(fā)的過程。
這個研發(fā)的過程之后,并不是馬上就可以去部署和應用了。我們會發(fā)現(xiàn)在算法出來之后,其實還要經(jīng)過再一輪的迭代,就是我驗證了這個算法具備可行性,而且 ROI 能夠算出來了,企業(yè)投入多少和產(chǎn)出多少能算出來,并覺得是值得投入的一件事情的時候,下一步可能才會進入到比較認真的工程化的開發(fā),包括它背后的數(shù)據(jù)架構(gòu)的設計、整個數(shù)據(jù)流的設計、這個算法的一個詳細的實現(xiàn)等等,這個是數(shù)據(jù)工程開發(fā)的部分。
但并不是開發(fā)完了之后部署上線,就結(jié)束了,還沒有完。我們發(fā)現(xiàn)很重要的是,這個算法部署上線了之后,其實才剛剛開始,我們要讓它在現(xiàn)場去產(chǎn)生價值的話,其實是要在上線之后持續(xù)地監(jiān)控和優(yōu)化它的運營。因為在這個算法上線之后,現(xiàn)場有些條件可能會改變,這個數(shù)據(jù)的情況也許也會變化,例如有一段時間數(shù)據(jù)鏈斷了,或者有段時間數(shù)據(jù)質(zhì)量不好了等等。所以在上線之后我們是需要持續(xù)地進行它的運營的,這還不是簡單的運維,即只保持它在跑著不要“死”,其實這是一個業(yè)務運營的問題,就是需要保證上線的這個算法模型應用確實能夠去解決業(yè)務的問題。
配合這套方法論,我們也開發(fā)了一套支撐的平臺和工具,然后就可以按照這個方法論,用相應的工具來加速整個數(shù)據(jù)價值創(chuàng)造的過程。但其實方法論是比工具要大的,因為不是所有的事都可以在工具里面來做,比如說場景的定義和探索其實就沒有工具的支持,那我們可能通過線下的工作訪問等方式來做。我們過去積累了一些行業(yè)的最佳實踐和可參考的案例,也就是大家按照我們的方法論,針對一個具體的業(yè)務問題,是怎么一步一步地做的,可以作為一個很好的參考。

講到工具平臺,我們基于 IoTDB 打造了一套“云+邊”協(xié)同的平臺。在云端或者是中心端是一套研發(fā)的環(huán)境,研發(fā)出來的模型我們可以通過在線或離線的方式,把它推送到邊緣端。邊緣端有點像一個工業(yè)手機部署在工業(yè)現(xiàn)場,上面可以下載各種各樣的數(shù)據(jù)智能 App,更多的是在現(xiàn)場來處理數(shù)據(jù)和跟人做交互的。在中心端和邊緣端,我們都用到了 IoTDB 來作為時序數(shù)據(jù)存儲的引擎。當然存儲引擎也不限于 IoTDB,因為工業(yè)現(xiàn)場的數(shù)據(jù)是多源異構(gòu)的,除了時序數(shù)據(jù)之外,比如設備臺賬可能就是存在關(guān)系數(shù)據(jù)庫里;可能還有現(xiàn)場的一些比如聲聞數(shù)據(jù)、質(zhì)檢的數(shù)據(jù),它可能是圖片、聲音文件等形式,因此我們可能需要用到對象數(shù)據(jù)庫來存儲;所以是需要有一整套支持多種不同數(shù)據(jù)源的技術(shù)引擎,來支持不同類型的數(shù)據(jù)的存儲。
另外在不同的數(shù)據(jù)引擎之上,我們要構(gòu)造同一套的數(shù)據(jù)資產(chǎn)和數(shù)據(jù)資源管理的體系,還有一套數(shù)據(jù)資源的價值挖掘的方法,能夠把這些數(shù)據(jù)用起來,去解決業(yè)務問題。但是確實從存儲這一層來說,IoTDB 扮演了一個非常重要的角色,因為現(xiàn)場的“人、機、料、法、環(huán)”中,來自機器設備的數(shù)據(jù)是最大量的,要把最大量的這類數(shù)據(jù)管好,就離不開時序數(shù)據(jù)庫。特別是在高度自動化的環(huán)境下面,所有設備狀態(tài)的信息、工藝控制的信息,其實都是以時序數(shù)據(jù)的形式存在的,所以 IoTDB 在這中間為我們提供了一個非常堅實的技術(shù)基礎。


我們聯(lián)合 IoTDB,最終是希望幫助企業(yè)建設起數(shù)智化創(chuàng)新的平臺和整體的組織能力。如果還是用工廠做比喻的話,我們有點像期望幫工業(yè)企業(yè)建立起一條工業(yè)數(shù)據(jù)的生產(chǎn)線,一頭的原料是現(xiàn)場形形色色的數(shù)據(jù);產(chǎn)線上處理原料的機臺其實就是一個一個分析的模型和應用;產(chǎn)線產(chǎn)出的成品就是我們經(jīng)過這些機臺,從原始數(shù)據(jù)中萃取出來的有關(guān)業(yè)務的洞察和一些智能決策的結(jié)果,這是產(chǎn)線的部分。
除了產(chǎn)線是從數(shù)據(jù)中產(chǎn)生價值,我們管它叫柔性的價值管道,上面的這些機臺也不是固定的。隨著業(yè)務的進展,我們要不斷地研發(fā)新的機臺,這就需要另外一個敏捷創(chuàng)新的管道。然后我們根據(jù)業(yè)務不同的需要和場景,按照一定的方法,不斷的研發(fā)相應的算法,最后能夠把它插到工業(yè)數(shù)據(jù)的生產(chǎn)線上,去處理現(xiàn)場的這些數(shù)據(jù),產(chǎn)生有價值的業(yè)務洞察。
到最后,有了這么一套體系的支持,在企業(yè)內(nèi)部會形成一個由跨部門、跨專業(yè)的團隊組成的若干個虛擬的創(chuàng)新小組,每個創(chuàng)新小組可能是針對一個場景,按照這個方法,在這套體系的支持之下來做數(shù)智化創(chuàng)新。當然不是所有的創(chuàng)新一定會有結(jié)果,都有試錯的過程,可能有些在一段時間之后就會發(fā)現(xiàn)業(yè)務價值不夠,或者是技術(shù)可行性不夠,可能它就終止了,但有些如果能夠走到最終,它就會變成我們可以推出到現(xiàn)場去使用的一個應用。

我們和 IoTDB 最終是希望幫助企業(yè)構(gòu)造起一個從業(yè)務數(shù)據(jù)化到數(shù)據(jù)業(yè)務化的業(yè)務價值的閉環(huán),讓數(shù)據(jù)成為活的資產(chǎn)。因為數(shù)據(jù)如果只是把它管起來,而不產(chǎn)生應用的話,其實它都不能稱為資產(chǎn);只有它被用起來,在持續(xù)不斷地產(chǎn)生業(yè)務價值,它才能成為企業(yè)的活的資產(chǎn)。

03 昆侖數(shù)據(jù)&工業(yè)大數(shù)據(jù)創(chuàng)新中心簡介
剛剛講到了,昆侖數(shù)據(jù)其實是希望能夠把 IT/ OT/ DT 打通,我們內(nèi)部也是有這樣的一群專家,因為我們不僅僅是自己解決問題,更希望能夠創(chuàng)造一套方法,能夠讓更多的工業(yè)里面的團隊可以按照這個方法來解決問題。我們在 2020 年的時候被世界經(jīng)濟論壇評為全球的“科技先鋒”,也是當年先進制造領域里面國內(nèi)唯一的一個企業(yè)。同時我們也負責運營工信體系的工業(yè)大數(shù)據(jù)創(chuàng)新中心,我們現(xiàn)在在北京、蘇州和四川三個地方都有創(chuàng)新中心。
我們服務的也都是設備和數(shù)據(jù)資產(chǎn)相對來說比較密集的行業(yè)。今天講的可能更多是先進制造業(yè),其實我們也服務很多其他的行業(yè),包括能源電力、煤炭油氣等一些行業(yè)。過去服務的基本上都是細分行業(yè)的一些龍頭企業(yè),數(shù)據(jù)基礎相對來說比較好,比較希望率先進入到深度挖掘數(shù)據(jù)業(yè)務價值的過程。并且我們服務的很多企業(yè),它們做的很多項目也都是在行業(yè)里面比較先行先試的項目,也拿到了一些示范的工程。因為我們也負責運營工信體系的工業(yè)大數(shù)據(jù)創(chuàng)業(yè)中心,所以我們除了服務企業(yè)之外,也有參與一些編著,比如說 2025 工業(yè)大數(shù)據(jù)技術(shù)路線圖的編訂,以及一些著作等等。
最后強調(diào)一下我們的定位,我們還是希望能夠幫工業(yè)企業(yè)建立起自主的數(shù)智化創(chuàng)新團隊,當然要做到這一點的話,我們需要有相應的方法、相應的工具。同時我們也會用“以戰(zhàn)代訓”的方式,通過和大家在一起實戰(zhàn)的方式,把這個能力交到工業(yè)企業(yè)的手上。所以未來我們也希望跟更多的工業(yè)企業(yè)同行,包括跟 IoTDB,作為我們產(chǎn)品的一個非常堅實的重要技術(shù)組成部分,大家繼續(xù)同行,希望能夠更好的用數(shù)據(jù)來推動整個中國工業(yè)的智能化的進程。
好,謝謝大家。

更多內(nèi)容推薦:
? 了解更多 IoTDB 應用案例
? 回顧 IoTDB 2023 大會全內(nèi)容