首頁
>
資源
>
會議活動

清華大學(xué)軟件學(xué)院院長王建民教授:AI 時代,如何從采數(shù)到用數(shù)?

7 月 5 日,2025 時序數(shù)據(jù)庫技術(shù)創(chuàng)新大會在北京成功舉辦,收獲強(qiáng)烈反響。本次大會以「下一站:DB + AI」為主題,匯集了超 30 位大咖嘉賓,學(xué)術(shù)界權(quán)威專家、企業(yè)代表、開發(fā)者圍繞時序數(shù)據(jù)庫 Apache IoTDB 的自研技術(shù)成果與應(yīng)用落地實例,探討工業(yè)物聯(lián)網(wǎng)領(lǐng)域如何借助 AI 技術(shù)與數(shù)據(jù)庫融合驅(qū)動智能化升級。

我們邀請到清華大學(xué)軟件學(xué)院院長王建民教授參加此次大會,并做主題報告——《AI 時代,從“采數(shù)”到“用數(shù)”的跨越》。以下為報告核心內(nèi)容總結(jié)。

01 AI 時代帶來軟件開發(fā)范式革命

王建民教授指出,當(dāng)前 AI 時代數(shù)據(jù)庫面臨的核心挑戰(zhàn)是如何實現(xiàn)從數(shù)據(jù)采集到數(shù)據(jù)價值挖掘的跨越式發(fā)展,引用大會上孫院士(中國工程院孫家廣院士)的觀點,認(rèn)為評判一個產(chǎn)品成功與否的關(guān)鍵在于“用戶用得好不好”,這一觀點為后續(xù)演講奠定了基調(diào)。

王建民教授提到 OpenAI 創(chuàng)始成員、特斯拉前 AI 總裁安德烈·卡帕斯的觀點,深入剖析了 AI 時代軟件開發(fā)的三大演進(jìn)階段。軟件 1.0 時代以傳統(tǒng)編程語言為基礎(chǔ),從匯編到 C、Java、Python 等高級語言,完全依賴程序員編寫算法;軟件 2.0 時代則以大模型為核心,通過數(shù)據(jù)訓(xùn)練和參數(shù)化實現(xiàn)智能推理;而軟件 3.0 時代,則實現(xiàn)了用自然語言提示詞直接生成軟件的革命性突破。

王建民教授特別強(qiáng)調(diào),這三個階段并非簡單的線性替代,而是呈現(xiàn)出并存共生的生態(tài)格局,指出這種變革使得"人人都是程序員,人人都是創(chuàng)造者"正在成為現(xiàn)實,極大地拓展了軟件創(chuàng)新的可能性邊界。

2025 大會王院長回顧圖1-20250716.png

在探討 AI 對計算機(jī)學(xué)科的影響時,王建民教授提到了 MIT 教授塞繆爾·馬登的研究成果,指出雖然計算機(jī)科學(xué)的基礎(chǔ)架構(gòu)(如硬件設(shè)備、系統(tǒng)類型等)保持相對穩(wěn)定,但應(yīng)用層面正在發(fā)生深刻變革:計算范式從 CPU 向 GPU 遷移,操作系統(tǒng)從單進(jìn)程向并行集群演進(jìn),AI 技術(shù)正在重塑整個應(yīng)用開發(fā)生態(tài)。王建民教授認(rèn)為,這種變化不是簡單的技術(shù)迭代,而是整個學(xué)科范式的重構(gòu),將為計算機(jī)科學(xué)帶來全新的發(fā)展機(jī)遇。

2025 大會王院長回顧圖2-20250716.png

02 工業(yè)終端的智能化趨勢

而在工業(yè)領(lǐng)域的發(fā)展方面,王建民教授特別強(qiáng)調(diào)了工業(yè)終端設(shè)備的智能化發(fā)展趨勢。他指出,智能制造的核心變革正發(fā)生在終端設(shè)備層面,現(xiàn)代工業(yè)終端已經(jīng)實現(xiàn)了計算能力和通信能力的深度融合。試飛場景中,國產(chǎn)大飛機(jī)內(nèi)部大量采用智能聯(lián)網(wǎng)設(shè)備;在軍事裝備和儲能行業(yè),終端設(shè)備的智能化升級正在帶來戰(zhàn)斗力和業(yè)務(wù)模式的本質(zhì)性改變。

王建民教授認(rèn)為,這種終端變革將引發(fā)更深層次的產(chǎn)業(yè)重構(gòu)。當(dāng)工業(yè)終端完成智能化轉(zhuǎn)型后,將打破傳統(tǒng)產(chǎn)業(yè)邊界,推動第一、二、三產(chǎn)業(yè)的深度融合。

2025 大會王院長回顧圖3-20250716.png

03 采數(shù):工業(yè)大數(shù)據(jù)的多源體系

王建民教授系統(tǒng)梳理了工業(yè)數(shù)據(jù)的三大核心來源:首先是智能終端數(shù)據(jù),如飛機(jī)、儲能設(shè)備等物聯(lián)網(wǎng)設(shè)備產(chǎn)生的時序數(shù)據(jù);其次是企業(yè)信息化數(shù)據(jù),包括 CAD 系統(tǒng)數(shù)據(jù)、客戶終端數(shù)據(jù)等;第三類是互聯(lián)網(wǎng)跨界數(shù)據(jù),涵蓋氣候、地理、環(huán)境等方向。

他特別以波音公司的理念為例,強(qiáng)調(diào)數(shù)據(jù)在制造流程中的核心地位,數(shù)據(jù)能夠支撐賦能生產(chǎn)、管理流程,并指出工業(yè)數(shù)據(jù)來源廣泛,通過 IT 和 OT 的融合,多源異構(gòu)數(shù)據(jù)能夠有效整合,為生產(chǎn)優(yōu)化、質(zhì)量管控等關(guān)鍵業(yè)務(wù)場景提供數(shù)據(jù)支撐。

2025 大會王院長回顧圖4-20250716.png

04 用數(shù):從產(chǎn)業(yè)數(shù)字化到數(shù)字產(chǎn)業(yè)化

多源數(shù)據(jù)構(gòu)成了現(xiàn)代工業(yè)的"價值圖譜",但關(guān)鍵在于如何將這些數(shù)據(jù)資源轉(zhuǎn)化為實際生產(chǎn)力。王建民教授提出了數(shù)據(jù)應(yīng)用的兩個階段:產(chǎn)業(yè)數(shù)字化階段實現(xiàn)基礎(chǔ)的數(shù)據(jù)查詢、監(jiān)測、預(yù)警等功能;數(shù)字產(chǎn)業(yè)化階段通過商務(wù)智能(BI)與人工智能(AI),實現(xiàn)“數(shù)據(jù)控制設(shè)備”,讓數(shù)據(jù)價值真正賦能業(yè)務(wù)系統(tǒng),優(yōu)化工業(yè)流程。

同時,王建民教授深入剖析了數(shù)據(jù)應(yīng)用落地的關(guān)鍵成功要素,強(qiáng)調(diào)成功的數(shù)字化轉(zhuǎn)型需要軟件工具、領(lǐng)域知識和數(shù)學(xué)方法的深度融合。這三個要素不是簡單的疊加關(guān)系,而是乘積效應(yīng)——任何一個要素的缺失都會導(dǎo)致整體效果歸零。他特別提出“以終為始”的方法論:首先要明確數(shù)據(jù)解決方案如何嵌入實際業(yè)務(wù)流程形成閉環(huán),然后逆向推導(dǎo)所需的業(yè)務(wù)支持,最后才考慮數(shù)據(jù)和技術(shù)實現(xiàn),以需求牽引、業(yè)務(wù)驅(qū)動為思路,避免陷入"為技術(shù)而技術(shù)"的誤區(qū)。

2025 大會王院長回顧圖5-20250716.png

05 時序數(shù)據(jù)庫 IoTDB 的技術(shù)創(chuàng)新

王建民教授重點介紹了時序數(shù)據(jù)庫 IoTDB 面向 AI 與工業(yè)智能化趨勢的突破性實踐。IoTDB 不僅是一款數(shù)據(jù)庫管理系統(tǒng),通過合并嵌入式終端 IoTNode 與訓(xùn)練推理節(jié)點 AINode,并將 TsFile 作為建立工業(yè)數(shù)據(jù)集的底層文件格式,用戶能夠?qū)崿F(xiàn)從設(shè)備數(shù)據(jù)采集到智能應(yīng)用的全流程無縫銜接。

這一架構(gòu)使得工業(yè)數(shù)據(jù)在源頭即可按標(biāo)準(zhǔn)化格式存儲,避免了繁瑣的數(shù)據(jù)轉(zhuǎn)換過程,同時用戶能夠通過內(nèi)置的 AI 能力,低成本地完成時序數(shù)據(jù)分析、模型訓(xùn)練和實時推理。

2025 大會王院長回顧圖6-20250716.png

目前,IoTDB 已實現(xiàn) MCP 功能,可以通過提示詞直接實現(xiàn)時序數(shù)據(jù)的查詢與分析,該功能已被 MCP 官網(wǎng)收錄。

2025 大會王院長回顧圖7-20250716.png

時序大模型應(yīng)用方面,王建民教授強(qiáng)調(diào),數(shù)據(jù)質(zhì)量和算法同等重要,算法確定以后,數(shù)據(jù)決定了模型的高度。時序數(shù)據(jù)體量龐大,歷史數(shù)據(jù)往往無法有效使用,存儲即“沉睡”。王建民教授認(rèn)為,這些歷史數(shù)據(jù)能夠參與形成時序大模型的底層數(shù)據(jù)集,提升大模型訓(xùn)練與預(yù)測質(zhì)量,IoTDB 也能夠更好地激活"沉睡"的歷史數(shù)據(jù),挖掘其潛在價值。

2025 大會王院長回顧圖8-20250716.png

結(jié)合時序大模型,IoTDB 實現(xiàn)了“AI in DB”的能力,使得用戶可以直接通過 SQL 語句完成模型的后訓(xùn)練工作。這意味著在未來,只要掌握 IoTDB,任何使用者都能勝任數(shù)據(jù)分析和模型調(diào)優(yōu)的工作。

2025 大會王院長回顧圖9-20250716.png

IoTDB 也實現(xiàn)了通過 SQL 語句完成數(shù)據(jù)推理與預(yù)測的能力。王建民教授認(rèn)為,從商業(yè)智能(BI)到人工智能(AI)的范式轉(zhuǎn)變,其本質(zhì)是從歷史數(shù)據(jù)分析轉(zhuǎn)向未來態(tài)勢預(yù)測,這種轉(zhuǎn)變正在推動業(yè)務(wù)系統(tǒng)逐步實現(xiàn)預(yù)測性控制和智能決策。

2025 大會王院長回顧圖10-20250716.png

06 未來展望

展望未來,王建民教授描繪了工業(yè)數(shù)據(jù)應(yīng)用的三大發(fā)展趨勢:終端設(shè)備將具備更強(qiáng)的智能化水平;云端功能將從單純的數(shù)據(jù)存儲進(jìn)化為模型知識提煉;伴隨多源數(shù)據(jù)的智能融合,時空大模型將在工業(yè)領(lǐng)域得到廣泛應(yīng)用。未來的工業(yè)系統(tǒng)將實現(xiàn)真正的“人機(jī)共融”,數(shù)據(jù)必將成為推動工業(yè)轉(zhuǎn)型升級的核心動能。

2025 大會王院長回顧圖11-20250716.png

更多內(nèi)容推薦:

回顧 IoTDB 2025 大會全內(nèi)容