近日,我校計算機科學與技術學院大數據挖掘與智能計算團隊在軟件工程領域頂級會議IEEE/ACM International Conference on Automated Software Engineering (ASE)上發表基于半監督學習的多源數據融合智能運維算法研究成果,并應邀在會議上作論文報告。ASE是軟件工程領域的頂級會議之一,創辦于1986年,是中國計算機學會推薦的A類國際會議。研究工作由我校和螞蟻集團合作完成,我校為第一完成單位,計算機科學與技術學院黃俊副教授為第一作者,碩士研究生楊陽為第二作者。
軟件系統架構由單體架構逐漸轉變為面向服務的微服務架構,微服務架構可以適應系統規模的快速增長,具備更快的迭代速度、更低的開發復雜性和更好的可擴展性。然而,確保系統的可靠性和安全性是一項極具挑戰的工作。目前,微服務系統提供了多源監控信息,方便運維人員保障微服務系統的正常運行。但現有的異常檢測方法主要基于單模態數據,并且大多是無監督或監督學習方式,容易發生異常誤報與漏報。

(模型整體框架流程圖)

(MSTGAD異常檢測模型)

(空間注意力模塊SAM)

(時序依賴注意力機制TAM)

(模型參數敏感性分析)
團隊提出了基于微服務系統孿生圖的多模態異常檢測模型,通過微服務調用關系構建微服務系統孿生圖MST Graph,將指標、日志和調用鏈信息分別嵌入到圖中的節點和邊,實現對三種模態數據進行融合學習?;赥ransformer架構,提出了包含時空注意力模塊的異常檢測網絡,設計了一個基于半監督的損失函數,促使模型有效地學習標簽數據和未標簽數據。在兩個數據集的對比實驗驗證模型具有較好的異常檢測性能,以及對不同數據模態之間的相關性和數據模態的時間依賴性建??梢杂行嵘惓z測的性能。本研究具有重要理論研究意義和實際應用價值,為微服務系統異常檢測提供了一種嶄新的思路,將引領微服務系統異常檢測關鍵技術的發展。
論文鏈接:https://conf.researchr.org/track/ase-2023/ase-2023-papers
代碼鏈接:https://github.com/alipay/microservice_system_twin_graph_based_anomaly_detection
(撰稿:黃俊 審核:陶陶 吳宣夠 張苒 王菁)