工本口子库漫画大数据挖掘与智能计算团队在软件工程领域国际顶级会议上发表微服务系统智能运维最新研究成果

近日,我院大数据挖掘与智能计算团队在软件工程领域顶级会议IEEE/ACM International Conference on Automated Software Engineering (ASE)上发表基于半监督学习的多源数据融合智能运维算法研究成果,并应邀在会议上作论文报告。ASE是软件工程领域的顶级会议之一,创办于1986年,是中国计算机学会推荐的A类国际会议。研究工作由我校和蚂蚁集团合作完成,我校为第一完成单位,黄俊副教授为第一作者,硕士研究生杨阳为第二作者。

软件系统架构由单体架构逐渐转变为面向服务的微服务架构,微服务架构可以适应系统规模的快速增长,具备更快的迭代速度、更低的开发复杂性和更好的可扩展性。然而,确保系统的可靠性和安全性是一项极具挑战的工作。目前,微服务系统提供了多源监控信息,方便运维人员保障微服务系统的正常运行。但现有的异常检测方法主要基于单模态数据,并且大多是无监督或监督学习方式,容易发生异常误报与漏报。

(模型整体框架流程图)

(MSTGAD异常检测模型)

(空间注意力模块SAM)

(时序依赖注意力机制TAM)

(模型参数敏感性分析)

团队提出了基于微服务系统孪生图的多模态异常检测模型,通过微服务调用关系构建微服务系统孪生图MST Graph,将指标、日志和调用链信息分别嵌入到图中的节点和边,实现对三种模态数据进行融合学习。基于Transformer架构,提出了包含时空注意力模块的异常检测网络,设计了一个基于半监督的损失函数,促使模型有效地学习标签数据和未标签数据。在两个数据集的对比实验验证模型具有较好的异常检测性能,以及对不同数据模态之间的相关性和数据模态的时间依赖性建模可以有效提升异常检测的性能。本研究具有重要理论研究意义和实际应用价值,为微服务系统异常检测提供了一种崭新的思路,将引领微服务系统异常检测关键技术的发展。

论文链接:https://conf.researchr.org/track/ase-2023/ase-2023-papers

代码链接:https://github.com/alipay/microservice_system_twin_graph_based_anomaly_detection

(撰稿:黄俊 审核:陶陶 吴宣够 韩军书)