[AIOps@NKU](https://nkcs.iops.ai/) 中国の南開大学の[[AIOps]]研究室。 > 私たちの研究室では、主に人工知能運用(AIOps)をテーマとして、伝統的な機械学習法(例:決定木、SVM、ロジスティック回帰)、深層学習法(例:変分オートエンコーダ、LSTM、CNN)、強化学習法(例:MCTS)、知識グラフ法、グラフ計算法などのAI手法をインターネットベースのサービスやWebベースのサービス(検索エンジン、オンラインショッピング、オンラインビデオ、インスタントメッセージと言う)のアプリケーションレベルおよび機械レベルのデータ解析に応用しています。大量のデータに対して、異常検出、根本原因分析、障害特定、障害予測などを行い、サービスの信頼性を維持し、ユーザー体験を向上させる。現在、Alibaba、Baidu、Huawei、Bytedance、Huya、CERNETと協業しています。これらの企業のデータは、私たちが提案するモデルの評価と最適化に利用することができます。 > 私たちは、より多くの学部生が私たちの研究室に参加することを歓迎します。実世界のデータを使って自分のアイデアを証明し、そのモデルを世界トップクラスの企業に展開して、何百万人ものユーザーの体験を向上させることができるのです MSRA、Alibaba、Baidu、Tencent、Bytedance、Huawei、Huyaなどのグローバルなインターネット/ITトップ企業にあなたを推薦します。 > 私たちの研究室は、 Dr. Shenglin ZhangとDr. Yongqian sunによって組織されています。私たちは一連の論文を発表しており、それはここで見ることができます。 ## Papers - LogCraft: [[2024__ASE__End-to-End AutoML for Unsupervised Log Anomaly Detection]] - Medicine: [[2024__ASE__Giving Every Modality a Voice in Microservice Failure Diagnosis via Multimodal Adaptive Optimization]] - ART: [[2024__ASE__ART - A Unified Unsupervised Framework for Incident Management in Microservice Systems]] - LabelEase: [[2024__ISSRE__LabelEase - A Semi-Automatic Tool for Efficient and Accurate Trace Labeling in Microservices]] - [[2024__TOSEM__Interpretable Failure Localization for Microservice Systems Based on Graph Autoencoder]] - [[2024__ISSRE__Multivariate Time Series Anomaly Detection based on Pre-trained Models with Dual-Attention Mechanism]] - [[2024__ISSRE__Auto-PIP - Real-time Identification of Critical Performance Inflection Points in Software Stress Testing]] - LatentSpace: [[2024__KDD__Microservice Root Cause Analysis With Limited Observability Through Intervention Recognition in the Latent Space]] - [[2024__TSC__Diagnosing Performance Issues for Large-Scale Microservice Systems with Heterogeneous Graph]] - [[2024__ESEC-FSE__Fault Diagnosis for Test Alarms in Microservices through Multi-source Data]] - [[2024__ESEC-FSE__Illuminating the Gray Zone - Non-intrusive Gray Failure Localization in Server Operating Systems]] - [[2024__WWW__Supervised Fine-Tuning for Unsupervised KPI Anomaly Detection for Mobile Web Systems]] - OmniTransfer: [[2023__ICWS__Efficient Multivariate Time Series Anomaly Detection Through Transfer Learning for Large-Scale Software Systems]] - [[2023__ESEC-FSE__Assess and Summarize - Improve Outage Understanding with Large Language Models]] - [[2023__ISSRE__Efficient and Robust Trace Anomaly Detection for Large-Scale Microservice Systems]] - [[2023__ISSRE__ AutoKAD - Empowering KPI Anomaly Detection with Label-Free Deployment]] - [[2023__IEEE Transactions on Services Computing__LogKG - Log Failure Diagnosis through Knowledge Graph]] - [[2023__KDD__Robust Multimodal Failure Detection for Microservice Systems]] - [[2022__ITSC__Robust Anomaly Clue Localization of Multi-dimensional Derived Measure for Online Video Services]] - [[2022__CCGrid__Generic and Robust Performance Diagnosis via Causal Inference for OLTP Database Systems]] - [[2022__WWW__Robust System Instance Clustering for Large-Scale Web Services]] - [[2021__ISSRE__Robust KPI Anomaly Detection for Large-Scale Software Services with Partial Labels]] - [[2021__ATC__Jump-Starting Multivariate Time Series Anomaly Detection for Online Service Systems]] - [[2020__IPCCC__FluxInfer―Automatic Diagnosis of Performance Anomaly for Online Database System]]