Level-4 fold of 16 log entries spanning 2026-06-14 to 2026-06-14. Dominant themes: AIOps 障害管理の体系的サーベイ群、監視用時系列データベースのアーキテクチャ、クラウド基盤技術(コンテナ・サーバーレス・メッセージブローカ)の前史的体系化。 ## Child Entries | Date | Op | Title | Page | Summary (extractive) | |---|---|---|---|---| | 2026-06-14 | ingest-paper | ByteSeries | [[@2020__SoCC__ByteSeries - An In-Memory Time Series Database for Large-Scale Monitoring Systems]] | 超高次元監視 TSDB ではデータ点圧縮よりメタデータ(系列キー・タグ)の圧縮がボトルネックであり、Compressed Inverted Index(trie + p4nzenc64)が圧縮とグループ集計を単一データ構造で両立し多次元クエリを 1.8〜10.7 倍高速化する | | 2026-06-14 | ingest-paper | Identifying Faults by Filtering Noisy Error Logs | [[@2011__SRDS__Identifying Faults in Large-Scale Distributed Systems by Filtering Noisy Error Logs]] | 2011 年 Alibaba Cloud 実証で障害注入テスト時のノイズ障害共存により再現率が 30% 低下。「ノイズログを源流で除去する」設計思想は LogCleaner・LogReducer の先駆けである | | 2026-06-14 | ingest-paper | A Survey of AIOps Methods for Failure Management | [[@2021__TIST__A Survey of AIOps Methods for Failure Management]] | pre-LLM 期 AIOps の Failure Management を proactive/reactive 軸 × 5 カテゴリ・14 サブカテゴリで 100 件整理。detection/RCA/prediction に研究集中(計 86.8%)、prevention 10.6%・remediation 2.5% | | 2026-06-14 | ingest-paper | Mining Causality of Network Events in Log Data | [[@2018__TNSM__Mining Causality of Network Events in Log Data]] | PC アルゴリズム + G-square 検定でスパースな二値ネットワーク syslog に適合。フーリエ+線形回帰の周期フィルタで 93% 除去、トラブルチケットの 74% に対応するエッジを 5.3 エッジ/日に絞り込む | | 2026-06-14 | ingest-paper | Lindorm TSDB | [[@2023__PVLDB__Lindorm TSDB - A Cloud-native Time-series Database for Large-scale Monitoring Systems]] | 「共有なし + 共有ストレージ」ハイブリッドで書き込みスループット直線以上のスケーラビリティを実現。Seriescache(MD5 エンコードのフォワードインデックス専用キャッシュ)が高次元問題の実用的解である | | 2026-06-14 | ingest-paper | A survey on intelligent management of alerts and incidents in IT services | [[@2024__JNCA__A survey on intelligent management of alerts and incidents in IT services]] | アラートとインシデントを別ライフサイクルとして分離する統一 AIM アーキテクチャを提示。alert determination の 3 種(distinguishing / severe ranking / alert-based incident identification)を直列統合する将来方向を示す | | 2026-06-14 | ingest-paper | Cloud Container Technologies: A State-of-the-Art Review | [[@2019__TCC__Cloud Container Technologies - A State-of-the-Art Review]] | 46 件 SMS で 2007-2016 のクラウドコンテナ研究を体系化。障害管理を「2017 年時点で未開拓」と明示。コンテナ研究は 2007 LXC → 2013 Docker → 2015 中盤クラスタ層という 2 段階加速で進行した | | 2026-06-14 | ingest | CNCF Serverless Overview Whitepaper v1.0 | [[@2018__CNCF WG Serverless__Serverless Overview Whitepaper v1.0]] | CNCF 白書(2018)は「サーバーレス = サーバー管理不要」を外部・運用視点で定義。「サーバーレス」用語の起源(2012 IronWorker)と FaaS 実用化(2014 AWS Lambda)に 2 年のギャップがある | | 2026-06-14 | ingest-paper | An up-to-date survey in web load balancing | [[@2011__World Wide Web__An up-to-date survey in web load balancing]] | 3 軸(OSI 層・応答返路・コンテンツ把握)で体系化。TCP 接続マイグレーション 5 方式と分散方針 3 分類は Kubernetes の Service/Ingress の前史にあたる | | 2026-06-14 | ingest-paper | A Survey of Distributed Message Broker Queues | [[@2017__arXiv__A Survey of Distributed Message Broker Queues]] | 同一テストベッド(5 ノード Flotilla)で Kafka と AMQP を直接対比。Kafka のスループット優位は SendFile API + シーケンシャル書き込み + OS ページキャッシュ + 標準バッチングに起因する | | 2026-06-14 | ingest-paper | How Long Will it Take to Mitigate this Incident for Online Service Systems? | [[@2021__ISSRE__How Long Will it Take to Mitigate this Incident for Online Service Systems]] | インシデント TTM のうち最終担当チーム確定後の緩和フェーズ T3 が平均 70.20% を占める。トリアージ改善だけでは TTM 短縮に限界がある | | 2026-06-14 | ingest | Practical Reliability Engineering | [[@2012__Wiley__Practical Reliability Engineering]] | 古典的信頼性工学は信頼性を「時間依存の品質」として扱い、数学的予測より工学判断・故障モード理解・是正フィードバックを優先する | | 2026-06-14 | ingest-paper | A Survey of Online Failure Prediction Methods | [[@2010__ACM CSUR__A Survey of Online Failure Prediction Methods]] | オンライン障害予測 taxonomy の起源は 2010 年。入力データ系統で 4 主要枝を持ち、Salfner+ 2010 の `(t_d, t_l, t_p, t_w)` は AIOps 評価の共通通貨である | | 2026-06-14 | ingest-paper | A Conceptual Framework for System Fault Tolerance | [[@1992__CMU SEI__A Conceptual Framework for System Fault Tolerance]] | 1992 年の「障害回避的措置(fault evasion)」が AIOps のプロアクティブカテゴリとして再実装された。30 年の概念的連続性を示す | | 2026-06-14 | ingest-paper | CMDiagnostor | [[@2023__WWW__CMDiagnostor - An Ambiguity-Aware Root Cause Localization Approach Based on Call Metric Data]] | コールメトリクスデータ(CMD)の「曖昧性(AmSit)」がコールグラフ精度の主ボトルネックである。入力グラフの精度が RCA 性能の上限を決める | | 2026-06-14 | ingest-paper | Automated Analysis of Distributed Tracing | [[@2021__J Grid Computing__Automated Analysis of Distributed Tracing - Challenges and Research Directions]] | OpenStack 本番 OpenTracing データの自動分析で「異常時間枠とサービスは Isolation Forest で位置づけられたが、Why 深掘りはトレース品質の天井で止まる」と診断。データの semantic 品質確保の議論の起点となる | ## Key Outcomes - Salfner+ 2010 のオンライン障害予測 taxonomy(4 主要枝)と 1992 年 CMU SEI の fault evasion 概念が、2021 年 TIST サーベイの proactive/reactive 分類に 30 年の概念的連続性として接続された(2026-06-14, Salfner+ / CMU SEI / TIST サーベイ) - 監視用 TSDB の ByteSeries と Lindorm TSDB が、ともに超高次元メタデータ管理を核心課題として特定し、Compressed Inverted Index と Seriescache という直交する設計解を提示した(2026-06-14, ByteSeries / Lindorm TSDB) - インシデント管理において TTM の 70.20% を占める緩和フェーズ T3 の存在が、トリアージ偏重の改善アプローチの限界を定量的に示した(2026-06-14, ISSRE TTM 研究) - CMDiagnostor の「入力グラフ精度が RCA 性能上限を決める」知見と分散トレーシング自動分析の「トレース品質の天井」診断が、データ品質がオブザーバビリティ分析の根本的制約であることを独立に裏づけた(2026-06-14, CMDiagnostor / Distributed Tracing 分析) - クラウド基盤技術(コンテナ・サーバーレス・負荷分散・メッセージブローカ)の 4 件のサーベイ・白書が、2007-2018 の技術史を体系化し Kubernetes 以降の設計判断の前史を構築した(2026-06-14, コンテナ / サーバーレス / 負荷分散 / メッセージブローカ) ## Cross-entry Themes - **AIOps 障害管理の歴史的深度**: 1992 年 CMU SEI の fault evasion → 2010 年 Salfner+ のオンライン障害予測 taxonomy → 2021 年 TIST サーベイの 5 カテゴリ体系化 → 2024 年 JNCA のアラート/インシデント分離型 AIM アーキテクチャという 30 年超の概念的系譜が同日に揃った - **データ品質がオブザーバビリティの天井を決める**: ノイズログ除去(2011 SRDS)、トレース品質の天井(2021 J Grid Computing)、コールグラフの曖昧性(2023 WWW CMDiagnostor)が、入力データの semantic 品質が分析精度の上限を支配するという共通原理を異なるデータ種別で確認している - **監視用 TSDB の高次元メタデータ問題**: ByteSeries の Compressed Inverted Index と Lindorm TSDB の Seriescache が、Gorilla 的データ点圧縮とは直交する次元でスケーラビリティを追求しており、超大規模監視では系列メタデータ管理が本質的ボトルネックであることを示す - **クラウド基盤技術の前史的体系化**: コンテナ(2007 LXC → 2013 Docker → 2015 クラスタ層)、サーバーレス(2012 用語起源 → 2014 AWS Lambda)、負荷分散(TCP マイグレーション 5 方式)、メッセージブローカ(Kafka vs AMQP)の 4 領域が同日に揃い、現代クラウドネイティブスタックの設計判断の前史を俯瞰できる ## Contradictions or Corrections - None detected. ## Child Pages - [[@2020__SoCC__ByteSeries - An In-Memory Time Series Database for Large-Scale Monitoring Systems]] - [[@2011__SRDS__Identifying Faults in Large-Scale Distributed Systems by Filtering Noisy Error Logs]] - [[@2021__TIST__A Survey of AIOps Methods for Failure Management]] - [[@2018__TNSM__Mining Causality of Network Events in Log Data]] - [[@2023__PVLDB__Lindorm TSDB - A Cloud-native Time-series Database for Large-scale Monitoring Systems]] - [[@2024__JNCA__A survey on intelligent management of alerts and incidents in IT services]] - [[@2019__TCC__Cloud Container Technologies - A State-of-the-Art Review]] - [[@2018__CNCF WG Serverless__Serverless Overview Whitepaper v1.0]] - [[@2011__World Wide Web__An up-to-date survey in web load balancing]] - [[@2017__arXiv__A Survey of Distributed Message Broker Queues]] - [[@2021__ISSRE__How Long Will it Take to Mitigate this Incident for Online Service Systems]] - [[@2012__Wiley__Practical Reliability Engineering]] - [[@2010__ACM CSUR__A Survey of Online Failure Prediction Methods]] - [[@1992__CMU SEI__A Conceptual Framework for System Fault Tolerance]] - [[@2023__WWW__CMDiagnostor - An Ambiguity-Aware Root Cause Localization Approach Based on Call Metric Data]] - [[@2021__J Grid Computing__Automated Analysis of Distributed Tracing - Challenges and Research Directions]] ## Related - [[DragonScale Memory]] - fold-operator spec - [[log]] - source entries - [[index]] - vault catalog