fold-k4-from-2026-06-14-to-2026-06-14-n16

Level-4 fold of 16 log entries spanning 2026-06-14 to 2026-06-14. Dominant themes: クラウドモニタリング・監視設計の「何を監視すべきか」問題、因果推論ベース RCA の実効性評価、データベースのストレージ・インデックス設計の古典と再工学。 ## Child Entries | Date | Op | Title | Page | Summary (extractive) | |---|---|---|---|---| | 2026-06-14 | ingest-paper | Performance Anomaly Detection and Bottleneck Identification | [[@2015__CSUR__Performance Anomaly Detection and Bottleneck Identification]] | 調査論文の 53% が PAD のみを扱い PADBI 統合は 18%——10 年後も「検知だけで根本原因特定を含まない」同型問題が続く最初の定量的証拠 | | 2026-06-14 | ingest-paper | CNCF TAG Observability Whitepaper v1.0 | [[@2023__CNCF TAG Observability__Observability Whitepaper]] | 「三本柱」を 5 シグナルへ拡張し、Exemplar によるメトリクス→トレース横断ナビゲーションと SLO バーンレートアラートの定量的フレームワークを提供 | | 2026-06-14 | ingest-paper | Detection Is Better Than Cure | [[@2023__ESEC-FSE__Detection Is Better Than Cure - A Cloud Incidents Perspective]] | Microsoft 本番でミス検知の 40% 超が「モニタ不在」に起因——「いかに検知するか」より「何を監視すべきか」が上位問題と定量裏付け | | 2026-06-14 | ingest-paper | Intelligent Monitoring Framework for Cloud Services | [[@2024__ICSE-SEIP__Intelligent Monitoring Framework for Cloud Services - A Data-Driven Approach]] | 791 本番サービスの実証でモニタオントロジー(13 リソースクラス・9 SLO タイプ)を導出。サービス依存グラフからモニタ推奨を自動化する初のデータ駆動アプローチ | | 2026-06-14 | ingest-paper | Anomaly Detection and Failure RCA in (Micro)Service-Based Cloud Applications | [[@2021__CSUR__Anomaly Detection and Failure Root Cause Analysis in (Micro)Service-Based Cloud Applications - A Survey]] | データ源 x 手法の 2 軸で異常検知 25 手法・RCA 26 手法を統合分類。PC アルゴリズム + ランダムウォークが pre-LLM era の標準 RCA パイプライン | | 2026-06-14 | ingest | Intelligent Monitoring (MS Research Blog) | [[@2024__Microsoft Research Blog__Intelligent Monitoring - Towards AI-Assisted Monitoring for Cloud Services]] | Monitor Scorecards(ベイズ統計 + 時系列モデリングでモニタ有効性を体系評価)が予告され、「推奨→評価」のサイクル閉鎖が計画 | | 2026-06-14 | ingest-paper | Root Cause Analysis for Microservices based on Causal Inference (ASE 2024) | [[@2024__ASE__Root Cause Analysis for Microservices based on Causal Inference - How Far Are We]] | Dummy ベースラインを初めて因果推論ベース RCA 評価に導入し、PC/FCI/Granger 系手法の多くが Dummy 同等。仮説検定系(BARO・NSigma)がグラフ構築スキップで最良 | | 2026-06-14 | ingest-paper | Chatbot Arena (arXiv 2024) | [[@2024__arXiv__Chatbot Arena - An Open Platform for Evaluating LLMs by Human Preference]] | Bradley-Terry モデルが Elo より頑健。能動サンプリングで必要票数をランダム比最大 54% 削減。クラウド投票と専門家評価の一致率 72-83% | | 2026-06-14 | ingest-paper | Humanity's Last Exam (arXiv 2025) | [[@2025__arXiv__Humanity's Last Exam]] | 最先端モデルでも HLE 最高 13.4% 正解率で RMS キャリブレーション誤差 73-89%。ベンチマーク飽和は不可避であり評価設計がモデル進化と競争する構造的課題 | | 2026-06-14 | ingest-paper | Correlating Instrumentation Data to System States (OSDI 2004) | [[@2004__OSDI__Correlating Instrumentation Data to System States - A Building Block for Automated Diagnosis]] | 単一メトリクスルールが balanced accuracy 56% に低下し、3-8 個の TAN 組合せで 87-94% を達成。「相関 ≠ 因果」の制約を 2004 年に明示化 | | 2026-06-14 | ingest-paper | Rethinking The Compaction Policies in LSM-trees | [[@2025__SIGMOD__Rethinking The Compaction Policies in LSM-trees]] | コンパクションは WA/RA の静的トレードオフでなく将来クエリスループットへの CPU/I/O 投資の時点選択問題。EcoTune が Leveling 比 1.5-3 倍改善 | | 2026-06-14 | ingest-paper | LLM-Oriented Information Retrieval | [[@2026__SIGIR__LLM-Oriented Information Retrieval - A Denoising-First Perspective]] | LLM 向け IR では消費者が人間から LLM へ変わるため、検索器は証拠密度・検証可能性・安全性を制御するノイズゲートになる必要がある | | 2026-06-14 | ingest-paper | B-Trees Are Back | [[@2025__SIGMOD__B-Trees Are Back - Engineering Fast and Pageable Node Layouts]] | B-Tree は可変長 record と 4 KiB page を保ったまま node layout 再工学で、純インメモリ索引との lookup 性能差を大きく縮められる | | 2026-06-14 | ingest-paper | Gorilla | [[@2015__VLDB__Gorilla - A Fast, Scalable, In-Memory Time Series Database]] | 「個々のデータ点ロスは許容、最新データの可用性が優先」という設計哲学が非 WAL・部分結果返却・最新ブロック優先復元に一貫反映され、HBase 比 73 倍高速化と 12 倍圧縮を両立 | | 2026-06-14 | ingest-paper | Chronix | [[@2017__FAST__Chronix - Long Term Storage and Retrieval Technology for Anomaly Detection in Operational Data]] | 汎用 TSDB はデータモデル制約で異常検知の探索的分析を根本から制限。ドメイン固有 TSDB との性能差は 20-97%——「何を保存・相関できるか」が検知可能空間を決定 | | 2026-06-14 | ingest-paper | Black-box inter-application traffic monitoring | [[@2020__SAC__Black-box inter-application traffic monitoring for adaptive container placement]] | eBPF カーネル内集約(KernelAgg)は per-connection バイトカウンタで 9% オーバーヘッドでコンテナ間通信グラフを構築。UserAgg 68%・Scope 方式 1% との設計空間整理 | ## Key Outcomes - Microsoft 本番のミス検知 40% 超が「モニタ不在」に起因(Detection Is Better Than Cure)し、791 サービスの実証から 13 リソースクラス・9 SLO タイプのモニタオントロジーが導出された(Intelligent Monitoring Framework)。「何を監視すべきか」がモニタ推奨自動化と Monitor Scorecards 評価フェーズ(MS Research Blog)へ発展し、AIOps の上位問題として確立 (2026-06-14 Detection Is Better Than Cure, Intelligent Monitoring Framework, Intelligent Monitoring Blog) - RCAEval が Dummy ベースラインを初めて因果推論ベース RCA に導入し、PC/FCI/Granger 系の多くが Dummy 同等にとどまることを実証。因果グラフ F1 は 0.10-0.54 で辺方向推定が全手法の共通ボトルネック。仮説検定系(BARO・NSigma)がグラフ構築をスキップして最良 (2026-06-14 RCAEval ASE 2024) - Cohen+(OSDI 2004) の「メトリクス帰属」と「相関 ≠ 因果」の明示化が、20 年後の MetricSifter 等メトリクス選択研究の直接的先行であることを確認。2015 年の Ibidunmoye+ が PAD 53%・PADBI 統合 18% と定量化した問題が 10 年後も継続 (2026-06-14 OSDI 2004, Ibidunmoye+) - CNCF TAG Observability 白書が三本柱を 5 シグナルへ拡張し、Exemplar によるメトリクス→トレース横断ナビゲーションと SLO バーンレートアラートの産業コンセンサスを記録 (2026-06-14 CNCF TAG) - Gorilla(2015)の圧縮が後続 TSDB の事実上の標準になり、Chronix(2017)がドメイン固有 TSDB の性能優位 20-97% を実証。両者が「何を保存するか」が検知可能空間を決めるという設計原則を補完的に裏づけ (2026-06-14 Gorilla, Chronix) - EcoTune が LSM ツリーのコンパクションを「将来クエリスループットへの投資時点選択」として再定式化し Leveling 比 1.5-3 倍を達成。B-Tree の node layout 再工学と合わせ、古典データ構造の設計空間再開拓が SIGMOD 2025 で二件同時に進行 (2026-06-14 EcoTune, B-Trees Are Back) - LLM 評価の二つの軸として、Chatbot Arena の Bradley-Terry モデル(能動サンプリングで必要票数 54% 削減)と HLE の最前線ベンチマーク(最高 13.4% 正解率・キャリブレーション誤差 73-89%)が対照的に並立 (2026-06-14 Chatbot Arena, HLE) ## Cross-entry Themes - **「何を監視すべきか」が AIOps の上位問題として三方から定量化**: Detection Is Better Than Cure(モニタ不在 40% 超)、Intelligent Monitoring Framework(13 リソースクラス・9 SLO タイプのオントロジー)、Monitor Scorecards(推奨→評価サイクル)が「検知手法の改善」より「監視対象の設計」を先に解く必要性を同日の三エントリで裏づけ - **因果推論ベース RCA の実効性が 2004 年から 2024 年まで追跡可能に**: Cohen+ 2004 の「メトリクス帰属」→Soldani+Brogi 2021 の「PC+ランダムウォーク標準パイプライン」→Pham+ 2024 の「Dummy 同等」が 20 年間の進歩と限界を一直線に可視化。仮説検定系のグラフ構築スキップが有効という結論は、精緻な因果グラフ構築の費用対効果を問い直す - **データベースの古典データ構造が再工学フェーズに**: B-Tree の node layout 再設計(SIGMOD 2025)、LSM ツリーのコンパクション再定式化(SIGMOD 2025)、Gorilla の ACID 放棄設計哲学(VLDB 2015)、Chronix のドメイン固有 TSDB(FAST 2017)が、データ構造レベルでの設計空間再探索として収束 - **LLM 評価がベンチマーク飽和とヒューマンフィードバックの二極化**: HLE の最高 13.4% 正解率(ベンチマーク難度の引き上げ)と Chatbot Arena の Bradley-Terry モデル(大規模ヒューマンフィードバックの効率化)が、静的ベンチマークの限界と動的評価基盤の必要性を対照的に示す ## Contradictions or Corrections - None detected. ## Child Pages - [[@2015__CSUR__Performance Anomaly Detection and Bottleneck Identification]] - [[@2023__CNCF TAG Observability__Observability Whitepaper]] - [[@2023__ESEC-FSE__Detection Is Better Than Cure - A Cloud Incidents Perspective]] - [[@2024__ICSE-SEIP__Intelligent Monitoring Framework for Cloud Services - A Data-Driven Approach]] - [[@2021__CSUR__Anomaly Detection and Failure Root Cause Analysis in (Micro)Service-Based Cloud Applications - A Survey]] - [[@2024__Microsoft Research Blog__Intelligent Monitoring - Towards AI-Assisted Monitoring for Cloud Services]] - [[@2024__ASE__Root Cause Analysis for Microservices based on Causal Inference - How Far Are We]] - [[@2024__arXiv__Chatbot Arena - An Open Platform for Evaluating LLMs by Human Preference]] - [[@2025__arXiv__Humanity's Last Exam]] - [[@2004__OSDI__Correlating Instrumentation Data to System States - A Building Block for Automated Diagnosis]] - [[@2025__SIGMOD__Rethinking The Compaction Policies in LSM-trees]] - [[@2026__SIGIR__LLM-Oriented Information Retrieval - A Denoising-First Perspective]] - [[@2025__SIGMOD__B-Trees Are Back - Engineering Fast and Pageable Node Layouts]] - [[@2015__VLDB__Gorilla - A Fast, Scalable, In-Memory Time Series Database]] - [[@2017__FAST__Chronix - Long Term Storage and Retrieval Technology for Anomaly Detection in Operational Data]] - [[@2020__SAC__Black-box inter-application traffic monitoring for adaptive container placement]] - [[Chronix]] - [[Gorilla]] - [[RCAEval]] - [[Chatbot Arena]] - [[LMSYS]] - [[TAG Observability]] - [[Liz Fong-Jones]] - [[継続的プロファイリング]] - [[LLM評価]] - [[LLM向け情報検索]] - [[RAGノイズ除去]] - [[B-Tree]] - [[B-Treeノードレイアウト最適化]] - [[LSMツリーコンパクション]] - [[EcoTune]] - [[RocksDB]] - [[btree-cpp]] - [[btree24]] - [[vmcache]] - [[コンテナ配置最適化]] - [[クラウドモニタリング]] - [[プロアクティブ障害管理]] ## Related - [[DragonScale Memory]] - fold-operator spec - [[log]] - source entries - [[index]] - vault catalog