fold-k4-from-2026-06-05-to-2026-06-05-n16-b2

Level-4 fold of 16 log entries spanning 2026-06-05 to 2026-06-05. Dominant themes: LLM 推論効率化とサービングサーベイ、エージェント型 RL フレームワーク、NSDI '26 集合通信・テレメトリ最適化。 ## Child Entries | Date | Op | Title | Page | Summary (extractive) | |---|---|---|---|---| | 2026-06-05 | ingest-paper | OpsAgent (ASE '26) | [[@2026__ASE__OpsAgent - An Evolving Multi-agent System for Incident Management in Microservices]] | training-free テキスト変換による異種テレメトリ統一が MAS 型インシデント管理の鍵。Lenovo 本番 53 日・10,492 件 84.09%・解決時間 2.5h→126s | | 2026-06-05 | concept | Scaling Telemetry Workloads | [[Scaling Telemetry Workloads]] | 博士論文の 3 層枠組み（計装・保持・分析）と「文脈豊富な両端で削減」の設計指針を概念ページとして独立化 | | 2026-06-05 | ingest-paper | Matryoshka (NSDI '26) | [[@2026__NSDI__Matryoshka - Realizing Hyperscale Data Center Network Design for the AI Era]] | 高レベル DCN 設計インテントをスイッチ設定に自動コンパイルする設定生成フェーズが学術研究の空白だったことを明示 | | 2026-06-05 | ingest-paper | FAST (NSDI '26) | [[@2026__NSDI__FAST - An Efficient Scheduler for All-to-All GPU Communication]] | Birkhoff 分解で MoE AllToAllv を NP 困難から多項式時間に帰着。64 GPU で 221 µs の合成時間 | | 2026-06-05 | ingest-paper | HeteCCL (NSDI '26) | [[@2026__NSDI__HeteCCL - Synthesizing Near-Optimal Collective Communication Schedules for Heterogeneous GPU Clusters]] | CEGIS でヘテロジニアス GPU クラスタの集合通信スケジュール合成を 9 時間超→9 分未満に短縮。NCCL 比最大 2.8× | | 2026-06-05 | ingest-paper | NSDI '26 × 6 | [[@2026__NSDI__EROICA - Online Performance Troubleshooting for Large-scale Model Training]] | LLM 訓練インフラの反復構造を共通前提に、性能診断・シミュレーション高速化・プライバシー保護テレメトリ・DCN 設計自動化・集合通信スケジューリングの 6 論文を横断 | | 2026-06-05 | ingest-paper | 分散トレーシング・ログ解析・テレメトリ最適化 × 8 | [[@2024__IEEE CLOUD__Enabling Programmable Metric Flows]] | トレースサンプリングに 4 アプローチ（ヘッドベース確率/テールベース適応/遡及的/全リクエスト圧縮）が収集量と情報損失のトレードオフを異なる位相で攻める | | 2026-06-05 | ingest | "LLM for SRE" の世界探索 | [[The-World-of-LLM4SRE]] | vault 所有者が 2024 年 3 月に LLM4SRE を 3 分類（ファインチューニング/RAG/エージェント型）で整理した一次観察 | | 2026-06-05 | ingest-paper | Towards Efficient Generative LLM Serving | [[@2025__ACM Computing Surveys__Towards Efficient Generative Large Language Model Serving]] | LLM サービング効率化をアルゴリズム/システムの 2 軸で体系化した初の包括的サーベイ。投機的復号が出力品質を保持できる唯一のアルゴリズム的高速化手法 | | 2026-06-05 | ingest-paper | Efficient LLMs: A Survey (TMLR 2024) | [[@2024__TMLR__Efficient Large Language Models - A Survey]] | LLM 効率化をモデル中心・データ中心・フレームワークの 3 軸で体系化した 67 ページの包括的サーベイ | | 2026-06-05 | batch-ingest | LLM 分散推論基盤 × 4 | [[@2025__さくらのナレッジ__分散推論基盤やその前提の考え方]] | 高火力 PHY での PD Disaggregation 実測。入力長 8k・32 並列時に PD 分離は ITL P99 を 30ms 以内に抑制 | | 2026-06-05 | ingest | NVIDIA LLM Inference Benchmarking | [[@2025__NVIDIA__LLM-Inference-Benchmarking-Fundamental-Concepts]] | LLM ベンチマークはユースケースごとに ISL/OSL プロファイルが異なり、GenAI-Perf と LLMPerf は ITL 計算に TTFT を含むか否かが異なる | | 2026-06-05 | ingest | Linux eBPF Tracing Technology | [[@2021__yuuk.io__Linux eBPF Tracing Technology]] | BCC→bpftrace→libbpf+CO-RE の 3 段開発ワークフローが go-conntracer-bpf の実装背景をなす | | 2026-06-05 | ingest-paper | AutoForge | [[@2025__arXiv__AutoForge - Environment Synthesis for Agentic RL]] | ツール記述文書のみから模擬環境を完全自動合成。GRPO を環境レベルへ拡張した ERPO で訓練安定性を確保 | | 2026-06-05 | ingest | DeepSWE | [[@2025__Together AI__DeepSWE - Training a Fully Open-sourced State-of-the-Art Coding Agent by Scaling RL]] | Qwen3-32B から SFT なしの純粋 RL(GRPO++)のみで SWE-Bench-Verified SOTA を達成 | | 2026-06-05 | ingest-paper | Agent-R1 | [[@2025__arXiv__Agent-R1 - Training Agents with End-to-End RL]] | ステップレベル MDP＋柔軟なコンテキスト管理を核に PPO・GRPO・Reinforce++・RLOO を同一基盤上で比較 | ## Key Outcomes - NSDI '26 の 6 論文が LLM 訓練インフラの反復構造を共通前提に、性能診断・シミュレーション高速化・プライバシー保護テレメトリ・DCN 設計自動化・集合通信スケジューリングの 5 応用面を開拓した（2026-06-05, NSDI '26 × 6） - FAST が Birkhoff 分解で AllToAllv を多項式時間に帰着し、HeteCCL が CEGIS でヘテロジニアス環境の合成時間を 9 時間超→9 分未満に短縮。ホモ/ヘテロ双方で集合通信最適化のフロンティアを前進させた（2026-06-05, FAST / HeteCCL） - 分散トレーシング・ログ解析 8 論文の横断で、トレースサンプリングの 4 アプローチ体系と「情報を絞ってから処理する」設計原理が明確化した（2026-06-05, テレメトリ最適化 × 8） - LLM サービングの 2 大サーベイ（Miao+ / Wan+）を同時取り込みし、アルゴリズム/システム 2 軸とモデル中心/データ中心/フレームワーク 3 軸の相補的体系を wiki に確立した（2026-06-05, Efficient LLM Serving / Efficient LLMs Survey） - OpsAgent が training-free テキスト変換＋PPO/反省の二重自己進化で Lenovo 本番 53 日・解決時間 2.5h→126s を達成。agentic SRE の産業実装事例として初の大規模定量結果を提供した（2026-06-05, OpsAgent） - エージェント型 RL では Agent-R1 がステップレベル MDP 定式化、DeepSWE が SFT なし純粋 RL、AutoForge が環境自動合成という 3 つの直交アプローチを提示した（2026-06-05, Agent-R1 / DeepSWE / AutoForge） - Scaling Telemetry Workloads 概念ページが博士論文の 3 層枠組みを wiki に独立化し、トレーシング・時系列 DB・特徴量削減の統一接続点となった（2026-06-05, concept） ## Cross-entry Themes - **集合通信最適化**: FAST（Birkhoff 分解、ホモジニアス）と HeteCCL（CEGIS、ヘテロジニアス）が「問題固有の構造的単純化で NP 困難を回避する」設計を独立に発見。NSDI '26 × 6 バッチが両者を含む - **テレメトリ削減の設計原理**: 分散トレーシング・ログ解析 8 論文の「情報を絞ってから処理する」原理と、Scaling Telemetry Workloads の「文脈豊富な両端で削減」指針が一致。eBPF Tracing の BCC→libbpf 系譜が実装基盤を提供する - **LLM 推論効率化の体系**: 2 大サーベイ + さくらインターネット実測 + NVIDIA ベンチマーク手法で、理論・実装・評価の 3 層を同日に構築 - **エージェント型 RL 訓練基盤**: Agent-R1（モジュラーフレームワーク）・DeepSWE（SFT 不要）・AutoForge（環境合成）が直交軸で agentic RL の設計空間を分割 ## Contradictions or Corrections - None detected. ## Child Pages - [[@2026__ASE__OpsAgent - An Evolving Multi-agent System for Incident Management in Microservices]] - [[Scaling Telemetry Workloads]] - [[@2026__NSDI__Matryoshka - Realizing Hyperscale Data Center Network Design for the AI Era]] - [[@2026__NSDI__FAST - An Efficient Scheduler for All-to-All GPU Communication]] - [[@2026__NSDI__HeteCCL - Synthesizing Near-Optimal Collective Communication Schedules for Heterogeneous GPU Clusters]] - [[@2026__NSDI__EROICA - Online Performance Troubleshooting for Large-scale Model Training]] - [[@2024__IEEE CLOUD__Enabling Programmable Metric Flows]] - [[The-World-of-LLM4SRE]] - [[@2025__ACM Computing Surveys__Towards Efficient Generative Large Language Model Serving]] - [[@2024__TMLR__Efficient Large Language Models - A Survey]] - [[@2025__さくらのナレッジ__分散推論基盤やその前提の考え方]] - [[@2025__NVIDIA__LLM-Inference-Benchmarking-Fundamental-Concepts]] - [[@2021__yuuk.io__Linux eBPF Tracing Technology]] - [[@2025__arXiv__AutoForge - Environment Synthesis for Agentic RL]] - [[@2025__Together AI__DeepSWE - Training a Fully Open-sourced State-of-the-Art Coding Agent by Scaling RL]] - [[@2025__arXiv__Agent-R1 - Training Agents with End-to-End RL]] ## Related - [[DragonScale Memory]] - fold-operator spec - [[log]] - source entries - [[index]] - vault catalog