# Lablup Inc. AI インフラ企業。[[Backend.AI]] と [[Sokovan]] を開発し、From Detection to Recovery 論文では 63 ノード・504 NVIDIA B200 GPU の本番訓練クラスタ運用分析を報告した。SKT、Upstage、NVIDIA Korea、[[VAST Data]] と統一監視パイプラインを共有し、60 ノード規模でだけ顕在化したストレージ I/O ボトルネックの共同診断に参加した。 ## 関連 - システム: [[Backend.AI]] / [[Sokovan]] - ソース: [[@2026__arXiv__From Detection to Recovery - Operational Analysis on LLM Pre-training with 504 GPUs]]