# Store Foundational AI (Amazon)
Amazon(Seattle, WA, USA)の基盤モデル学習を担う組織ユニット。数千台規模の GPU クラスタで大規模基盤モデルの事前学習を運用する。[[ストラグラー]]検知と[[GPUクラスタ運用|ノード健全性管理]]システム [[Guard]] を開発し、検知ツールの一部を [[fkat]](Amazon's Foundational Software Kit for AI Training)としてオープンソース化した([[@2026__MLSys2026__Guard - Scalable Straggler Detection and Node Health Management for Large-Scale Training]])。本 wiki の別ページ [[Amazon Web Services]] とは別ユニットであり、クラウドサービス提供ではなく自社の基盤モデル学習を担う。
## 関連
- ソース: [[@2026__MLSys2026__Guard - Scalable Straggler Detection and Node Health Management for Large-Scale Training]]
- エンティティ: [[Guard]] / [[fkat]] / [[Guanliang Liu]]