# OpenPAI
[[Microsoft]] が開発した Kubernetes ベースのオープンソース・ディープラーニング訓練プラットフォーム。[[HiveD]] の統合先として OSDI 2020 の HiveD 論文で言及された。
## 概要
GPU クラスタ上でのディープラーニング訓練ジョブを管理する基盤プラットフォーム。Kubernetes を基盤として、ジョブ管理・資源スケジューリング・モデルレジストリ・データ管理などを提供する。
## HiveD との関係
[[HiveD]] は OpenPAI に統合されており、OpenPAI 上で動作するテナントの GPU アフィニティ保証と共有安全性を提供する。
## 関連
- ソース: [[@@2020__OSDI__HiveD Sharing a GPU Cluster for Deep Learning with Guarantees]]
- 関連システム: [[HiveD]]
- 組織: [[Microsoft]]
- 概念: [[GPUクラスタスケジューリング]]