# OpenPAI [[Microsoft]] が開発した Kubernetes ベースのオープンソース・ディープラーニング訓練プラットフォーム。[[HiveD]] の統合先として OSDI 2020 の HiveD 論文で言及された。 ## 概要 GPU クラスタ上でのディープラーニング訓練ジョブを管理する基盤プラットフォーム。Kubernetes を基盤として、ジョブ管理・資源スケジューリング・モデルレジストリ・データ管理などを提供する。 ## HiveD との関係 [[HiveD]] は OpenPAI に統合されており、OpenPAI 上で動作するテナントの GPU アフィニティ保証と共有安全性を提供する。 ## 関連 - ソース: [[@@2020__OSDI__HiveD Sharing a GPU Cluster for Deep Learning with Guarantees]] - 関連システム: [[HiveD]] - 組織: [[Microsoft]] - 概念: [[GPUクラスタスケジューリング]]