# Qinghao Hu LLM 開発ワークロードの特徴づけ記事 [[@2024__USENIX login Online__Understanding Workload Characteristics in Large Language Model Development]] の著者。[[Shanghai AI Laboratory]] の GPU データセンター [[Acme]] における 6 か月トレースを用い、LLM 専用クラスタの短ジョブ支配・GPU 利用率二極化・インフラ障害の GPU 時間影響を報告した。(Source: [[@2024__USENIX login Online__Understanding Workload Characteristics in Large Language Model Development]]) ## 関連 - 共著: [[Peng Sun]] / [[Tianwei Zhang]] - 関連組織・システム: [[Shanghai AI Laboratory]] / [[Acme]] - 関連概念: [[GPUクラスタ運用]] / [[LLM分散学習]]