# Shengkun Cui [[@2025__SC__Characterizing GPU Resilience and Impact on AI - HPC Systems]](Cui+, SC2025、別題 "Story of Two GPUs")の共同筆頭著者(Archit Patke と equal contribution)。所属は [[University of Illinois Urbana-Champaign]](Urbana, USA、[email protected])。同論文では [[NCSA]] の [[Delta]] における A100/H100 GPU の 2.5 年分のレジリエンス特徴付けを主導した。 ## 関連 - ソース: [[@2025__SC__Characterizing GPU Resilience and Impact on AI - HPC Systems]] - 組織: [[University of Illinois Urbana-Champaign]] / [[NCSA]] - 人物: [[Ravishankar K. Iyer]](責任著者) - 概念: [[GPUクラスタ運用]] - [[Kaleidoscope]] フレームワーク([[@2020__SC20__Live Forensics for HPC Systems - A Case Study on Distributed Storage Systems]], SC 2020)の共著者。[[Saurabh Jha]] とともに [[Blue Waters]] ストレージの障害フォレンジクスに取り組んだ。(Source: [[@2020__SC20__Live Forensics for HPC Systems - A Case Study on Distributed Storage Systems]]) ## 出典 - [[@2025__SC__Characterizing GPU Resilience and Impact on AI - HPC Systems]](筆頭著者として登場) - [[@2020__SC20__Live Forensics for HPC Systems - A Case Study on Distributed Storage Systems]](共著者として登場)