# Shengkun Cui
[[@2025__SC__Characterizing GPU Resilience and Impact on AI - HPC Systems]](Cui+, SC2025、別題 "Story of Two GPUs")の共同筆頭著者(Archit Patke と equal contribution)。所属は [[University of Illinois Urbana-Champaign]](Urbana, USA、
[email protected])。同論文では [[NCSA]] の [[Delta]] における A100/H100 GPU の 2.5 年分のレジリエンス特徴付けを主導した。
## 関連
- ソース: [[@2025__SC__Characterizing GPU Resilience and Impact on AI - HPC Systems]]
- 組織: [[University of Illinois Urbana-Champaign]] / [[NCSA]]
- 人物: [[Ravishankar K. Iyer]](責任著者)
- 概念: [[GPUクラスタ運用]]
- [[Kaleidoscope]] フレームワーク([[@2020__SC20__Live Forensics for HPC Systems - A Case Study on Distributed Storage Systems]], SC 2020)の共著者。[[Saurabh Jha]] とともに [[Blue Waters]] ストレージの障害フォレンジクスに取り組んだ。(Source: [[@2020__SC20__Live Forensics for HPC Systems - A Case Study on Distributed Storage Systems]])
## 出典
- [[@2025__SC__Characterizing GPU Resilience and Impact on AI - HPC Systems]](筆頭著者として登場)
- [[@2020__SC20__Live Forensics for HPC Systems - A Case Study on Distributed Storage Systems]](共著者として登場)