## Memo ## Memo with LLM ## Abstract 我々は、GPUカーネルが、入力に応じてべき等インスタンスと非べき等インスタンスの両方を持ち得ることを発見した。 このようなカーネルは条件付きべき等と呼ばれ、実際のGPUアプリケーションに広く見られます(6つのアプリケーションから547個中490個)。 そのため、GPUカーネルをべき等か非べき等かのいずれかに分類する先行研究は、べき等ベースのシステムの正しさや効率を著しく損なう可能性があります。 本論文では、インスタンスレベルでの冪等性検証のための初のシステムであるPICKERを紹介します。 PICKERは、GPUカーネルインスタンスの実行前に、その起動引数を利用して動的にidempotencyを検証します。 検証の待ち時間をマイクロ秒単位まで大幅に短縮するために、いくつかの最適化が提案されています。 代表的なGPUアプリケーション(547カーネル、合計18,217インスタンス)を用いた評価により、PICKERは偽陽性がなく、偽陰性の割合が18.54%のidempotentインスタンスを特定でき、すべてのインスタンスで5us以内に検証を完了できることが示されました。 さらに、PICKERを統合することで、フォールトトレラントシステムはチェックポイントコストを4%未満に削減でき、スケジューリングシステムは先取り待ち時間を84.2%削減できます。