# GenAI-Perf
[[NVIDIA]] が開発・公開するオープンソースの LLM 推論ベンチマークツール。TTFT・ITL・TPS・RPS を計測し、[[TensorRT-LLM]] や [[NVIDIA NIM]] のエンドポイントを主なターゲットとする。
## 計測指標
- **TTFT**(Time to First Token)
- **ITL**(Intertoken Latency): `(e2e_latency – TTFT) / (出力トークン数 – 1)` で算出(TTFT を含まない)
- **TPS**(Tokens Per Second)
- **RPS**(Requests Per Second)
## LLMPerf との違い
| 指標 | GenAI-Perf | LLMPerf |
|------|-----------|---------|
| ITL の計算 | TTFT を **含まない** | TTFT を **含む** |
| TPS の分母 | ツール独自の定義 | ツール独自の定義(異なる) |
→ 両ツールの結果を直接比較する際は正規化が必要。(出典: [[@2025__NVIDIA__LLM-Inference-Benchmarking-Fundamental-Concepts]])
## 関連
- 開発元: [[NVIDIA]]
- 対象インフラ: [[TensorRT-LLM]] / [[NVIDIA NIM]]
- 概念: [[LLM推論]]
- ソース: [[@2025__NVIDIA__LLM-Inference-Benchmarking-Fundamental-Concepts]]