# Capital One
Capital One は、"From Attention to Disaggregation: Tracing the Evolution of LLM Inference" の著者所属として記載される組織である。同論文は LLM 推論最適化の発展を、KV Cache、FlashAttention、Continuous Batching、Speculative Decoding、PagedAttention、RadixAttention から [[Prefill-Decode分離]] へ接続して整理する。(Source: [[@2025__arXiv__From Attention to Disaggregation - Tracing the Evolution of LLM Inference]])
## 関連
- ソース: [[@2025__arXiv__From Attention to Disaggregation - Tracing the Evolution of LLM Inference]]
- 人物: [[Srinivasa Rao Aravilli]]