# Capital One Capital One は、"From Attention to Disaggregation: Tracing the Evolution of LLM Inference" の著者所属として記載される組織である。同論文は LLM 推論最適化の発展を、KV Cache、FlashAttention、Continuous Batching、Speculative Decoding、PagedAttention、RadixAttention から [[Prefill-Decode分離]] へ接続して整理する。(Source: [[@2025__arXiv__From Attention to Disaggregation - Tracing the Evolution of LLM Inference]]) ## 関連 - ソース: [[@2025__arXiv__From Attention to Disaggregation - Tracing the Evolution of LLM Inference]] - 人物: [[Srinivasa Rao Aravilli]]