# 道下幹也 [[SAKURA Internet]] クラウド事業本部所属のエンジニア。 LINE Yahoo にて IaaS および GPU 周辺業務に 6 年間従事した後、2025 年 8 月にさくらインターネットへ入社。現在は [[高火力 PHY]] サービスに従事し、GPU インフラとソフトウェアの最新動向のキャッチアップ・検証および社内展開を推進している。 「高火力 PHY で作る分散推論基盤」連載(さくらのナレッジ)の著者。第 1 回では LLM 推論の基礎概念から性能指標体系・バッチ戦略・PD 分離・KV Cache 設計まで、分散推論基盤を構築するための前提知識を体系的に解説した。([[@2025__さくらのナレッジ__分散推論基盤やその前提の考え方]]) ## 関連 - 所属: [[SAKURA Internet]] - プロダクト: [[高火力 PHY]] - 本ソース: [[@2025__さくらのナレッジ__分散推論基盤やその前提の考え方]]