# Zixuan Zhou Zixuan Zhou は、"A Survey on Efficient Inference for Large Language Models" の第一著者(同等貢献)である。論文では [[Infinigence-AI]] と Tsinghua University 所属として記載され、LLM 推論効率化を data-level、model-level、system-level の三層に整理している。(Source: [[@2024__arXiv__A Survey on Efficient Inference for Large Language Models]]) ## 関連 - ソース: [[@2024__arXiv__A Survey on Efficient Inference for Large Language Models]] - 概念: [[LLM推論]]