## Memo ## Memo with LLM ## Abstract インターネット上のウェブアプリケーションの増加により、データセンターのトラフィックは著しく増加している。 これらのアプリケーションには多様なQoS(Quality of Service)要件があるため、データセンター管理は複雑なタスクとなっている。 データセンターでは、特定のリソースタイプ(コンピューティング、メモリ、ネットワーク、ストレージ)に必要なリソースの量をワークロードと呼びます。 クラウドデータセンタでは、ワークロードの分類と特徴付けは、リソース管理、アプリケーションパフォーマンス管理、キャパシティサイジング、および将来のリソース需要の予測に使用されます。 将来のリソース需要の正確な予測は、QoS要件を満たし、効率的なリソース利用を確保するのに役立ちます。 したがって、コスト効率の高い方法でアプリケーションの性能要件を満たすためには、データセンターのワークロードのモデリングと特性評価が必要になる。 本論文では、データセンターのワークロードを分類し、リソースの使用状況に基づいてワークロードを特徴付ける手法を提案する。 Googleクラスタトレース(GCT)データセットとBit Brainsトレース(BBT)データセットの2種類のワークロードを使用した。 ワークロードの分類には、7つの異なる機械学習アルゴリズムが使用されている。 作業負荷の分布は、GCT と BBT の両方について、異種アプリケーションの混合で推定されている。 7つの機械学習アルゴリズムを分類精度に基づいて比較した。 最後に、分類のための異なる属性の重要度を推定するアルゴリズムを提案する。