[GitHub - alibaba/clusterdata: cluster data collected from production clusters in Alibaba for cluster management research](https://github.com/alibaba/clusterdata) > Alibaba Cluster Trace Programは、Alibaba Groupによって公開されています。このプログラムは、研究者や学生、この分野に興味を持つ人々が、実際の生産現場からのクラスタトレースを提供することで、最新のインターネットデータセンター(IDC)の特性やワークロードについてより深く理解することを支援します。 ### Our Motivation > 冒頭で述べたように、このデータを公開する動機は、関連分野の人々が最新のデータセンターについて理解を深めるのに役立ち、研究者が自分のアイデアを検証するための実データを提供することにあります。研究・調査の目的であれば、トレースはどのように使用しても構いません。 > このデータは、オンラインサービスとバッチジョブが混在するIDCにおいて、アリババが直面する課題を解決するために提供されています。 その課題は、以下のようなトピックに集約されます。 > ワークロードのキャラクタライゼーションスケジューリングやリソース管理戦略の検討のために、様々な生産ワークロードを代表的にシミュレーションできるように、Alibabaのワークロードをどのように特性化するか。 ワークロードをマシンに割り当てるための新しいアルゴリズム。リソースの利用効率を高め、さまざまなアプリケーションのパフォーマンスSLAを確保するために、ワークロードをマシンに割り当て、再スケジュールする方法(例:リソースの競合を減らし、適切なプロイアリティを定義することによって)。 オンラインサービスのスケジューラ(Sigma)とバッチジョブのスケジューラ(Fuxi)の連携。オンラインサービスのQoS(Quality of Service)と高速な障害回復を維持しながら、バッチジョブのスループットを向上させるために、オンラインサービスとバッチジョブ間のリソース割り当てをどのように調整するかについて説明します。コロケーション(異なるスケジューラで管理するワークロード)の規模が拡大するにつれ、連携メカニズムの設計はますます重要になってきています。