# World of Code Ma+ EMSE 2021 が提案する FLOSS ecosystem の計算/統計基盤。GitHub・GitLab・Bitbucket の 3 大 VCS から完全収集した project objects(authors・projects・commits・blobs)を相互参照可能な形で提供し、research-ready・operational・updatable・expandable な dataset を志向する。 - 当時のスナップショットで **173M projects** をカバー(2024 時点)。 - [[@2024__MSR__A Dataset of Microservices-based Open-Source Projects]] が起点として WoC を採用、ここから 389,559 projects を抽出し OSS-MS dataset 構築の基盤とした。 - 限界: Git 系 VCS のみ、private repository は未収録、また時間で変化する project は snapshot 時点での hash 提示が必要。 ## 関連 - 本ソース: [[@2024__MSR__A Dataset of Microservices-based Open-Source Projects]] - 関連概念: マイクロサービスベンチマーク構築のためのスクリーニング基盤