# World of Code
Ma+ EMSE 2021 が提案する FLOSS ecosystem の計算/統計基盤。GitHub・GitLab・Bitbucket の 3 大 VCS から完全収集した project objects(authors・projects・commits・blobs)を相互参照可能な形で提供し、research-ready・operational・updatable・expandable な dataset を志向する。
- 当時のスナップショットで **173M projects** をカバー(2024 時点)。
- [[@2024__MSR__A Dataset of Microservices-based Open-Source Projects]] が起点として WoC を採用、ここから 389,559 projects を抽出し OSS-MS dataset 構築の基盤とした。
- 限界: Git 系 VCS のみ、private repository は未収録、また時間で変化する project は snapshot 時点での hash 提示が必要。
## 関連
- 本ソース: [[@2024__MSR__A Dataset of Microservices-based Open-Source Projects]]
- 関連概念: マイクロサービスベンチマーク構築のためのスクリーニング基盤