長期保存を目的とした、低アクセス頻度・高耐久性要件のストレージ層。クラウドでは Amazon S3 Glacier・Azure Archive Storage・Google Cloud Archive Storage として提供される。現在の主流媒体は磁気テープと HDD。
## 主要特性と設計含意
アーカイバルストレージには以下の特性がある:
- **書き込み超優位**: 読み出しに対し書き込みが量的に圧倒的に多い(MBベースで 47:1、操作数で 174:1 — [[@2023__SOSP__Project Silica - Towards Sustainable Cloud Archival Storage in Glass]])
- **小規模 I/O 支配**: 直感に反し I/O 操作の過半数(58.7%)が 4 MiB 以下の小規模リード。大容量ファイルはバイト数では多いが操作数では少数(<2%)
- **バースト性**: 日単位では最大 16x の peak/mean 比だが 30 日以上の集計では ≈2 まで平滑化
- **書き込みバッファリングの有効性**: 30 日以上のバッファリングで書き込み利用率を高水準に維持できる
- **長い SLO**: 現行テープ系で 10+ 時間の読み出し SLO が許容される
## 媒体比較
| 媒体 | 寿命 | ビット腐敗 | スクラビング | ガベージコレクション | 環境制御 |
|------|------|-----------|------------|---------------------|---------|
| HDD | 〜5 年 | あり | 要 | 要 | 要 |
| 磁気テープ | 〜10 年 | あり | 要 | 要 | 要(厳格) |
| DVDブルーレイ | 〜50 年 | 少 | 不要 | 不要 | 一部要 |
| 石英ガラス([[ガラスストレージ]]) | 1000 年超 | なし | 不要 | 不要 | 不要 |
## 横断的知見
- クラウドアーカイバルワークロードの実態は「大容量・稀アクセス」という一般通念と大きく異なり、多数の小規模リードが支配的である([[@2023__SOSP__Project Silica - Towards Sustainable Cloud Archival Storage in Glass]])。これはテープ設計(大容量逐次アクセス前提)がクラウドアーカイバルに適合しない根本原因
- バックグラウンド管理コスト(スクラビング・リフレッシュ・ガベージコレクション)がユーザーアクセスを圧倒し、アーカイバルストレージの総コストの大部分を占める
- ストレージシステムの設計は「何が保存されるか」より「どのように読まれるか」のワークロード実測から出発すべき
## 未解決の問い
- ガラスストレージが量産コスト段階に達した際、クラウドプロバイダーの磁気テープとのコスト交差点はいつか
- アーカイバル SLO(10+ 時間)が許容される理由とユースケース境界はどこか
- ファイルフォーマット・アプリケーション陳腐化は媒体耐久性が解決されたあとの次の課題として、どのようなアーキテクチャ的解が考えられるか