長期保存を目的とした、低アクセス頻度・高耐久性要件のストレージ層。クラウドでは Amazon S3 Glacier・Azure Archive Storage・Google Cloud Archive Storage として提供される。現在の主流媒体は磁気テープと HDD。 ## 主要特性と設計含意 アーカイバルストレージには以下の特性がある: - **書き込み超優位**: 読み出しに対し書き込みが量的に圧倒的に多い(MBベースで 47:1、操作数で 174:1 — [[@2023__SOSP__Project Silica - Towards Sustainable Cloud Archival Storage in Glass]]) - **小規模 I/O 支配**: 直感に反し I/O 操作の過半数(58.7%)が 4 MiB 以下の小規模リード。大容量ファイルはバイト数では多いが操作数では少数(<2%) - **バースト性**: 日単位では最大 16x の peak/mean 比だが 30 日以上の集計では ≈2 まで平滑化 - **書き込みバッファリングの有効性**: 30 日以上のバッファリングで書き込み利用率を高水準に維持できる - **長い SLO**: 現行テープ系で 10+ 時間の読み出し SLO が許容される ## 媒体比較 | 媒体 | 寿命 | ビット腐敗 | スクラビング | ガベージコレクション | 環境制御 | |------|------|-----------|------------|---------------------|---------| | HDD | 〜5 年 | あり | 要 | 要 | 要 | | 磁気テープ | 〜10 年 | あり | 要 | 要 | 要(厳格) | | DVDブルーレイ | 〜50 年 | 少 | 不要 | 不要 | 一部要 | | 石英ガラス([[ガラスストレージ]]) | 1000 年超 | なし | 不要 | 不要 | 不要 | ## 横断的知見 - クラウドアーカイバルワークロードの実態は「大容量・稀アクセス」という一般通念と大きく異なり、多数の小規模リードが支配的である([[@2023__SOSP__Project Silica - Towards Sustainable Cloud Archival Storage in Glass]])。これはテープ設計(大容量逐次アクセス前提)がクラウドアーカイバルに適合しない根本原因 - バックグラウンド管理コスト(スクラビング・リフレッシュ・ガベージコレクション)がユーザーアクセスを圧倒し、アーカイバルストレージの総コストの大部分を占める - ストレージシステムの設計は「何が保存されるか」より「どのように読まれるか」のワークロード実測から出発すべき ## 未解決の問い - ガラスストレージが量産コスト段階に達した際、クラウドプロバイダーの磁気テープとのコスト交差点はいつか - アーカイバル SLO(10+ 時間)が許容される理由とユースケース境界はどこか - ファイルフォーマット・アプリケーション陳腐化は媒体耐久性が解決されたあとの次の課題として、どのようなアーキテクチャ的解が考えられるか