## Memo
## Abstract
大規模オンラインサービスにおける多くの障害は、例外の不適切な処理に起因する。(1)状態変化による複数の例外にまたがる暗黙の依存関係、(2)ロギングなしのサイレントコード処理、(3)根本原因の例外と障害発現の分離(コードと時間)。本論文では、開発者がテスト/カナリア・デプロイ環境において、このような例外依存の障害を診断するのを支援するフレームワークであるExChainの設計と実装を紹介する。ExChainは、前述の要因が存在する場合でも、例外間の因果関係を構築する。私たちの重要な観察は、誤処理された例外は必ず重要なシステム状態を変更し、それが下流の機能に影響を与えるということです。これらの状態を追跡する際の重要な課題は、パフォーマンスオーバーヘッドと精度のトレードオフのバランスをとることである。この目的のために、ExChainは例外間の潜在的な因果関係を確立するために状態影響解析を使用し、状態伝播を追跡するために新しいハイブリッドテイント追跡アプローチを使用します。ExChainを使用することで、10個の一般的なアプリケーションで報告された11個の微妙な例外依存障害のうち8個の根本原因を特定することに成功した。ExChainは最先端のアプローチを大幅に凌駕し、偽陽性が数桁少ない。ExChainはまた、ベースラインの静的/動的解析の代替手法と比較して、精度と性能のトレードオフを大幅に改善します。