監視SaaSでは、エラーの回復までに時間を要した分だけ、agentや内部のキューでバッファリングされているデータ書き込みの遅延が大きくなる。遅延を解消するためには、普段以上のスループットで書き込みを処理しないといけないため、やっとエラーから回復したのに普段以上のリクエストが押し寄せてくる運命にある...
[[Datadog]]のインシデントを眺めて
[Datadog US1 Status - Recovering from a multi-product outage](https://status.datadoghq.com/incidents/nhrdzp86vqtp)