> LINEとLINE Payは急成長を遂げましたが、急激な成長はいくつかの問題を引き起こしました。
一つ目の問題は、システムを管理する監視ツールがバラバラで、システムの把握やアラームの管理が大変だということです。また、共通のインフラに大きく依存していたため、要求に迅速に対応するのが困難でした。
二つ目の問題は、エラーログによる誤検知アラームです。システムが大きくなってログの量も増え、エラーログも増加しました。しかし、増加したエラーログがすべて実際の障害につながっていたわけではありませんでした。このような誤検知アラームは、開発者の疲労感を高め、真の検知アラームを見逃す原因となります。
このセッションでは、 LINE Payがどのようにして独自の監視システムを構築したのか、また、LINE PayがMLを使って多くのエラーログの中から実際の障害を発見する方法についてお話しします。
[Building LINE Pay Monitoring System and Anomaly Log Detection System Using ML - Speaker Deck](https://speakerdeck.com/line_devday2021/building-line-pay-monitoring-system-and-anomaly-log-detection-system-using-ml)
- ログの異常検知
- [[混合ガウスモデル]]
- [[LSTM]]