[[The Morning Paper]] - blog: [The Morning Paper on Operability | the morning paper](https://blog.acolyer.org/2016/09/21/the-morning-paper-on-operability/) - slide: [The Morning Paper on Operability - Speaker Deck](https://speakerdeck.com/acolyer/the-morning-paper-on-operability) > - [ ] この講演について考え始めたとき、論文の大半は(少なくとも私が読んだ論文の大半は)運用上の問題についてあまり触れていないという印象を持ちました。しかし、自分のコレクションを振り返ってみると、運用に関連する問題に触れている論文がいかに多いかに驚かされました。これから25分ほど、私の個人的なハイライトを紹介します。この中から、皆さんの興味を引き、さらに深く掘り下げるきっかけになるものがあれば幸いです。 ## 紹介されている論文 - [[2007__LISA__On designing and deploying internet-scale services]] - [[Internet Scale Services Checklist]] - [[2010__Dapper, a Large-Scale Distributed Systems Tracing Infrastructure]] - [[2014__OSDI__The Mystery Machine - End-to-end Performance Analysis of Large-scale Internet Services]] - [[2015__VLDB__Gorilla - A Fast, Scalable, In-Memory Time Series Database]] - [[2014__OSDI__lprof - A Non-intrusive Request Flow Profiler for Distributed Systems]] - [[2015__SOSP__Pivot tracing - dynamic causal monitoring for distributed systems]] - [[2015__SOSP__Failure Sketching - A Technique for AutomatedRoot Cause Diagnosis of In-Production Failures]] - [[2002__TSE__Simplifying and isolating failure-inducing input]] - [[2016__SIGMOD__DBSherlock―A Performance Diagnostic Tool for Transactional Databases]] - [[2016__NSDI__Minimizing Faulty Executions of Distributed Systems]] - [[How Complex Systems Fail]]