[[2023__arXiv__PACE-LM - Prompting and Augmentation for Calibrated Confidence Estimation with GPT-4 in Cloud Incident Root Cause Analysis|PACE-LM]]の評価プロトコルとしても用いられており、次のように説明されている。 > 信頼性ダイアグラム(7、11)は、機械学習モデルにおける確率的予測のキャリブレーションを評価するための重要なツールである。信頼性ダイアグラムは、モデルによって生成された予測確率を、観測された頻度と視覚的に比較し、モデルが十分に較正された信頼 度を提供する能力についての洞察を提供する。キャリブレーションの性能を迅速に評価する役割を担っています。信頼性ダイアグラムの文脈では、横軸は信頼軸であり、0から1の間の範囲を表している。この区間は、より小さなサブ区間に等しく分割される。 各サブ区間のバーの高さは、それぞれのサブ区間に位置する信頼 度スコアが割り当てられた根本原因の集合体の中で、正のラベル が占める割合を示している。灰色で表示されている領域は、対応 するバーが整列することを期待される区間である。