[[構造変化]] - ノート:[Change points and structural breaks](https://kevin-kotze.gitlab.io/tsm/ts-2-note/) - スライド: [Change points and structural breaks](https://kevin-kotze.gitlab.io/tsm/ts-2-slide/#1) 時系列変数を含む分析を行う場合、伝統的な[[線形回帰]]モデルを使用すると、通常、一貫したデータ生成プロセスを持つサンプル期間を利用したいと思うでしょう。選択したサンプル期間がこの基準を満たすことを確認するために、変化点検定または[[構造変化]]検定を使用して、基礎となるデータ生成プロセスの変化を特定することができます。世界金融危機やCovid-19の大流行などのイベント以来、時系列内の複数の変化点の位置を特定できるようにする必要性が高まってきています。 この分野の文献は幅広く、最近の進歩は、興味深い実用的なアプリケーションのホストを可能にする一般性のレベルで、いくつかの異なるモデルの使用を検討している。これらには、定常回帰変数と時間依存性と異種分散性を示すことができる誤差を持つモデル、トレンド変数と単位根の可能性を持つモデル、共積分モデルなどが含まれる。 これらの手続きは、時系列またはその構成要素の平均または分散のいずれかにおける多数の変数に共通するブレーク、および基礎となるデータ生成プロセスの変化に起因すると思われる予測精度の変化を検定するために使用することができます。これらのモデルは、通常の最小二乗法、道具変数、ベイズ法、分位点回帰、LASSO(Least Absolute Shrinkage and Selection Operator)に基づく方法など様々な推定戦略を利用しており、通常、時系列、パネル、因子モデルのコンテキスト内で適用されています。 以下では、変数間の線形関係に基づく計量経済学的な応用に関連する特定の側面のみに焦点を当てることにする。我々の焦点は、与えられたデータサンプルにおけるブレークを検定し、ブレークの日付の周りに信頼区間を形成するレトロスペクティブ(オフライン)メソッドを利用することである。最近の文献のレビューについては、Perron (2006), Perron (2010), Casini and Perron (2019) and Burg and Williams (2020) を参照。また、ウェブページ http://changepoint.info には、多くの重要な参考文献が掲載されている。 ## 1 Change point detection 特定の変化点テストは、確率過程や時系列の確率分布の変化に関連する特定の期間を特定することを目的としています。一般的に、この問題は、変化が起こったかどうか、あるいはいくつかの変化が起こったかどうかを検出することと、そのような変化の時間を特定することの両方に関するものです。 ### 1.1 Single change point detection ここで、この仮説を検証するための一般的な尤度比に基づくアプローチを紹介する。変化点を検出するために尤度ベースのアプローチを使用する可能性は、Hinkley (1970)によって最初に提案され、彼は正規分布のオブザベーション内の平均の変化に対する尤度比検定統計量の漸近分布を導出した。このアプローチは,その後,Gupta と Tang (1987)によって,正規分布のオブザベーション内の分散の変化を考慮するように拡張された.興味のある読者は,より包括的なレビューとして,Silva and Teixeira (2008) および Eckley, Fearnhead, and Killick (2011)に言及される. ### 1.2 Multiple change point detection Killick and Eckley (2014) は、文献上、複数の変化点を特定する最も一般的なアプローチは、以下の式を最小化することであると指摘している。 ![[Pasted image 20220330110646.png]] ここで、C はセグメントのコスト関数である。この場合、β f ( m ) は、負の対数尤度(すなわち、閾値 c の多重変化点バージョン)と組み合わせることができるオーバーフィッティングを防止するためのペナルティである。標準的なペナルティ関数には、Schwarz、Bayesian、Akaike、Hannan-Quinn 基準などの様々な形式の情報基準や、この目的のために特別に開発された多くの追加ペナルティ関数があります。この最小化問題を解くブルートフォース・アプローチは、2 T - 1個の解を考慮し、mが既知の場合は( T - 1 m )に減少する。以下では、式(1.3)を最小化する3つの多重変化点アルゴリズム、すなわち、バイナリセグメンテーション、セグメントネイバーズ、および、プルーニングされた正確な線形時間(PELT)を考察する。 Killick and Eckley (2014)は、バイナリ・セグメンテーションは間違いなく最も広く使われている複数の変化点探索手法で、Edwards and Cavalli-Sforza (1965), Scott and Knott (1974) and Sen and Srivastava (1975) の仕事に端を発している、と指摘しています。この方法を使用する場合、まず、利用可能なすべてのデータに対して1つの変化点テストを適用します。変化点が特定された場合、データは変化点の位置で2つに分割されます。変化点が特定された場合、データは変化点の位置で2つに分割されます。1つの変化点の手順を、変化前と変化後の2つの新しいデータセットで繰り返します。新しいデータセットのどちらかで変化点が確認された場合、さらに分割されます。このプロセスは、データのどの部分にも変化点が見つからなくなるまで続けられます。この手順は、式(1.3)の近似的な最小化であり、f ( m ) = m である。これは、変化点の位置が、以前に特定された変化点の条件となるためである。このように、二項分割は、2 T - 1個の可能な解の部分集合のみを考慮するため、計算上都合の良い近似アルゴリズムである。このアルゴリズムの計算量は O ( T log T ) であるが,この速さは結果として得られる変化点の正確さを犠牲にすることになる(詳細は Killick, Fearnhead, and Eckley (2012) を参照). セグメント近傍アルゴリズムは,Auger and Lawrence (1989) によって提案され,Bai and Perron (1998) のアプリケーションで適用されている.このアルゴリズムは、動的計画法の助けを借りて、式(1.3)で与えられる式を最小化し、m個の変化点に対して計算された情報を再利用して、m+1個の変化点に対する最適なセグメンテーションを求めるものである。これにより、計算量は、素朴探索の O ( 2 T ) から O ( Q T 2 ) に減少し、Q は識別する変化点の最大数である。このアルゴリズムは厳密であるが、計算量はバイナリ・セグメンテーションよりもかなり高い。 Killick, Fearnhead, and Eckley (2012)で提案されたPELTアルゴリズムもセグメント近傍アルゴリズムと同様に厳密解を提供します(つまり、近似ではありません).これは、[[動的計画法]]と[[枝刈り法]]を利用することで、特定の仮定が満たされることを条件として、O ( T ) 探索アルゴリズムになることができ、より計算効率が高いことが示されている。これらの条件のほとんどは特に負担になるものではありません。 ### 1.3 Changes in mean and variance 変化点問題についての初期の研究は、平均の変化を識別することに重点を置いており、それぞれ[[尤度比]]と累積和([[CUSUM]])検定統計を作成したPage(1954)とHinkley(1970)の研究が含まれています。分散の変化の検定はあまり注目されていないが、この分野の研究の多くは、Hinkley (1970)の研究を基礎としている。この拡張は,Hsu (1979), Horvath (1993) and Chen and Gupta (1997) で議論されており,Killick et al. (2010) は,通常,変動の微妙な変化を検出することは比較的困難であると指摘している.また、データが想定された分布にあるとき、平均と分散の両方の変化を組み合わせて検定することもできます。 これらのテストからの出力の例を提供するために、シミュレーションデータを利用することができます。最初のケースでは、一定の分散を持つランダムな正規分布から360のオブザベーションを抽出することにしています。最初の100個のオブザベーションはゼロの平均値を持ち、2番目の50個のオブザベーションは1.5の平均、3番目の90個のオブザベーションはゼロの平均、最後の120個は-0.8の平均値を持ちます。このデータは図1に表示されています。 二項分割法を用いると、観測値85、152、233の後にデータを分割することで、[[ベイズ情報量規準]]が示唆するように、データの記述を改善することができることが示唆される。図2は、この方法を用いた場合の、平均値の変化の結果を示している。 ![[Pasted image 20220330111247.png]] バイナリ・セグメンテーション法は最も簡便な結果を提供しますが、セグメント・ネイバーフェア・アルゴリズムを用いると、より正確な結果を提供することができ、オブザベーション100、149、233で破れが発生することが示唆されます。この結果は、Figure 3 に、この方法を使用した場合の、平均値の変化の結果を表示しています。 ![[Pasted image 20220330111309.png]] そして、より好都合な刈り込み最適化アルゴリズムを用いても、同じ結果が得られる。この結果はFigure 4に表示されています。 ![[Pasted image 20220330111326.png]] ランダムな正規分布から360個のオブザベーションを抽出して、同じ平均と異なる分散を使用します。最初の100個のオブザベーションは1、2番目の50個のオブザベーションは2、3番目の90個のオブザベーションは1、最後の120個のオブザベーションは0.5の分散を持っています。PELTアルゴリズムを使用した後、オブザベーション104、150、236で分散の変化点を識別して、図5に表示されている結果を提供することができます。 ![[Pasted image 20220330111413.png]] ## 2 Structural break tests 構造的ブレークという用語は、多くの点で変化点と同義であるが、回帰係数に変化がある特定のケースを指すと思われる。したがって、構造的ブレークテストは、検討中のモデルの特定の仕様に依存します。線形回帰モデルの場合。 ![[Pasted image 20220330111449.png|600]] ... 一般化ゆらぎ検定の枠組みは、特定の回帰モデルをデータに当てはめた後、残差またはパラメータ推定値のいずれかのゆらぎの挙動を考慮する前に、グラフで不変性からの逸脱を識別しようとするものである。たとえば,Brown, Durbin, and Evans (1975)によって導入されたCUSUM検定の変種は,特定のモデルからの残差の累積和を考慮する.もし、残差が白色ノイズであれば、残差はゼロに中心を持つことが期待されます。しかし、これらの残差がゼロから有意に離れる場合、この振る舞いは、データに構造的な断絶があることを示唆しているのかもしれません。 ### 2.1 Chow’s breakpoint test Chow (1960) breakpoint testは、同じ回帰モデルを別々のサブサンプルに当てはめ、パラメータ推定値に有意な差があるかどうかを確認するものである。形式的には、この検定は、2つのモデルのパラメータについてF-検定統計量を構成した後、「構造変化なし」という帰無仮説が成り立つかどうかを調査するものである。有意差がある場合は、関係性に構造変化があることを示す。 ### 2.2 Quandt likelihood ratio test Quandt (1960) 尤度比 (QLR) 検定は,Chow 検定を自然に拡張したもので,特定の区間内のすべての潜在的ブレイクポイントについてF-検定統計量が計算される.この区間は,通常,回帰モデルの推定に必要とされる自由度に依存する.そして,すべての潜在的分岐点のグリッドで最大の検定統計量は,最も可能性の高い分岐点を示すので,QLR 統計量として識別される.そして、この検定統計量の絶対値が比較的大きければ、構造変化がないという帰無仮説を棄却することになる。Andrews (1993) と Andrews and Ploberger (1994) は、この検定統計量の適用分布を開発し、漸近的な p 値の算出に使用している。別の臨界値については、Hansen (1997) と Stock and Watson (2010)で議論されている。これは通常、supF-検定として実行されるが、他のバリエーションも存在する。この統計量は、ブレークポイントという選択肢に対して良い検出力を示します。 ### 2.3 Testing for multiple structural breaks Bai and Perron (1998) と Bai and Perron (2003) は、このアプローチを拡張して、複数の構造切断を検定している。彼らは、0対τ 1ブレーク、τ 1対τ 2ブレークなどのF-検定を利用しています。したがって、m個のブレークポイントの可能性があると仮定すると、彼らは、結果の残差平方和を最小化する係数のグループを識別するために、異なる可能なβ j係数の最小二乗推定値を考慮します。 この手順を実行するために、Bai and Perron (2003)は、観測されていない1つのブレークポイントを含む回帰から残差平方和を算出しています。そして,この統計量の値は,ブレークポイントが含まれない回帰の残差平方和と比較される.その後、2番目のブレークポイントが含まれ、残差平方和が1つのブレークポイントのものと比較される。したがって,構造変化のすべての日付を識別する問題は,すべてのm 個のパーティションにわたって残差平方和を最小化するm 個のブレークポイントを見つけることである.モデル選択には情報量規準が用いられることが多いが、この場合、m個のブレークポイントの選択を特定することになる。Bai and Perron (2003)は,AICは通常,ブレークポイントの数を過大評価するので,通常,BICが好まれることを示唆する.この計算を比較的簡便に行うために、彼らは動的計画法を使用しています。 ### 2.4 CUSUM test CUSUMテストは、一般化された変動テストの枠組みを利用した再帰的残差の累積和に基づくものである。構造変化を調査するために、累積和を5%臨界境界と一緒にプロットします。このテストは、累積和が2つの境界のいずれかを破った場合、パラメータの不安定性を発見します。これは、もともと Brown, Durbin, and Evans (1975)によって、パラメータ安定性の帰無仮説を検定するために提案され、プロセスが最初は比較的安定で、その後比較的乱高下するときに特に有用です。 [statsmodels.stats.diagnostic.breaks_cusumolsresid — statsmodels](https://www.statsmodels.org/dev/generated/statsmodels.stats.diagnostic.breaks_cusumolsresid.html) [Regression Diagnostics and Specification Tests — statsmodels](https://www.statsmodels.org/dev/diagnostic.html?highlight=breaks#unknown-change-point) ## 3 Conclusion 時系列モデルは、特定の期間に観測される変数間の関係を考察するものである。これらのモデルのほとんどは、変数間の関係が全期間にわたって一定であることを前提としている。変化点検定と構造切断モデルは、データの最初の2つのモーメントまたはモデルのパラメータに生じる可能性のある永久的な変化を特定しようとするものです。 広く使われているいくつかの経済・金融指標には、特に最近の期間において、潜在的な構造的破たんが多数存在します。この点を認識しないと、データの関連する特徴について無効な結論を導き、そのようなモデルからの予測は通常、比較的不正確なものとなってしまいます。 データの最初の2つのモーメントが変化点の影響を受けている可能性がある場合、上記のような多くのテストのうちの1つを実行することができます。さらに、構造的断絶の可能性があるデータに線形モデルを使用する場合、構造的断絶検定を利用することができます。この場合、QLR統計量またはCUSUM検定を使用して、単一の断絶を特定することができます。あるいは,複数の構造的破れを検定するために,Bai and Perron (1998) または Bai and Perron (2003)の手法を用いることができる.