Chow-Test

Der Chow-Test ist ein statistischer Test, mit dem sich die Koeffizienten zweier linearer Regressionen auf Gleichheit testen lassen. Der Test ist nach seinem Erfinder, dem Ökonomen Gregory Chow, benannt.

Anwendungsgebiete

Der Chow-Test wird in der Ökonometrie verwendet, um Zeitreihen auf Strukturbrüche zu testen. Ein weiteres Anwendungsgebiet ist die Programmevaluation, hierbei werden zwei unterschiedliche Teilgruppen (Programme), wie zum Beispiel zwei Schultypen, miteinander verglichen. Im Gegensatz zur Zeitreihenanalyse lassen sich hier die beiden Teilgruppen keinen aufeinander folgenden Intervallen zuordnen, stattdessen erfolgt die Einteilung nach einem qualitativen Aspekt, wie zum Beispiel dem Schultyp.

Strukturbruch	Programmevaluation
Datei:Chowtest4.svg	Datei:Chowtest8.svg
Bei <math> x=1{,}7 </math> liegt ein Strukturbruch vor, Regressionen auf den Teilintervallen <math>[0;1,7]</math> und <math>[1,7;4] </math> liefern eine bessere Modellierung als die Regression über dem Gesamtinterval (gestrichelt)	Vergleich zweier Programme (rot, grün) im selben Datensatz, separate Regressionen auf den zu einem Programm gehörigen Daten liefern eine bessere Modellierung als die Regression über den gesamten Datensatz (schwarz)

Vorgehen

Gegeben ist ein Datensatz <math>(Y_i,X_i)</math> mit <math>X_i=(x_{i1},\ldots,x_{ik}) </math> für <math>i=1\ldots N</math>, dessen Beziehung durch eine lineare Funktion mit einem normalverteilten Fehler (<Math>\epsilon </math>) mit Erwartungswert 0 (<math>E(\epsilon)=0 </math>) beschrieben wird (multiple Regressionsanalyse), d. h. man hat

<math>Y_{i}=c_0+c_1x_{i1}+c_2x_{i2}+\ldots+c_kx_{ik}+\epsilon_i</math> für <math>i=1\ldots N</math>.

Man vermutet jedoch, dass sich der Datensatz in zwei Gruppen der Größen <math>N_a</math> und <math>N_b</math> aufteilen lässt, die durch zwei unterschiedliche lineare Funktionen besser beschrieben werden.

<math>Y_{i}=a_0+a_1x_{i1}+a_2x_{i2}+\ldots+a_kx_{ik}+\epsilon_i</math> für <math>i=1\ldots N_a</math>

<math>Y_{i}=b_0+b_1x_{i1}+b_2x_{i2}+\ldots+b_kx_{ik}+\epsilon_i</math> für <math>i=N_a+1\ldots N_a+N_b</math>

Hierbei ist <math>N=N_a+N_b</math> und es wird die Hypothese <math>H_0\colon (a_0,a_1,\ldots,a_k)=(b_0,b_1,\ldots,b_k) </math> gegen <math>H_1\colon (a_0,a_1,\ldots,a_k)\neq (b_0,b_1,\ldots,b_k) </math> getestet. Bezeichnet man die Summe der quadrierten Residuen der Regression über den gesamten Datensatz mit <math>S</math> und über die beiden Teilgruppen mit <math>S_a</math> und <math>S_b</math>, dann folgt die unten definierte Testgröße <math>T</math> einer F-Verteilung mit den Freiheitsgraden <math>k+1</math> und <math>N_a+N_b-2(k+1)</math>.

Beispiel

Gegeben ist der folgende Datensatz, dessen Beziehung durch die lineare Funktion <math> Y=c_0+c_1X </math> modelliert werden soll:

<math>X_i</math>	0,5	1,0	1,5	2,0	2,5	3,0	3,5	4,0	4,5	5,0	5,5	6,0
<math>Y_i</math>	−0,043	0,435	0,149	0,252	0,571	0,555	0,678	3,119	2,715	3,671	3,928	3,962

Datei:Chowtest1.svg

Der Datenplot legt einen Strukturbruch bei <math>x=4</math> nahe.

Ein Datenplot lässt vermuten, dass bei <math> x=4 </math> ein Strukturbruch vorliegt, daher teilt man den Datensatz in 2 Intervalle <math>[0{,}5; 3{,}5]</math> und <math>[4{,}0; 6{,}0]</math> ein und führt über diesen, zusätzlich zur Regression über den gesamten Datensatz, getrennte Regressionen durch. Dann testet man, ob die beiden Teilregressionen dieselbe lineare Funktion erzeugen, also <math> H_0\colon (a_0,a_1)=(b_0,b_1) </math> gegen <math> H_1\colon (a_0,a_1)\neq(b_0,b_1) </math>

Regression auf dem gesamten Datensatz:

<math>\overline{x}=\frac{1}{12}\sum_{i=1}^{12} X_i=3{,}2500 </math>	<math>\overline{y}=\frac{1}{12}\sum_{i=1}^{12} Y_i= 1{,}6660 </math>
<math>S_{xx}=\sum_{i=1}^{12} (X_i-\overline{x})^2=35{,}7500 </math>	<math>S_{yy}=\sum_{i=1}^{12} (Y_i-\overline{y})^2= 29{,}7661</math>
<math>S_{xy}=\sum_{i=1}^{12} (X_i-\overline{x})(Y_i-\overline{y}) = 30{,}0570 </math>	<math>S=S_{yy}-\frac{S_{xy}^2}{S_{xx}}=4{,}4955</math>

Regression auf <math>[0{,}5, 3{,}5]</math>

<math>\overline{x}=\frac{1}{7}\sum_{i=1}^{7} X_i=2{,}0000 </math>	<math>\overline{y}=\frac{1}{7}\sum_{i=1}^{7} Y_i = 0{,}3710 </math>
<math>S_{xx}=\sum_{i=1}^{7} (X_i-\overline{x})^2=7{,}0000 </math>	<math>S_{yy}=\sum_{i=1}^{7} (Y_i-\overline{y})^2 = 0{,}4070</math>
<math>S_{xy}=\sum_{i=1}^{7} (X_i-\overline{x})(Y_i-\overline{y})=1{,}4125 </math>	<math>S_a=S_{yy}-\frac{S_{xy}^2}{S_{xx}} = 0{,}1220</math>

Datei:Chowtest2.svg

Datenplot mit Regressionsgeraden

Regression auf <math> [4{,}0, 6{,}0]</math>

<math>\overline{x}=\frac{1}{5}\sum_{i=1}^{5} X_i=5{,}0000 </math>	<math>\overline{y}=\frac{1}{5}\sum_{i=1}^{5} Y_i= 3{,}4790 </math>
<math>S_{xx}=\sum_{i=1}^{5} (X_i-\overline{x})^2=2{,}5000 </math>	<math>S_{yy}=\sum_{i=1}^{5} (Y_i-\overline{y})^2= 1{,}1851</math>
<math>S_{xy}=\sum_{i=1}^{5} (X_i-\overline{x})(Y_i-\overline{y})=1{,}4495 </math>	<math>S_b=S_{yy}-\frac{S_{xy}^2}{S_{xx}}=0{,}3446</math>

Berechnung der Testgröße:

Wegen <math>F_{2;8;0,95} = 4{,}459\,</math> (Signifikanzniveau <math>\alpha = 0{,}05\,</math>) gilt <math>T \ge F_{2; 8; 0,95}</math>. Somit kann die Nullhypothese <math>H_0\,</math> verworfen werden. Das heißt, die beiden Regressionsgeraden auf den Teilintervallen sind nicht identisch. Es liegt also ein Strukturbruch vor und die Teilregressionen liefern eine bessere Modellierung als die Regression über den gesamten Datensatz.

Literatur

Howard E. Doran: Applied Regression Analysis in Econometrics. CRC Press 1989, ISBN 0-8247-8049-3, S. 146 ({{#if: JHzik5hkrIMC

| {{#if: {{#if: ||1}} {{#if: JHzik5hkrIMC ||1}} | <0|&pg={{#if:|RA{{{Band}}}-}}PA146|&pg=146}}{{#if:|&q=}}#v=onepage|{{#if:|&pg=|}}{{#if:|&q=}}}}{{#if:|q=%7B%7B%7BSuchbegriff%7D%7D%7D}}|{{#if:|q=%7B%7B%7BSuchbegriff%7D%7D%7D}}}} {{#if:Auszug|{{#invoke:WLink|getEscapedTitle|Auszug}}|eingeschränkte Vorschau}}{{#if:|| in der Google-Buchsuche}}{{#ifeq:|US|-USA}}{{#if: JHzik5hkrIMC |{{#invoke: Vorlage:GoogleBook|fine |id=JHzik5hkrIMC |errN=Parameter „BuchID“ hat falsche Länge |errC=Parameter „BuchID“ enthält ungültige Zeichen |errH=# in der „BuchID“ |errP=Parameterzuweisungen in der „BuchID“ |class=editoronly |cat={{#ifeq: 0 | 0 | Wikipedia:Vorlagenfehler/Vorlage:Google Buch}} |template= Vorlage:Google Buch}} }} | Es darf nur genau einer der beiden Parameter „Suchbegriff“ oder „BuchID“ ausgefüllt werden. Bitte beachte die in der Vorlage:Google Buch befindliche Dokumentation und prüfe die verwendeten Parameter.{{#ifeq: 0 | 0 | }}}} | Es muss mindestens einer der beiden Parameter „Suchbegriff“ oder „BuchID“ ausgefüllt werden. Bitte beachte die in der Vorlage:Google Buch befindliche Dokumentation und prüfe die verwendeten Parameter.{{#ifeq: 0 | 0 | }}}}{{#invoke:TemplatePar|check |all= |opt= Suchbegriff= BuchID= Seite= Band= SeitenID= Hervorhebung= Linktext= Land= KeinText= |cat= {{#ifeq: 0 | 0 | Wikipedia:Vorlagenfehler/Vorlage:Google Buch}} |template= Vorlage:Google Buch |format= @@@ }}{{#if:Auszug|{{#if:{{#invoke:WLink|isBracketedLink|Auszug}}| Linktext ungültig}}}})

Christopher Dougherty: Introduction to Econometrics. Oxford University Press 2007, ISBN 0-19-928096-7, S. 194 ({{#if: h0MTRO_3jYEC

| {{#if: {{#if: ||1}} {{#if: h0MTRO_3jYEC ||1}} | <0|&pg={{#if:|RA{{{Band}}}-}}PA194|&pg=194}}{{#if:|&q=}}#v=onepage|{{#if:|&pg=|}}{{#if:|&q=}}}}{{#if:|q=%7B%7B%7BSuchbegriff%7D%7D%7D}}|{{#if:|q=%7B%7B%7BSuchbegriff%7D%7D%7D}}}} {{#if:Auszug|{{#invoke:WLink|getEscapedTitle|Auszug}}|eingeschränkte Vorschau}}{{#if:|| in der Google-Buchsuche}}{{#ifeq:|US|-USA}}{{#if: h0MTRO_3jYEC |{{#invoke: Vorlage:GoogleBook|fine |id=h0MTRO_3jYEC |errN=Parameter „BuchID“ hat falsche Länge |errC=Parameter „BuchID“ enthält ungültige Zeichen |errH=# in der „BuchID“ |errP=Parameterzuweisungen in der „BuchID“ |class=editoronly |cat={{#ifeq: 0 | 0 | Wikipedia:Vorlagenfehler/Vorlage:Google Buch}} |template= Vorlage:Google Buch}} }} | Es darf nur genau einer der beiden Parameter „Suchbegriff“ oder „BuchID“ ausgefüllt werden. Bitte beachte die in der Vorlage:Google Buch befindliche Dokumentation und prüfe die verwendeten Parameter.{{#ifeq: 0 | 0 | }}}} | Es muss mindestens einer der beiden Parameter „Suchbegriff“ oder „BuchID“ ausgefüllt werden. Bitte beachte die in der Vorlage:Google Buch befindliche Dokumentation und prüfe die verwendeten Parameter.{{#ifeq: 0 | 0 | }}}}{{#invoke:TemplatePar|check |all= |opt= Suchbegriff= BuchID= Seite= Band= SeitenID= Hervorhebung= Linktext= Land= KeinText= |cat= {{#ifeq: 0 | 0 | Wikipedia:Vorlagenfehler/Vorlage:Google Buch}} |template= Vorlage:Google Buch |format= @@@ }}{{#if:Auszug|{{#if:{{#invoke:WLink|isBracketedLink|Auszug}}| Linktext ungültig}}}})

Gregory C. Chow: Tests of Equality Between Sets of Coefficients in Two Linear Regressions. Econometrica. 28(3), 1960, S. 591–605 ({{#invoke:JSTOR|f|1=1910133}}{{#if:

 | {{#ifeq: 0 | 0
     |  }}

}})

Weblinks

[{{canonicalurl:Commons:Category:{{#if:Chow test|Chow test|Chow-Test}}|uselang=de}} Commons: {{#if:|{{{2}}}|{{#if:Chow test|Chow test|{{#invoke:WLink|getArticleBase}}}}}}]{{#switch:1

|X|x= |0|-= |S|s= – Sammlung von Bildern |1|= – Sammlung von Bildern{{#if:

    | {{#switch: {{#invoke:TemplUtl|faculty|1}}/{{#invoke:TemplUtl|faculty|1}}
        |1/=  und Videos
        |1/1=, Videos und Audiodateien
        |/1=  und Audiodateien}}
    | , Videos und Audiodateien
  }}

|#default= – }}{{#if: Chow test

   | {{#ifeq: {{#invoke:Str|left|chow test|9}} 
       | category:

| FEHLER: Ohne Category: angeben!}}}}

Vorlage:Wikidata-Registrierung