Chi-Quadrat-Verteilung

Die Chi-Quadrat-Verteilung bzw. <math>\chi^2</math>-Verteilung (ältere Bezeichnung: Helmert-Pearson-Verteilung, nach Friedrich Robert Helmert und Karl Pearson) ist eine stetige Wahrscheinlichkeitsverteilung über der Menge der nichtnegativen reellen Zahlen. Üblicherweise ist mit „Chi-Quadrat-Verteilung“ die zentrale Chi-Quadrat-Verteilung gemeint. Die Chi-Quadrat-Verteilung hat einen einzigen Parameter, nämlich die Anzahl der Freiheitsgrade <math>n</math>.

Datei:Chi-square pdf.svg

Dichten der Chi-Quadrat-Verteilung mit unterschiedlicher Anzahl an Freiheitsgraden k

Sie ist eine der Verteilungen, die aus der Normalverteilung <math>\mathcal N\left(\mu, \sigma^2\right)</math> abgeleitet werden können: Sind <math>Z_1, ..., Z_n</math> unabhängige und standardnormalverteilte Zufallsvariablen, so ist die Chi-Quadrat-Verteilung mit <math>n</math> Freiheitsgraden definiert als die Verteilung der Summe <math> Z_1^2 +\dotsb+ Z_n^2</math> der quadrierten Zufallsvariablen. Solche Summen quadrierter Zufallsvariablen treten bei Schätzfunktionen wie der Stichprobenvarianz zur Schätzung der empirischen Varianz auf. Die Chi-Quadrat-Verteilung ermöglicht damit unter anderem ein Urteil über die Kompatibilität eines vermuteten funktionalen Zusammenhangs (Abhängigkeit von der Zeit, Temperatur, Druck etc.) mit empirisch ermittelten Messpunkten: Unter einer Auswahl von verschiedenen Modellen bietet dasjenige mit der besten Anpassungsgüte, dem kleinsten Chi-Quadrat-Wert, die beste Erklärung der Daten.<ref>R. Barlow: Statistics Wiley, 1989, S. 152 (Goodness of Fit).</ref><ref>Kendall, Stuart: The Advanced Theory Of Statistics Vol. 2 Third Edition, London, 1973, S. 436 (Goodness of Fit).</ref> So stellt die Chi-Quadrat-Verteilung durch die Quantifizierung der zufälligen Schwankungen die Auswahl verschiedener Erklärungsmodelle auf eine numerische Basis. Außerdem erlaubt sie, wenn man die empirische Varianz bestimmt hat, die Schätzung des Vertrauensintervalls, das den (unbekannten) Wert der Varianz der Grundgesamtheit mit einer gewissen Wahrscheinlichkeit einschließt. Diese und weitere Anwendungen sind weiter unten und im Artikel Chi-Quadrat-Test beschrieben.

Die Chi-Quadrat-Verteilung wurde 1876 eingeführt von Friedrich Robert Helmert, die Bezeichnung stammt von Karl Pearson (1900).<ref>F. R. Helmert. In: Zeitschrift fuer Math. und Physik 21, 1876, S. 192–219. Karl Pearson: On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably Be Supposed to have Arisen from Random Sampling. In: Philosophical Magazine 5, Band 50, 1900, S. 157–175. Zitiert nach L. Schmetterer: Mathematische Statistik. Springer, Wien 1966, S. 93</ref>

Definition

Datei:Chi-Squared-pdf and cdf.png

Dichte und Verteilung von mehreren Chi-Quadrat-verteilten Zufallsgrößen

Sind <math>Z_1,\dotsc, Z_n</math>stochastisch unabhängige und standardnormalverteilte Zufallsvariablen, so heißt die Verteilung der Zufallsvariablen <math>X</math> mit

<math>X= Z_1^2 + \cdots + Z_n^2</math>

Chi-Quadrat-Verteilung mit <math>n</math> Freiheitsgraden.<ref name=":0">{{#invoke:Vorlage:Literatur|f}}</ref> Hierfür schreibt man symbolisch

und sagt, dass sie <math>\chi_n^2</math>-verteilt ist.

Hinweis: In der Statistik werden oftmals Stichprobenfunktionen, die unter gewissen Bedingungen chi-Quadrat-verteilt sind, mit <math>\chi^2</math> bezeichnet.

Eigenschaften

Dichtefunktion

Die Summe quadrierter Größen kann keine negativen Werte annehmen. Deshalb hat die Dichte <math>f_n</math> der <math>\chi_n^2</math>-Verteilung für <math>x< 0</math> den Wert null. Für <math>x>0</math> lässt sie sich darstellen als

<math>f_n(x) = \frac{1}{2^{\frac{n}{2}}\Gamma(\tfrac{n}{2})} x^{\frac{n}{2}-1}\exp\left(-\frac x2\right).</math><ref name=":0" />

Dabei steht <math>\Gamma</math> für die Gammafunktion. Die Werte von <math>\Gamma(\tfrac{n}{2})</math> kann man rekursiv aus

<math>\Gamma(\tfrac{1}{2}) = \sqrt\pi \; , \quad \Gamma(1) = 1 \; ,</math>

<math>\Gamma(x+1) = x \cdot \Gamma(x) \quad \text{mit}\quad x \in \mathbb{R}^+ </math>

berechnen.

Spezialfall: Für die Dichte <math>f_2</math> der <math>\chi^2</math>-Verteilung mit <math>n=2</math> Freiheitsgraden gilt für <math>x>0</math>

<math>f_2(x) = \frac{1}{2}\exp\left(-\frac x2\right).</math>

Verteilungsfunktion

Die Verteilungsfunktion kann man mit Hilfe der regularisierten unvollständigen Gammafunktion <math>P(a,x)</math> ausdrücken:

<math>F_n(x)= P(\tfrac n2,\tfrac x2).</math>

Wenn <math>n</math> eine natürliche Zahl ist, dann kann die Verteilungsfunktion wie folgt dargestellt werden:

<math>

P\left(\tfrac n2,\tfrac x2\right)=\begin{cases} 1-e^{ -\frac x2}\sum\limits_{k=0}^{n/2-1} \frac 1{\Gamma(k+1)} (\tfrac x2)^k & \text{ falls } n \text{ gerade},\\ \operatorname{erf}\left(\sqrt{\tfrac x2}\right) - e^{ -\frac x2}\sum\limits_{k=0}^{\lfloor n/2\rfloor -1}\frac 1{\Gamma(k+\tfrac 32)} (\tfrac x2)^{k+\tfrac 12} & \text{ falls } n \text{ ungerade}, \end{cases} </math>

wobei <math>\operatorname{erf}</math> die Fehlerfunktion bezeichnet.

Spezialfall: Für die Verteilungsfunktion <math>F_2</math> der <math>\chi^2</math>-Verteilung mit <math>n=2</math> Freiheitsgraden gilt für <math>x>0</math>

<math>F_2(x) = 1-\exp\left(-\frac x2\right).</math>

Reproduktivität

Ist <math>X</math> die Summe der Quadrate von <math>m</math> unabhängigen standardnormalverteilten Zufallsvariablen und <math>Y</math> die Summe der Quadrate von <math>n</math> unabhängigen standardnormalverteilten Zufallsvariablen, so gilt

<math>X \sim \chi^2_m</math> und <math>Y \sim \chi^2_n</math>.

Die Summe <math>X+Y</math> ist dann aber die Summe der Quadrate von <math>m+n</math> unabhängigen standardnormalverteilten Zufallsvariablen, also gilt

<math>X+Y \sim \chi^2_{m+n}</math>.

Die Chi-Quadrat-Verteilung ist also reproduktiv.

Erwartungswert

Der Erwartungswert einer chi-quadrat-verteilten Zufallsvariable mit <math>n</math> Freiheitsgraden ist

<math> \operatorname{E}\left(\chi^2_n\right) = n</math>.

Varianz

Die Varianz einer chi-quadrat-verteilten Zufallsvariable mit <math>n</math> Freiheitsgraden beträgt

<math>\operatorname{Var}(\chi^2_n) = 2n</math>.

Modus

Eine Chi-Quadrat-Verteilung mit <math>n\geq 3</math> Freiheitsgraden hat den Modus <math>n-2</math>. Die Dichte der Chi-Quadrat-Verteilungen mit einem und zwei Freiheitsgraden nimmt das Supremum auf dem offenen Intervall <math>(0,\infty) </math> nicht an, die Dichten sind in diesen beiden Fällen aber monoton fallend. Man findet daher auch teils die Bezeichnung Modus 0 für die Chi-Quadrat-Verteilungen mit einem und zwei Freiheitsgraden.

Schiefe

Die Schiefe <math>\gamma_m</math> der Chi-Quadrat-Verteilung mit <math>n</math> Freiheitsgraden ist

<math>\gamma_m(\chi^2_n) = \frac{2 \sqrt{2}}{\sqrt{n}}</math>.

Die Chi-Quadrat-Verteilung besitzt eine positive Schiefe, d. h., sie ist linkssteil- bzw. rechtsschief. Je höher die Anzahl der Freiheitsgrade <math>n</math>, desto weniger schief ist die Verteilung.

Kurtosis

Die Kurtosis (Wölbung) <math>\beta_2</math> der Chi-Quadrat-Verteilung mit <math>n</math> Freiheitsgraden ist gegeben durch

<math>\beta_2=3 + \frac{12}{n}</math>.

Der Exzess <math>\gamma_2</math> gegenüber der Normalverteilung ergibt sich damit zu <math>\gamma_2 = \tfrac{12}{n}</math>.<ref>Wolfram Mathworld</ref> Daher gilt: Je höher die Anzahl der Freiheitsgrade <math>n</math>, desto geringer der Exzess.

Momenterzeugende Funktion

Die momenterzeugende Funktion für <math>X \sim \chi_n^2</math> hat die Form<ref>A. C. Davison: Statistical Models, Cambridge University Press 2008, ISBN 1-4672-0331-9, Kapitel 3.2</ref>

<math>M_X(t) = \frac{1}{(1-2 t)^{n/2}}</math>.

Charakteristische Funktion

Die charakteristische Funktion für <math>X \sim \chi_n^2</math> ergibt sich aus der momenterzeugenden Funktion als:

<math>\varphi_X(s) = \frac{1}{(1-2 i s)^{n/2}}</math>.

Entropie

Die Entropie der Chi-Quadrat-Verteilung (ausgedrückt in nats) beträgt

<math>H(X)=\ln\left(2\Gamma\left(\frac{n}{2}\right)\right) + \left(1-\frac{n}{2}\right)\psi\left(\frac{n}{2}\right)+\frac{n}{2},</math>

wobei <math>\psi</math> die Digamma-Funktion bezeichnet.

Nichtzentrale Chi-Quadrat-Verteilung

Wenn die normalverteilten Zufallsvariablen nicht bezüglich ihres Erwartungswertes <math>\mu_i (i = 1, \ldots , n)</math> zentriert sind (d. h., wenn nicht alle <math>\mu_i = 0</math> sind), erhält man die nichtzentrale Chi-Quadrat-Verteilung. Sie hat als zweiten Parameter neben <math>n</math> den Nichtzentralitätsparameter <math>\lambda > 0</math>.

Seien <math>Z_i \sim \mathcal{N}(\mu_i,1),\,i=1,2,\ldots, n</math>, so ist

<math>\sum_{i=1}^n {Z_i}^2\sim \chi^2(n,\lambda)</math> mit <math>\lambda=\sum_{i=1}^n {\mu_i}^2</math>.

Insbesondere folgt aus <math>\,X\sim\chi^2(n-1)</math> und <math>Z\sim\mathcal{N}(\sqrt{\lambda},1)</math>, dass <math>\,X+Z^2\sim\chi^2(n,\lambda)</math> ist.

Eine zweite Möglichkeit, eine nichtzentrale Chi-Quadrat-Verteilung zu erzeugen, ist als Mischverteilung der zentralen Chi-Quadrat-Verteilung. Dabei ist

<math>\chi^2(n+2\,j)=\chi^2(n,\lambda)</math>,

wenn <math>j\sim\mathcal{P}\left(\tfrac{\lambda}{2}\right)</math> aus einer Poisson-Verteilung gezogen wird.

Dichtefunktion

Die Dichtefunktion <math>f(x)</math> der nichtzentralen Chi-Quadrat-Verteilung hat für <math>x<0</math> den Wert null und für <math>x \geq 0</math> ist

<math>f(x)=\frac{\exp\left(-\frac{1}{2}(x+\lambda)\right)}{2^\frac{n}{2}}\sum_{j=0}^\infty \frac{x^{\frac{n}{2}+j-1}\lambda^j}{2^{2j}\,\Gamma\left(\frac{n}{2}+j\right)\,j!}</math>.

Die Summe über j führt auf eine modifizierte Bessel-Funktion erster Gattung <math>I_q(x)</math> . Damit erhält die Dichtefunktion folgende Form:

<math>f(x)=\frac{\exp\left(-\frac{1}{2}(x+\lambda)\right)x^{\frac{1}{2}(n-1) }\sqrt{\lambda}}{2(\lambda x)^\frac{n}{4}} I_{\frac{n}{2}-1}\left(\sqrt{\lambda x}\right) </math> für <math>x\ge 0</math>.

Der Erwartungswert <math>n + \lambda</math> und die Varianz <math>2 n + 4 \lambda </math> der nichtzentralen Chi-Quadrat-Verteilung gehen ebenso wie die Dichte für <math>\lambda \to 0</math> in die entsprechenden Ausdrücke der zentralen Chi-Quadrat-Verteilung über.

Verteilungsfunktion

Die Verteilungsfunktion der nichtzentralen Chi-Quadrat-Verteilung kann mit Hilfe der Marcum-Q-Funktion <math>Q_M (a,b)</math> ausgedrückt werden:<ref>Albert H. Nuttall: Some Integrals Involving the Q_M Function. In: IEEE Transactions on Information Theory. Nr. 21, 1975, S. 95–96, {{#invoke:Vorlage:Handle|f|scheme=doi|class=plainlinks|parProblem=Problem|errCat=Wikipedia:Vorlagenfehler/Parameter:DOI|errClasses=error editoronly|errHide=1|errNS=0 4 10 100}}.</ref>

<math>F (x) = 1 - Q_{\frac{n}{2}} \left( \sqrt{\lambda}, \sqrt{x} \right)</math>

Beispiel

Gegeben sind <math>n</math> Messungen einer Größe <math>x</math>, die aus einer normalverteilten Grundgesamtheit stammen. Sei <math>\overline{x}</math> der empirische Mittelwert der <math>n</math> gemessenen Werte und

<math>s^2=\frac{1}{n-1}\sum_{k=1}^n(x_k-\overline{x})^2</math>

die korrigierte Stichprobenvarianz.

Dann lässt sich z. B. das Konfidenzintervall für die Varianz der Grundgesamtheit <math>\sigma^2</math> angeben:

<math>\tfrac{n-1}{\chi_b^2}\,s^2\leq\sigma^2\leq\tfrac{n-1}{\chi_a^2}\,s^2</math>

Die Grenzen ergeben sich daraus, dass <math>\tfrac{(n-1)s^2}{\sigma^2}</math> wie <math>\chi_{n-1}^2</math> verteilt ist.

Konkretes Beispiel: Stichprobe mit <math>n = 100</math> Werten, Varianz <math>s^2 = 1{,}0</math> , 95-%-Konfidenzintervall:

95 % der Werte sollen sich innerhalb des Intervalls befinden. Es wird also davon ausgegangen, dass je 2,5 % der Werte die obere bzw. untere Intervallgrenze überschreiten dürfen. In diesem Fall wird daher <math>\chi_b^2</math> durch <math>F_{n-1}(\chi_b^2) = 0{,}975</math> und <math>\chi_a^2</math> durch <math>F_{n-1}(\chi_a^2)= 0{,}025</math> bestimmt.

Bei der Berechnung der Grenzen des Konfidenzintervalls in Programmen wird üblicherweise die Inverse Funktion verwendet (Kehrwert der kumulierten Chi-Quadrat-Verteilung): z. B. in Excel oder Numbers die Funktion CHIINV(p,n-1) :

Die untere Intervallgrenze ergibt sich mit <math>s^2 = 1{,}0</math> aus:

= 99 * s^2 / CHIINV(0,025; 99) = 0.7709

Die obere Intervallgrenze ergibt sich aus:

= 99 * s^2 / CHIINV(0,975; 99) = 1,3495

Herleitung der Verteilung der Stichprobenvarianz

Sei <math>x_{1},\dots, x_{n }</math> eine Stichprobe von <math>n</math> Messwerten, gezogen aus einer normalverteilten Zufallsvariablen <math>X</math> mit empirischen Mittelwert <math>\overline{x}=\tfrac{1}{n}\sum_{i=1}^n x_i</math> und Stichprobenvarianz <math>s^2=\tfrac{1}{n-1}\sum_{i=1}^n(x_i-\overline{x})^2</math> als Schätzfunktionen für Erwartungswert <math>\mu</math> und Varianz <math>\sigma^2</math> der Grundgesamtheit.

Dann lässt sich zeigen, dass <math>\tfrac{(n-1)s^2}{\sigma^2}=\sum_{i=1}^n \tfrac{(x_i-\overline{x})^2}{\sigma^2}</math> verteilt ist wie <math>\chi_{n-1}^2</math>.

Dazu werden nach Helmert<ref>Helmert. In: Astronomische Nachrichten, 88, 1876, S. 113–132</ref> die <math>(x_i)</math> mittels einer orthonormalen Linearkombination in neue Variablen <math>(y_j)</math> transformiert. Die Transformation lautet:

<math>y_{1}=\tfrac{1}{\sqrt{2}}x_{1}-\tfrac{1}{\sqrt{2}}x_{2}</math>

<math>y_{2}=\tfrac{1}{\sqrt{6}}x_{1}+\tfrac{1}{\sqrt{6}}x_{2}-\tfrac{2}{\sqrt{6}}x_{3}</math>

<math>\vdots</math>

<math>y_{n-1}=\tfrac{1}{\sqrt{n(n-1)}}x_{1}+\tfrac{1}{\sqrt{n(n-1)}}x_{2}+\dotsb +\tfrac{1}{\sqrt{n(n-1)}}x_{n-1}-\tfrac{n-1}{\sqrt{n(n-1)}}x_{n}</math>

<math>y_{n}=\tfrac{1}{\sqrt{n}}x_{1}+\tfrac{1}{\sqrt{n}}x_{2}+\dotsb +\tfrac{1}{\sqrt{n}}x_{n-1}+\tfrac{1}{\sqrt{n}}x_{n}=\sqrt{n}\,\overline{x}.</math>

Die neuen unabhängigen Variablen <math>y_i</math> sind wie <math>X</math> normalverteilt mit gleicher Varianz <math>\sigma_{y_i}^2=\sigma_{x_i}^2=\sigma^2, (i=1,\dots, n)</math>, aber mit Erwartungswert <math>\mathrm{E}(y_i) = 0, (i=1,\dots, n-1),</math> beides aufgrund der Faltungsinvarianz der Normalverteilung.

Außerdem gilt für die Koeffizienten <math>a_{i j}</math> in <math>y_{i}=\sum_{j=1}^n a_{i j}x_{j}</math> (falls <math>j>i+1</math>, ist <math>a_{i j}=0</math>) wegen der Orthonormalität <math>\sum_{i=1}^n a_{i j}a_{i k}=\delta_{j k}</math> (Kronecker-Delta) und damit

<math>\sum_{i=1}^n y_{i}^2=\sum_{i=1}^n\sum_{j=1}^na_{i j}x_{j}\sum_{k=1}^na_{i k}x_{k}=\sum_{j=1}^n\sum_{k=1}^n\delta_{j k}x_{j}x_{k}=\sum_{j=1}^n x_{j}^2.</math>

Deshalb ergibt sich nun für die Summe der Abweichungsquadrate

<math>(n-1) s^2=\sum_{i=1}^n (x_i-\overline{x})^2=\sum_{i=1}^n x_{i}^2-n\overline{x}^2=\sum_{i=1}^n y_{i}^2-y_{n}^2=\sum_{i=1}^{n-1} y_{i}^2</math>

und schlussendlich nach Division durch <math>\sigma^2</math>

<math>(n-1)\frac{s^2}{\sigma^2}=\sum_{i=1}^{n-1} \frac{y_i^2}{\sigma^2}.</math>

Der Ausdruck auf der linken Seite ist offenbar verteilt wie eine Summe von quadrierten standardnormalverteilten unabhängigen Variablen mit <math>n-1</math> Summanden, wie für <math>\chi_{n-1}^2</math> gefordert.

Demnach ist also die Summe Chi-Quadrat-verteilt mit <math>n-1</math> Freiheitsgraden <math>\sum_{i=1}^n \left( \tfrac{x_i-\overline{x}}{\sigma} \right)^2 \sim \chi_{n-1}^2</math>, während laut Definition der Chi-Quadrat-Summe <math>\sum_{i=1}^n \left( \tfrac{x_i-\mu}{\sigma} \right)^2 \sim \chi_{n}^2</math>. Ein Freiheitsgrad wird hier „verbraucht“, denn aufgrund der Schwerpunkteigenschaft des empirischen Mittels <math>\sum\nolimits_{i=1}^n \left(x_i - \bar{x}\right)=0</math> ist die letzte Abweichung <math>\left(x_n-\overline x\right)</math> bereits durch die ersten <math>(n-1)</math> bestimmt. Folglich variieren nur <math>(n-1)</math> Abweichungen frei und man mittelt die empirische Varianz deshalb, indem man durch die Anzahl der Freiheitsgrade <math>(n-1)</math> dividiert.

Beziehung zu anderen Verteilungen

Beziehung zur Gammaverteilung

Die Chi-Quadrat-Verteilung ist ein Spezialfall der Gammaverteilung. Ist <math>X\sim \chi^2_n</math>, so gilt

<math>X \sim \mathcal{G}(\tfrac{n}{2},\tfrac{1}{2}).</math>

Beziehung zur Normalverteilung

Datei:Quantile graph.svg

Quantile einer Normalverteilung und einer Chi-Quadrat-Verteilung

Seien <math>Z_1 , \dotsc , Z_n</math> unabhängige und standardnormalverteilte Zufallsvariablen, dann ist deren Quadratsumme <math>Q</math> chi-Quadrat-verteilt mit <math>n</math> Freiheitsgraden:

<math>Q = Z_1^2 + \dotsb + Z_n^2 \;\sim \;\chi^2(n)</math>.

Für <math>n \geq 30</math> ist <math>Y = \sqrt{2X} - \sqrt{2n-1}</math> näherungsweise standardnormalverteilt.

Für <math> n>100 </math> ist die Zufallsvariable <math>X_n</math> näherungsweise normalverteilt, mit Erwartungswert <math>n</math> und Standardabweichung <math>\sqrt{2n}</math> bzw. bei einer nichtzentralen Chi-Quadrat-Verteilung mit Erwartungswert <math>n+\lambda</math> und Standardabweichung <math>\sqrt{2n + 4 \lambda}</math>.

Beziehung zur Exponentialverteilung

Eine Chi-Quadrat-Verteilung mit 2 Freiheitsgraden ist eine Exponentialverteilung <math>\operatorname{Exp}(\lambda)</math> mit dem Parameter <math>\, \lambda=1/2</math>.

Beziehung zur Erlang-Verteilung

Eine Chi-Quadrat-Verteilung mit <math>2n</math> Freiheitsgraden ist identisch mit einer Erlang-Verteilung <math>\operatorname{Erl}(\lambda,n)</math> mit <math>n</math> Freiheitsgraden und <math>\, \lambda=1/2</math>.

Beziehung zur F-Verteilung

Seien <math>X_1</math> und <math>X_2</math> unabhängige Chi-Quadrat-verteilte Zufallsvariablen mit <math>r_1</math> bzw. <math>r_2</math> Freiheitsgraden, dann ist der Quotient

F-verteilt mit <math>r_1</math> Zählerfreiheitsgraden und <math>r_2 </math> Nennerfreiheitsgraden.<ref>George G. Judge, R. Carter Hill, W. Griffiths, Helmut Lütkepohl, T. C. Lee. Introduction to the Theory and Practice of Econometrics. 2. Auflage. John Wiley & Sons, New York / Chichester / Brisbane / Toronto / Singapore 1988, ISBN 0-471-62414-4, S. 51.</ref>

Beziehung zur Poisson-Verteilung

Die Verteilungsfunktionen der Poisson-Verteilung und der Chi-Quadrat-Verteilung hängen auf folgende Weise zusammen:

Die Wahrscheinlichkeit, <math>n</math> oder mehr Ereignisse in einem Intervall zu finden, innerhalb dessen man im Mittel <math>\lambda</math> Ereignisse erwartet, gleicht der Wahrscheinlichkeit, dass der Wert von <math>\chi_{2n}^2\leq 2\lambda</math> ist. Es gilt nämlich

<math>1 - Q(n, \lambda ) = P(n, \lambda )</math>,

mit <math>P</math> und <math>Q</math> als regularisierte Gammafunktionen.

Beziehung zur stetigen Gleichverteilung

Ist <math>U</math> gleichverteilt auf dem Intervall <math>[0,1]</math>, dann gilt <math>X=-2\ln(U)\sim\chi^2(2)</math>, denn

<math>P(X\leq x) = P(U\geq \operatorname{exp}(-x/2)) = 1-\operatorname{exp}(-x/2) = F_2(x), \qquad x>0.</math>

Sind <math>U_1,\ldots,U_m</math> unabhängig und identisch verteilte Zufallsvariablen mit <math>U_k \sim \mathcal{U}(0,1)</math>, dann gilt somit

Herleitung der Dichtefunktion

Die Dichte der Zufallsvariable <math>X=Z_1^2+\dotsb + Z_n^2</math>, mit <math>Z_1,\dots ,Z_n</math> unabhängig und standardnormalverteilt, ergibt sich aus der gemeinsamen Dichte der Zufallsvariablen <math>Z_1,\dots ,Z_n</math>. Diese gemeinsame Dichte ist das <math>n</math>-fache Produkt der Standardnormalverteilungsdichte:

<math>f_{Z_1,\dots ,Z_n}(z_1,\dots ,z_n)=\prod_{i=1}^n \frac{e^{-\frac12 z_i^2}}{\sqrt{2\pi}}=(2\pi)^{-\frac n2} e^{-\frac 12 (z_1^2+ \dotsb +z_n^2)}.</math>

Für die gesuchte Dichte gilt:

<math>

\begin{align} f_{n}(x) & =\lim_{h\to 0} \frac 1h P(x< X \le x+h) \\ & =\lim_{h\to 0} \frac 1h \int\limits_K (2\pi)^{-\frac n2} e^{-\frac 12 (z_1^2+ \dotsb +z_n^2)}\,dz_1 \ldots dz_n \\ & =(2\pi)^{-\tfrac n2} e^{-\frac x2} \lim_{h\to 0} \frac 1h \int\limits_K dz_1\ldots dz_n \\ \end{align} </math> mit <math>K=\{x\leq z_1^2+ \dotsb +z_n^2\leq x+h\}.</math>

Im Grenzwert ist die Summe im Argument der Exponentialfunktion gleich <math>x</math>. Man kann zeigen, dass man den Integranden als <math>(2\pi)^{-\tfrac n2} e^{-\frac x2}</math> vor das Integral und den Limes ziehen kann.

Das verbleibende Integral

<math>\int\limits_K dz_1\ldots dz_n = V_n(\sqrt{x+h})-V_n(\sqrt x)</math>

entspricht dem Volumen der Schale zwischen der Kugel mit Radius <math>\sqrt{x+h}</math> und der Kugel mit Radius <math>\sqrt x</math> ,

wobei <math>V_n(R)= \frac{\pi^{\frac n2}R^n}{\Gamma(\frac n2+1)}</math> das Volumen der n-dimensionalen Kugel mit Radius R angibt.

Es folgt: <math> \lim_{h\to 0} \frac 1h \int\limits_K dz_1\ldots dz_n = \frac{d \,V_n(\sqrt{x})}{d \,x} =\frac{\pi^{\tfrac n2}x^{\tfrac n2-1}}{\Gamma(\tfrac n2)} </math>

und nach Einsetzen in den Ausdruck für die gesuchte Dichte: <math>f_n(x) = \frac{1}{2^{\frac{n}{2}}\Gamma(\tfrac{n}{2})} x^{\frac{n}{2}-1}\exp\left(-\frac x2\right) \quad, x > 0</math>.

Quantilfunktion

Die Quantilfunktion <math>x_p</math> der Chi-Quadrat-Verteilung ist die Lösung der Gleichung <math display="inline">p=P\left(\frac n2 , \frac {x_p}2\right)</math> und damit prinzipiell über die Umkehrfunktion zu berechnen. Konkret gilt hier

<math>x_p=2 P^{-1}\left(\frac n2 ,p\right),</math>

mit <math>P^{-1}</math> als Inverse der regularisierten unvollständigen Gammafunktion. Dieser Wert <math>x_p</math> ist in der Quantiltabelle unter den Koordinaten <math>p</math> und <math>n</math> eingetragen.

Quantilfunktion für kleinen Stichprobenumfang

Für wenige Werte <math>n</math> (1, 2, 4) kann man die Quantilfunktion auch alternativ angeben:

<math> n=1: x_p=2 (\operatorname{Erf}^{-1}(p))^2 ,</math>

wobei <math> \operatorname{Erf}</math> die Fehlerfunktion, <math>W_{-1}(x)\, </math> den unteren Zweig der Lambertschen W-Funktion bezeichnet und <math>e</math> die Eulersche Zahl.

Näherung der Quantilfunktion für feste Wahrscheinlichkeiten

Für bestimmte feste Wahrscheinlichkeiten <math> p</math> lassen sich die zugehörigen Quantile <math>x_p</math> durch die einfache Funktion des Stichprobenumfangs <math> n</math>

<math>x_p\approx n+a\sqrt{n+\sgn(a)\sqrt{n}}+b+c/n</math>

mit den Parametern <math>a, b, c</math> aus der Tabelle annähern, wobei <math>\sgn(a)</math> die Signum-Funktion bezeichnet, die einfach das Vorzeichen ihres Arguments darstellt:

<math>p</math>	0,005	0,01	0,025	0,05	0,1	0,5	0,9	0,95	0,975	0,99	0,995
<math>a</math>	−3,643	−3,298	−2,787	−2,34	−1,83	0	1,82	2,34	2,78	3,29	3,63
<math>b</math>	1,8947	1,327	0,6	0,082	−0,348	−0,67	−0,58	−0,15	0,43	1,3	2
<math>c</math>	−2,14	−1,46	−0,69	−0,24	0	0,104	−0,34	−0,4	−0,4	−0,3	0

Der Vergleich mit einer <math>\chi^2</math>-Tabelle zeigt ab <math> n>3</math> einen relativen Fehler unter 0,4 %, ab <math>n>10</math> unter 0,1 %. Da die <math>\chi^2</math>-Verteilung für große <math>n</math> in eine Normalverteilung mit Standardabweichung <math>\sqrt{2 n}</math> übergeht, besitzt der Parameter <math>a</math> aus der Tabelle, der hier frei angepasst wurde, bei der entsprechenden Wahrscheinlichkeit <math>p</math> etwa die Größe des <math>\sqrt 2</math>-fachen des Quantils der Normalverteilung (<math>\sqrt{2}\,\operatorname{Erf}^{-1}(2p-1)</math>), wobei <math>\operatorname{Erf}^{-1}</math> die Umkehrfunktion der Fehlerfunktion bedeutet.

Das 95-%-Konfidenzintervall für die Varianz der Grundgesamtheit aus dem Abschnitt Beispiel kann z. B. mit den beiden Funktionen <math>x_p</math> aus den Zeilen mit <math>p=0{,}025 \to\chi_a^2</math> und <math>p=0{,}975 \to\chi_b^2</math> auf einfache Weise als Funktion von <math>n</math> grafisch dargestellt werden.

Der Median befindet sich in der Spalte der Tabelle mit <math> p=0{,}5</math>.

Literatur

{{#invoke:Vorlage:Literatur|f}}

Weblinks

[[b:{{#if:|{{{lang}}}:}}{{#if:Statistik: Tabelle der Chi-Quadrat-Verteilung|Statistik: Tabelle der Chi-Quadrat-Verteilung|Chi-Quadrat-Verteilung}}|Wikibooks: {{#if:Tabelle der χ²-Verteilung (Quantiltabelle)|Tabelle der χ²-Verteilung (Quantiltabelle)|{{#if:Statistik: Tabelle der Chi-Quadrat-Verteilung|Statistik: Tabelle der Chi-Quadrat-Verteilung|Chi-Quadrat-Verteilung}}}}]]{{#switch: 1

|1|= – Lern- und Lehrmaterialien |0|-= |X|x={{#switch: 0

      |0|4|10|12|14|100=}}

|#default= – {{{suffix}}}

}}{{#if: | ({{#invoke:Multilingual|format|{{{lang}}}|slang=!|shift=m}}) }}

{{#invoke:TemplatePar|check

  |opt= 1= 2= lang= suffix=
  |template=Vorlage:Wikibooks
  |cat=Wikipedia:Vorlagenfehler/Schwesterprojekt
  }}

Einzelnachweise

{{#if:Navigationsleiste DUWahrscheinlichkeitsverteilungen‎ |{{safesubst:#ifeq:0|10| {{#switch: Chi-Quadrat-Verteilung |Navigationsleiste|NaviBlock|0=|#default= Vorlage:Templatetransclusioncheck Vorlage:Dokumentation/ruler }}}}Vorlage:Klappleiste/Anfang {{#if:

|

Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann | Conway-Maxwell-Poisson | discrete-Phase-Type | erweitert negativ binomial | Gauss-Kuzmin | gemischt Poisson | geometrisch | logarithmisch | negativ binomial | parabolisch-fraktal | Poisson | Skellam | verallgemeinert Poisson | Yule-Simon | Zeta }} Vorlage:Klappleiste/Ende}}{{#if:Navigationsleiste KUWahrscheinlichkeitsverteilungen‎ |{{safesubst:#ifeq:0|10| {{#switch: Chi-Quadrat-Verteilung |Navigationsleiste|NaviBlock|0=|#default= Vorlage:Templatetransclusioncheck Vorlage:Dokumentation/ruler }}}}Vorlage:Klappleiste/Anfang {{#if:

|

Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy | Extremwert | exponential Power | Fishers z | Fisher-Tippett (Gumbel) | generalized hyperbolic | Hyperbolic-secant | Landau | Laplace | alpha-stabil | logistisch | normal (Gauß) | normal-invers Gauß’sch | Skew-normal | Studentsche t | Type-1-Gumbel | Variance-Gamma | Voigt }} Vorlage:Klappleiste/Ende}}{{#if:Navigationsleiste MUWahrscheinlichkeitsverteilungen‎ |{{safesubst:#ifeq:0|10| {{#switch: Chi-Quadrat-Verteilung |Navigationsleiste|NaviBlock|0=|#default= Vorlage:Templatetransclusioncheck Vorlage:Dokumentation/ruler }}}}Vorlage:Klappleiste/Anfang {{#if:

|

Multivariate Matrixverteilungen:
Gleichverteilung auf der Stiefel-Mannigfaltigkeit | Invers Wishart | Matrix Beta | Matrix Gamma | Matrix invers Beta | Matrix invers Gamma | Matrix Normal | Matrix Student-t | Matrix-Von-Mises-Fisher-Verteilung | Normal-invers-Wishart | Normal-Wishart | Wishart }}

Vorlage:Klappleiste/Ende}}{{#if:|{{{{{4}}}}}}}{{#if:|{{{{{5}}}}}}}{{#if:|{{{{{6}}}}}}}{{#if:|{{{{{7}}}}}}}{{#if:|{{{{{8}}}}}}}{{#if:|{{{{{9}}}}}}}{{#if:|{{{{{10}}}}}}}{{#if:|{{{{{11}}}}}}}{{#if:|{{{{{12}}}}}}}{{#if:|{{{{{13}}}}}}}{{#if:|{{{{{14}}}}}}}{{#if:|{{{{{15}}}}}}}{{#if:|{{{{{16}}}}}}}{{#if:|{{{{{17}}}}}}}{{#if:|{{{{{18}}}}}}}{{#if:|{{{{{19}}}}}}}{{#if:|{{{{{20}}}}}}}{{#if:|

Zu viele Navigationsleisten (>20)

}}