Multivariate Verteilung

Vorlage:Hinweisbaustein

Eine multivariate Verteilung ist in der Wahrscheinlichkeitsrechnung und in der Statistik die Verteilung eines Zufallsvektors – also einer Zufallsvariablen, deren Werte Vektoren im <math>\R^n</math> sind. Im zweidimensionalen Fall <math>n=2</math> spricht man auch von einer bivariaten Verteilung. Die multivariate Verteilung eines Zufallsvektors <math>X = (X_1, \dotsc, X_n)</math> ist somit ein Wahrscheinlichkeitsmaß auf <math>\R^n</math>, das messbaren Teilmengen <math>A \subseteq \R^n</math> die Wahrscheinlichkeit zuordnet, dass <math>X</math> einen Wert aus <math>A</math> annimmt. Eine multivariate Verteilung kann durch eine multivariate Verteilungsfunktion charakterisiert werden. Die Verteilungen der einzelnen Komponenten <math>X_i</math> eines Zufallsvektors werden die Randverteilungen von <math>X</math> genannt. Beispiele für multivariate Verteilungen sind die Multinomialverteilung oder die multivariate Normalverteilung, weitere finden sich in der Liste multivariater und matrixvariater Wahrscheinlichkeitsverteilungen.

Einführendes Beispiel

Wir betrachten zwei Zufallsexperimente:

Zweimaliges Würfeln mit einem idealen Würfel. Dies ist äquivalent zu einem Urnenexperiment mit sechs unterscheidbaren Kugeln, wobei zweimal mit Zurücklegen gezogen wird. Es gibt 36 mögliche Ergebnispaare (da wir die Reihenfolge des Würfelns bzw. der Ziehung berücksichtigen), und alle 36 Möglichkeiten sind gleich wahrscheinlich, haben also eine Wahrscheinlichkeit von 1/36.
Ein ähnliches Urnenexperiment, aber ohne Zurücklegen. In diesem Fall kommen die Ergebnisse (1,1), (2,2), …, (6,6) nicht vor, da die <math>i</math>-te Kugel beim zweiten Ziehen nicht vorkommen kann, wenn sie bereits bei der ersten Ziehung herausgenommen wurde. Die übrigen 30 Paare sind gleich wahrscheinlich und haben daher die Wahrscheinlichkeit 1/30.

Diese beiden Experimente ergeben nun zweidimensionale diskrete Zufallsvariablen <math>Z_1</math> und <math>Z_2</math>, welche die gleichen Randverteilungen haben (jede Zahl von 1 bis 6 ist bei beiden Experimenten in beiden Ziehungen gleich wahrscheinlich und tritt mit Wahrscheinlichkeit 1/6 auf).

Jedoch sind die beiden Ziehungen im ersten Experiment unabhängig, da die gezogene Kugel zurückgelegt wird, während sie im zweiten Experiment nicht unabhängig sind. Das wird am deutlichsten, wenn man sich klarmacht, dass die Paare (1,1), (2,2), …, (6,6) bei einem unabhängigen Experiment jeweils mit Wahrscheinlichkeit 1/36 vorkommen müssen (Produkt der Randwahrscheinlichkeiten 1/6), sie aber beim zweiten Experiment überhaupt nicht auftreten können (Wahrscheinlichkeit 0 haben), da die Kugel nicht zurückgelegt wird.

Die Verteilungen von <math>Z_1</math> und <math>Z_2</math> sind daher verschieden; es handelt sich also um ein Beispiel zweier unterschiedlicher diskreter multivariater Verteilungen mit gleichen Randverteilungen.

Skriptfehler: Ein solches Modul „Vorlage:Anker“ ist nicht vorhanden. Bivariate Verteilung

Datei:NormalWithClaytonDependence.png

10000 Stichproben einer mit der Clayton-Copula modellierten bivariaten Verteilung (mit <math>\alpha = 2{,}88</math>), bei der die Randverteilungen eindimensionale Standardnormalverteilungen sind

Die Realisationen eines bivariaten Zufallsvektors (einer zweidimensionalen Zufallsvariablen) <math>Z=(X,Y)</math> sind Vektoren in <math>\R^2 = \R \times \R</math>. Die bivariate Verteilung des Zufallsvektors <math>Z</math> liegt durch die Angabe der Wahrscheinlichkeiten

<math>P(Z \in B)\quad\text{für alle } B \in \mathcal{B}(\R^2)</math>

fest, wobei <math>\mathcal{B}(\R^2)</math> die Borelsche σ-Algebra auf <math>\R^2</math> bezeichnet. Durch <math>P_Z(B) := P(Z \in B)</math> für alle <math>B \in \mathcal{B}(\R^2)</math> ist ein Wahrscheinlichkeitsmaß <math>P_Z\colon \mathcal{B}(\R^2) \to [0,1]</math> definiert, das <math>(\R^2,\mathcal{B}(\R^2),P_Z)</math> zu einem Wahrscheinlichkeitsraum macht. <math>P_Z</math> ist die bivariate Wahrscheinlichkeitsverteilung oder kurz bivariate Verteilung von <math>Z</math>.

Bivariate Verteilungsfunktion

Die Verteilung des Zufallsvektors <math>Z</math> liegt bereits dann fest, wenn die Wahrscheinlichkeiten

<math>P(Z \in (-\infty,x] \times (-\infty,y]) \quad\text{für alle } x, y \in \R</math>

gegeben sind. Dies motiviert das Konzept der bivariaten Verteilungsfunktion des Zufallsvektors <math>Z</math>, die durch

definiert ist. Durch Angabe der Funktion <math>F_Z\colon \R^2 \to [0,1]</math> liegt die Wahrscheinlichkeitsverteilung von <math>Z</math> fest, da sich aus den durch die Verteilungsfunktion angegebenen Wahrscheinlichkeiten mit den Regeln der Wahrscheinlichkeitsrechnung die Wahrscheinlichkeiten aller anderen Ereignisse ergeben.

Bivariate Dichtefunktion

Falls der Zufallsvektor <math>Z</math> eine bivariate (oder zweidimensionale) Dichtefunktion <math>f_{X,Y}</math> besitzt, dann besteht zwischen der bivariaten Verteilungsfunktion und der bivariaten Dichtefunktion der Zusammenhang

<math>F_Z(x,y) = \int_{-\infty}^{y}\int_{-\infty}^{x} f_{X,Y}(u,v)\mathrm{d}u \, \mathrm{d}v</math>.

Somit liegt durch die Angabe einer bivariaten Dichtefunktion die bivariate Verteilungsfunktion und damit die bivariate Verteilung fest.

Bivariate Verteilung und bedingte Wahrscheinlichkeiten

Wenn die Zufallsvariable diskret ist, dann kann man die gemeinsame Verteilung mit Hilfe bedingter Wahrscheinlichkeiten so schreiben:

<math>

\begin{align} \mathrm{P}(X=x\ \mathrm{und}\ Y=y) & {} = \mathrm{P}(Y=y \mid X=x) \cdot \mathrm{P}(X=x) \\ & {} = \mathrm{P}(X=x \mid Y=y) \cdot \mathrm{P}(Y=y) \end{align} </math> und im stetigen Fall entsprechend

Hier sind <math>f_{Y|X}(y|x)</math> und <math>f_{X|Y}(x|y)</math> die bedingten Dichten (<math>Y</math> unter der Bedingung <math>X=x</math>, bzw. von <math>X</math> unter der Bedingung <math>Y=y</math>) und <math>f_X(x), f_Y(y)</math> die Dichten der Randverteilungen von <math>X</math> und <math>Y</math>.

Stochastische Unabhängigkeit

Die Komponenten des Zufallsvektors <math>Z=(X,Y)</math> sind genau dann stochastisch unabhängig, wenn

gilt. Anderenfalls liegt stochastische Abhängigkeit vor. Wenn für diskrete Zufallsvariablen

gilt oder wenn für stetige Zufallsvariablen

gilt, dann sind die Zufallsvariablen <math>X</math> und <math>Y</math> unabhängig.

Abhängigkeitsstruktur und Copula

Wenn die Komponenten des Zufallsvektors <math>(X,Y)</math> nicht stochastisch unabhängig sind, kann die Abhängigkeitsstruktur durch die sogenannte Copula charakterisiert werden. In der Abbildung ist ein Beispiel für die Modellierung der Abhängigkeitsstruktur mit Hilfe einer speziellen Copula gezeigt. Insbesondere ist das ein Beispiel dafür, dass eine bivariate Zufallsvariable mit normalen Randverteilungen nicht bivariat normalverteilt sein muss.

Der allgemeine mehrdimensionale Fall

Multivariate Verteilungen ordnen einem geeigneten Teilmengensystem von <math>\R^n</math>, dem sogenannten Ereignissystem, Wahrscheinlichkeiten zu. Typischerweise wird als Ereignissystem die Borelsche σ-Algebra auf <math>\R^n</math> gewählt, die mit <math>\mathcal{B}(\R^n)</math> bezeichnet wird. Aus wahrscheinlichkeitstheoretischer Sicht gilt: „Multivariate Verteilungen sind Wahrscheinlichkeitsmaße auf <math>\mathcal{B}(\R^n)</math>.“<ref>Klaus D. Schmidt: Maß und Wahrscheinlichkeit. 2., durchgesehene Auflage. Springer, Berlin/Heidelberg 2011, ISBN 978-3-642-21025-9, S. 292. </ref>

Bei Anwendungen, insbesondere im Bereich der Statistik, steht ein Zufallsvektor (eine <math>n</math>-dimensionale Zufallsvariable), <math>X: \Omega \to \R^n</math> im Vordergrund, dessen Komponenten Zufallsvariablen sind. Der Zufallsvektor <math>X = (X_1,\dots, X_n)</math> besitzt dann eine multivariate Verteilung, die das Bildmaß <math>P_X</math> von <math>P</math> unter <math>X</math> ist. Dabei gilt

<math>P_X(B) = P(X \in B)\quad\text{für alle }B \in \mathcal{B}(\R^n)\;.</math>

Verteilungsfunktion

Die Verteilungsfunktion <math>F_P</math> einer multivariaten Verteilung <math>P \colon \mathcal{B}(\R^n) \to [0,1]</math> ist durch

<math>F_P(x_1, \dots, x_n) = P((-\infty,x_1]\times \dots \times (-\infty,x_n]) \quad\text{für alle }(x_1, \dots, x_n) \in \R^n</math>

definiert.<ref>Klaus D. Schmidt: Maß und Wahrscheinlichkeit. 2., durchgesehene Auflage. Springer, Berlin/Heidelberg 2011, ISBN 978-3-642-21025-9, S. 294. </ref>

Die Verteilungsfunktion <math>F_X</math> eines Zufallsvektors <math>X \colon \Omega \to \R^n</math> ist durch

<math>F_X(x_1, \dots, x_n) = P(X_1 \leq x_1, \dots, X_n \leq x_n) = P(X \in (-\infty,x_1]\times \dots \times (-\infty,x_n]) \quad\text{für alle }(x_1, \dots, x_n) \in \R^n</math>

definiert.<ref name="MKB">K. V. Mardia, J. T. Kent und J. M. Bibby: Multivariate Analysis. 1979, S. 26. </ref>

Besitzt der Zufallsvektor <math>X=(X_1, \dots, X_n)</math> eine Dichtefunktion <math>f_X \colon \R^n \to [0,\infty)</math>, dann hängen die Verteilungsfunktion <math>F_X</math> und die Dichte <math>f_X</math> über

<math>F_X(x_1, \dots, x_n) = \int_{-\infty}^{x_n} \dots \int_{-\infty}^{x_1} f_X(u_1, \dots, u_n) \mathrm{d} u_1 \dots \mathrm{d} u_n</math>

zusammen.<ref name="MKB" />

Randverteilungen

Es gibt für Randverteilungen mehr Möglichkeiten als im zweidimensionalen Fall, da nun Randverteilungen für jede niedrigere Dimension <math>1 \le k < n</math> existieren und man <math>{n \choose k}</math> Möglichkeiten hat, einen <math>k</math>-dimensionalen Teilvektor aus einem <math>n</math>-dimensionalen Vektor auszuwählen. Beispielsweise gibt es im dreidimensionalen Fall zur Verteilung des Zufallsvektors <math>(X_1,X_2,X_3)</math> die drei eindimensionale Randverteilungen der Komponenten <math>X_1</math>, <math>X_2</math> und <math>X_3</math> sowie die drei zweidimensionale Randverteilungen der Teilvektoren <math>(X_1,X_2)</math>, <math>(X_1,X_3)</math> und <math>(X_2,X_3)</math>.

Verteilungen von Zufallsmatrizen

Eine Zufallsmatrix <math>\mathbf X</math> ist eine Matrix, deren Elemente Zufallsvariablen sind. Sie kann als eine Funktion <math>\mathbf X\colon \Omega \to \R^{m\times n}</math> aufgefasst werden. Die Verteilung einer Zufallsmatrix ordnet den (Borel-messbaren) Teilmengen von <math>\R^{m\times n}</math> Wahrscheinlichkeiten zu.

Im Zusammenhang mit der Schätzung der Kovarianzmatrix einer <math>d</math>-dimensionalen multivariaten Normalverteilung spielt eine <math>d\times d</math>-dimensionale Wishart-Verteilung eine entscheidende Rolle.<ref>P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Wishart-Verteilung, S. 69. </ref><ref>K. V. Mardia, J. T. Kent, J. M. Bibby: Multivariate Analysis. 1979, S. 69. </ref> Die Wishart-Verteilung ist eine Matrix-Verallgemeinerung der Chi-Quadrat-Verteilung.<ref>K. V. Mardia, J. T. Kent, J. M. Bibby: Multivariate Analysis. 1979, S. 43. </ref>

Spezielle multivariate Verteilungen

Diskrete multivariate Verteilungen

Spezielle multivariate Verteilungen sind z. B. die Multinomialverteilung,<ref>Norman L. Johnson, Samuel Kotz, Narayanaswamy Balakrishnan: Discrete Multivariate Distributions. 1997, Kap. 35. </ref> die negative Multinomialverteilung,<ref>Norman L. Johnson, Samuel Kotz, Narayanaswamy Balakrishnan: Discrete Multivariate Distributions. 1997, Kap. 36. </ref> die multivariate Poissonverteilung,<ref>Norman L. Johnson, Samuel Kotz, Narayanaswamy Balakrishnan: Discrete Multivariate Distributions. 1997, Kap. 37. </ref> die multivariate hypergeometrische Verteilung,<ref>Norman L. Johnson, Samuel Kotz, Narayanaswamy Balakrishnan: Discrete Multivariate Distributions. 1997, Kap. 39. </ref> die multivariate Pólya-Eggenberger-Verteilung<ref>Norman L. Johnson, Samuel Kotz, Narayanaswamy Balakrishnan: Discrete Multivariate Distributions. 1997, Kap. 40. </ref> und die multivariate Ewens-Verteilung<ref>Norman L. Johnson, Samuel Kotz, Narayanaswamy Balakrishnan: Discrete Multivariate Distributions. 1997, Kap. 41. </ref>.

Stetige multivariate Verteilungen

Spezielle stetige multivariate Verteilungen sind z. B. die multivariate Normalverteilung,<ref>Samuel Kotz et al.: Continuous Multivariate Distributions. 2000, Kap. 44. </ref> verschiedene Konzepte multivariater Exponentialverteilungen,<ref>Samuel Kotz et al.: Continuous Multivariate Distributions. 2000, Kap. 47. </ref> Gammaverteilungen,<ref>Samuel Kotz et al.: Continuous Multivariate Distributions. 2000, Kap. 48. </ref> logistischer Verteilungen,<ref>Samuel Kotz et al.: Continuous Multivariate Distributions. 2000, Kap. 51. </ref> die multivariate Dirichlet-Verteilung,<ref>Samuel Kotz et al.: Continuous Multivariate Distributions. 2000, Kap. 49. </ref> die multivariate Liouville-Verteilung<ref>Samuel Kotz et al.: Continuous Multivariate Distributions. 2000, Kap. 50. </ref> und die multivariaten Extremwertverteilungen<ref>Samuel Kotz et al.: Continuous Multivariate Distributions. 2000, Kap. 53. </ref>.

Literatur

Ludwig Fahrmeir, Alfred Hamerle (Hrsg.): Multivariate statistische Verfahren. de Gruyter, New York 1996, ISBN 3-11-008509-7.
Joachim Hartung, Bärbel Elpelt: Multivariate Statistik. Oldenbourg, München/Wien 1999, ISBN 3-486-25287-9.
Norman L. Johnson, Samuel Kotz, Narayanaswamy Balakrishnan: Discrete Multivariate Distributions. Wiley, New York 1997, ISBN 978-0-471-12844-1.
K. V. Mardia, J. T. Kent, J. M. Bibby: Multivariate Analysis. Acad. Press, New York 1979, ISBN 0-12-471250-9 (engl.).
Samuel Kotz, Narayanaswamy Balakrishnan, Norman L. Johnson: Continuous Multivariate Distributions – Volume 1: Models and Applications. 2. Auflage. Wiley, New York 2000, ISBN 978-0-471-18387-7, doi:10.1002/0471722065.

Einzelnachweise