Sattelpunktproblem

In der Mathematik bezeichnet ein Sattelpunktproblem eine spezielle Problemklasse, welche auf ein lineares Gleichungssystem in Blockgestalt führt, und zwar eine <math>(n+m)\times(n+m)</math>-Matrix <math>M</math> der Form

<math>M = \begin{pmatrix}A & B \\ B^T & 0\end{pmatrix},</math>

wobei <math>A</math> eine <math>n\times n</math>-Matrix ist und <math>B</math> eine <math>n\times m</math>-Matrix. Der <math>0</math>-Block ist von der Größe <math>m\times m</math>.

Ursprung von Sattelpunktproblemen

Gleichungssysteme in Sattelpunktform entstehen in vielen Anwendungen, beispielsweise bei Optimierungsproblemen unter Nebenbedingungen.

Beispiel hierfür ist das Lösen von quadratischen Programmen mit Gleichungsrestriktionen durch Anwendung der Karush-Kuhn-Tucker-Bedingungen. Diese sind Äquivalent zur Bestimmung eines Sattelpunkt bei der Lagrange-Dualität, was den Namen erklärt.

Eine weitere wichtige Klasse von Sattelpunktproblemen stammt aus der Diskretisierung von partiellen Differentialgleichungen. Das wichtigste Beispiel sind die inkompressiblen Navier-Stokes-Gleichungen in linearisierter Form, diskretisiert beispielsweise mit finiten Elementen, welches auf natürliche Weise ein lineares Gleichungssystem in obiger Blockgestalt ergibt. Die Blockmatrix <math>A</math> entsteht dort aus der Diskretisierung des Geschwindigkeitsterms <math>\vec{u}</math> in der Impulsgleichung, die Matrix <math>B</math> aus der Diskretisierung des Druckterms <math>p</math>, und die Matrix <math>B^T</math> resultiert aus der Diskretisierung der Geschwindigkeit in der Kontinuitätsgleichung.

Lösung von Sattelpunktgleichungen

Anwendungen wie die diskretisierten Navier-Stokes-Gleichungen erfordern die Lösung eines linearen Gleichungssystems

Damit das Gleichungssystem eindeutig lösbar ist, muss die Matrix vollen Rang besitzen. Eine notwendige Voraussetzung dafür ist, dass die Anzahl der Zeilen in der Matrix <math>B^T</math> nicht größer ist als die Anzahl der Spalten. Eine hinreichende Bedingung gibt die sog. LBB-Bedingung (nach Ladyschenskaja, Babuška und Brezzi), oft auch inf-sup-Bedingung genannt.

Effiziente numerische Algorithmen zur Lösung von Gleichungssystemen mit Sattelpunktstruktur verwenden eine spezielle Form des Schur-Komplements, welche die Blockstruktur der Matrix ausnutzt. Insbesondere bei der numerischen Lösung der Navier-Stokes-Gleichungen ist diese Variante sehr beliebt.

Gewöhnliche iterative Lösungsverfahren wie das Krylov-Unterraum-Verfahren GMRES ohne Beachtung der Struktur von <math>M</math> eignen sich dagegen relativ schlecht, da die gängigen Methoden zur Vorkonditionierung wie das Jacobi-, Gauß-Seidel-Verfahren oder die ILU-Zerlegung wegen der Nullen auf der Hauptdiagonalen im unteren Diagonalblock nicht funktionieren. Ohne Vorkonditionierung konvergieren selbst die oft hervorragenden Krylov-Unterraum-Verfahren nur sehr langsam und sind unbrauchbar.

Begriffsklärung

Die Bezeichnung Sattelpunktproblem für eine Gleichung der Form

<math> Mx = \begin{pmatrix}A & B \\ B^T & 0\end{pmatrix} \begin{pmatrix}u \\ p\end{pmatrix} = \begin{pmatrix}0 \\ 0\end{pmatrix}= b </math>

leitet sich aus den Eigenschaften der zugehörigen quadratischen Form

mit einer symmetrisch positiv definiten Matrix <math>A</math> ab, wobei die Herleitung hier für eine homogene rechte Seite erfolgt. Der allgemeine Fall mit <math>b\neq 0</math> hat analoge Eigenschaften.

Sei <math>x^* = (u^*,p^*)</math> eine Lösung des linearen Gleichungssystems <math>Mx=0</math>. Dann ist <math>(u^*,p^*)</math> ein Sattelpunkt von <math>F</math>, denn für alle <math>u\in \mathbb{R}^n</math>:

wobei die zweite Gleichheit durch Ersetzen von <math> Bp^* = - A u^*</math> und Einfügen des Terms <math>(u^*)^T A u^* = 0</math> erreicht ist. Nun

Der Term <math>(u-u^*)^T A (u-u^*)</math> ist nichtnegativ für alle <math>u</math>, da die Matrix <math>A</math> symmetrisch positiv definit ist.

Zudem zeigt man die Ungleichheit

für alle <math>p\in \mathbb{R}^m</math>, was die Existenz des Sattelpunktes zeigt.

Siehe auch

Literatur

Dietrich Braess: Finite Elemente. Theorie, schnelle Löser und Anwendungen in der Elastizitätstheorie. Abschnitt III.4, Springer-Verlag, Berlin 2003, ISBN 3-540-00122-0.