Reguläre Sprache

In der theoretischen Informatik ist eine reguläre Sprache oder reguläre Menge oder erkennbare Sprache eine formale Sprache, die einigen Einschränkungen unterliegt. Reguläre Sprachen können von endlichen Automaten erkannt werden und von regulären Ausdrücken beschrieben werden.

Eigenschaften

Die Klasse der regulären Sprachen hat in der Informatik eine große praktische Bedeutung. Sie bildet eine echte Teilmenge der kontextfreien Sprachen. Die Klasse der regulären Sprachen entspricht innerhalb der Chomsky-Hierarchie der am meisten eingeschränkten Sprachklasse vom Typ 3.

Definition

Eine Sprache <math>L</math> über einem Alphabet <math>\Sigma</math>, also eine Menge von Wörtern <math>L\subseteq \Sigma^{*}</math>, heißt dann regulär, wenn sie eine der folgenden äquivalenten Bedingungen erfüllt:

<math>L</math> wird von einer regulären Grammatik erzeugt.
<math>L</math> wird von einem endlichen Automaten entschieden.
<math>L</math> kann durch einen regulären Ausdruck dargestellt werden.
Die auf <math>\Sigma^{*}</math> durch <math>(x,y)\in R_L :\Leftrightarrow (\forall z\in \Sigma^{*}:(xz\in L\Leftrightarrow yz\in L))</math> definierte Relation <math>R_L</math> hat endlichen Index (Satz von Myhill-Nerode).
<math>L</math> kann in der monadischen Logik 2. Stufe definiert werden.
<math>L</math> ist induktiv definiert als: Verankerung: <math>L=\{a\}</math> mit <math>a \in \Sigma</math> oder <math>L=\emptyset</math> oder <math>L=\{\varepsilon\}</math> Induktion: Für <math>L_1,L_2</math> reguläre Sprachen: <math>L=L_1\cdot L_2</math> oder <math> L=L_1\cup L_2</math> oder <math>L=L^*</math>

Nachweis der Regularität einer Sprache

Will man für eine gegebene Sprache nachweisen, dass sie regulär ist, so muss man sie demnach auf eine reguläre Grammatik, einen endlichen Automaten, einen regulären Ausdruck oder auf bereits bekannte reguläre Sprachen zurückführen. Für einen Nachweis, dass eine Sprache <math>L</math> nicht regulär ist, ist es meistens zweckmäßig, das Pumping-Lemma (= Pumplemma) für reguläre Sprachen zu benutzen oder in schwierigeren Fällen nachzuweisen, dass der Index von <math>R_L</math> nicht endlich ist.

Beispiele

<math>\left\{a^i b^j \mid i, j \in \mathbb{N}\right\}</math> ist regulär.
Alle endlichen Sprachen <math>L</math> über einem beliebigen Alphabet <math>\Sigma</math>, d. h. solche mit <math>\left| L \right|\in\mathbb{N}</math>, sind regulär.
- Beispiel: <math>\left\{a, ab\right\}</math>
- Auch die leere Menge ist eine reguläre Sprache.
Alle kontextfreien Sprachen über einem unären Alphabet, d. h. solche mit <math>\left|\Sigma\right|=1</math>, sind regulär.
Die Dyck-Sprachen sind nicht regulär.

Abschlusseigenschaften

Die Klasse der regulären Sprachen ist abgeschlossen unter den gewöhnlichen Mengenoperationen Vereinigung, Durchschnitt und Komplement. Darüber hinaus gilt die Abgeschlossenheit auch für die Konkatenation und den sogenannten Kleene-Stern sowie die Differenzmenge. Im Einzelnen gilt also:

Die Vereinigung <math>L = L_1 \cup L_2</math> zweier regulärer Sprachen <math>L_1</math> und <math>L_2</math> ist regulär.
Der Schnitt <math>L = L_1\cap L_2</math> zweier regulärer Sprachen <math>L_1</math> und <math>L_2</math> ist regulär.
Das Komplement <math>\overline{L} = {\Sigma}^* \setminus L</math> einer regulären Sprache <math>L</math> ist regulär.
Die Konkatenation <math>\{uv \mid u\in L_1 \land v\in L_2\}</math> zweier regulärer Sprachen <math>L_1</math> und <math>L_2</math> ist regulär.
Der Kleene-Stern <math>L^{*}</math> einer regulären Sprache <math>L</math>, d. h. die beliebig häufige Konkatenation von Wörtern aus der Sprache <math>L</math> vereinigt mit dem leeren Wort, ist regulär.
Die Differenz <math>L = L_1\setminus L_2</math> zweier regulärer Sprachen <math>L_1</math> und <math>L_2</math> ist regulär.<ref>Das ergibt sich schon aus den Abschlusseigenschaften von Schnitt und Komplement, da <math>L_1\setminus L_2 = L_1 \cap \overline{L_2}</math> ist.</ref>

Typische Entscheidungsprobleme

Seien <math>L</math>, <math>L_1</math> und <math>L_2</math> gegebene reguläre Sprachen über dem Alphabet <math>\Sigma</math>. Dann ergeben sich folgende typische Problemstellungen:

Wortproblem: Gehört ein Wort <math>w\in\Sigma^{*}</math> zu <math>L</math>?
Leerheitsproblem: Ist <math>L</math> die leere Menge?
Schnittproblem: Ist <math>L_1 \cap L_2</math> die leere Menge?
Endlichkeitsproblem: Besteht <math>L</math> aus einer endlichen Menge von Wörtern?
Äquivalenzproblem: Gilt <math>L_1=L_2</math>?
Inklusionsproblem: Gilt <math>L_1\subseteq L_2</math>?

Alle diese Probleme sind entscheidbar.

Literatur

Michael Sipser: Introduction to the Theory of Computation. PWS Publishing, Boston u. a. 1997, ISBN 0-534-94728-X, Chapter 1: Regular Languages.
Uwe Schöning: Theoretische Informatik – kurzgefasst. 4. Auflage. Spektrum, Heidelberg u. a. 2001, ISBN 3-8274-1099-1, (Spektrum-Hochschultaschenbuch), Kapitel 1.2: Reguläre Sprachen.
John E. Hopcroft, Rajeev Motwani, Jeffrey D. Ullman: Einführung in die Automatentheorie. Formale Sprachen und Komplexitätstheorie. 2. überarbeitete Auflage. Pearson Studium, München 2002, ISBN 3-8273-7020-5, (i – Informatik).
Dag Hovland: The Inclusion Problem for Regular Expressions. In: LNCS Language and Automata Theory and Applications. Band 6031, 2010, S. 309–320, doi:10.1007/978-3-642-13089-2_26 (PDF).

Weblinks

REG. In: Complexity Zoo. (englisch)

Einzelnachweise und Anmerkungen