teorema de greibach

En informática teórica , en particular en teoría del lenguaje formal , el teorema de Greibach establece que ciertas propiedades de las clases de lenguaje formal son indecidibles . Lleva el nombre de la científica informática Sheila Greibach , quien lo demostró por primera vez en 1963. ^[1]^[2]

Definiciones

Dado un conjunto Σ, a menudo llamado "alfabeto", el conjunto (infinito) de todas las cadenas construidas a partir de miembros de Σ se denota por Σ ^* . Un lenguaje formal es un subconjunto de Σ ^* . Si L ₁ y L ₂ son lenguajes formales, su producto L ₁L ₂ se define como el conjunto { w ₁w ₂ : w ₁ ∈ L ₁ , w ₂ ∈ L ₂ } de todas las concatenaciones de una cadena w ₁ de L ₁ con una cuerda w ₂ de L ₂ . Si L es un lenguaje formal y a es un símbolo de Σ, su cociente L / a se define como el conjunto { w : wa ∈ L } de todas las cadenas que pueden convertirse en miembros de L añadiendo una a . Se conocen varios enfoques de la teoría del lenguaje formal para denotar un lenguaje formal mediante una descripción finita, como una gramática formal o una máquina de estados finitos .

Por ejemplo, usando un alfabeto Σ = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 }, el conjunto Σ ^* consta de todos (representaciones decimales de) números naturales, con ceros a la izquierda permitidos, y la cadena vacía, denotada como ε. El conjunto L _div3 de todos los naturales divisibles por 3 es un lenguaje formal infinito sobre Σ; se puede describir de forma finita mediante la siguiente gramática regular con símbolo inicial S ₀ :

Ejemplos de lenguajes finitos son {ε,1,2} y {0,2,4,6,8}; su producto {ε,1,2}{0,2,4,6,8} produce los números pares hasta 28. El cociente del conjunto de números primos hasta 100 por el símbolo 7, 4 y 2 produce el lenguaje {ε,1,3,4,6,9}, {} y {ε}, respectivamente.

Declaración formal del teorema.

El teorema de Greibach es independiente de un enfoque particular para describir un lenguaje formal. Simplemente considera un conjunto C de lenguajes formales sobre un alfabeto Σ∪{#} tal que

cada idioma en C tiene una descripción finita,
cada lenguaje regular sobre Σ∪{#} está en C , ^{[nota 1]}
dadas descripciones de los lenguajes L ₁ , L ₂ ∈ C y de un lenguaje regular R ∈ C , se puede calcular efectivamente una descripción de los productos L ₁R y RL ₁ , y de la unión L ₁ ∪ L _{2 , y}
es indecidible para cualquier idioma miembro L ∈ C con L ⊆ Σ ^* si L = Σ ^* .

Sea P cualquier subconjunto no trivial de C que contenga todos los conjuntos regulares sobre Σ∪{#} y esté cerrado bajo el cociente por cada símbolo en Σ∪{#}. ^{[nota 2]} Entonces la cuestión de si L ∈ P para una descripción dada de un lenguaje L ∈ C es indecidible.

Prueba

Sea M ⊆ Σ ^* , tal que M ∈ C , pero M ∉ P . ^{[nota 3]} Para cualquier L ∈ C con L ⊆ Σ ^* , defina φ( L ) = ( M #Σ ^* ) ∪ (Σ ^* # L ). A partir de una descripción de L , se puede calcular efectivamente una descripción de φ( L ).

Entonces L = Σ ^* si y sólo si φ( L ) ∈ P :

Si L = Σ ^* , entonces φ( L ) = Σ ^* #Σ ^* es un lenguaje regular y, por tanto, en P .
De lo contrario, existe algo de w ∈ Σ ^* \ L , y el cociente φ( L )/(# w ) es igual a M . Por lo tanto, mediante la aplicación repetida de la propiedad del cociente-cierre, φ( L ) ∈ P implicaría M = φ( L )/(# w ) ∈ P , contradiciendo la definición de M .

Por lo tanto, si la pertenencia a P sería decidible para φ( L ) a partir de su descripción, también lo sería la igualdad de L con Σ ^* a partir de su descripción, lo que contradice la definición de C. ^[3]

Aplicaciones

Utilizando el teorema de Greibach, se puede demostrar que los siguientes problemas son indecidibles:

Dada una gramática libre de contexto , ¿describe un lenguaje regular ?

Prueba: La clase de lenguajes libres de contexto y el conjunto de lenguajes regulares satisfacen las propiedades anteriores de C y P , respectivamente. ^{[nota 4]}^[4]

Dado un lenguaje libre de contexto , ¿es inherentemente ambiguo ?

Prueba: la clase de lenguajes libres de contexto y el conjunto de lenguajes libres de contexto que no son inherentemente ambiguos satisfacen las propiedades anteriores de C y P , respectivamente. ^[5]

Dada una gramática sensible al contexto , ¿describe un lenguaje libre de contexto ?

Véase también Gramática libre de contexto#Estar en un nivel inferior o superior de la jerarquía de Chomsky .

Notas

^ Esto queda implícito en Hopcroft, Ullman, 1979: P ⊆ C debe contener todos estos lenguajes regulares.
^ Es decir, si L ∈ P , entonces L / a ∈ P para cada a ∈ Σ∪{#}.
^ La existencia de tal M es requerida por el requisito algo vago anterior de que P sea "no trivial".
^ Los lenguajes habituales no tienen contexto: gramática libre de contexto#Subclases ; Los lenguajes libres de contexto están cerrados con respecto a la unión y la concatenación (incluso general): Gramática libre de contexto#Propiedades de cierre ; la igualdad con Σ ^* es indecidible para lenguajes libres de contexto: Gramática libre de contexto#Universalidad ; Los lenguajes regulares están cerrados bajo cocientes (incluso generales): Lenguaje regular#Propiedades de cierre .

Referencias

^ Sheila Greibach (1963). "La indecidibilidad del problema de ambigüedad para gramáticas lineales mínimas". Información y Control . 6 (2): 117–125. doi :10.1016/s0019-9958(63)90149-9.
^ Sheila Greibach (1968). "Una nota sobre las propiedades indecidibles de los lenguajes formales". Teoría de sistemas matemáticos . 2 (1): 1–6. doi :10.1007/bf01691341. S2CID 19948229.
^ John E. Hopcroft ; Jeffrey D. Ullman (1979). Introducción a la teoría, los lenguajes y la computación de autómatas . Addison-Wesley. ISBN 0-201-02988-X.pág.205-206
^ Hopcroft, Ullman, 1979, p.205, Teorema 8.15
^ Hopcroft, Ullman, 1979, p.206, Teorema 8.16