En lingüística , las dependencias entre series (también llamadas dependencias cruzadas por algunos autores [1] ) ocurren cuando las líneas que representan las relaciones de dependencia entre dos series de palabras se cruzan entre sí. [2] Son de particular interés para los lingüistas que desean determinar la estructura sintáctica del lenguaje natural; los idiomas que contienen un número arbitrario de ellas no son libres de contexto . Por este hecho, se ha demostrado que el holandés [3] y el suizo-alemán [4] no son libres de contexto.
Ejemplo
Como el suizo-alemán permite ordenar los verbos y sus argumentos de forma cruzada, tenemos el siguiente ejemplo, tomado de Shieber: [4]
Es decir, "ayudamos a Hans a pintar la casa".
Observe que las frases sustantivas secuenciales em Hans ( Hans ) y es huus ( la casa ), y los verbos secuenciales hälfed ( ayudar ) y aastriiche ( pintar ) forman dos series separadas de constituyentes. Observe también que el verbo dativo hälfed y el verbo acusativo aastriiche toman el dativo em Hans y el acusativo es huus como argumentos, respectivamente.
No libre de contexto
Sea el conjunto de todas las oraciones suizo-alemanas. Demostraremos matemáticamente que no es independiente del contexto.
En las oraciones suizo-alemanas, el número de verbos de un caso gramatical (dativo o acusativo) debe coincidir con el número de objetos de ese caso. Además, una oración que contenga un número arbitrario de tales objetos es admisible (en principio). Por lo tanto, podemos definir el siguiente lenguaje formal , un subconjunto de : Por lo tanto, tenemos , donde es el lenguaje regular definido por donde el símbolo superíndice más significa "una o más copias". Dado que el conjunto de lenguajes libres de contexto está cerrado bajo intersección con lenguajes regulares, solo necesitamos probar que no es libre de contexto (, [5] pp 130–135).
Después de una sustitución de palabras, tiene la forma . Dado que se puede mapear a mediante el siguiente mapa: , y dado que los lenguajes libres de contexto están cerrados bajo mapeos de símbolos terminales a cadenas terminales (es decir, un homomorfismo ) (, [5] pp 130–135), solo necesitamos probar que no es libre de contexto.
es un ejemplo estándar de lenguaje no libre de contexto (, [5] p. 128). Esto se puede demostrar mediante el lema de Ogden .
Supongamos que el lenguaje se genera mediante una gramática independiente del contexto, entonces sea la longitud requerida en el lema de Ogden, luego consideremos la palabra en el lenguaje y marquemos las letras . Entonces no se pueden satisfacer todas las tres condiciones implicadas por el lema de Ogden.
De manera similar, se puede demostrar que todos los idiomas hablados conocidos que contienen dependencias entre series no son libres de contexto. [2] Esto llevó al abandono de la gramática de estructura de frase generalizada una vez que se identificaron dependencias entre series en los idiomas naturales en la década de 1980. [6]
Tratamiento
La investigación en lenguajes ligeramente sensibles al contexto ha intentado identificar una subclase más acotada y más manejable computacionalmente de lenguajes sensibles al contexto que puedan capturar la sensibilidad al contexto tal como se encuentra en los lenguajes naturales. Por ejemplo, las dependencias entre series se pueden expresar en sistemas de reescritura lineales libres de contexto (LCFRS); se puede escribir una gramática LCFRS para { a n b n c n d n | n ≥ 1}, por ejemplo. [7] [8] [9]
Referencias
^ Stabler, Edward (2004), "Variedades de dependencias cruzadas: dependencia de la estructura y sensibilidad leve al contexto" (PDF) , Cognitive Science , 28 (5): 699–720, doi : 10.1016/j.cogsci.2004.05.002.
^ ab Jurafsky, Daniel; Martin, James H. (2000). Procesamiento del habla y del lenguaje (1.ª ed.). Prentice Hall. págs. 473–495. ISBN978-0-13-095069-7..
^ Bresnan, Joan; M. Kaplan, Ronald (1982), "Dependencias entre series en holandés", Linguistic Inquiry , 13 (4): 613–635.
^ ab Shieber, Stuart (1985), "Evidencia contra la libertad de contexto del lenguaje natural" (PDF) , Lingüística y filosofía , 8 (3): 333–343, doi :10.1007/BF00630917, S2CID 222277837.
^ Gazdar, Gerald (1988). "Aplicabilidad de las gramáticas indexadas a las lenguas naturales". Análisis sintáctico de lenguas naturales y teorías lingüísticas . Estudios en lingüística y filosofía. Vol. 35. págs. 69–94. doi :10.1007/978-94-009-1337-0_3. ISBN978-1-55608-056-2.
^ http://user.phil-fak.uni-duesseldorf.de/~kallmeyer/GrammarFormalisms/4nl-cfg.pdf [ URL básica PDF ]
^ http://user.phil-fak.uni-duesseldorf.de/~kallmeyer/GrammarFormalisms/4lcfrs-intro.pdf [ URL básica PDF ]
^ Laura Kallmeyer (2010). Análisis sintáctico más allá de las gramáticas independientes del contexto . Springer Science & Business Media. Págs. 1–5. ISBN.978-3-642-14846-0.