En lingüística, la coocurrencia o coocurrencia es una frecuencia por encima del azar de aparición ordenada de dos términos adyacentes en un corpus de texto . La coocurrencia en este sentido lingüístico puede interpretarse como un indicador de proximidad semántica o una expresión idiomática . La lingüística de corpus y sus análisis estadísticos revelan patrones de coocurrencia dentro de una lengua y permiten determinar colocaciones típicas para sus elementos léxicos. Se identifica una restricción de coocurrencia cuando los elementos lingüísticos nunca ocurren juntos. El análisis de estas restricciones puede conducir a descubrimientos sobre la estructura y el desarrollo de una lengua. [1]
La coocurrencia puede verse como una extensión del conteo de palabras en dimensiones superiores. La coocurrencia se puede describir cuantitativamente utilizando medidas como correlación o información mutua .