En lingüística, la coocurrencia o co- ocurrencia es una frecuencia superior a la casualidad de aparición ordenada de dos términos adyacentes en un corpus de texto . La co-ocurrencia en este sentido lingüístico puede interpretarse como un indicador de proximidad semántica o una expresión idiomática . La lingüística de corpus y sus análisis estadísticos revelan patrones de co-ocurrencias dentro de una lengua y permiten elaborar colocaciones típicas para sus elementos léxicos. Una restricción de co-ocurrencia se identifica cuando los elementos lingüísticos nunca ocurren juntos. El análisis de estas restricciones puede conducir a descubrimientos sobre la estructura y el desarrollo de una lengua. [1]
La coocurrencia puede considerarse una extensión del conteo de palabras en dimensiones superiores. La coocurrencia puede describirse cuantitativamente utilizando medidas como la correlación o la información mutua .