En la teoría de estimación estadística , la probabilidad de cobertura , o cobertura para abreviar, es la probabilidad de que un intervalo de confianza o una región de confianza incluya el valor verdadero (parámetro) de interés. Puede definirse como la proporción de casos en los que el intervalo rodea el valor verdadero según la evaluación de la frecuencia de largo plazo . [1]
En la predicción estadística, la probabilidad de cobertura es la probabilidad de que un intervalo de predicción incluya un valor fuera de la muestra de la variable aleatoria . La probabilidad de cobertura se puede definir como la proporción de casos en los que el intervalo rodea un valor fuera de la muestra, según se evalúa mediante la frecuencia de largo plazo . [2]
El grado fijo de certeza especificado previamente por el analista, denominado nivel de confianza o coeficiente de confianza del intervalo construido, es efectivamente la probabilidad de cobertura nominal del procedimiento para construir intervalos de confianza. Por lo tanto, referirse a un "nivel de confianza nominal" o "coeficiente de confianza nominal" (por ejemplo, como sinónimo de probabilidad de cobertura nominal ) generalmente debe considerarse tautológico y engañoso, ya que la noción de nivel de confianza en sí misma implica inherentemente nominalidad . [a] La probabilidad de cobertura nominal a menudo se establece en 0,95. Por el contrario, la probabilidad de cobertura (verdadera) es la probabilidad real de que el intervalo contenga el parámetro.
Si se cumplen todos los supuestos utilizados para derivar un intervalo de confianza, la probabilidad de cobertura nominal será igual a la probabilidad de cobertura (denominada probabilidad de cobertura "verdadera" o "real" para enfatizar). Si no se cumple algún supuesto, la probabilidad de cobertura real podría ser menor o mayor que la probabilidad de cobertura nominal. Cuando la probabilidad de cobertura real es mayor que la probabilidad de cobertura nominal, el intervalo se denomina intervalo (de confianza) conservador ; si es menor que la probabilidad de cobertura nominal, el intervalo se denomina anticonservador o permisivo . Por ejemplo, supongamos que el interés está en el número medio de meses que las personas con un tipo particular de cáncer permanecen en remisión después de un tratamiento exitoso con quimioterapia . El intervalo de confianza tiene como objetivo contener la duración media de la remisión desconocida con una probabilidad dada. En este ejemplo, la probabilidad de cobertura sería la probabilidad real de que el intervalo contenga realmente la duración media de la remisión verdadera.
Una discrepancia entre la probabilidad de cobertura y la probabilidad de cobertura nominal ocurre frecuentemente cuando se aproxima una distribución discreta con una continua . La construcción de intervalos de confianza binomiales es un ejemplo clásico donde las probabilidades de cobertura rara vez son iguales a los niveles nominales. [3] [4] [5] Para el caso binomial, se han creado varias técnicas para construir intervalos. El intervalo de puntuación de Wilson es una construcción bien conocida basada en la distribución normal . Otras construcciones incluyen los intervalos de Wald, exacto, Agresti-Coull y de verosimilitud. Si bien el intervalo de puntuación de Wilson puede no ser la estimación más conservadora, produce probabilidades de cobertura promedio que son iguales a los niveles nominales mientras que aún produce un intervalo de confianza comparativamente estrecho.
La "probabilidad" en la probabilidad de cobertura se interpreta con respecto a un conjunto de repeticiones hipotéticas de todo el procedimiento de recopilación y análisis de datos. En estas repeticiones hipotéticas, se consideran conjuntos de datos independientes que siguen la misma distribución de probabilidad que los datos reales, y se calcula un intervalo de confianza a partir de cada uno de estos conjuntos de datos; consulte la construcción de Neyman . La probabilidad de cobertura es la fracción de estos intervalos de confianza calculados que incluyen el valor del parámetro deseado pero no observable.
En la estimación, cuando la probabilidad de cobertura es igual a la probabilidad de cobertura nominal, eso se conoce como coincidencia de probabilidad. [6]
En predicción, cuando la probabilidad de cobertura es igual a la probabilidad de cobertura nominal, eso se conoce como coincidencia de probabilidad predictiva. [2]
La construcción del intervalo de confianza asegura que la probabilidad de encontrar el parámetro verdadero en el intervalo dependiente de la muestra sea (al menos) :