En el análisis estadístico se utiliza una banda de confianza para representar la incertidumbre en una estimación de una curva o función basada en datos limitados o ruidosos. De manera similar, se utiliza una banda de predicción para representar la incertidumbre sobre el valor de un nuevo punto de datos en la curva, pero sujeto a ruido. Las bandas de confianza y predicción se utilizan a menudo como parte de la presentación gráfica de los resultados de un análisis de regresión .
Las bandas de confianza están estrechamente relacionadas con los intervalos de confianza , que representan la incertidumbre en una estimación de un único valor numérico. "Como los intervalos de confianza, por construcción, sólo se refieren a un único punto, son más estrechos (en este punto) que una banda de confianza que se supone que se mantiene simultáneamente en muchos puntos". [1]
Supongamos que nuestro objetivo es estimar una función f ( x ). Por ejemplo, f ( x ) podría ser la proporción de personas de una edad particular x que apoyan a un candidato dado en una elección. Si x se mide con la precisión de un solo año, podemos construir un intervalo de confianza del 95% separado para cada edad. Cada uno de estos intervalos de confianza cubre el valor verdadero correspondiente f ( x ) con una confianza de 0,95. Tomados en conjunto, estos intervalos de confianza constituyen una banda de confianza puntual del 95% para f ( x ).
En términos matemáticos, una banda de confianza puntual con probabilidad de cobertura 1 − α satisface la siguiente condición por separado para cada valor de x :
donde es la estimación puntual de f ( x ).
La probabilidad de cobertura simultánea de una colección de intervalos de confianza es la probabilidad de que todos ellos cubran sus valores verdaderos correspondientes simultáneamente. En el ejemplo anterior, la probabilidad de cobertura simultánea es la probabilidad de que todos los intervalos para x = 18,19,... cubran sus valores verdaderos (suponiendo que 18 es la edad mínima a la que una persona puede votar). Si cada intervalo individualmente tiene una probabilidad de cobertura de 0,95, la probabilidad de cobertura simultánea es generalmente menor que 0,95. Una banda de confianza simultánea del 95% es una colección de intervalos de confianza para todos los valores x en el dominio de f ( x ) que se construye para tener una probabilidad de cobertura simultánea de 0,95.
En términos matemáticos, una banda de confianza simultánea con probabilidad de cobertura 1 − α satisface la siguiente condición:
En casi todos los casos, una banda de confianza simultánea será más amplia que una banda de confianza puntual con la misma probabilidad de cobertura. En la definición de una banda de confianza puntual, ese cuantificador universal se mueve fuera de la función de probabilidad.
Las bandas de confianza surgen comúnmente en el análisis de regresión . [2] En el caso de una regresión simple que involucra una sola variable independiente, los resultados se pueden presentar en forma de un gráfico que muestra la línea de regresión estimada junto con bandas de confianza puntuales o simultáneas. Los métodos comúnmente utilizados para construir bandas de confianza simultáneas en regresión son los métodos de Bonferroni y Scheffé ; consulte Procedimientos de control de la tasa de error por familia para obtener más información.
Se pueden construir bandas de confianza en torno a estimaciones de la función de distribución empírica . La teoría simple permite la construcción de intervalos de confianza puntuales, pero también es posible construir una banda de confianza simultánea para la función de distribución acumulativa en su conjunto invirtiendo la prueba de Kolmogorov-Smirnov o utilizando métodos de verosimilitud no paramétricos. [3]
Las bandas de confianza surgen siempre que un análisis estadístico se centra en la estimación de una función.
También se han diseñado bandas de confianza para estimaciones de funciones de densidad , funciones de densidad espectral , [4] funciones cuantiles , suavizados de diagramas de dispersión , funciones de supervivencia y funciones características . [ cita requerida ]
Las bandas de predicción se relacionan con los intervalos de predicción de la misma manera que las bandas de confianza se relacionan con los intervalos de confianza. Las bandas de predicción surgen comúnmente en el análisis de regresión. El objetivo de una banda de predicción es cubrir con una probabilidad prescrita los valores de una o más observaciones futuras de la misma población de la que se tomó una muestra de un conjunto de datos determinado. Así como los intervalos de predicción son más amplios que los intervalos de confianza, las bandas de predicción serán más amplias que las bandas de confianza.
En términos matemáticos, una banda de predicción con probabilidad de cobertura 1 − α satisface la siguiente condición para cada valor de x :
donde y * es una observación tomada del proceso de generación de datos en el punto dado x que es independiente de los datos utilizados para construir la estimación puntual y el intervalo de confianza [ vague ] w ( x ). Este es un intervalo de predicción puntual. [ vague ] Sería posible construir un intervalo simultáneo [ vague ] para un número finito de observaciones independientes utilizando, por ejemplo, el método de Bonferroni para ampliar el intervalo [ vague ] en una cantidad apropiada.