Intervalo de predicción

Por ejemplo, en el contexto de las inundaciones fluviales (donde los análisis a menudo se basan en los valores del mayor caudal de cada año), puede haber interés en hacer inferencias sobre la mayor inundación que probablemente se experimentará en los próximos 50 años.

La cantidad pivotal más familiar es la t de Student, que puede deducirse mediante este método y se utiliza en el apartado siguiente.

Un intervalo de predicción [ℓ, u] para una observación futura X en una distribución normal N (µ, σ2) con media y varianza conocidas se pueden calcular a partir de donde

, la unidad tipificada de X, se distribuye como estándar normal.

Por lo tanto o siendo z el cuantil en la distribución normal estándar para el cual: o equivalentemente; El intervalo de predicción se escribe convencionalmente como: Por ejemplo, para calcular el intervalo de predicción con una probabilidad del 95% para una distribución normal con una media (µ) de 5 y una desviación estándar (σ) de 1, entonces z es aproximadamente 2 (véase la tabla adjunta).

Tenga en cuenta que hay dos opciones naturales para s2 aquí: dividir por

Luego se usa la función de cuantiles con estos parámetros estimados

Este enfoque es utilizable, pero el intervalo resultante no tendrá la interpretación de muestreo repetida,[5]​ no es un intervalo de confianza predictivo.

a partir de la cual se pueden calcular intervalos como antes.

Esto es necesario para que la propiedad del intervalo de confianza deseado se mantenga.

Por el contrario, dada una distribución normal con media conocida 0, pero varianza desconocida

a partir de la que se pueden calcular intervalos como antes.

Téngase en cuenta que esta distribución de predicción es más conservadora que el uso de una distribución normal con la desviación estándar estimada

y la media conocida 0, ya que utiliza la distribución t en lugar de la distribución normal, por lo que produce intervalos más amplios.

Esto es necesario para que la propiedad del intervalo de confianza deseado se mantenga.

con μ y σ2 desconocidas se obtiene la siguiente estadística auxiliar:[7]​ Esta combinación simple es posible porque la media muestral y la varianza muestral de la distribución normal son estadísticas independientes; esto solo es cierto para la distribución normal y, de hecho, caracteriza la distribución normal.

Se pueden calcular intervalos de predicción sin ningún supuesto sobre la población.

Por ejemplo, si n = 19, entonces [m, M] da un intervalo de predicción del 18/20= 90%, es decir, que el 90% de las veces, la vigésima observación debería caer entre la observación más pequeña y la más grande observada hasta el momento.

Más generalmente, si X(j) y X(k) son observaciones ordenadas de la muestra con j < k y j + k = n + 1, entonces [X(j), X(k)] es un intervalo de predicción para Xn+1 con una cobertura de probabilidad (significación estadística) igual a (n + 1 − 2j) / (n + 1).

Este hecho se puede visualizar dibujando los n puntos de la muestra sobre una recta, que divide la línea en n + 1 secciones (n − 1 segmentos entre muestras, y 2 intervalos que van hasta el infinito en ambos extremos), y observando que Xn+1 tiene la misma posibilidad de caer en cualquiera de estas n + 1 secciones.

Por lo tanto, también se puede elegir cualquier k de estas secciones y dar un k / (n + 1) intervalo de predicción (o conjunto, si las secciones no son consecutivas).

Téngase en cuenta que si bien esto da la probabilidad de que una observación futura se encuentre dentro de un rango, no proporciona ninguna estimación de dónde caerá en un segmento, especialmente si se encuentra fuera del rango de valores observados, puede quedar muy lejos del rango.

Véase la teoría de valores extremos para un análisis más detallado.

Formalmente, esto se aplica no solo al muestreo de una población, sino a cualquier conjunto de variables aleatorias intercambiables, no necesariamente independiente o idénticamente distribuidas.

es una nueva estadística, y se calcula su distribución muestral.

Supóngase que los datos están siendo modelados mediante una regresión lineal: donde

es la variable independiente, εi es un término de error aleatorio, y

para los parámetros, como de una regresión lineal simple, el valor resultado previsto yd para un valor dado xd es (el punto en la línea de regresión), mientras que la respuesta real sería El punto estimado

En cambio, un intervalo de predicción proporciona un intervalo en el que se espera que caiga yd; esto no es necesario si los parámetros reales α y β son conocidos (junto con el término de error εi), pero si se está estimando desde una muestra, entonces puede usarse el error estándar de las estimaciones de la intersección y la pendiente (

En regresión,Faraway (2002, p. 39) hace una distinción entre los intervalos para las predicciones de la respuesta media, frente a las predicciones de la respuesta observada, que afectan esencialmente a la inclusión o no del sumando unidad dentro de la raíz cuadrada en los factores de expansión anteriores (para más detalles, véase Faraway (2002)).

Intervalo de predicción (en coordenadas cartesianas ) dado desde z (el cuantil de la unidad tipificada , en coordenadas cartesianas ). El eje vertical está escalado logarítmicamente
Diagrama que muestra la función acumulada de una distribución normal con media ( µ ) igual a 0 y varianza ( σ 2 ) 1. Además del cuantil , el intervalo de predicción para que no se supere un valor observable dado, se puede calcular mediante la fórmula (1 − (1 − Φ µ , σ 2 (valor observable))·2). Por ejemplo, para un valor observable de x = 1.96 se obtiene Φ µ , σ 2 (1.96) = 0.9750 correspondiente a un intervalo de predicción del (1 − (1 − 0.9750)·2)= 0.9500 = 95%