stringtranslate.com

Intervalo de predicción

En la inferencia estadística , específicamente en la inferencia predictiva , un intervalo de predicción es una estimación de un intervalo en el que caerá una observación futura, con una cierta probabilidad, dado lo ya observado. Los intervalos de predicción se utilizan a menudo en el análisis de regresión .

Un ejemplo sencillo lo da un dado de seis caras con valores nominales que van de 1 a 6. El intervalo de confianza para el valor esperado estimado del valor nominal será de alrededor de 3,5 y se estrechará con un tamaño de muestra mayor. Sin embargo, el intervalo de predicción para el próximo lanzamiento oscilará aproximadamente entre 1 y 6, incluso con cualquier número de muestras vistas hasta ahora.

Los intervalos de predicción se utilizan tanto en la estadística frecuentista como en la estadística bayesiana : un intervalo de predicción tiene la misma relación con una observación futura que un intervalo de confianza frecuentista o un intervalo creíble bayesiano con un parámetro de población no observable: los intervalos de predicción predicen la distribución de puntos futuros individuales, mientras que Los intervalos de confianza y los intervalos creíbles de parámetros predicen la distribución de las estimaciones de la verdadera media poblacional u otra cantidad de interés que no se puede observar.

Introducción

Si se hace el supuesto paramétrico de que la distribución subyacente es una distribución normal y tiene un conjunto de muestras { X 1 ,...,  X n }, entonces se pueden utilizar intervalos de confianza e intervalos de credibilidad para estimar la media poblacional μ y el estándar poblacional. desviación σ de la población subyacente, mientras que los intervalos de predicción pueden usarse para estimar el valor de la siguiente variable de muestra, X n +1 .

Alternativamente, en términos bayesianos, un intervalo de predicción puede describirse como un intervalo creíble para la variable en sí, en lugar de para un parámetro de su distribución.

El concepto de intervalos de predicción no necesita limitarse a la inferencia sobre un único valor muestral futuro, sino que puede extenderse a casos más complicados. Por ejemplo, en el contexto de las inundaciones de ríos, donde los análisis a menudo se basan en valores anuales del mayor caudal dentro del año, puede ser interesante hacer inferencias sobre la mayor inundación que probablemente se experimentará en los próximos 50 años.

Dado que los intervalos de predicción solo se ocupan de observaciones pasadas y futuras, en lugar de parámetros de población no observables, algunos estadísticos, como Seymour Geisser , [ cita necesaria ] los recomiendan como un método mejor que los intervalos de confianza, siguiendo el enfoque en los observables de Bruno de Finetti. . [ cita necesaria ]

Distribución normal

Dada una muestra de una distribución normal , cuyos parámetros se desconocen, es posible dar intervalos de predicción en el sentido frecuentista, es decir, un intervalo [ ab ] basado en estadísticas de la muestra tal que en experimentos repetidos, X n +1 cae en el intervalo el porcentaje de tiempo deseado; A estos se les puede llamar " intervalos de confianza predictivos ". [1]

Una técnica general de intervalos de predicción frecuentista es encontrar y calcular una cantidad fundamental de los observables X 1 , ...,  X nX n +1 , es decir, una función de observables y parámetros cuya distribución de probabilidad no depende de los parámetros. que se puede invertir para dar una probabilidad de que la observación futura X n +1 caiga en algún intervalo calculado en términos de los valores observados hasta el momento. Esta cantidad fundamental, que depende sólo de los observables, se denomina estadística auxiliar . [2] El método habitual para construir cantidades fundamentales es tomar la diferencia de dos variables que dependen de la ubicación, de modo que la ubicación se cancele, y luego tomar la razón de dos variables que dependen de la escala, de modo que la escala se cancele. La cantidad fundamental más familiar es el estadístico t de Student , que puede derivarse mediante este método y se utiliza en la secuela.

Media conocida, varianza conocida

Se puede calcular un intervalo de predicción [ , u ] para una observación futura X en una distribución normal N ( µ , σ 2 ) con media y varianza conocidas a partir de

donde , la puntuación estándar de X , se distribuye como normal estándar.

Por eso

o

siendo z el cuantil en la distribución normal estándar para el cual:

o equivalente;

Intervalo de predicción (en el eje y ) dado a partir de z (el cuantil de la puntuación estándar , en el eje x ). El eje y está comprimido logarítmicamente (pero los valores que contiene no se modifican).

El intervalo de predicción se escribe convencionalmente como:

Por ejemplo, para calcular el intervalo de predicción del 95 % para una distribución normal con una media ( µ ) de 5 y una desviación estándar ( σ ) de 1, entonces z es aproximadamente 2. Por lo tanto, el límite inferior del intervalo de predicción es aproximadamente 5 ‒ (2·1) ​​= 3, y el límite superior es aproximadamente 5 + (2·1) ​​= 7, dando así un intervalo de predicción de aproximadamente 3 a 7.

Diagrama que muestra la función de distribución acumulativa para la distribución normal con media ( µ ) 0 y varianza ( σ 2 ) 1. Además de la función cuantil , el intervalo de predicción para cualquier puntuación estándar se puede calcular mediante (1 − (1 −  Φ µ , σ 2 (puntuación estándar))·2). Por ejemplo, una puntuación estándar de x  = 1,96 da Φ µ , σ 2 (1,96) = 0,9750 correspondiente a un intervalo de predicción de (1 − (1 − 0,9750)·2) = 0,9500 = 95%.

Estimación de parámetros

Para una distribución con parámetros desconocidos, un enfoque directo para la predicción es estimar los parámetros y luego usar la función cuantil asociada; por ejemplo, se podría usar la media muestral como estimación de μ y la varianza muestral s 2 como estimación de σ 2. . Aquí hay dos opciones naturales para s 2 : dividir por produce una estimación insesgada, mientras que dividir por n produce el estimador de máxima verosimilitud , y cualquiera de los dos podría usarse. Luego se utiliza la función cuantil con estos parámetros estimados para dar un intervalo de predicción.

Este enfoque es utilizable, pero el intervalo resultante no tendrá la interpretación de muestreo repetido [4] ; no es un intervalo de confianza predictivo.

Para la secuela, utilice la media muestral:

y la varianza muestral (insesgada):

Media desconocida, varianza conocida

Dada [5] una distribución normal con media μ desconocida pero varianza conocida 1, la media muestral de las observaciones tiene distribución mientras que la observación futura tiene distribución. Al tomar la diferencia de estas se cancela μ y se obtiene una distribución normal de varianza .

Al resolver se obtiene la distribución de predicción a partir de la cual se pueden calcular intervalos como antes. Este es un intervalo de confianza predictivo en el sentido de que si se utiliza un rango de cuantiles de 100 p %, entonces, en aplicaciones repetidas de este cálculo, la observación futura caerá en el intervalo predicho el 100 p % de las veces.

Observe que esta distribución de predicción es más conservadora que usar la media estimada y la varianza conocida 1, ya que usa la varianza y , por lo tanto, produce intervalos más amplios. Esto es necesario para que se cumpla la propiedad del intervalo de confianza deseada.

Media conocida, varianza desconocida

Por el contrario, dada una distribución normal con media conocida 0 pero varianza desconocida , la varianza muestral de las observaciones tiene, a escala, una distribución ; más precisamente:

mientras que la observación futura tiene distribución. Al tomar la relación entre la observación futura y la desviación estándar de la muestra [ se necesita aclaración ] se cancela σ, lo que produce una distribución t de Student con n  – 1 grados de libertad :

Al resolver se obtiene la distribución de predicción a partir de la cual se pueden calcular intervalos como antes.

Observe que esta distribución de predicción es más conservadora que usar una distribución normal con la desviación estándar estimada y la media conocida 0, ya que usa la distribución t en lugar de la distribución normal, por lo que produce intervalos más amplios. Esto es necesario para que se cumpla la propiedad del intervalo de confianza deseada.

Media desconocida, varianza desconocida

Combinando lo anterior para una distribución normal con μ y σ 2 desconocidas se obtiene la siguiente estadística auxiliar: [6]

Esta combinación simple es posible porque la media muestral y la varianza muestral de la distribución normal son estadísticas independientes; esto sólo es cierto para la distribución normal y, de hecho, caracteriza la distribución normal.

Resolver produce la distribución de predicción.

La probabilidad de caer en un intervalo dado es entonces:

donde T a es el percentil 100((1 −  p )/2) de la distribución t de Student con n  − 1 grados de libertad. Por lo tanto, los números

son los puntos finales de un intervalo de predicción del 100(1 −  p )% para .

Métodos no paramétricos

Se pueden calcular intervalos de predicción sin realizar suposiciones sobre la población, es decir, de forma no paramétrica .

El método de arranque residual se puede utilizar para construir intervalos de predicción no paramétricos.

Predicción conforme

En general, el método de predicción conforme es más general. Veamos el caso especial de utilizar el mínimo y el máximo como límites para un intervalo de predicción: si uno tiene una muestra de variables aleatorias idénticas { X 1 , ...,  X n }, entonces la probabilidad de que la siguiente observación X n +1 será el mayor es 1/( n  + 1), ya que todas las observaciones tienen la misma probabilidad de ser máximas. De la misma manera, la probabilidad de que X n +1 sea el más pequeño es 1/( n  + 1). El otro ( n  − 1)/( n  + 1) del tiempo, X n +1 cae entre el máximo de muestra y el mínimo de muestra de la muestra { X 1 , ...,  X n }. Por lo tanto, al denotar el máximo y el mínimo de la muestra mediante M y m, se obtiene un  intervalo de predicción ( n  − 1)/( n + 1) de [ mM ].

Tenga en cuenta que si bien esto da la probabilidad de que una observación futura caiga dentro de un rango, no proporciona ninguna estimación sobre en qué parte de un segmento caerá; en particular, si cae fuera del rango de valores observados, puede estar muy fuera del rango. el rango. Consulte la teoría del valor extremo para obtener más información. Formalmente, esto se aplica no sólo al muestreo de una población, sino a cualquier secuencia intercambiable de variables aleatorias, no necesariamente independientes o distribuidas de manera idéntica .

Contraste con otros intervalos

Contraste con intervalos de confianza

En la fórmula para el intervalo de confianza predictivo no se hace mención de los parámetros no observables μ y σ de la media poblacional y la desviación estándar; se utilizan las estadísticas de la muestra observada y la media y la desviación estándar de la muestra, y lo que se estima es el resultado de muestras futuras . .

En lugar de utilizar estadísticas muestrales como estimadores de parámetros poblacionales y aplicar intervalos de confianza a estas estimaciones, se considera "la siguiente muestra" como una estadística en sí misma y se calcula su distribución muestral .

En los intervalos de confianza de los parámetros, se estiman los parámetros poblacionales; Si se desea interpretar esto como una predicción de la siguiente muestra, se modela "la siguiente muestra" como una extracción de esta población estimada, utilizando la distribución de la población (estimada) . Por el contrario, en los intervalos de confianza predictivos, se utiliza la distribución muestral de (una estadística de) una muestra de n o n  + 1 observaciones de dicha población, y la distribución de la población no se utiliza directamente, aunque el supuesto sobre su forma (aunque no los valores de sus parámetros) se utiliza para calcular la distribución muestral.

En análisis de regresión

Una aplicación común de los intervalos de predicción es el análisis de regresión .

Supongamos que los datos se modelan mediante una regresión en línea recta:

donde es la variable respuesta , es la variable explicativa , ε i es un término de error aleatorio y y son parámetros.

Dadas las estimaciones y para los parámetros, como los de una regresión lineal simple , el valor de respuesta previsto y d para un valor explicativo dado x d es

(el punto en la línea de regresión), mientras que la respuesta real sería

La estimación puntual se llama respuesta media y es una estimación del valor esperado de y d ,

En cambio, un intervalo de predicción proporciona un intervalo en el que se espera que y d caiga; Esto no es necesario si se conocen los parámetros reales α y β (junto con el término de error ε i ), pero si se estima a partir de una muestra , entonces se puede usar el error estándar de las estimaciones para la intercepción y la pendiente ( y ) , así como su correlación, para calcular un intervalo de predicción.

En regresión, Faraway (2002, p. 39) hace una distinción entre intervalos para predicciones de la respuesta media y para predicciones de la respuesta observada, lo que afecta esencialmente la inclusión o no del término de unidad dentro de la raíz cuadrada en los factores de expansión anteriores; para más detalles, véase Faraway (2002).

Estadísticas bayesianas

Seymour Geisser , defensor de la inferencia predictiva, ofrece aplicaciones predictivas de la estadística bayesiana . [7]

En la estadística bayesiana, se pueden calcular intervalos de predicción (bayesianos) a partir de la probabilidad posterior de la variable aleatoria, como un intervalo creíble . En el trabajo teórico, los intervalos creíbles no suelen calcularse para la predicción de eventos futuros, sino para la inferencia de parámetros; es decir, intervalos creíbles de un parámetro, no para los resultados de la variable en sí. Sin embargo, particularmente cuando las aplicaciones se refieren a posibles valores extremos de casos aún por observar, los intervalos creíbles para tales valores pueden ser de importancia práctica.

Aplicaciones

Los intervalos de predicción se utilizan comúnmente como definiciones de rangos de referencia , como los rangos de referencia de los análisis de sangre para dar una idea de si un análisis de sangre es normal o no. Para este propósito, el intervalo de predicción más comúnmente utilizado es el intervalo de predicción del 95%, y un rango de referencia basado en él puede denominarse rango de referencia estándar .

Ver también

Notas

  1. ^ Geisser (1993, p. 6): Capítulo 2: Enfoques predictivos no bayesianos
  2. ^ Geisser (1993, pág.7)
  3. ^ abcd Tabla A2 en Sterne & Kirkwood (2003, p.472)
  4. ^ Geisser (1993, págs. 8-9)
  5. ^ Geisser (1993, pág. 7–)
  6. ^ Geisser (1993, ejemplo 2.2, págs. 9-10)
  7. ^ Geisser (1993)

Referencias

Otras lecturas