stringtranslate.com

Procedimiento de trabajo-Hotelling

En estadística , particularmente en análisis de regresión , el procedimiento Working-Hotelling , llamado así por Holbrook Working y Harold Hotelling , es un método de estimación simultánea en modelos de regresión lineal . Uno de los primeros desarrollos en inferencia simultánea , fue ideado por Working y Hotelling para el modelo de regresión lineal simple en 1929. [1] Proporciona una región de confianza para respuestas de media múltiple, es decir, da los límites superior e inferior de más de un valor de una variable dependiente en varios niveles de las variables independientes en un cierto nivel de confianza . Las bandas de confianza resultantes se conocen como bandas de confianza de Working-Hotelling-Scheffé .

Al igual que el método de Scheffé, estrechamente relacionado con el método de análisis de varianza , que considera todos los contrastes posibles , el procedimiento de Working-Hotelling considera todos los valores posibles de las variables independientes; es decir, en un modelo de regresión particular, la probabilidad de que todos los intervalos de confianza de Working-Hotelling cubran el valor verdadero de la respuesta media es el coeficiente de confianza . Como tal, cuando solo se considera un pequeño subconjunto de los valores posibles de la variable independiente, es más conservador y produce intervalos más amplios que competidores como la corrección de Bonferroni en el mismo nivel de confianza. Supera a la corrección de Bonferroni a medida que se consideran más valores.

Declaración

Regresión lineal simple

Consideremos un modelo de regresión lineal simple , donde es la variable de respuesta y la variable explicativa, y sean y las estimaciones de mínimos cuadrados de y respectivamente. Entonces, la estimación de mínimos cuadrados de la respuesta media en el nivel es . Se puede demostrar entonces , suponiendo que los errores siguen de manera independiente e idéntica la distribución normal , que un intervalo de confianza de la respuesta media en un cierto nivel de es el siguiente:

donde es el error cuadrático medio y denota el percentil superior de la distribución t de Student con grados de libertad .

Sin embargo, como se estiman múltiples respuestas medias, el nivel de confianza disminuye rápidamente. Para fijar el coeficiente de confianza en , el método Working-Hotelling emplea una estadística F: [2] [3]

donde y denota el percentil superior de la distribución F con grados de libertad. El nivel de confianza de es sobre todos los valores de , es decir .

Regresión lineal múltiple

Las bandas de confianza de Working-Hotelling se pueden generalizar fácilmente a la regresión lineal múltiple. Considere un modelo lineal general como se define en el artículo sobre regresiones lineales , es decir,

dónde

Nuevamente, se puede demostrar que la estimación de mínimos cuadrados de la respuesta media es , donde consiste en estimaciones de mínimos cuadrados de las entradas en , es decir . Asimismo, se puede demostrar que un intervalo de confianza para una única estimación de respuesta media es el siguiente: [4]

donde es el valor observado del error cuadrático medio .

El enfoque de Working-Hotelling para estimaciones múltiples es similar al de la regresión lineal simple, con solo un cambio en los grados de libertad: [3]

dónde .

Representación gráfica

En el caso de regresión lineal simple, las bandas de confianza de Working–Hotelling–Scheffé , dibujadas conectando los límites superior e inferior de la respuesta media en cada nivel, toman la forma de hipérbolas . Al dibujarlas, a veces se las aproxima mediante las bandas de confianza de Graybill–Bowden, que son lineales y, por lo tanto, más fáciles de graficar: [2]

donde denota el percentil superior de la distribución del módulo máximo estudentizado con dos medias y grados de libertad.

El modelo de regresión lineal simple con una banda de confianza de Working-Hotelling.

Ejemplo numérico

En este ejemplo se utilizan los mismos datos de mínimos cuadrados ordinarios :

A estos datos se les ajustó un modelo de regresión lineal simple. Se encontró que los valores de y son −39,06 y 61,27 respectivamente. El objetivo es estimar la masa media de las mujeres dadas sus alturas con un nivel de confianza del 95 %. Se encontró que el valor de es . También se encontró que , , y . Luego, para predecir la masa media de todas las mujeres de una altura particular, se derivó la siguiente banda de Working–Hotelling–Scheffé:

Lo que da como resultado el gráfico de la izquierda.

Comparación con otros métodos

Bandas de Bonferroni para el mismo modelo de regresión lineal, basadas en la estimación de la variable respuesta dados los valores observados de X. Las bandas de confianza son notablemente más estrechas.

El método Working-Hotelling puede dar límites de confianza más estrictos o más laxos en comparación con la corrección de Bonferroni . En general, para familias pequeñas de afirmaciones, los límites de Bonferroni pueden ser más estrictos, pero cuando aumenta el número de valores estimados, el procedimiento Working-Hotelling producirá límites más estrechos. Esto se debe a que el nivel de confianza de los límites Working-Hotelling-Scheffé es exactamente cuando se consideran todos los valores de las variables independientes, es decir . Alternativamente, desde una perspectiva algebraica, el valor crítico permanece constante a medida que aumenta el número de estimaciones de , mientras que los valores correspondientes en las estimaciones de Bonferonni, , serán cada vez más divergentes a medida que aumenta el número de estimaciones. Por lo tanto, el método Working-Hotelling es más adecuado para comparaciones a gran escala, mientras que Bonferroni es el preferido si solo se deben estimar unas pocas respuestas medias. En la práctica, generalmente se utilizan primero ambos métodos y se elige el intervalo más estrecho. [4]

Otra alternativa a la banda de Working–Hotelling–Scheffé es la banda de Gavarian, que se utiliza cuando se necesita una banda de confianza que mantenga anchos iguales en todos los niveles. [5]

El procedimiento Working-Hotelling se basa en los mismos principios que el método de Scheffé , que proporciona intervalos de confianza familiares para todos los contrastes posibles . [6] Sus pruebas son casi idénticas. [5] Esto se debe a que ambos métodos estiman combinaciones lineales de la respuesta media en todos los niveles de los factores. Sin embargo, el procedimiento Working-Hotelling no trata con contrastes sino con diferentes niveles de la variable independiente, por lo que no hay ningún requisito de que los coeficientes de los parámetros sumen cero. Por lo tanto, tiene un grado más de libertad. [6]

Véase también

Notas al pie

  1. ^ Miller (1966), pág. 1
  2. ^Por Miller (2014)
  3. ^ de Neter, Wasserman y Kutner, págs. 163-165
  4. ^ de Neter, Wasserman y Kutner, págs. 244-245
  5. ^ de Miller (1966), págs. 123-127
  6. ^ ab Westfall, Tobias y Wolfinger, págs. 277–280

Bibliografía