Al igual que el método de Scheffé, estrechamente relacionado con el método de análisis de varianza , que considera todos los contrastes posibles , el procedimiento de Working-Hotelling considera todos los valores posibles de las variables independientes; es decir, en un modelo de regresión particular, la probabilidad de que todos los intervalos de confianza de Working-Hotelling cubran el valor verdadero de la respuesta media es el coeficiente de confianza . Como tal, cuando solo se considera un pequeño subconjunto de los valores posibles de la variable independiente, es más conservador y produce intervalos más amplios que competidores como la corrección de Bonferroni en el mismo nivel de confianza. Supera a la corrección de Bonferroni a medida que se consideran más valores.
Declaración
Regresión lineal simple
Consideremos un modelo de regresión lineal simple , donde es la variable de respuesta y la variable explicativa, y sean y las estimaciones de mínimos cuadrados de y respectivamente. Entonces, la estimación de mínimos cuadrados de la respuesta media en el nivel es . Se puede demostrar entonces , suponiendo que los errores siguen de manera independiente e idéntica la distribución normal , que un intervalo de confianza de la respuesta media en un cierto nivel de es el siguiente:
Sin embargo, como se estiman múltiples respuestas medias, el nivel de confianza disminuye rápidamente. Para fijar el coeficiente de confianza en , el método Working-Hotelling emplea una estadística F: [2] [3]
donde y denota el percentil superior de la distribución F con grados de libertad. El nivel de confianza de es sobre todos los valores de , es decir .
Regresión lineal múltiple
Las bandas de confianza de Working-Hotelling se pueden generalizar fácilmente a la regresión lineal múltiple. Considere un modelo lineal general como se define en el artículo sobre regresiones lineales , es decir,
dónde
Nuevamente, se puede demostrar que la estimación de mínimos cuadrados de la respuesta media es , donde consiste en estimaciones de mínimos cuadrados de las entradas en , es decir . Asimismo, se puede demostrar que un intervalo de confianza para una única estimación de respuesta media es el siguiente: [4]
donde es el valor observado del error cuadrático medio .
El enfoque de Working-Hotelling para estimaciones múltiples es similar al de la regresión lineal simple, con solo un cambio en los grados de libertad: [3]
dónde .
Representación gráfica
En el caso de regresión lineal simple, las bandas de confianza de Working–Hotelling–Scheffé , dibujadas conectando los límites superior e inferior de la respuesta media en cada nivel, toman la forma de hipérbolas . Al dibujarlas, a veces se las aproxima mediante las bandas de confianza de Graybill–Bowden, que son lineales y, por lo tanto, más fáciles de graficar: [2]
donde denota el percentil superior de la distribución del módulo máximo estudentizado con dos medias y grados de libertad.
A estos datos se les ajustó un modelo de regresión lineal simple. Se encontró que los valores de y son −39,06 y 61,27 respectivamente. El objetivo es estimar la masa media de las mujeres dadas sus alturas con un nivel de confianza del 95 %. Se encontró que el valor de es . También se encontró que , , y . Luego, para predecir la masa media de todas las mujeres de una altura particular, se derivó la siguiente banda de Working–Hotelling–Scheffé:
Lo que da como resultado el gráfico de la izquierda.
Comparación con otros métodos
El método Working-Hotelling puede dar límites de confianza más estrictos o más laxos en comparación con la corrección de Bonferroni . En general, para familias pequeñas de afirmaciones, los límites de Bonferroni pueden ser más estrictos, pero cuando aumenta el número de valores estimados, el procedimiento Working-Hotelling producirá límites más estrechos. Esto se debe a que el nivel de confianza de los límites Working-Hotelling-Scheffé es exactamente cuando se consideran todos los valores de las variables independientes, es decir . Alternativamente, desde una perspectiva algebraica, el valor crítico permanece constante a medida que aumenta el número de estimaciones de , mientras que los valores correspondientes en las estimaciones de Bonferonni, , serán cada vez más divergentes a medida que aumenta el número de estimaciones. Por lo tanto, el método Working-Hotelling es más adecuado para comparaciones a gran escala, mientras que Bonferroni es el preferido si solo se deben estimar unas pocas respuestas medias. En la práctica, generalmente se utilizan primero ambos métodos y se elige el intervalo más estrecho. [4]
Otra alternativa a la banda de Working–Hotelling–Scheffé es la banda de Gavarian, que se utiliza cuando se necesita una banda de confianza que mantenga anchos iguales en todos los niveles. [5]
El procedimiento Working-Hotelling se basa en los mismos principios que el método de Scheffé , que proporciona intervalos de confianza familiares para todos los contrastes posibles . [6] Sus pruebas son casi idénticas. [5] Esto se debe a que ambos métodos estiman combinaciones lineales de la respuesta media en todos los niveles de los factores. Sin embargo, el procedimiento Working-Hotelling no trata con contrastes sino con diferentes niveles de la variable independiente, por lo que no hay ningún requisito de que los coeficientes de los parámetros sumen cero. Por lo tanto, tiene un grado más de libertad. [6]
Graybill, Franklin A.; Bowden, David C. (1 de junio de 1967). "Bandas de confianza de segmentos lineales para modelos lineales simples". Revista de la Asociación Estadounidense de Estadística . 62 (318): 403–408. doi :10.1080/01621459.1967.10482917. ISSN 0162-1459.
Miller, Rupert G. (1966). Inferencia estadística simultánea . Nueva York: Springer-Verlag. ISBN 978-1-4613-8124-2.
Miller, R. (2014). "Comparaciones múltiples I". Enciclopedia de ciencias estadísticas . doi :10.1002/0471667196. hdl :11693/51057. ISBN .9780471667193.
Neter, John; Wasserman, William; Kutner, Michael (1990). Modelos estadísticos lineales aplicados . Tokio: Richard D Irwin, Inc. ISBN 978-0-256-08338-5.
Westfall, Peter H; Tobias, RD; Wolfinger, Russell Dean (2011). Comparaciones múltiples y pruebas múltiples utilizando SAS . Cary, NC: SAS Pub. ISBN 9781607648857.
Working, Holbrook; Hotelling, Harold (1929-03-01). "Aplicaciones de la teoría del error a la interpretación de tendencias". Revista de la Asociación Estadounidense de Estadística . 24 (165A): 73–85. doi :10.1080/01621459.1929.10506274. ISSN 0162-1459.