stringtranslate.com

Prueba F de igualdad de varianzas

En estadística, una prueba F de igualdad de varianzas es una prueba para la hipótesis nula de que dos poblaciones normales tienen la misma varianza . En teoría, cualquier prueba F puede considerarse como una comparación de dos varianzas, pero el caso específico que se analiza en este artículo es el de dos poblaciones, donde la estadística de prueba utilizada es la relación de dos varianzas de muestra . [1] Esta situación particular es importante en estadística matemática ya que proporciona un caso ejemplar básico en el que se puede derivar la distribución F. [2] Para la aplicación en estadística aplicada , existe la preocupación [3] de que la prueba sea tan sensible al supuesto de normalidad que no sería aconsejable utilizarla como una prueba rutinaria para la igualdad de varianzas. En otras palabras, este es un caso en el que la "normalidad aproximada" (que en contextos similares a menudo se justificaría utilizando el teorema del límite central ), no es lo suficientemente buena como para hacer que el procedimiento de prueba sea aproximadamente válido en un grado aceptable.

La prueba

Sean X 1 , ...,  X n e Y 1 , ...,  Y m muestras independientes e idénticamente distribuidas de dos poblaciones que tienen cada una una distribución normal . Los valores esperados para las dos poblaciones pueden ser diferentes, y la hipótesis a probar es que las varianzas son iguales. Sea

sea ​​la media muestral . Sea

sean las varianzas de la muestra . Entonces, la estadística de prueba

tiene una distribución F con n  − 1 y m  − 1 grados de libertad si la hipótesis nula de igualdad de varianzas es verdadera. De lo contrario, sigue una distribución F escalada por la razón de varianzas verdaderas. La hipótesis nula se rechaza si F es demasiado grande o demasiado pequeña en función del nivel alfa deseado (es decir, significancia estadística ).

Propiedades

Se sabe que esta prueba F es extremadamente sensible a la no normalidad , [4] [5] por lo que la prueba de Levene , la prueba de Bartlett o la prueba de Brown-Forsythe son mejores pruebas para probar la igualdad de dos varianzas. (Sin embargo, todas estas pruebas crean inflaciones de error de tipo I experimentales cuando se realizan como una prueba del supuesto de homocedasticidad antes de una prueba de efectos. [6] ) Las pruebas F para la igualdad de varianzas se pueden utilizar en la práctica, con cuidado, particularmente cuando se requiere una verificación rápida, y sujetas a la verificación diagnóstica asociada: los libros de texto prácticos [7] sugieren verificaciones tanto gráficas como formales del supuesto.

Las pruebas F se utilizan para otras pruebas estadísticas de hipótesis , como la prueba de diferencias en las medias en tres o más grupos, o en diseños factoriales. Estas pruebas F generalmente no son robustas cuando hay violaciones del supuesto de que cada población sigue la distribución normal , particularmente para niveles alfa pequeños y diseños desequilibrados. [8] Sin embargo, para niveles alfa grandes (por ejemplo, al menos 0,05) y diseños equilibrados, la prueba F es relativamente robusta, aunque (si el supuesto de normalidad no se cumple) sufre una pérdida de poder estadístico comparativo en comparación con sus contrapartes no paramétricas.

Generalización

La generalización inmediata del problema descrito anteriormente se aplica a situaciones en las que hay más de dos grupos o poblaciones y la hipótesis es que todas las varianzas son iguales. Este es el problema que se trata con la prueba de Hartley y la prueba de Bartlett .

Véase también

Referencias

  1. ^ Snedecor, George W. y Cochran, William G. (1989), Métodos estadísticos, octava edición, Iowa State University Press.
  2. ^ Johnson, NL, Kotz, S., Balakrishnan, N. (1995) Distribuciones univariadas continuas, volumen 2 , Wiley. ISBN  0-471-58494-0 (Sección 27.1)
  3. ^ Agresti, A. y Kateri, M. (2021), Fundamentos de estadística para científicos de datos: con R y Python, CRC Press. ISBN 978-0-367-74845-6 (Sección 5.3.2) 
  4. ^ Box, GEP (1953). "No normalidad y pruebas de varianzas". Biometrika . 40 (3/4): 318–335. doi :10.1093/biomet/40.3-4.318. JSTOR  2333350.
  5. ^ Markowski, Carol A; Markowski, Edward P. (1990). "Condiciones para la efectividad de una prueba preliminar de varianza". The American Statistician . 44 (4): 322–326. doi :10.2307/2684360. JSTOR  2684360.
  6. ^ Sawilowsky, S. (2002). "Fermat, Schubert, Einstein y Behrens–Fisher: La diferencia probable entre dos medias cuando σ12 ≠ σ22", Journal of Modern Applied Statistical Methods , 1 (2), 461–472.
  7. ^ Rees, DG (2001) Essential Statistics (4.ª edición) , Chapman & Hall/CRC, ISBN 1-58488-007-4 . Sección 10.15 
  8. ^ Blair, RC (1981). "Una reacción a 'Consecuencias del incumplimiento de los supuestos subyacentes al análisis de efectos fijos de varianza y covarianza'". Revista de Investigación Educativa . 51 (4): 499–507. doi :10.3102/00346543051004499. S2CID  121873115.