Método de Newman-Keuls

El método de Newman-Keuls o Student-Newman-Keuls (SNK) es un procedimiento de comparaciones múltiples por pasos que se utiliza para identificar medias de muestra que son significativamente diferentes entre sí. ^[1] Debe su nombre a Student (1927), ^[2] D. Newman, ^[3] y M. Keuls. ^[4] Este procedimiento se utiliza a menudo como prueba post-hoc siempre que se haya revelado una diferencia significativa entre tres o más medias de muestra mediante un análisis de varianza (ANOVA) . ^[1] El método de Newman-Keuls es similar a la prueba de rango de Tukey , ya que ambos procedimientos utilizan estadísticas de rango estudentizadas . ^[5]^[6] A diferencia de la prueba de rango de Tukey, el método de Newman-Keuls utiliza diferentes valores críticos para diferentes pares de comparaciones de medias. Por lo tanto, es más probable que el procedimiento revele diferencias significativas entre las medias de los grupos y cometa errores de tipo I al rechazar incorrectamente una hipótesis nula cuando es verdadera. En otras palabras, el procedimiento de Neuman-Keuls es más potente pero menos conservador que la prueba de rango de Tukey. ^[6]^[7]

Historia y control de la tasa de error tipo I

El método de Newman-Keuls fue introducido por Newman en 1939 y desarrollado por Keuls en 1952. Esto fue antes de que Tukey presentara varias definiciones de tasas de error (1952a, ^[8] 1952b, ^[9] 1953 ^[10] ). El método de Newman-Keuls controla la tasa de error familiar (FWER) en el sentido débil pero no en el sentido fuerte: ^[11]^[12] el procedimiento de Newman-Keuls controla el riesgo de rechazar la hipótesis nula si todas las medias son iguales (hipótesis nula global) pero no controla el riesgo de rechazar hipótesis nulas parciales. Por ejemplo, cuando se comparan cuatro medias, bajo la hipótesis nula parcial de que μ1=μ2 y μ3=μ4=μ+delta con un delta distinto de cero, el procedimiento de Newman-Keuls tiene una probabilidad mayor que alfa de rechazar μ1=μ2 o μ3=μ4 o ambos. En ese ejemplo, si delta es muy grande, el procedimiento de Newman-Keuls es casi equivalente a dos pruebas t de Student que prueban μ1=μ2 y μ3=μ4 con una tasa de error tipo I nominal alfa, sin procedimiento de prueba múltiple; por lo tanto, el FWER casi se duplica. ^[11] En el peor de los casos, la FWER del procedimiento de Newman–Keuls es 1-(1-alpha)^int(J/2) donde int(J/2) representa la parte entera del número total de grupos dividido por 2. ^[12] Por lo tanto, con dos o tres grupos, el procedimiento de Newman–Keuls tiene un fuerte control sobre la FWER pero no para cuatro grupos o más. En 1995, Benjamini y Hochberg presentaron un criterio nuevo, más liberal y más poderoso para ese tipo de problemas: el control de la tasa de falsos descubrimientos (FDR). ^[13] En 2006, Shaffer demostró (mediante una simulación exhaustiva) que el método de Newman–Keuls controla la FDR con algunas restricciones. ^[14]

Supuestos obligatorios

Los supuestos de la prueba de Newman-Keuls son esencialmente los mismos que los de una prueba t de grupos independientes : normalidad , homogeneidad de varianza y observaciones independientes . La prueba es bastante robusta a las violaciones de la normalidad. Violar la homogeneidad de varianza puede ser más problemático que en el caso de dos muestras, ya que el MSE se basa en datos de todos los grupos. El supuesto de independencia de las observaciones es importante y no debe violarse.

Procedimientos

El método de Newman-Keuls emplea un enfoque por pasos al comparar las medias de las muestras. ^[15] Antes de cualquier comparación de medias, todas las medias de las muestras se ordenan por rango en orden ascendente o descendente, produciendo así un rango ordenado ( p ) de medias de las muestras. ^[1]^[15] Luego se hace una comparación entre las medias de las muestras más grande y más pequeña dentro del rango más grande. ^[15] Suponiendo que el rango más grande es de cuatro medias (o p = 4), una diferencia significativa entre las medias más grande y más pequeña como lo revela el método de Newman-Keuls resultaría en un rechazo de la hipótesis nula para ese rango específico de medias. La siguiente comparación más grande de dos medias de muestra se haría entonces dentro de un rango más pequeño de tres medias (o p = 3). A menos que no haya diferencias significativas entre dos medias de muestra dentro de un rango dado, esta comparación por pasos de las medias de muestra continuará hasta que se haga una comparación final con el rango más pequeño de solo dos medias. Si no hay una diferencia significativa entre las dos medias de muestra, entonces se conservarán todas las hipótesis nulas dentro de ese rango y no serán necesarias más comparaciones dentro de rangos más pequeños.

Para determinar si existe una diferencia significativa entre dos medias con tamaños de muestra iguales, el método de Newman-Keuls utiliza una fórmula idéntica a la utilizada en la prueba de rango de Tukey , que calcula el valor q tomando la diferencia entre dos medias de muestra y dividiéndola por el error estándar:

q={\frac {{\bar {X}}_{A}-{\bar {X}}_{B}}{\sqrt {\frac {MSE}{n}}}},

donde representa el valor del rango estudentizado , y son las medias de muestra más grande y más pequeña dentro de un rango, es la varianza del error tomada de la tabla ANOVA, y es el tamaño de la muestra (número de observaciones dentro de una muestra). Si se hacen comparaciones con medias de tamaños de muestra desiguales ( ), entonces la fórmula de Newman–Keuls se ajustaría de la siguiente manera: ${\estilo de visualización q}$ ${\bar {X}}_{A}$ ${\bar {X}}_{B}$ ${\estilo de visualización MSE}$ ${\estilo de visualización n}$ $Estilo de visualización: {n_{A}}\neq {n_{B}}}$

q={\frac {{\bar {X}}_{A}-{\bar {X}}_{B}}{\sqrt {{\frac {MSE}{2}}({\frac {1}{n_{A}}}+{\frac {1}{n_{B}}})}}},

donde y representan los tamaños de muestra de las dos medias muestrales. En ambos casos, el error cuadrático medio ( MSE ) se obtiene del ANOVA realizado en la primera etapa del análisis. $estilo de visualización n_{A}$ $estilo de visualización n_{B}$

Una vez calculado, el valor q calculado se puede comparar con un valor crítico q (o ), que se puede encontrar en una tabla de distribución q basada en el nivel de significancia ( ), los grados de libertad del error ( ) de la tabla ANOVA y el rango ( ) de medias de muestra a probar. ^[16] Si el valor q calculado es igual o mayor que el valor crítico q , entonces la hipótesis nula ( H ₀ : μ _A = μ _B ) para ese rango específico de medias se puede rechazar. ^[16] Debido a que el número de medias dentro de un rango cambia con cada comparación sucesiva por pares, el valor crítico de la estadística q también cambia con cada comparación, lo que hace que el método de Neuman-Keuls sea más indulgente y, por lo tanto, más poderoso que la prueba de rango de Tukey. Por lo tanto, si se encontró que una comparación por pares era significativamente diferente utilizando el método de Newman-Keuls, puede que no necesariamente sea significativamente diferente cuando se analiza con la prueba de rango de Tukey. ^[7]^[16] Por el contrario, si se encontró que la comparación por pares no era significativamente diferente utilizando el método de Newman-Keuls, tampoco puede ser significativamente diferente con la prueba de rango de Tukey. ^[7] $q_{\alpha }\,_{\nu }\,_{p}$ $\alpha$ $\nu$ $p$

Limitaciones

El procedimiento de Newman-Keuls no puede producir un intervalo de confianza para cada diferencia de medias, o para valores p exactos ajustados por multiplicidad debido a su naturaleza secuencial. ^{[ cita requerida ]} Los resultados son algo difíciles de interpretar ya que es difícil articular cuáles son las hipótesis nulas que se probaron. ^{[ cita requerida ]}

Véase también

Referencias

^ abc De Muth, James E. (2006). Estadística básica y aplicaciones estadísticas farmacéuticas (2.ª ed.). Boca Raton, FL: Chapman and Hall/CRC. págs. 229–259. ISBN 978-0-8493-3799-4.
^ Student (1927). "Errores del análisis de rutina". Biometrika . 19 (1/2): 151–164. doi :10.2307/2332181. JSTOR 2332181.
^ Newman, D. (1939). "La distribución del rango en muestras de una población normal, expresada en términos de una estimación independiente de la desviación estándar". Biometrika . 31 (1): 20–30. doi :10.1093/biomet/31.1-2.20.
^ Keuls, M. (1952). "El uso del "rango studentizado" en relación con un análisis de varianza" (PDF) . Euphytica . 1 (2): 112–122. doi :10.1007/bf01908269. S2CID 19365087. Archivado desde el original (PDF) el 2014-11-04.
^ Broota, KD (1989). Diseño experimental en la investigación del comportamiento (1.ª ed.). Nueva Delhi, India: New Age International (P) Ltd., págs. 81-96. ISBN 978-81-224-0215-5.
^ ab Sheskin, David J. (1989). Manual de procedimientos estadísticos paramétricos y no paramétricos (3.ª ed.). Boca Raton, FL: CRC Press. pp. 665–756. ISBN 978-1-58488-440-8.
^ abc Roberts, Maxwell; Russo, Riccardo (1999). "Seguimiento de un ANOVA de un factor entre sujetos". Guía del estudiante para el análisis de varianza . Filey, Reino Unido: J&L Composition Ltd., págs. 82-109. ISBN 978-0-415-16564-8.
^ Tukey, JW (1952a). "Hojas recordatorias para tolerancias para varios tipos de tasas de error. Manuscrito inédito". Brown, 1984 .
^ Tukey, JW (1952b). "Hojas recordatorias para comparaciones múltiples. Manuscrito inédito". Brown, 1984 .
^ Tukey, JW (1953). "El problema de las comparaciones múltiples. Manuscrito inédito". Brown, 1984 .
^ ab Proschan, Michael A.; Brittain, Erica H. (30 de abril de 2020). "Una introducción al control fuerte y débil de la tasa de error familiar". Estadísticas en Medicina . 39 (9): 1407–1413. doi :10.1002/sim.8463. ISSN 0277-6715. PMID 32106332. S2CID 211556180.
^ ab Keselman, HJ; Keselman, Joanne C.; Games, Paul A. (1991). "Tasa máxima de error de tipo I por familia: la diferencia menos significativa, Newman-Keuls y otros procedimientos de comparación múltiple". Psychological Bulletin . 110 (1): 155–161. doi :10.1037/0033-2909.110.1.155. ISSN 0033-2909.
^ Benjamini, Y., Hochberg, Y. (1995). "Control de la tasa de descubrimientos falsos: un nuevo y poderoso enfoque para pruebas múltiples" (PDF) . Revista de la Royal Statistical Society. Serie B (Metodológica) . 57 (1): 289–300. doi :10.1111/j.2517-6161.1995.tb02031.x. JSTOR 2346101.{{cite journal}}: CS1 maint: multiple names: authors list (link)
^ Shaffer, Juliet P (2007). "Control de la tasa de descubrimientos falsos con restricciones: la prueba de Newman-Keuls revisada". Biometrical Journal . 49 (1): 136–143. doi :10.1002/bimj.200610297. PMID 17342955. S2CID 32625652.
^ abc Toothaker, Larry E. (1993). Procedimientos de comparación múltiple (aplicaciones cuantitativas en las ciencias sociales) (2.ª ed.). Newburry Park, CA: Chapman and Hall/CRC. págs. 27–45. ISBN 978-0-8039-4177-9.
^ abc Zar, Jerrold H. (1999). Análisis bioestadístico (4.ª ed.). Newburry Park, CA: Prentice Hall. pp. 208–230. ISBN 978-0-13-081542-2.