Prueba de McNemar

La prueba de McNemar es una prueba estadística utilizada en datos nominales pareados . Se aplica a tablas de contingencia 2 × 2 con un rasgo dicotómico , con pares de sujetos emparejados, para determinar si las frecuencias marginales de fila y columna son iguales (es decir, si hay " homogeneidad marginal "). Recibe su nombre en honor a Quinn McNemar , quien la introdujo en 1947. ^[1] Una aplicación de la prueba en genética es la prueba de desequilibrio de transmisión para detectar el desequilibrio de ligamiento . ^[2]

Los parámetros que se utilizan habitualmente para evaluar una prueba diagnóstica en las ciencias médicas son la sensibilidad y la especificidad . La sensibilidad (o recuerdo) es la capacidad de una prueba para identificar correctamente a las personas con la enfermedad. La especificidad es la capacidad de la prueba para identificar correctamente a las personas que no padecen la enfermedad.

Supongamos ahora que se realizan dos pruebas en el mismo grupo de pacientes y que estas pruebas tienen la misma sensibilidad y especificidad. En esta situación, uno se deja llevar por estos hallazgos y supone que ambas pruebas son equivalentes. Sin embargo, puede que no sea así. Para ello, tenemos que estudiar a los pacientes con enfermedad y a los pacientes sin enfermedad (con una prueba de referencia). También tenemos que averiguar en qué puntos estas dos pruebas difieren entre sí. Ésta es precisamente la base de la prueba de McNemar. Esta prueba compara la sensibilidad y la especificidad de dos pruebas diagnósticas en el mismo grupo de pacientes. ^[3]

Definición

La prueba se aplica a una tabla de contingencia de 2 × 2, que tabula los resultados de dos pruebas en una muestra de N sujetos, de la siguiente manera.

La hipótesis nula de homogeneidad marginal establece que las dos probabilidades marginales para cada resultado son las mismas, es decir, p _a + p _b = p _a + p _c y p _c + p _d = p _b + p _d .

Por lo tanto, las hipótesis nula y alternativa son ^[1]

{\begin{aligned}H_{0}&:~p_{b}=p_{c}\\H_{1}&:~p_{b}\neq p_{c}\end{aligned}}

Aquí p _a , etc., denotan la probabilidad teórica de ocurrencias en celdas con la etiqueta correspondiente.

La estadística de prueba de McNemar es:

\chi ^{2}={(bc)^{2} \sobre b+c}.

Bajo la hipótesis nula, con un número suficientemente grande de discordantes (celdas b y c), tiene una distribución chi-cuadrado con 1 grado de libertad . Si el resultado es significativo , esto proporciona evidencia suficiente para rechazar la hipótesis nula, a favor de la hipótesis alternativa de que p _b ≠ p _c , lo que significaría que las proporciones marginales son significativamente diferentes entre sí. $\chi ^{2}$ $\chi ^{2}$

Variaciones

Si b o c son pequeños ( b + c < 25), entonces no se aproximan bien mediante la distribución de chi-cuadrado. ^[^{cita requerida}^] Se puede utilizar entonces una prueba binomial exacta, donde b se compara con una distribución binomial con parámetro de tamaño n = b + c y p = 0,5. Efectivamente, la prueba binomial exacta evalúa el desequilibrio en los discordantes b y c . Para lograr un valor P bilateral, el valor P de la cola extrema debe multiplicarse por 2. Para b ≥ c : $\chi ^{2}$

{\text{valor P exacto}}=2\sum _{i=b}^{n}{n \choose i}0.5^{i}(1-0.5)^{ni},

que es simplemente el doble de la función de distribución acumulativa de distribución binomial con p = 0,5 y n = b + c .

Edwards ^[4] propuso la siguiente versión corregida de continuidad de la prueba de McNemar para aproximar el valor P exacto binomial:

\chi ^{2}={(|bc|-1)^{2} \sobre b+c}.

La prueba de McNemar de P medio (prueba binomial de p medio) se calcula restando la mitad de la probabilidad del b observado del valor P unilateral exacto y luego duplicándolo para obtener el valor P medio bilateral: ^[5]^[6]

{\text{valor p medio}}=2\left(\sum _{i=b}^{n}{n \choose i}0,5^{i}(1-0,5)^{ni}-0,5{n \choose b}0,5^{b}(1-0,5)^{nb}\right)

Esto es equivalente a:

{\text{valor p medio}}={\text{valor p exacto}}-{n \choose b}0,5^{b}(1-0,5)^{nb}

donde el segundo término es la función de masa de probabilidad de distribución binomial y n = b + c . Las funciones de distribución binomial están fácilmente disponibles en paquetes de software comunes y la prueba de P media de McNemar se puede calcular fácilmente. ^[6]

El consejo tradicional ha sido utilizar la prueba binomial exacta cuando b + c < 25. Sin embargo, las simulaciones han demostrado que tanto la prueba binomial exacta como la prueba de McNemar con corrección de continuidad son demasiado conservadoras. ^[6] Cuando b + c < 6, el valor P exacto siempre excede el nivel de significación común de 0,05. La prueba original de McNemar era la más potente, pero a menudo ligeramente liberal. La versión de P media era casi tan potente como la prueba asintótica de McNemar y no se encontró que superara el nivel de significación nominal.

Ejemplos

En el primer ejemplo, un investigador intenta determinar si un medicamento tiene un efecto sobre una enfermedad en particular. Hay 314 pacientes y se les diagnostica (enfermedad: presente o ausente ) antes y después de usar el medicamento, lo que significa que cada muestra se puede describir utilizando 1 de 4 combinaciones. Los recuentos de individuos se dan en la tabla, con el diagnóstico (enfermedad: presente o ausente ) antes del tratamiento dado en las filas, y el diagnóstico después del tratamiento en las columnas. La prueba requiere que los mismos sujetos se incluyan en las mediciones antes y después (pares coincidentes).

En este ejemplo, la hipótesis nula de "homogeneidad marginal" significaría que no hubo efecto del tratamiento. A partir de los datos anteriores, la estadística de la prueba de McNemar:

\chi ^{2}={(121-59)^{2} \over {121+59}}

tiene un valor de 21,35, lo que es extremadamente improbable que forme la distribución implicada por la hipótesis nula ( p < 0,001). Por lo tanto, la prueba proporciona evidencia sólida para rechazar la hipótesis nula de que no hay efecto del tratamiento.

Un segundo ejemplo ilustra las diferencias entre la prueba asintótica de McNemar y las alternativas. ^[6] La tabla de datos tiene el mismo formato que antes, con números diferentes en las celdas:

Con estos datos, el tamaño de la muestra (161 pacientes) no es pequeño, sin embargo los resultados de la prueba de McNemar y otras versiones son diferentes. La prueba binomial exacta da p = 0,053 y la prueba de McNemar con corrección de continuidad da = 3,68 y p = 0,055. La prueba asintótica de McNemar da = 4,55 y p = 0,033 y la prueba de McNemar de P media da p = 0,035. Tanto la prueba de McNemar como la versión de P media proporcionan evidencia más sólida de un efecto estadísticamente significativo del tratamiento en este segundo ejemplo. $\chi ^{2}$ $\chi ^{2}$

Discusión

Una observación interesante al interpretar la prueba de McNemar es que los elementos de la diagonal principal no contribuyen a la decisión sobre si (en el ejemplo anterior) la condición previa o posterior al tratamiento es más favorable. Por lo tanto, la suma b + c puede ser pequeña y la potencia estadística de las pruebas descritas anteriormente puede ser baja, incluso aunque el número de pares a + b + c + d sea grande (véase el segundo ejemplo anterior).

Una extensión de la prueba de McNemar existe en situaciones donde la independencia no necesariamente se cumple entre los pares; en cambio, hay grupos de datos pareados donde los pares en un grupo pueden no ser independientes, pero la independencia se cumple entre diferentes grupos. ^[7] Un ejemplo es analizar la efectividad de un procedimiento dental; en este caso, un par corresponde al tratamiento de un diente individual en pacientes que podrían tener múltiples dientes tratados; la efectividad del tratamiento de dos dientes en el mismo paciente no es probable que sea independiente, pero el tratamiento de dos dientes en diferentes pacientes es más probable que sea independiente. ^[8]

Información en los emparejamientos

En la década de 1970, se planteó la hipótesis de que conservar las amígdalas podría proteger contra el linfoma de Hodgkin . John Rice escribió: ^[9]

85 pacientes con enfermedad de Hodgkin [...] tenían un hermano del mismo sexo que no padecía la enfermedad y cuya edad se diferenciaba en menos de 5 años de la del paciente. Estos investigadores presentaron la siguiente tabla:
${\begin{array}{c|c|c}\hline &{\text{Tonsillectomy}}&{\text{No tonsillectomy}}\\\hline {\text{Hodgkins}}&41&44\\\hline {\text{Control}}&33&52\end{array}}$
Calcularon una estadística de chi-cuadrado [...] [ellos] habían cometido un error en su análisis al ignorar los emparejamientos. [...] [sus] muestras no eran independientes, porque los hermanos estaban emparejados [...] armamos una tabla que muestra los emparejamientos:
${\begin{array}{cc}&{\text{Sibling}}\\{\text{Patient}}&{\begin{array}{c|c|c}\hline &{\text{No tonsillectomy}}&{\text{Tonsillectomy}}\\\hline {\text{No tonsillectomy}}&37&7\\\hline {\text{Tonsillectomy}}&15&26\end{array}}\end{array}}$

La prueba de McNemar se puede aplicar a la segunda tabla. Nótese que la suma de los números de la segunda tabla es 85 (el número de pares de hermanos), mientras que la suma de los números de la primera tabla es el doble, 170 (el número de individuos). La segunda tabla proporciona más información que la primera. Los números de la primera tabla se pueden encontrar utilizando los números de la segunda tabla, pero no al revés. Los números de la primera tabla proporcionan solo los totales marginales de los números de la segunda tabla. La prueba de McNemar permite comparar los pares 15 y 7 en los que los hermanos habían recibido previamente un tratamiento diferente en sus amígdalas, como relevantes para la hipótesis, mientras que ignora los menos informativos 37 y 26 en los que los hermanos habían recibido previamente el tratamiento en sus amígdalas o ninguno de ellos.

Pruebas y métodos relacionados

La prueba del signo binomial proporciona una prueba exacta para la prueba de McNemar.
La prueba Q de Cochran es una extensión de la prueba de McNemar para más de dos "tratamientos".
La prueba exacta de Liddell es una alternativa exacta a la prueba de McNemar. ^[10]^[11]
La prueba de Stuart-Maxwell es una generalización diferente de la prueba de McNemar, utilizada para probar la homogeneidad marginal en una tabla cuadrada con más de dos filas/columnas. ^[12]^[13]^[14]
La prueba de Bhapkar (1966) es una alternativa más poderosa a la prueba de Stuart-Maxwell, ^[15]^[16] pero tiende a ser liberal. Existen alternativas competitivas a los métodos existentes. ^[17]
La prueba de McNemar es un caso especial de la prueba de Cochran-Mantel-Haenszel ; es equivalente a una prueba CMH con un estrato para cada uno de los N pares y, en cada estrato, una tabla 2x2 que muestra las respuestas binarias pareadas. ^[18]
Los intervalos de confianza multinomiales se utilizan para pares coincidentes de datos binarios.

Véase también

Referencias

^ ab McNemar, Quinn (18 de junio de 1947). "Nota sobre el error de muestreo de la diferencia entre proporciones o porcentajes correlacionados". Psychometrika . 12 (2): 153–157. doi :10.1007/BF02295996. PMID 20254758. S2CID 46226024.
^ Spielman RS; McGinnis RE; Ewens WJ (marzo de 1993). "Prueba de transmisión para el desequilibrio de ligamiento: la región del gen de la insulina y la diabetes mellitus dependiente de insulina (IDDM)". Am J Hum Genet . 52 (3): 506–16. PMC 1682161 . PMID 8447318.
^ Hawass, NE (abril de 1997). "Comparación de las sensibilidades y especificidades de dos procedimientos diagnósticos realizados en el mismo grupo de pacientes". The British Journal of Radiology . 70 (832): 360–366. doi :10.1259/bjr.70.832.9166071. ISSN 0007-1285. PMID 9166071.
^ Edwards, A (1948). "Nota sobre la "corrección por continuidad" al probar la significancia de la diferencia entre proporciones correlacionadas". Psychometrika . 13 (3): 185–187. doi :10.1007/bf02289261. PMID 18885738. S2CID 33607853.
^ Lancaster, HO (1961). "Pruebas de significancia en distribuciones discretas". J Am Stat Assoc . 56 (294): 223–234. doi :10.1080/01621459.1961.10482105.
^ abcd Fagerland, MW; Lydersen, S.; Laake, P. (2013). "La prueba de McNemar para datos de pares emparejados binarios: p medio y asintótico son mejores que condicionales exactos". Metodología de investigación médica de BMC . 13 : 91. doi : 10.1186/1471-2288-13-91 . PMC 3716987 . PMID 23848987.
^ Yang, Z.; Sun, X.; Hardin, JW (2010). "Una nota sobre las pruebas para datos binarios de pares coincidentes agrupados". Biometrical Journal . 52 (5): 638–652. doi :10.1002/bimj.201000035. PMID 20976694. S2CID 29461324.
^ Durkalski, VL; Palesch, YY; Lipsitz, SR; Rust, PF (2003). "Análisis de datos agrupados de pares emparejados". Estadísticas en Medicina . 22 (15): 2417–28. doi :10.1002/sim.1438. PMID 12872299. S2CID 25909362. Archivado desde el original el 5 de enero de 2013 . Consultado el 1 de abril de 2009 .
^ Rice, John (1995). Estadística matemática y análisis de datos (segunda edición). Belmont, California: Duxbury Press. pp. 492–494. ISBN 978-0-534-20934-6.
^ Liddell, D. (1976). "Pruebas prácticas de tablas de contingencia 2 × 2". Revista de la Royal Statistical Society . 25 (4): 295–304. doi :10.2307/2988087. JSTOR 2988087.
^ "Prueba de Maxwell, prueba de McNemar, prueba Kappa". Rimarcik.com . Consultado el 22 de noviembre de 2012 .
^ Sun, Xuezheng; Yang, Zhao (2008). "Prueba generalizada de McNemar para homogeneidad de las distribuciones marginales" (PDF) . SAS Global Forum.
^ Stuart, Alan (1955). "Una prueba de homogeneidad de las distribuciones marginales en una clasificación de dos vías". Biometrika . 42 (3/4): 412–416. doi :10.1093/biomet/42.3-4.412. JSTOR 2333387.
^ Maxwell, AE (1970). "Comparación de la clasificación de sujetos por dos jueces independientes". The British Journal of Psychiatry . 116 (535): 651–655. doi :10.1192/bjp.116.535.651. PMID 5452368. S2CID 9211848.
^ "Pruebas de homogeneidad marginal de McNemar". John-uebersax.com. 2006-08-30 . Consultado el 2012-11-22 .
^ Bhapkar, VP (1966). "Una nota sobre la equivalencia de dos criterios de prueba para hipótesis en datos categóricos". Revista de la Asociación Estadounidense de Estadística . 61 (313): 228–235. doi :10.1080/01621459.1966.10502021. JSTOR 2283057.
^ Yang, Z.; Sun, X.; Hardin, JW (2012). "Prueba de homogeneidad marginal en datos politómicos de pares emparejados". Innovación terapéutica y ciencia regulatoria . 46 (4): 434–438. doi :10.1177/0092861512442021. S2CID 123109340.
^ Agresti, Alan (2002). Análisis de datos categóricos (PDF) . Hooken, Nueva Jersey: John Wiley & Sons, Inc. p. 413. ISBN 978-0-471-36093-3.

Enlaces externos

Cuadrícula McNemar 2×2 de Vassar College con calculadora en línea
Pruebas de homogeneidad marginal de McNemar