La prueba de McNemar es una prueba estadística utilizada en datos nominales pareados . Se aplica a tablas de contingencia 2 × 2 con un rasgo dicotómico , con pares de sujetos emparejados, para determinar si las frecuencias marginales de fila y columna son iguales (es decir, si hay " homogeneidad marginal "). Recibe su nombre en honor a Quinn McNemar , quien la introdujo en 1947. [1] Una aplicación de la prueba en genética es la prueba de desequilibrio de transmisión para detectar el desequilibrio de ligamiento . [2]
Los parámetros que se utilizan habitualmente para evaluar una prueba diagnóstica en las ciencias médicas son la sensibilidad y la especificidad . La sensibilidad (o recuerdo) es la capacidad de una prueba para identificar correctamente a las personas con la enfermedad. La especificidad es la capacidad de la prueba para identificar correctamente a las personas que no padecen la enfermedad.
Supongamos ahora que se realizan dos pruebas en el mismo grupo de pacientes y que estas pruebas tienen la misma sensibilidad y especificidad. En esta situación, uno se deja llevar por estos hallazgos y supone que ambas pruebas son equivalentes. Sin embargo, puede que no sea así. Para ello, tenemos que estudiar a los pacientes con enfermedad y a los pacientes sin enfermedad (con una prueba de referencia). También tenemos que averiguar en qué puntos estas dos pruebas difieren entre sí. Ésta es precisamente la base de la prueba de McNemar. Esta prueba compara la sensibilidad y la especificidad de dos pruebas diagnósticas en el mismo grupo de pacientes. [3]
La prueba se aplica a una tabla de contingencia de 2 × 2, que tabula los resultados de dos pruebas en una muestra de N sujetos, de la siguiente manera.
La hipótesis nula de homogeneidad marginal establece que las dos probabilidades marginales para cada resultado son las mismas, es decir, p a + p b = p a + p c y p c + p d = p b + p d .
Por lo tanto, las hipótesis nula y alternativa son [1]
Aquí p a , etc., denotan la probabilidad teórica de ocurrencias en celdas con la etiqueta correspondiente.
La estadística de prueba de McNemar es:
Bajo la hipótesis nula, con un número suficientemente grande de discordantes (celdas b y c), tiene una distribución chi-cuadrado con 1 grado de libertad . Si el resultado es significativo , esto proporciona evidencia suficiente para rechazar la hipótesis nula, a favor de la hipótesis alternativa de que p b ≠ p c , lo que significaría que las proporciones marginales son significativamente diferentes entre sí.
Si b o c son pequeños ( b + c < 25), entonces no se aproximan bien mediante la distribución de chi-cuadrado. [ cita requerida ] Se puede utilizar entonces una prueba binomial exacta, donde b se compara con una distribución binomial con parámetro de tamaño n = b + c y p = 0,5. Efectivamente, la prueba binomial exacta evalúa el desequilibrio en los discordantes b y c . Para lograr un valor P bilateral, el valor P de la cola extrema debe multiplicarse por 2. Para b ≥ c :
que es simplemente el doble de la función de distribución acumulativa de distribución binomial con p = 0,5 y n = b + c .
Edwards [4] propuso la siguiente versión corregida de continuidad de la prueba de McNemar para aproximar el valor P exacto binomial:
La prueba de McNemar de P medio (prueba binomial de p medio) se calcula restando la mitad de la probabilidad del b observado del valor P unilateral exacto y luego duplicándolo para obtener el valor P medio bilateral: [5] [6]
Esto es equivalente a:
donde el segundo término es la función de masa de probabilidad de distribución binomial y n = b + c . Las funciones de distribución binomial están fácilmente disponibles en paquetes de software comunes y la prueba de P media de McNemar se puede calcular fácilmente. [6]
El consejo tradicional ha sido utilizar la prueba binomial exacta cuando b + c < 25. Sin embargo, las simulaciones han demostrado que tanto la prueba binomial exacta como la prueba de McNemar con corrección de continuidad son demasiado conservadoras. [6] Cuando b + c < 6, el valor P exacto siempre excede el nivel de significación común de 0,05. La prueba original de McNemar era la más potente, pero a menudo ligeramente liberal. La versión de P media era casi tan potente como la prueba asintótica de McNemar y no se encontró que superara el nivel de significación nominal.
En el primer ejemplo, un investigador intenta determinar si un medicamento tiene un efecto sobre una enfermedad en particular. Hay 314 pacientes y se les diagnostica (enfermedad: presente o ausente ) antes y después de usar el medicamento, lo que significa que cada muestra se puede describir utilizando 1 de 4 combinaciones. Los recuentos de individuos se dan en la tabla, con el diagnóstico (enfermedad: presente o ausente ) antes del tratamiento dado en las filas, y el diagnóstico después del tratamiento en las columnas. La prueba requiere que los mismos sujetos se incluyan en las mediciones antes y después (pares coincidentes).
En este ejemplo, la hipótesis nula de "homogeneidad marginal" significaría que no hubo efecto del tratamiento. A partir de los datos anteriores, la estadística de la prueba de McNemar:
tiene un valor de 21,35, lo que es extremadamente improbable que forme la distribución implicada por la hipótesis nula ( p < 0,001). Por lo tanto, la prueba proporciona evidencia sólida para rechazar la hipótesis nula de que no hay efecto del tratamiento.
Un segundo ejemplo ilustra las diferencias entre la prueba asintótica de McNemar y las alternativas. [6] La tabla de datos tiene el mismo formato que antes, con números diferentes en las celdas:
Con estos datos, el tamaño de la muestra (161 pacientes) no es pequeño, sin embargo los resultados de la prueba de McNemar y otras versiones son diferentes. La prueba binomial exacta da p = 0,053 y la prueba de McNemar con corrección de continuidad da = 3,68 y p = 0,055. La prueba asintótica de McNemar da = 4,55 y p = 0,033 y la prueba de McNemar de P media da p = 0,035. Tanto la prueba de McNemar como la versión de P media proporcionan evidencia más sólida de un efecto estadísticamente significativo del tratamiento en este segundo ejemplo.
Una observación interesante al interpretar la prueba de McNemar es que los elementos de la diagonal principal no contribuyen a la decisión sobre si (en el ejemplo anterior) la condición previa o posterior al tratamiento es más favorable. Por lo tanto, la suma b + c puede ser pequeña y la potencia estadística de las pruebas descritas anteriormente puede ser baja, incluso aunque el número de pares a + b + c + d sea grande (véase el segundo ejemplo anterior).
Una extensión de la prueba de McNemar existe en situaciones donde la independencia no necesariamente se cumple entre los pares; en cambio, hay grupos de datos pareados donde los pares en un grupo pueden no ser independientes, pero la independencia se cumple entre diferentes grupos. [7] Un ejemplo es analizar la efectividad de un procedimiento dental; en este caso, un par corresponde al tratamiento de un diente individual en pacientes que podrían tener múltiples dientes tratados; la efectividad del tratamiento de dos dientes en el mismo paciente no es probable que sea independiente, pero el tratamiento de dos dientes en diferentes pacientes es más probable que sea independiente. [8]
En la década de 1970, se planteó la hipótesis de que conservar las amígdalas podría proteger contra el linfoma de Hodgkin . John Rice escribió: [9]
85 pacientes con enfermedad de Hodgkin [...] tenían un hermano del mismo sexo que no padecía la enfermedad y cuya edad se diferenciaba en menos de 5 años de la del paciente. Estos investigadores presentaron la siguiente tabla:
Calcularon una estadística de chi-cuadrado [...] [ellos] habían cometido un error en su análisis al ignorar los emparejamientos. [...] [sus] muestras no eran independientes, porque los hermanos estaban emparejados [...] armamos una tabla que muestra los emparejamientos:
La prueba de McNemar se puede aplicar a la segunda tabla. Nótese que la suma de los números de la segunda tabla es 85 (el número de pares de hermanos), mientras que la suma de los números de la primera tabla es el doble, 170 (el número de individuos). La segunda tabla proporciona más información que la primera. Los números de la primera tabla se pueden encontrar utilizando los números de la segunda tabla, pero no al revés. Los números de la primera tabla proporcionan solo los totales marginales de los números de la segunda tabla. La prueba de McNemar permite comparar los pares 15 y 7 en los que los hermanos habían recibido previamente un tratamiento diferente en sus amígdalas, como relevantes para la hipótesis, mientras que ignora los menos informativos 37 y 26 en los que los hermanos habían recibido previamente el tratamiento en sus amígdalas o ninguno de ellos.