La prueba de Mantel , llamada así por Nathan Mantel , es una prueba estadística de la correlación entre dos matrices . Las matrices deben tener la misma dimensión; en la mayoría de las aplicaciones, son matrices de interrelaciones entre los mismos vectores de objetos. La prueba fue publicada por primera vez por Nathan Mantel , un bioestadístico de los Institutos Nacionales de Salud , en 1967. [1] Se pueden encontrar descripciones de la misma en libros de estadística avanzada (por ejemplo, Sokal y Rohlf 1995 [2] ).
La prueba se utiliza comúnmente en ecología , donde los datos suelen ser estimaciones de la "distancia" entre objetos, como especies de organismos. Por ejemplo, una matriz podría contener estimaciones de las distancias genéticas (es decir, la cantidad de diferencia entre dos genomas diferentes) entre todos los pares posibles de especies en el estudio, obtenidas mediante los métodos de sistemática molecular ; mientras que la otra podría contener estimaciones de la distancia geográfica entre las áreas de distribución de cada especie y todas las demás especies. En este caso, la hipótesis que se está probando es si la variación en la genética de estos organismos está correlacionada con la variación en la distancia geográfica.
Si hay n objetos y la matriz es simétrica (por lo que la distancia del objeto a al objeto b es la misma que la distancia de b a a ), dicha matriz contiene
distancias. Como las distancias no son independientes entre sí (ya que cambiar la "posición" de un objeto cambiaría una de estas distancias (la distancia de ese objeto a cada uno de los otros)), no podemos evaluar la relación entre las dos matrices simplemente evaluando el coeficiente de correlación entre los dos conjuntos de distancias y probando su significación estadística . La prueba de Mantel aborda este problema.
El procedimiento adoptado es una especie de prueba de aleatorización o permutación . Se calcula la correlación entre los dos conjuntos de distancias, y ésta es a la vez la medida de correlación informada y la estadística de prueba en la que se basa la prueba. En principio, se podría utilizar cualquier coeficiente de correlación, pero normalmente se utiliza el coeficiente de correlación producto-momento de Pearson .
A diferencia del uso habitual del coeficiente de correlación, para evaluar la significancia de cualquier desviación aparente de una correlación cero, las filas y columnas de una de las matrices se someten a permutaciones aleatorias muchas veces, y la correlación se vuelve a calcular después de cada permutación. La significancia de la correlación observada es la proporción de dichas permutaciones que conducen a un coeficiente de correlación más alto.
El razonamiento es que si la hipótesis nula de que no existe relación entre las dos matrices es verdadera, entonces la permutación de las filas y columnas de la matriz debería tener la misma probabilidad de producir un coeficiente mayor o menor. Además de superar los problemas que surgen de la dependencia estadística de los elementos dentro de cada una de las dos matrices, el uso de la prueba de permutación significa que no se está confiando en suposiciones sobre las distribuciones estadísticas de los elementos en las matrices.
Muchos paquetes estadísticos incluyen rutinas para realizar la prueba de Mantel.
Los diversos artículos que presentan la prueba de Mantel (y su extensión, la prueba parcial de Mantel) carecen de un marco estadístico claro que especifique completamente las hipótesis nula y alternativa. Esto puede transmitir la idea errónea de que estas pruebas son universales. Por ejemplo, las pruebas de Mantel y de Mantel parcial pueden tener fallas en presencia de autocorrelación espacial y arrojar valores p erróneamente bajos. Véase, por ejemplo, Guillot y Rousset (2013). [3]