Prueba de chi-cuadrado

Una prueba de chi-cuadrado (también prueba de chi-cuadrado o prueba de $χ 2$ ) es una prueba de hipótesis estadística que se utiliza en el análisis de tablas de contingencia cuando los tamaños de muestra son grandes. En términos más simples, esta prueba se utiliza principalmente para examinar si dos variables categóricas ( dos dimensiones de la tabla de contingencia ) son independientes al influir en la estadística de la prueba ( valores dentro de la tabla ). ^[1] La prueba es válida cuando el estadístico de prueba tiene chi-cuadrado distribuido bajo la hipótesis nula , específicamente la prueba de chi-cuadrado de Pearson y variantes de la misma. La prueba de chi-cuadrado de Pearson se utiliza para determinar si existe una diferencia estadísticamente significativa entre las frecuencias esperadas y las frecuencias observadas en una o más categorías de una tabla de contingencia . Para tablas de contingencia con tamaños de muestra más pequeños, se utiliza en su lugar la prueba exacta de Fisher .

En las aplicaciones estándar de esta prueba, las observaciones se clasifican en clases mutuamente excluyentes. Si la hipótesis nula de que no hay diferencias entre las clases de la población es cierta, el estadístico de prueba calculado a partir de las observaciones sigue una distribución de $frecuencia$ $χ2$ . El propósito de la prueba es evaluar qué tan probable sería que las frecuencias observadas supusieran que la hipótesis nula fuera cierta.

Las estadísticas de prueba que siguen una distribución $χ 2$ ocurren cuando las observaciones son independientes. También existen pruebas $de χ 2$ para probar la hipótesis nula de independencia de un par de variables aleatorias basadas en observaciones de los pares.

Las pruebas de chi-cuadrado $a$ menudo se refieren a pruebas para las cuales la distribución del estadístico de prueba se aproxima asintóticamente a la distribución $χ2$ , lo que significa que la distribución muestral (si la hipótesis nula es verdadera) del estadístico de prueba se aproxima cada vez más a una distribución de chi-cuadrado. a medida que aumentan los tamaños de muestra .

Historia

En el siglo XIX, los métodos analíticos estadísticos se aplicaban principalmente en el análisis de datos biológicos y era costumbre que los investigadores asumieran que las observaciones seguían una distribución normal , como Sir George Airy y Mansfield Merriman , cuyos trabajos fueron criticados por Karl Pearson en su artículo de 1900. . ^[2]

A finales del siglo XIX, Pearson notó la existencia de una asimetría significativa en algunas observaciones biológicas. Para modelar las observaciones independientemente de que sean normales o asimétricas, Pearson, en una serie de artículos publicados entre 1893 y 1916, ^[3]^[4]^[5]^[6] ideó la distribución de Pearson , una familia de distribuciones de probabilidad continuas , que incluye la distribución normal y muchas distribuciones asimétricas, y propuso un método de análisis estadístico que consiste en utilizar la distribución de Pearson para modelar la observación y realizar una prueba de bondad de ajuste para determinar qué tan bien se ajusta realmente el modelo a las observaciones.

Prueba de chi-cuadrado de Pearson

En 1900, Pearson publicó un artículo ^[2] sobre la prueba $de χ 2$ , que se considera uno de los fundamentos de la estadística moderna. ^[7] En este artículo, Pearson investigó una prueba de bondad de ajuste.

Supongamos que $n$ observaciones en una muestra aleatoria de una población se clasifican en $k$ clases mutuamente excluyentes con números respectivos de observaciones $x i$ (para $i = 1,2,\dots, k$ ), y una hipótesis nula da la probabilidad $p i$ de que una La observación cae en la $i-$ ésima clase. Entonces tenemos los números esperados $m i = np i$ para todo $i$ , donde

{\begin{alineado}&\sum _{i=1}^{k}{p_{i}}=1\\[8pt]&\sum _{i=1}^{k}{m_ {i}}=n\sum _{i=1}^{k}{p_{i}}=n\end{aligned}}

Pearson propuso que, bajo la circunstancia de que la hipótesis nula sea correcta, como $n \to \infty$ la distribución límite de la cantidad dada a continuación es la distribución $χ 2 .$

X^{2}=\sum _{i=1}^{k}{\frac {(x_{i}-m_{i})^{2}}{m_{i}}}=\ suma _{i=1}^{k}{{\frac {x_{i}^{2}}{m_{i}}}-n}

Pearson abordó primero el caso en el que los números esperados $m i$ son números suficientemente grandes conocidos en todas las celdas, asumiendo que cada observación $x i$ puede considerarse distribuida normalmente , y llegó al resultado de que, en el límite cuando $n$ se vuelve grande, $X 2$ sigue la distribución $χ 2$ con $k - 1$ grados de libertad.

Sin embargo, Pearson consideró a continuación el caso en el que los números esperados dependían de los parámetros que debían estimarse a partir de la muestra, y sugirió que, siendo la notación de $m i$ los verdaderos números esperados y $m' i$ los números esperados estimados, la diferencia

X^{2}-{X'}^{2}=\sum _{i=1}^{k}{\frac {x_{i}^{2}}{m_{i}}} -\sum _{i=1}^{k}{\frac {x_{i}^{2}}{m'_{i}}}

normalmente será positivo y lo suficientemente pequeño como para omitirlo. En conclusión, Pearson argumentó que si consideráramos que $X' 2$ también se distribuye como distribución $χ 2$ con $k - 1$ grados de libertad, el error en esta aproximación no afectaría las decisiones prácticas. Esta conclusión causó cierta controversia en las aplicaciones prácticas y no se resolvió durante 20 años hasta los artículos de Fisher de 1922 y 1924. ^[8]^[9]

Otros ejemplos de pruebas de chi-cuadrado

Una estadística de prueba que sigue exactamente una distribución de chi-cuadrado es la prueba de que la varianza de una población distribuida normalmente tiene un valor dado basado en una varianza muestral . Estas pruebas son poco comunes en la práctica porque generalmente se desconoce la verdadera varianza de la población. Sin embargo, existen varias pruebas estadísticas en las que la distribución chi-cuadrado es aproximadamente válida:

Prueba exacta de Fisher

Para conocer una prueba exacta utilizada en lugar de la prueba de independencia de chi-cuadrado 2 × 2, consulte la prueba exacta de Fisher .

prueba binomial

Para obtener una prueba exacta utilizada en lugar de la prueba de bondad de ajuste de chi-cuadrado 2 × 1, consulte prueba binomial .

Otras pruebas de chi-cuadrado

Prueba de chi cuadrado de Cochran-Mantel-Haenszel .
Prueba de McNemar , utilizada en determinadas tablas 2×2 con emparejamiento
Prueba de aditividad de Tukey
La prueba de maleta en el análisis de series de tiempo , prueba de la presencia de autocorrelación
Pruebas de índice de verosimilitud en modelos estadísticos generales , para probar si existe evidencia de la necesidad de pasar de un modelo simple a uno más complicado (donde el modelo simple está anidado dentro del complicado).

Corrección de Yates por continuidad

El uso de la distribución chi-cuadrado para interpretar la estadística chi-cuadrado de Pearson requiere asumir que la probabilidad discreta de las frecuencias binomiales observadas en la tabla puede aproximarse mediante la distribución continua chi-cuadrado . Esta suposición no es del todo correcta e introduce algunos errores.

Para reducir el error de aproximación, Frank Yates sugirió una corrección por continuidad que ajusta la fórmula de la prueba chi-cuadrado de Pearson restando 0,5 de la diferencia absoluta entre cada valor observado y su valor esperado en una tabla de contingencia de 2 × 2 . ^[10] Esto reduce el valor de chi-cuadrado obtenido y, por lo tanto, aumenta su valor p .

Prueba de chi-cuadrado para la varianza en una población normal

Si se toma una muestra de tamaño $n$ de una población que tiene una distribución normal , entonces hay un resultado (ver distribución de la varianza muestral ) que permite realizar una prueba para determinar si la varianza de la población tiene un valor predeterminado. Por ejemplo, un proceso de fabricación podría haber estado en condiciones estables durante un largo período, lo que permitiría determinar un valor de la varianza esencialmente sin errores. Supongamos que se está probando una variante del proceso, lo que da lugar a una pequeña muestra de $n$ artículos cuya variación se va a probar. El estadístico de prueba $T$ en este caso podría establecerse como la suma de los cuadrados alrededor de la media muestral, dividida por el valor nominal de la varianza (es decir, el valor que se probará como mantenimiento). Entonces $T$ tiene una distribución chi-cuadrado con $n - 1$ grados de libertad . Por ejemplo, si el tamaño de la muestra es 21, la región de aceptación para $T$ con un nivel de significancia del 5% está entre 9,59 y 34,17.

Ejemplo de prueba de chi-cuadrado para datos categóricos

Supongamos que hay una ciudad de 1.000.000 de habitantes con cuatro barrios: $A$ , $B$ , $C$ y $D.$ Se toma una muestra aleatoria de 650 residentes de la ciudad y se registra su ocupación como "de cuello blanco", "de cuello azul" o "sin cuello" . La hipótesis nula es que el barrio de residencia de cada persona es independiente de su clasificación ocupacional. Los datos se tabulan como:

Tomemos la muestra que vive en el barrio $A$ , 150, para estimar qué proporción del total de 1.000.000 vive en el barrio $A.$ De manera similar tomamos ⁠349/650⁠ para estimar qué proporción de ese millón son trabajadores administrativos. Bajo el supuesto de independencia bajo la hipótesis, deberíamos "esperar" que el número de trabajadores administrativos en el vecindario $A$ sea

150\times {\frac {349}{650}}\aproximadamente 80,54

Luego en esa "celda" de la tabla, tenemos

{\frac {\left({\text{observado}}-{\text{esperado}}\right)^{2}}{\text{esperado}}}={\frac {\left(90 -80,54\derecha)^{2}}{80,54}}\aproximadamente 1,11

La suma de estas cantidades en todas las celdas es el estadístico de prueba; en este caso, . Bajo la hipótesis nula, esta suma tiene aproximadamente una distribución chi-cuadrado cuyo número de grados de libertad es $\aproximadamente 24,57$

({\text{número de filas}}-1)({\text{número de columnas}}-1)=(3-1)(4-1)=6

Si el estadístico de prueba es improbablemente grande según esa distribución chi-cuadrado, entonces se rechaza la hipótesis nula de independencia. Aquí tenemos un valor de chi-cuadrado de 24,57, que es bastante grande y, por lo tanto, tenemos cierta evidencia para rechazar la hipótesis nula (H0). Esto significa que el vecindario de residencia de cada persona está correlacionado con su clasificación ocupacional.

Una cuestión relacionada es la prueba de homogeneidad. Supongamos que en lugar de dar a cada residente de cada uno de los cuatro barrios las mismas posibilidades de inclusión en la muestra, decidimos de antemano cuántos residentes de cada barrio incluir. Entonces cada residente tiene las mismas posibilidades de ser elegido que todos los residentes del mismo barrio, pero los residentes de diferentes barrios tendrían diferentes probabilidades de ser elegidos si los cuatro tamaños de muestra no son proporcionales a las poblaciones de los cuatro barrios. En tal caso, estaríamos probando la "homogeneidad" en lugar de la "independencia". La pregunta es si las proporciones de trabajadores manuales, administrativos y no manuales en los cuatro barrios son las mismas. Sin embargo, la prueba se realiza de la misma forma.

Aplicaciones

En criptoanálisis , la prueba de chi-cuadrado se utiliza para comparar la distribución de texto sin formato y (posiblemente) texto cifrado descifrado . El valor más bajo de la prueba significa que el descifrado se realizó correctamente con una alta probabilidad. ^[11]^[12] Este método se puede generalizar para resolver problemas criptográficos modernos. ^[13]

En bioinformática , la prueba de chi-cuadrado se utiliza para comparar la distribución de ciertas propiedades de genes (p. ej., contenido genómico, tasa de mutación, agrupamiento de redes de interacción, etc.) que pertenecen a diferentes categorías (p. ej., genes de enfermedades, genes esenciales, genes en un determinado cromosoma, etc.). ^[14]^[15]

Ver también

Referencias

^ "Chi-Square - Sociología 3112 - Departamento de Sociología - Universidad de Utah". soc.utah.edu . Consultado el 12 de noviembre de 2022 .
^ ab Pearson, Karl (1900). "Sobre el criterio de que un sistema dado de desviaciones de lo probable en el caso de un sistema correlacionado de variables es tal que puede suponerse razonablemente que ha surgido de un muestreo aleatorio". Revista Filosófica . Serie 5. 50 (302): 157–175. doi :10.1080/14786440009463897.
^ Pearson, Karl (1893). "Contribuciones a la teoría matemática de la evolución [resumen]". Actas de la Royal Society . 54 : 329–333. doi : 10.1098/rspl.1893.0079 . JSTOR 115538.
^ Pearson, Karl (1895). "Contribuciones a la teoría matemática de la evolución, II: Variación sesgada en material homogéneo". Transacciones filosóficas de la Royal Society . 186 : 343–414. Código bibliográfico : 1895RSPTA.186..343P. doi : 10.1098/rsta.1895.0010 . JSTOR 90649.
^ Pearson, Karl (1901). "Contribuciones matemáticas a la teoría de la evolución, X: Suplemento de una memoria sobre variación sesgada". Transacciones filosóficas de la Royal Society A. 197 (287–299): 443–459. Código Bib : 1901RSPTA.197..443P. doi :10.1098/rsta.1901.0023. JSTOR 90841.
^ Pearson, Karl (1916). "Contribuciones matemáticas a la teoría de la evolución, XIX: Segundo suplemento de una memoria sobre variación sesgada". Transacciones filosóficas de la Royal Society A. 216 (538–548): 429–457. Código bibliográfico : 1916RSPTA.216..429P. doi : 10.1098/rsta.1916.0009 . JSTOR 91092.
^ Cochran, William G. (1952). "La prueba de bondad de ajuste de Chi-cuadrado". Los anales de la estadística matemática . 23 (3): 315–345. doi : 10.1214/aoms/1177729380 . JSTOR 2236678.
^ Pescador, Ronald A. (1922). "Sobre la interpretación de $χ$ $2$ a partir de tablas de contingencia y el cálculo de P". Revista de la Real Sociedad de Estadística . 85 (1): 87–94. doi :10.2307/2340521. JSTOR 2340521.
^ Pescador, Ronald A. (1924). "Las condiciones bajo las cuales $χ$ $2$ mide la discrepancia entre observación e hipótesis". Revista de la Real Sociedad de Estadística . 87 (3): 442–450. JSTOR 2341149.
^ Yates, Frank (1934). "Tabla de contingencia con números pequeños y la prueba $de χ$ $2$ ". Suplemento de la Revista de la Royal Statistical Society . 1 (2): 217–235. doi :10.2307/2983604. JSTOR 2983604.
^ "Estadística de chi cuadrado". Criptografía práctica . Archivado desde el original el 18 de febrero de 2015 . Consultado el 18 de febrero de 2015 .
^ "Uso de chi cuadrado para descifrar códigos". Recursos de matemáticas del IB . Escuela internacional británica de Phuket. 15 de junio de 2014.
^ Ryabko, B. Ya.; Stognienko, VS; Shokin, Yu. Yo (2004). "Una nueva prueba de aleatoriedad y su aplicación a algunos problemas criptográficos" (PDF) . Revista de planificación e inferencia estadística . 123 (2): 365–376. doi :10.1016/s0378-3758(03)00149-6 . Consultado el 18 de febrero de 2015 .
^ Feldman, yo; Rzhetsky, A.; Vitkup, D. (2008). "Propiedades de red de genes que albergan mutaciones de enfermedades hereditarias". PNAS . 105 (11): 4323–432. Código Bib : 2008PNAS..105.4323F. doi : 10.1073/pnas.0701722105 . PMC 2393821 . PMID 18326631.
^ "pruebas de chi-cuadrado" (PDF) . Archivado desde el original (PDF) el 29 de junio de 2018 . Consultado el 29 de junio de 2018 .

Lectura adicional

Weisstein, Eric W. "Prueba de chi cuadrado". MundoMatemático .
Corder, GW; Capataz, DI (2014). Estadísticas no paramétricas: un enfoque paso a paso. Nueva York: Wiley. ISBN 978-1118840313.
Greenwood, Cindy ; Nikulin, MS (1996). Una guía para las pruebas de chi-cuadrado . Nueva York: Wiley. ISBN 0-471-55779-X.
Nikulin, MS (1973). Prueba de normalidad de chi-cuadrado . Actas de la Conferencia Internacional de Vilnius sobre Teoría de la probabilidad y Estadística Matemática . vol. 2. págs. 119-122.
Bagdonavicius, Vilijandas B.; Nikulin, Mikhail S. (2011). "Prueba de bondad de ajuste de chi-cuadrado para datos censurados a la derecha". Revista Internacional de Estadística y Matemáticas Aplicadas . 24 : 30–50. SEÑOR 2800388.