Prueba de chi-cuadrado

Una prueba de chi-cuadrado (también prueba de chi-cuadrado o prueba $χ 2$ ) es una prueba de hipótesis estadística utilizada en el análisis de tablas de contingencia cuando los tamaños de muestra son grandes. En términos más simples, esta prueba se utiliza principalmente para examinar si dos variables categóricas ( dos dimensiones de la tabla de contingencia ) son independientes a la hora de influir en la estadística de prueba ( valores dentro de la tabla ). ^[1] La prueba es válida cuando la estadística de prueba se distribuye mediante chi-cuadrado bajo la hipótesis nula , específicamente la prueba de chi-cuadrado de Pearson y sus variantes. La prueba de chi-cuadrado de Pearson se utiliza para determinar si existe una diferencia estadísticamente significativa entre las frecuencias esperadas y las frecuencias observadas en una o más categorías de una tabla de contingencia . Para las tablas de contingencia con tamaños de muestra más pequeños, se utiliza en su lugar una prueba exacta de Fisher .

En las aplicaciones estándar de esta prueba, las observaciones se clasifican en clases mutuamente excluyentes. Si la hipótesis nula de que no existen diferencias entre las clases de la población es verdadera, la estadística de prueba calculada a partir de las observaciones sigue una distribución de frecuencias $χ 2$ . El propósito de la prueba es evaluar qué tan probables serían las frecuencias observadas suponiendo que la hipótesis nula es verdadera.

Las pruebas estadísticas que siguen una distribución $χ 2$ se dan cuando las observaciones son independientes. También existen pruebas $χ 2$ para probar la hipótesis nula de independencia de un par de variables aleatorias en función de las observaciones de los pares.

Las pruebas de chi-cuadrado a menudo se refieren a pruebas para las cuales la distribución del estadístico de prueba se aproxima a la distribución $χ 2$ de manera asintótica , lo que significa que la distribución de muestreo (si la hipótesis nula es verdadera) del estadístico de prueba se aproxima cada vez más a una distribución de chi-cuadrado a medida que aumentan los tamaños de muestra .

Historia

En el siglo XIX, los métodos analíticos estadísticos se aplicaban principalmente en el análisis de datos biológicos y era habitual que los investigadores asumieran que las observaciones seguían una distribución normal , como Sir George Airy y Mansfield Merriman , cuyos trabajos fueron criticados por Karl Pearson en su artículo de 1900. ^[2]

A finales del siglo XIX, Pearson advirtió la existencia de una asimetría significativa en algunas observaciones biológicas. Para modelar las observaciones independientemente de si eran normales o asimétricas, Pearson, en una serie de artículos publicados entre 1893 y 1916, ^[3]^[4]^[5]^[6] ideó la distribución de Pearson , una familia de distribuciones de probabilidad continuas , que incluye la distribución normal y muchas distribuciones asimétricas, y propuso un método de análisis estadístico que consistía en utilizar la distribución de Pearson para modelar la observación y realizar una prueba de bondad de ajuste para determinar qué tan bien se ajusta realmente el modelo a las observaciones.

Prueba de chi-cuadrado de Pearson

En 1900, Pearson publicó un artículo ^[2] sobre la prueba $χ 2$ , que se considera uno de los fundamentos de la estadística moderna. ^[7] En este artículo, Pearson investigó una prueba de bondad de ajuste.

Supongamos que $n$ observaciones en una muestra aleatoria de una población se clasifican en $k$ clases mutuamente excluyentes con respectivos números observados de observaciones $x i$ (para $i = 1,2,\dots, k$ ), y una hipótesis nula da la probabilidad $p i$ de que una observación caiga en la $i$ ésima clase. Por lo tanto, tenemos los números esperados $m i = np i$ para todos $los i$ , donde

{\begin{aligned}&\sum _{i=1}^{k}{p_{i}}=1\\[8pt]&\sum _{i=1}^{k}{m_{i}}=n\sum _{i=1}^{k}{p_{i}}=n\end{aligned}}

Pearson propuso que, bajo la circunstancia de que la hipótesis nula sea correcta, cuando $n \to \infty$ la distribución límite de la cantidad dada a continuación es la distribución $χ 2 .$

X^{2}=\suma _{i=1}^{k}{\frac {(x_{i}-m_{i})^{2}}{m_{i}}}=\suma _{i=1}^{k}{{\frac {x_{i}^{2}}{m_{i}}}-n}

Pearson abordó primero el caso en el cual los números esperados $m i$ son números suficientemente grandes conocidos en todas las celdas asumiendo que cada observación $x i$ puede tomarse como distribuida normalmente , y llegó al resultado de que, en el límite cuando $n$ se vuelve grande, $X 2$ sigue la distribución $χ 2 con$ $k - 1$ grados de libertad.

Sin embargo, Pearson consideró a continuación el caso en el que los números esperados dependían de los parámetros que debían estimarse a partir de la muestra, y sugirió que, con la notación de $m i$ siendo los números esperados verdaderos y $m' i$ siendo los números esperados estimados, la diferencia

X^{2}-{X'}^{2}=\suma _{i=1}^{k}{\frac {x_{i}^{2}}{m_{i}}}-\suma _{i=1}^{k}{\frac {x_{i}^{2}}{m'_{i}}}

Por lo general, será positivo y lo suficientemente pequeño como para omitirlo. En una conclusión, Pearson argumentó que si consideráramos que $X' 2$ también se distribuye como una distribución $χ 2$ con $k - 1$ grados de libertad, el error en esta aproximación no afectaría las decisiones prácticas. Esta conclusión causó cierta controversia en las aplicaciones prácticas y no se resolvió durante 20 años hasta los artículos de Fisher de 1922 y 1924. ^[8]^[9]

Otros ejemplos de pruebas de chi-cuadrado

Una prueba estadística que sigue exactamente una distribución de chi-cuadrado es la prueba de que la varianza de una población distribuida normalmente tiene un valor dado en función de una varianza de muestra . Estas pruebas son poco comunes en la práctica porque la varianza real de la población suele ser desconocida. Sin embargo, existen varias pruebas estadísticas en las que la distribución de chi-cuadrado es aproximadamente válida:

Prueba exacta de Fisher

Para una prueba exacta utilizada en lugar de la prueba de chi-cuadrado 2 × 2 para independencia, consulte la prueba exacta de Fisher .

Prueba binomial

Para una prueba exacta utilizada en lugar de la prueba de chi-cuadrado 2 × 1 para la bondad de ajuste, consulte la prueba binomial .

Otras pruebas de chi-cuadrado

Prueba de chi-cuadrado de Cochran–Mantel–Haenszel .
Prueba de McNemar , utilizada en ciertas tablas 2 × 2 con emparejamiento
Prueba de aditividad de Tukey
La prueba de portmanteau en el análisis de series temporales , que prueba la presencia de autocorrelación
Pruebas de razón de verosimilitud en modelos estadísticos generales , para comprobar si hay evidencia de la necesidad de pasar de un modelo simple a uno más complicado (donde el modelo simple está anidado dentro del complicado).

Corrección de Yates para la continuidad

Para interpretar la estadística de chi- cuadrado de Pearson, se debe suponer que la probabilidad discreta de las frecuencias binomiales observadas en la tabla se puede aproximar mediante la distribución de chi-cuadrado continua . Esta suposición no es del todo correcta e introduce algunos errores.

Para reducir el error de aproximación, Frank Yates sugirió una corrección por continuidad que ajusta la fórmula de la prueba de chi-cuadrado de Pearson restando 0,5 de la diferencia absoluta entre cada valor observado y su valor esperado en una tabla de contingencia de 2 × 2. ^[10] Esto reduce el valor de chi-cuadrado obtenido y, por lo tanto, aumenta su valor p .

Prueba de chi-cuadrado para la varianza en una población normal

Si se toma una muestra de tamaño $n$ de una población que tiene una distribución normal , entonces hay un resultado (ver distribución de la varianza de la muestra ) que permite hacer una prueba para determinar si la varianza de la población tiene un valor predeterminado. Por ejemplo, un proceso de fabricación podría haber estado en condiciones estables durante un largo período, lo que permite determinar un valor para la varianza esencialmente sin error. Supongamos que se está probando una variante del proceso, dando lugar a una pequeña muestra de $n$ artículos de producto cuya variación se va a probar. El estadístico de prueba $T$ en este caso podría establecerse como la suma de cuadrados sobre la media de la muestra, dividida por el valor nominal de la varianza (es decir, el valor que se va a probar como válido). Entonces $T$ tiene una distribución de chi-cuadrado con $n - 1$ grados de libertad . Por ejemplo, si el tamaño de la muestra es 21, la región de aceptación para $T$ con un nivel de significancia del 5% está entre 9,59 y 34,17.

Ejemplo de prueba de chi-cuadrado para datos categóricos

Supongamos que hay una ciudad de 1.000.000 de habitantes con cuatro barrios: $A$ , $B$ , $C$ y $D.$ Se toma una muestra aleatoria de 650 residentes de la ciudad y se registra su ocupación como "empleado administrativo", "empleado obrero" o "sin empleo" . La hipótesis nula es que el barrio de residencia de cada persona es independiente de su clasificación ocupacional. Los datos se tabulan de la siguiente manera:

Tomemos la muestra que vive en el barrio $A$ , 150, para estimar qué proporción del total de 1.000.000 vive en el barrio $A.$ De manera similar, tomamos ⁠349/650⁠ para estimar qué proporción de los 1.000.000 son trabajadores de cuello blanco. Suponiendo que la hipótesis es independiente, deberíamos "esperar" que el número de trabajadores de cuello blanco en el barrio $A$ sea

150\times {\frac {349}{650}}\aproximadamente 80,54

Luego en esa "celda" de la tabla, tenemos

{\frac {\left({\text{observado}}-{\text{esperado}}\right)^{2}}{\text{esperado}}}={\frac {\left(90-80.54\right)^{2}}{80.54}}\approx 1.11

La suma de estas cantidades en todas las celdas es la estadística de prueba; en este caso, . Bajo la hipótesis nula, esta suma tiene aproximadamente una distribución de chi-cuadrado cuyo número de grados de libertad es $\aproximadamente 24,57$

({\text{número de filas}}-1)({\text{número de columnas}}-1)=(3-1)(4-1)=6

Si la estadística de prueba es improbablemente grande según esa distribución de chi-cuadrado, entonces se rechaza la hipótesis nula de independencia. Aquí tenemos un valor de chi-cuadrado de 24,57, que es bastante grande y, por lo tanto, tenemos cierta evidencia para rechazar la hipótesis nula (H0). Esto significa que el barrio de residencia de cada persona está correlacionado con su clasificación ocupacional.

Un problema relacionado es una prueba de homogeneidad. Supongamos que en lugar de dar a cada residente de cada uno de los cuatro barrios la misma probabilidad de ser incluido en la muestra, decidimos de antemano cuántos residentes de cada barrio incluir. Entonces cada residente tiene la misma probabilidad de ser elegido que todos los residentes del mismo barrio, pero los residentes de diferentes barrios tendrían diferentes probabilidades de ser elegidos si los cuatro tamaños de muestra no son proporcionales a las poblaciones de los cuatro barrios. En tal caso, estaríamos probando la "homogeneidad" en lugar de la "independencia". La pregunta es si las proporciones de trabajadores manuales, administrativos y no administrativos en los cuatro barrios son las mismas. Sin embargo, la prueba se realiza de la misma manera.

Aplicaciones

En criptoanálisis , la prueba de chi-cuadrado se utiliza para comparar la distribución del texto simple y el texto cifrado (posiblemente) descifrado . El valor más bajo de la prueba significa que la descifración tuvo éxito con alta probabilidad. ^[11]^[12] Este método se puede generalizar para resolver problemas criptográficos modernos. ^[13]

En bioinformática , la prueba de chi-cuadrado se utiliza para comparar la distribución de ciertas propiedades de los genes (por ejemplo, contenido genómico, tasa de mutación, agrupamiento de redes de interacción, etc.) que pertenecen a diferentes categorías (por ejemplo, genes de enfermedades, genes esenciales, genes en un cromosoma determinado, etc.). ^[14]^[15]

Véase también

Referencias

^ "Chi-cuadrado - Sociología 3112 - Departamento de Sociología - Universidad de Utah". soc.utah.edu . Consultado el 12 de noviembre de 2022 .
^ ab Pearson, Karl (1900). "Sobre el criterio de que un sistema dado de desviaciones de lo probable en el caso de un sistema correlacionado de variables es tal que puede suponerse razonablemente que ha surgido de un muestreo aleatorio". Philosophical Magazine . Serie 5. 50 (302): 157–175. doi :10.1080/14786440009463897.
^ Pearson, Karl (1893). "Contribuciones a la teoría matemática de la evolución [resumen]". Actas de la Royal Society . 54 : 329–333. doi : 10.1098/rspl.1893.0079 . JSTOR 115538.
^ Pearson, Karl (1895). "Contribuciones a la teoría matemática de la evolución, II: Variación sesgada en material homogéneo". Philosophical Transactions of the Royal Society . 186 : 343–414. Bibcode :1895RSPTA.186..343P. doi : 10.1098/rsta.1895.0010 . JSTOR 90649.
^ Pearson, Karl (1901). "Contribuciones matemáticas a la teoría de la evolución, X: Suplemento a una memoria sobre variación sesgada". Philosophical Transactions of the Royal Society A . 197 (287–299): 443–459. Bibcode :1901RSPTA.197..443P. doi :10.1098/rsta.1901.0023. JSTOR 90841.
^ Pearson, Karl (1916). "Contribuciones matemáticas a la teoría de la evolución, XIX: Segundo suplemento a una memoria sobre variación sesgada". Philosophical Transactions of the Royal Society A . 216 (538–548): 429–457. Bibcode :1916RSPTA.216..429P. doi : 10.1098/rsta.1916.0009 . JSTOR 91092.
^ Cochran, William G. (1952). "La prueba de chi-cuadrado de bondad de ajuste". Anales de estadística matemática . 23 (3): 315–345. doi : 10.1214/aoms/1177729380 . JSTOR 2236678.
^ Fisher, Ronald A. (1922). "Sobre la interpretación de $χ$ $2$ a partir de tablas de contingencia y el cálculo de P". Revista de la Royal Statistical Society . 85 (1): 87–94. doi :10.2307/2340521. JSTOR 2340521.
^ Fisher, Ronald A. (1924). "Las condiciones bajo las cuales $χ$ $2$ mide la discrepancia entre la observación y la hipótesis". Journal of the Royal Statistical Society . 87 (3): 442–450. JSTOR 2341149.
^ Yates, Frank (1934). "Tabla de contingencia que involucra números pequeños y la prueba $χ$ $2$ ". Suplemento del Journal of the Royal Statistical Society . 1 (2): 217–235. doi :10.2307/2983604. JSTOR 2983604.
^ "Estadística de chi-cuadrado". Criptografía práctica . Archivado desde el original el 18 de febrero de 2015. Consultado el 18 de febrero de 2015 .
^ "Uso de la prueba Chi cuadrado para descifrar códigos". Recursos de matemáticas del IB . British International School Phuket. 15 de junio de 2014.
^ Ryabko, B. Ya.; Stognienko, VS; Shokin, Yu. I. (2004). "Una nueva prueba de aleatoriedad y su aplicación a algunos problemas criptográficos" (PDF) . Journal of Statistical Planning and Inference . 123 (2): 365–376. doi :10.1016/s0378-3758(03)00149-6 . Consultado el 18 de febrero de 2015 .
^ Feldman, I.; Rzhetsky, A.; Vitkup, D. (2008). "Propiedades de red de genes que albergan mutaciones de enfermedades hereditarias". PNAS . 105 (11): 4323–432. Bibcode :2008PNAS..105.4323F. doi : 10.1073/pnas.0701722105 . PMC 2393821 . PMID 18326631.
^ "pruebas de chi-cuadrado" (PDF) . Archivado desde el original (PDF) el 29 de junio de 2018 . Consultado el 29 de junio de 2018 .

Lectura adicional

Weisstein, Eric W. "Prueba de chi-cuadrado". MathWorld .
Corder, GW; Foreman, DI (2014). Estadísticas no paramétricas: un enfoque paso a paso. Nueva York: Wiley. ISBN 978-1118840313.
Greenwood, Cindy y Nikulin, MS (1996). Una guía para la prueba de chi-cuadrado . Nueva York: Wiley. ISBN 0-471-55779-X.
Nikulin, MS (1973). Prueba de chi-cuadrado para normalidad . Actas de la Conferencia Internacional de Vilnius sobre Teoría de la Probabilidad y Estadística Matemática . Vol. 2. págs. 119–122.
Bagdonavicius, Vilijandas B.; Nikulin, Mikhail S. (2011). "Prueba de bondad de ajuste de chi-cuadrado para datos censurados a la derecha". Revista internacional de matemáticas y estadísticas aplicadas . 24 : 30–50. MR 2800388.