En estadística , la corrección de continuidad de Yates (o prueba de chi-cuadrado de Yates ) se utiliza en determinadas situaciones cuando se prueba la independencia en una tabla de contingencia . Su objetivo es corregir el error introducido suponiendo que las probabilidades discretas de las frecuencias de la tabla pueden aproximarse mediante una distribución continua ( chi-cuadrado ). A diferencia de la estadística chi-cuadrado estándar de Pearson, es aproximadamente imparcial .
El uso de la distribución chi-cuadrado para interpretar la estadística chi-cuadrado de Pearson requiere asumir que la probabilidad discreta de las frecuencias binomiales observadas en la tabla puede aproximarse mediante la distribución continua chi-cuadrado . Esta suposición no es del todo correcta e introduce algunos errores.
Para reducir el error de aproximación, Frank Yates , un estadístico inglés , sugirió una corrección por continuidad que ajusta la fórmula de la prueba chi-cuadrado de Pearson restando 0,5 a la diferencia entre cada valor observado y su valor esperado en una tabla de contingencia de 2 × 2. . [1] Esto reduce el valor de chi-cuadrado obtenido y por lo tanto aumenta su valor p .
El efecto de la corrección de Yates es evitar la sobreestimación de la significación estadística para datos pequeños. Esta fórmula se utiliza principalmente cuando al menos una celda de la tabla tiene un recuento esperado inferior a 5.
La siguiente es la versión corregida de Yates de la estadística chi-cuadrado de Pearson :
dónde:
Como atajo, para una tabla 2×2 con las siguientes entradas:
En algunos casos, esto es mejor.
Siempre se debe aplicar la corrección de Yates, ya que tenderá a mejorar la precisión del valor p obtenido. [ cita necesaria ] Sin embargo, en situaciones con tamaños de muestra grandes, el uso de la corrección tendrá poco efecto en el valor del estadístico de prueba y, por lo tanto, en el valor p.