La prueba de Boschloo es una prueba de hipótesis estadística para analizar tablas de contingencia 2x2 . Examina la asociación de dos variables aleatorias distribuidas según el método de Bernoulli y es una alternativa uniformemente más potente que la prueba exacta de Fisher . Fue propuesta en 1970 por RD Boschloo. [1]
Una tabla de contingencia de 2 × 2 visualiza observaciones independientes de dos variables binarias y :
La distribución de probabilidad de dichas tablas se puede clasificar en tres casos distintos. [2]
La prueba exacta de Fisher está diseñada para el primer caso y, por lo tanto, es una prueba condicional exacta (porque condiciona las sumas de las columnas). El ejemplo típico de un caso de este tipo es el de la señora que prueba té : una señora prueba 8 tazas de té con leche. En 4 de esas tazas, la leche se vierte antes que el té. En las otras 4 tazas, el té se vierte primero.
La señora intenta asignar las tazas a las dos categorías. Siguiendo nuestra notación, la variable aleatoria representa el método utilizado (1 = leche primero, 0 = leche último) y representa las suposiciones de la señora (1 = leche primero supuesta, 0 = leche última supuesta). Entonces las sumas de las filas son los números fijos de tazas preparadas con cada método: La señora sabe que hay 4 tazas en cada categoría, por lo que asignará 4 tazas a cada método. Por lo tanto, las sumas de las columnas también están fijadas de antemano: Si no puede notar la diferencia, y son independientes y el número de tazas correctamente clasificadas con leche primero sigue la distribución hipergeométrica
La prueba de Boschloo está diseñada para el segundo caso y, por lo tanto, es una prueba incondicional exacta. A menudo se encuentran ejemplos de un caso de este tipo en la investigación médica, donde se compara un punto final binario entre dos grupos de pacientes. Siguiendo nuestra notación, representa el primer grupo que recibe algún medicamento de interés. representa el segundo grupo que recibe un placebo . indica la curación de un paciente (1 = curación, 0 = no curación). Entonces, las sumas de las filas son iguales a los tamaños de los grupos y generalmente se fijan de antemano. Las sumas de las columnas son el número total de curas o continuaciones de la enfermedad y no se fijan de antemano.
La prueba de chi-cuadrado de Pearson (sin ninguna "corrección de continuidad") es la opción correcta para el tercer caso, donde no hay restricciones ni en los totales de las filas ni en los totales de las columnas. Este tercer escenario describe la mayoría de los estudios de observación u "observaciones de campo", donde los datos se recogen a medida que están disponibles en un entorno no controlado. Por ejemplo, si uno sale a recoger dos tipos de mariposas de un color particular predeterminado identificable, que se pueden reconocer antes de la captura, pero no es posible distinguir si una mariposa es de la especie 1 o de la especie 0; antes de capturarla y examinarla de cerca: uno puede decir simplemente por su color que una mariposa que se persigue debe ser una de las dos especies de interés. Para cualquier sesión de un día de recogida de mariposas, no se puede predeterminar cuántas de cada especie se recogerán, sólo quizás el número total de capturas, dependiendo del criterio del recolector para detenerse. Si las especies se cuentan en filas separadas de la tabla, entonces las sumas de las filas no tienen restricciones y se distribuyen binomialmente de forma independiente. La segunda distinción entre las mariposas capturadas será si la mariposa es hembra (tipo 1) o macho (tipo 0), lo que se contabiliza en las columnas. Si su sexo también requiere un examen minucioso de la mariposa, eso también es independientemente aleatorio binomial. Eso significa que, debido al diseño experimental , las sumas de las columnas no tienen restricciones, al igual que las filas: ni el recuento de ninguna de las especies ni el recuento del sexo de las mariposas capturadas en cada especie están predeterminados por el proceso de observación, y ninguno de los totales restringe al otro.
La única restricción posible es el total general de todas las mariposas capturadas, e incluso eso podría no tener restricciones, dependiendo de cómo decida el recolector detenerse. Pero como no se puede saber con certeza de antemano, para un día en particular en una pradera en particular, qué tan exitosa puede ser la búsqueda durante el tiempo disponible para la recolección, incluso el total general podría no tener restricciones: depende de si la restricción de los datos recopilados es el tiempo disponible para capturar mariposas o algún total predeterminado que se debe recopilar, tal vez para garantizar estadísticas suficientemente significativas.
Este tipo de "experimento" (también llamado "observación de campo") es casi totalmente no controlado, por lo que algunos prefieren llamarlo simplemente "observación", no "experimento". Todos los números de la tabla son aleatorios de forma independiente. Cada una de las celdas de la tabla de contingencia es una probabilidad binomial separada y ni la prueba "exacta" totalmente restringida de Fisher ni la prueba parcialmente restringida de Boschloo se basan en las estadísticas que surgen del diseño experimental. La prueba de chi-cuadrado de Pearson es la prueba adecuada para un estudio observacional sin restricciones, y la prueba de Pearson, a su vez, emplea el modelo estadístico incorrecto para los otros dos tipos de experimento. (Obsérvese de paso que la estadística de chi-cuadrado de Pearson nunca debe tener ninguna "corrección de continuidad" aplicada, sea cual sea, por ejemplo, ninguna "corrección de Yates": la consecuencia de esa "corrección" será distorsionar sus valores p para que coincidan con la prueba de Fisher, es decir, dar la respuesta incorrecta).
La hipótesis nula de la prueba unilateral de Boschloo (valores altos de favorecen la hipótesis alternativa) es:
La hipótesis nula de la prueba unilateral también puede formularse en la otra dirección (valores pequeños de favorecen la hipótesis alternativa):
La hipótesis nula de la prueba de dos colas es:
No existe una definición universal de la versión de dos colas de la prueba exacta de Fisher. [3] Dado que la prueba de Boschloo se basa en la prueba exacta de Fisher, tampoco existe una versión universal de dos colas de la prueba de Boschloo. A continuación, tratamos la prueba de una cola y .
Denotamos el nivel de significancia deseado por . La prueba exacta de Fisher es una prueba condicional y apropiada para el primero de los casos mencionados anteriormente. Pero si tratamos la suma de la columna observada como fija de antemano, la prueba exacta de Fisher también se puede aplicar al segundo caso. El tamaño real de la prueba depende entonces de los parámetros de molestia y . Se puede demostrar que el tamaño máximo se toma para proporciones iguales [4] y aún está controlado por . [1] Sin embargo, Boschloo afirmó que para tamaños de muestra pequeños, el tamaño máximo es a menudo considerablemente menor que . Esto conduce a una pérdida indeseable de poder .
Boschloo propuso utilizar la prueba exacta de Fisher con un nivel nominal mayor . Aquí, se debe elegir lo más grande posible de modo que el tamaño máximo aún esté controlado por : . Este método fue especialmente ventajoso en el momento de la publicación de Boschloo porque se podían buscar valores comunes de y . Esto hizo que realizar la prueba de Boschloo fuera fácil desde el punto de vista computacional.
La regla de decisión del método de Boschloo se basa en la prueba exacta de Fisher. Una forma equivalente de formular la prueba es utilizar el valor p de la prueba exacta de Fisher como estadístico de prueba . El valor p de Fisher se calcula a partir de la distribución hipergeométrica (para facilitar la notación, escribimos en lugar de ):
La distribución de está determinada por las distribuciones binomiales de y y depende del parámetro de molestia desconocido . Para un nivel de significancia especificado, el valor crítico de es el valor máximo que satisface . El valor crítico es igual al nivel nominal del enfoque original de Boschloo.
La prueba de Boschloo se ocupa del parámetro de molestia desconocido tomando el máximo en todo el espacio de parámetros . El procedimiento de Berger y Boos adopta un enfoque diferente al maximizar en un intervalo de confianza de y agregar . [5] suele ser un valor pequeño, como 0,001 o 0,0001. Esto da como resultado una prueba de Boschloo modificada que también es exacta. [6]
Todas las pruebas exactas mantienen el nivel de significación especificado, pero pueden tener un poder variable en diferentes situaciones. Mehrotra et al. compararon el poder de algunas pruebas exactas en diferentes situaciones. [6] Los resultados con respecto a la prueba de Boschloo se resumen a continuación.
La prueba de Boschloo y la prueba de Boschloo modificada tienen una potencia similar en todos los escenarios considerados. La prueba de Boschloo tiene una potencia ligeramente superior en algunos casos y viceversa en otros.
La prueba de Boschloo es, por su construcción, uniformemente más potente que la prueba exacta de Fisher. Para muestras pequeñas (por ejemplo, 10 por grupo), la diferencia de potencia es grande y oscila entre 16 y 20 puntos porcentuales en los casos considerados. La diferencia de potencia es menor para muestras de mayor tamaño.
Esta prueba se basa en la estadística de prueba
¿Dónde están las tasas de eventos grupales y es la tasa de eventos agrupados?
La potencia de esta prueba es similar a la de la prueba de Boschloo en la mayoría de los casos. En algunos casos, la prueba de conjunto tiene mayor potencia, con diferencias que oscilan en su mayoría entre 1 y 5 puntos porcentuales. En muy pocos casos, la diferencia llega hasta los 9 puntos porcentuales.
Esta prueba también se puede modificar mediante el procedimiento de Berger & Boos. Sin embargo, la prueba resultante tiene una potencia muy similar a la prueba sin modificar en todos los escenarios.
Esta prueba se basa en la estadística de prueba
¿Dónde están las tarifas de eventos grupales?
La potencia de esta prueba es similar a la de la prueba de Boschloo en muchos escenarios. En algunos casos, la prueba -Unpooled tiene mayor potencia, con diferencias que van desde 1 a 5 puntos porcentuales. Sin embargo, en otros casos, la prueba de Boschloo tiene una potencia notablemente mayor, con diferencias de hasta 68 puntos porcentuales.
Esta prueba también se puede modificar con el procedimiento de Berger & Boos. La prueba resultante tiene una potencia similar a la prueba sin modificar en la mayoría de los casos. En algunos casos, la potencia mejora considerablemente con la modificación, pero la comparación de potencia general con la prueba de Boschloo permanece inalterada.
El cálculo de la prueba de Boschloo se puede realizar con el siguiente software:
{{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link)