stringtranslate.com

Prueba binomial

La prueba binomial es una prueba exacta de la significancia estadística de las desviaciones de una distribución teóricamente esperada de observaciones en dos categorías utilizando datos de muestra.

Uso

La prueba binomial es útil para probar hipótesis sobre la probabilidad ( ) de éxito:

donde es un valor definido por el usuario entre 0 y 1.

Si en una muestra de tamaño hay éxitos, mientras esperamos , la fórmula de la distribución binomial da la probabilidad de encontrar este valor:

Si la hipótesis nula fuera correcta, entonces el número esperado de éxitos sería . Hallamos nuestro valor para esta prueba considerando la probabilidad de ver un resultado como extremo o más extremo. Para una prueba de una cola, esto es sencillo de calcular. Supongamos que queremos probar si . Entonces nuestro valor sería,

Se puede realizar un cálculo análogo si estamos probando si usamos la suma del rango de a en su lugar.

Calcular un valor de para una prueba de dos colas es un poco más complicado, ya que una distribución binomial no es simétrica si . Esto significa que no podemos simplemente duplicar el valor de de la prueba de una cola. Recordemos que queremos considerar eventos que sean tan extremos como el que hemos visto o más, por lo que debemos considerar la probabilidad de que veamos un evento que sea tan o menos probable que . Sea . todos esos eventos. Entonces, el valor de dos colas se calcula como,

Uso común

Un uso común de la prueba binomial es el caso en el que la hipótesis nula plantea que dos categorías ocurren con la misma frecuencia ( ), como en el lanzamiento de una moneda. Hay tablas disponibles para indicar la cantidad de observaciones significativas en las categorías para este caso. Sin embargo, como muestra el ejemplo siguiente, la prueba binomial no se limita a este caso.

Cuando hay más de dos categorías y se requiere una prueba exacta, se debe utilizar la prueba multinomial , basada en la distribución multinomial , en lugar de la prueba binomial. [1]

Muestras grandes

En el caso de muestras grandes, como el ejemplo siguiente, la distribución binomial se aproxima bien mediante distribuciones continuas convenientes , que se utilizan como base para pruebas alternativas que son mucho más rápidas de calcular, como la prueba de chi-cuadrado de Pearson y la prueba G. Sin embargo, en el caso de muestras pequeñas, estas aproximaciones no funcionan y no hay alternativa a la prueba binomial.

La aproximación más usual (y más fácil) es a través de la distribución normal estándar, en la que se realiza una prueba z del estadístico de prueba , dado por

donde es el número de éxitos observados en una muestra de tamaño y es la probabilidad de éxito según la hipótesis nula. Es posible mejorar esta aproximación introduciendo una corrección de continuidad :

Para valores muy grandes , esta corrección de continuidad no será importante, pero para valores intermedios, donde la prueba binomial exacta no funciona, arrojará un resultado sustancialmente más preciso.

En notación en términos de una proporción de muestra medida , hipótesis nula para la proporción y tamaño de muestra , donde y , se puede reorganizar y escribir la prueba z anterior como

dividiendo por tanto en numerador como en denominador, que es una forma que puede resultar más familiar para algunos lectores.

Ejemplo

Supongamos que tenemos un juego de mesa que depende de la tirada de un dado y que concede especial importancia a que salga un 6. En un juego en particular, el dado se lanza 235 veces y sale 6 51 veces. Si el dado es justo, esperaríamos que saliera un 6.

veces. Hemos observado que la cantidad de 6 es mayor que la que esperaríamos en promedio por pura casualidad si el dado hubiera sido justo. Pero, ¿es el número significativamente alto lo suficiente como para que podamos concluir algo sobre la imparcialidad del dado? Esta pregunta puede responderse mediante la prueba binomial. Nuestra hipótesis nula sería que el dado es justo (la probabilidad de que salga cada número en el dado es 1/6).

Para encontrar una respuesta a esta pregunta usando la prueba binomial, utilizamos la distribución binomial

con pmf .

Como hemos observado un valor mayor que el valor esperado, podríamos considerar la probabilidad de observar 51 6 o más bajo la hipótesis nula, lo que constituiría una prueba de una cola (aquí estamos básicamente probando si este dado está sesgado a generar más 6 de lo esperado). Para calcular la probabilidad de 51 o más 6 en una muestra de 235 bajo la hipótesis nula, sumamos las probabilidades de obtener exactamente 51 6, exactamente 52 6, y así sucesivamente hasta la probabilidad de obtener exactamente 235 6:

Si tenemos un nivel de significancia del 5%, entonces este resultado (0,02654 < 5%) indica que tenemos evidencia lo suficientemente significativa para rechazar la hipótesis nula de que el dado es justo.

Normalmente, cuando probamos la imparcialidad de un dado, también nos interesa si el dado está sesgado a generar menos 6 de lo esperado, y no solo más 6 como consideramos en la prueba de una cola anterior. Para considerar ambos sesgos, utilizamos una prueba de dos colas . Tenga en cuenta que para hacer esto no podemos simplemente duplicar el valor p de una cola a menos que la probabilidad del evento sea 1/2. Esto se debe a que la distribución binomial se vuelve asimétrica a medida que esa probabilidad se desvía de 1/2. Hay dos métodos para definir el valor p de dos colas. Un método es sumar la probabilidad de que la desviación total en números de eventos en cualquier dirección del valor esperado sea mayor o menor que el valor esperado. La probabilidad de que eso ocurra en nuestro ejemplo es 0,0437. El segundo método implica calcular la probabilidad de que la desviación del valor esperado sea tan improbable o más improbable que el valor observado, es decir, a partir de una comparación de las funciones de densidad de probabilidad. Esto puede crear una diferencia sutil, pero en este ejemplo arroja la misma probabilidad de 0,0437. En ambos casos, la prueba de dos colas revela significancia al nivel del 5 %, lo que indica que la cantidad de 6 observada fue significativamente diferente para este dado que la cantidad esperada al nivel del 5 %.

En paquetes de software estadístico

Las pruebas binomiales están disponibles en la mayoría del software utilizado con fines estadísticos. Por ejemplo:

Véase también

Referencias

  1. ^ Howell, David C. (2007). Métodos estadísticos para la psicología (6.ª ed.). Belmont, California: Thomson. ISBN 978-0495012870.

Lectura adicional

Enlaces externos