stringtranslate.com

prueba Z

Una prueba Z es cualquier prueba estadística para la cual la distribución del estadístico de prueba bajo la hipótesis nula puede aproximarse mediante una distribución normal . La prueba Z prueba la media de una distribución. Para cada nivel de significancia en el intervalo de confianza , la prueba Z tiene un único valor crítico (por ejemplo, 1,96 para un 5% de dos colas), lo que la hace más conveniente que la prueba t de Student cuyos valores críticos están definidos por el tamaño de la muestra ( a través de los correspondientes grados de libertad ). Tanto la prueba Z como la prueba t de Student tienen similitudes en el sentido de que ambas ayudan a determinar la importancia de un conjunto de datos. Sin embargo, la prueba z rara vez se utiliza en la práctica porque la desviación de la población es difícil de determinar.

Aplicabilidad

Debido al teorema del límite central , muchas estadísticas de prueba tienen una distribución aproximadamente normal para muestras grandes. Por lo tanto, muchas pruebas estadísticas se pueden realizar convenientemente como pruebas Z aproximadas si el tamaño de la muestra es grande o se conoce la varianza poblacional. Si la varianza poblacional es desconocida (y por lo tanto debe estimarse a partir de la muestra misma) y el tamaño de la muestra no es grande ( n < 30), la prueba t de Student puede ser más apropiada (en algunos casos, n < 50, como descrito abajo).

Procedimiento

Cómo realizar una prueba Z cuando T es un estadístico que se distribuye aproximadamente normalmente bajo la hipótesis nula es el siguiente:

Primero, estime el valor esperado μ de T bajo la hipótesis nula y obtenga una estimación s de la desviación estándar de T.

En segundo lugar, determine las propiedades de T  : una cola o dos colas.

Para la hipótesis nula H 0 : μ≥μ 0 frente a la hipótesis alternativa H 1 : μ<μ 0 , es de cola inferior/izquierda (una cola).

Para la hipótesis nula H 0 : μ≤μ 0 frente a la hipótesis alternativa H 1 : μ>μ 0 , es de cola superior/derecha (una cola).

Para la hipótesis nula H 0 : μ=μ 0 frente a la hipótesis alternativa H 1 : μ≠μ 0 , es de dos colas.

En tercer lugar, calcule la puntuación estándar :

valores p de una y dos colasZZZfunción de distribución acumulativa normal

Uso en pruebas de ubicación

  1. El término " prueba Z " se utiliza a menudo para referirse específicamente a la prueba de ubicación de una muestra que compara la media de un conjunto de mediciones con una constante dada cuando se conoce la varianza de la muestra. Por ejemplo, si los datos observados X 1 , ..., X n son (i) independientes, (ii) tienen una media común μ y (iii) tienen una varianza común σ 2 , entonces el promedio muestral X tiene una media μ y varianza .
  2. La hipótesis nula es que el valor medio de X es un número dado μ 0 . Podemos usar X   como estadístico de prueba, rechazando la hipótesis nula si X  − μ 0 es grande.
  3. Para calcular la estadística estandarizada , necesitamos saber o tener un valor aproximado de σ 2 , a partir del cual podamos calcular . En algunas aplicaciones, se conoce σ 2 , pero esto es poco común.
  4. Si el tamaño de la muestra es moderado o grande, podemos sustituir la varianza muestral por σ 2 , dando una prueba complementaria . La prueba resultante no será una prueba Z exacta ya que no se tiene en cuenta la incertidumbre en la varianza de la muestra; sin embargo, será una buena aproximación a menos que el tamaño de la muestra sea pequeño.
  5. Se puede utilizar una prueba t para tener en cuenta la incertidumbre en la varianza de la muestra cuando los datos son exactamente normales .
  6. Diferencia entre la prueba Z y la prueba t: la prueba Z se utiliza cuando el tamaño de la muestra es grande (n>50) o se conoce la varianza de la población. La prueba t se utiliza cuando el tamaño de la muestra es pequeño (n<50) y se desconoce la varianza de la población.
  7. No existe una constante universal en la que el tamaño de la muestra se considere lo suficientemente grande como para justificar el uso de la prueba complementaria. Reglas generales típicas: el tamaño de la muestra debe ser de 50 observaciones o más.
  8. Para tamaños de muestra grandes, el procedimiento de prueba t proporciona valores p casi idénticos a los del procedimiento de prueba Z.
  9. Otras pruebas de ubicación que se pueden realizar como pruebas Z son la prueba de ubicación de dos muestras y la prueba de diferencias pareadas .

Condiciones

Para que la prueba Z sea aplicable, se deben cumplir ciertas condiciones.

Si se incluyen estimaciones de parámetros molestos como se analizó anteriormente, es importante utilizar estimaciones apropiadas para la forma en que se muestrearon los datos . En el caso especial de las pruebas Z para el problema de ubicación de una o dos muestras, la desviación estándar habitual de la muestra sólo es apropiada si los datos se recopilaron como una muestra independiente.

En algunas situaciones, es posible diseñar una prueba que tenga en cuenta adecuadamente la variación en las estimaciones de parámetros molestos de los complementos. En el caso de problemas de ubicación de una y dos muestras, una prueba t hace esto.

Ejemplo

Supongamos que en una región geográfica particular, la media y la desviación estándar de las puntuaciones en una prueba de lectura son 100 puntos y 12 puntos, respectivamente. Nuestro interés está en los puntajes de 55 estudiantes en una escuela en particular que recibieron un puntaje promedio de 96. Podemos preguntar si este puntaje promedio es significativamente menor que el promedio regional; es decir, ¿son los estudiantes de esta escuela comparables a un puntaje aleatorio simple? muestra de 55 estudiantes de toda la región, o sus puntajes son sorprendentemente bajos?

Primero calcule el error estándar de la media:

¿Dónde está la desviación estándar de la población?

Luego calcule la puntuación z , que es la distancia desde la media de la muestra a la media de la población en unidades del error estándar:

En este ejemplo, tratamos la media y la varianza de la población como conocidas, lo que sería apropiado si todos los estudiantes de la región fueran evaluados. Cuando se desconocen los parámetros de la población, se debe realizar una prueba t de Student .

La puntuación media del aula es 96, que es −2,47 unidades de error estándar de la media poblacional de 100. Al buscar la puntuación z en una tabla de probabilidad acumulada de la distribución normal estándar , encontramos que la probabilidad de observar un valor normal estándar a continuación −2,47 es aproximadamente 0,5 − 0,4932 = 0,0068. Este es el valor p unilateral para la hipótesis nula de que los 55 estudiantes son comparables a una muestra aleatoria simple de la población de todos los examinados. El valor p bilateral es aproximadamente 0,014 (el doble del valor p unilateral ).

Otra forma de expresar las cosas es que con probabilidad 1 − 0,014 = 0,986, una muestra aleatoria simple de 55 estudiantes tendría una puntuación media en la prueba dentro de 4 unidades de la media poblacional. También podríamos decir que con un 98,6% de confianza rechazamos la hipótesis nula de que los 55 examinados son comparables a una muestra aleatoria simple de la población de examinados.

La prueba Z nos dice que los 55 estudiantes de interés tienen una puntuación media inusualmente baja en comparación con la mayoría de las muestras aleatorias simples de tamaño similar de la población de examinados. Una deficiencia de este análisis es que no considera si el tamaño del efecto de 4 puntos es significativo. Si en lugar de un aula, consideráramos una subregión que contiene 900 estudiantes cuyo puntaje promedio fuera 99, se observaría casi el mismo puntaje z y valor p . Esto muestra que si el tamaño de la muestra es lo suficientemente grande, diferencias muy pequeñas con respecto al valor nulo pueden ser altamente significativas desde el punto de vista estadístico. Consulte la prueba de hipótesis estadística para obtener más información sobre este tema.

Pruebas Z distintas de las pruebas de ubicación

Las pruebas de ubicación son las pruebas Z más familiares . Otra clase de pruebas Z surge en la estimación de máxima verosimilitud de los parámetros en un modelo estadístico paramétrico . Las estimaciones de máxima verosimilitud son aproximadamente normales en determinadas condiciones y su varianza asintótica se puede calcular en términos de la información de Fisher. La estimación de máxima verosimilitud dividida por su error estándar se puede utilizar como estadístico de prueba para la hipótesis nula de que el valor poblacional del parámetro es igual a cero. De manera más general, si es la estimación de máxima verosimilitud de un parámetro θ, y θ 0 es el valor de θ bajo la hipótesis nula,

se puede utilizar como estadístico de prueba Z.

Cuando se utiliza una prueba Z para estimaciones de máxima verosimilitud, es importante tener en cuenta que la aproximación normal puede ser deficiente si el tamaño de la muestra no es lo suficientemente grande. Aunque no existe una regla simple y universal que indique qué tan grande debe ser el tamaño de la muestra para utilizar una prueba Z , la simulación puede dar una buena idea de si una prueba Z es apropiada en una situación determinada.

Las pruebas Z se emplean siempre que se puede argumentar que un estadístico de prueba sigue una distribución normal bajo la hipótesis nula de interés. Muchas estadísticas de prueba no paramétricas , como las estadísticas U , son aproximadamente normales para tamaños de muestra suficientemente grandes y, por lo tanto, a menudo se realizan como pruebas Z.

Ver también

Referencias