stringtranslate.com

Distribución muestral

En estadística , una distribución muestral o distribución de muestra finita es la distribución de probabilidad de una determinada estadística basada en una muestra aleatoria . Si se utilizara por separado un número arbitrariamente grande de muestras, cada una de las cuales incluye múltiples observaciones (puntos de datos), para calcular un valor de una estadística (como, por ejemplo, la media muestral o la varianza muestral ) para cada muestra, entonces el muestreo La distribución es la distribución de probabilidad de los valores que toma la estadística. En muchos contextos, sólo se observa una muestra, pero la distribución muestral se puede encontrar teóricamente.

Las distribuciones muestrales son importantes en estadística porque proporcionan una simplificación importante en el camino hacia la inferencia estadística . Más específicamente, permiten que las consideraciones analíticas se basen en la distribución de probabilidad de una estadística, en lugar de en la distribución de probabilidad conjunta de todos los valores de muestra individuales.

Introducción

La distribución muestral de una estadística es la distribución de esa estadística, considerada como una variable aleatoria , cuando se deriva de una muestra aleatoria de tamaño . Puede considerarse como la distribución de la estadística para todas las muestras posibles de la misma población de un tamaño de muestra determinado. La distribución muestral depende de la distribución subyacente de la población, la estadística que se considera, el procedimiento de muestreo empleado y el tamaño de muestra utilizado. A menudo existe un interés considerable en saber si la distribución muestral puede aproximarse mediante una distribución asintótica , que corresponde al caso límite ya sea cuando el número de muestras aleatorias de tamaño finito, tomadas de una población infinita y utilizadas para producir la distribución, tiende a infinito. , o cuando se toma sólo una "muestra" de tamaño igualmente infinito de esa misma población.

Por ejemplo, considere una población normal con media y varianza . Supongamos que tomamos repetidamente muestras de un tamaño determinado de esta población y calculamos la media aritmética para cada muestra; esta estadística se llama media muestral . La distribución de estas medias, o promedios, se denomina "distribución muestral de la media muestral". Esta distribución es normal ( n es el tamaño de la muestra) ya que la población subyacente es normal, aunque las distribuciones muestrales a menudo también pueden estar cerca de lo normal incluso cuando la distribución de la población no lo es (ver teorema del límite central ). Una alternativa a la media muestral es la mediana muestral . Cuando se calcula a partir de la misma población, tiene una distribución muestral diferente a la de la media y generalmente no es normal (pero puede estar cerca para tamaños de muestra grandes).

La media de una muestra de una población que tiene una distribución normal es un ejemplo de estadística simple tomada de una de las poblaciones estadísticas más simples . Para otras estadísticas y otras poblaciones, las fórmulas son más complicadas y, a menudo, no existen en forma cerrada . En tales casos, las distribuciones muestrales pueden aproximarse mediante simulaciones de Monte-Carlo , [1] métodos de arranque o teoría de distribución asintótica .

Error estándar

La desviación estándar de la distribución muestral de una estadística se denomina error estándar de esa cantidad. Para el caso en el que el estadístico es la media muestral y las muestras no están correlacionadas, el error estándar es:

Una implicación importante de esta fórmula es que el tamaño de la muestra debe cuadruplicarse (multiplicarse por 4) para lograr la mitad (1/2) del error de medición. Al diseñar estudios estadísticos en los que el costo es un factor, esto puede contribuir a comprender las compensaciones costo-beneficio.

Para el caso en el que la estadística es el total de la muestra y las muestras no están correlacionadas, el error estándar es:

Ejemplos

Referencias

  1. ^ Mooney, Christopher Z. (1999). Simulación del Monte Carlo. Thousand Oaks, California: Sage. pag. 2.ISBN _ 9780803959439.

enlaces externos