stringtranslate.com

Margen de error

Densidades de probabilidad de encuestas de distintos tamaños, cada una codificada por colores según su intervalo de confianza del 95 % (abajo), margen de error (izquierda) y tamaño de la muestra (derecha). Cada intervalo refleja el rango dentro del cual se puede tener un 95 % de confianza en que se puede encontrar el porcentaje verdadero , dado un porcentaje informado del 50 %. El margen de error es la mitad del intervalo de confianza (también, el radio del intervalo). Cuanto mayor sea la muestra, menor será el margen de error. Además, cuanto más alejado del 50 % esté el porcentaje informado, menor será el margen de error.

El margen de error es una estadística que expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta . Cuanto mayor sea el margen de error, menos confianza se debe tener en que el resultado de una encuesta refleje el resultado de un censo de toda la población . El margen de error será positivo siempre que una población esté muestreada de forma incompleta y la medida del resultado tenga una varianza positiva , es decir, siempre que la medida varíe .

El término margen de error se utiliza a menudo en contextos no relacionados con encuestas para indicar un error de observación al informar cantidades medidas.

Concepto

Consideremos una encuesta simple de sí/no como una muestra de encuestados extraídos de una población que informa el porcentaje de respuestas afirmativas . Nos gustaría saber qué tan cerca está del resultado verdadero una encuesta de toda la población , sin tener que realizar una. Si, hipotéticamente, realizáramos una encuesta sobre muestras subsiguientes de encuestados (recién extraídos de ), esperaríamos que esos resultados subsiguientes se distribuyeran normalmente alrededor de , el porcentaje verdadero pero desconocido de la población. El margen de error describe la distancia dentro de la cual se espera que un porcentaje específico de estos resultados varíe de .

Según el teorema del límite central , el margen de error ayuda a explicar cómo la distribución de las medias de la muestra (o el porcentaje de sí, en este caso) se aproximará a una distribución normal a medida que aumenta el tamaño de la muestra. Si esto se aplica, hablaría de que el muestreo es imparcial, pero no de la distribución inherente de los datos. [1]

Según la regla 68-95-99.7 , esperaríamos que el 95% de los resultados se encuentren dentro de aproximadamente dos desviaciones estándar ( ) a cada lado de la media verdadera . Este intervalo se denomina intervalo de confianza y el radio (la mitad del intervalo) se denomina margen de error , que corresponde a un nivel de confianza del 95% .

Generalmente, a un nivel de confianza , una muestra del tamaño de una población que tiene una desviación estándar esperada tiene un margen de error

donde denota el cuantil (también, comúnmente, una puntuación z ), y es el error estándar .

Desviación estándar y error estándar

Esperaríamos que el promedio de los valores distribuidos normalmente   tenga una desviación estándar que de alguna manera varíe con . Cuanto menor sea , más amplio será el margen. Esto se denomina error estándar .

Para el resultado único de nuestra encuesta, suponemos que , y que todos los resultados subsiguientes juntos tendrían una varianza .

Nótese que corresponde a la varianza de una distribución de Bernoulli .

Margen máximo de error en diferentes niveles de confianza

Para un nivel de confianza , existe un intervalo de confianza correspondiente sobre la media , es decir, el intervalo dentro del cual los valores de deberían caer con probabilidad . Los valores precisos de están dados por la función cuantil de la distribución normal (a la que se aproxima la regla 68–95–99,7).

Tenga en cuenta que no está definido para , es decir, no está definido, al igual que .

Gráficos logarítmicos de vs tamaño de muestra n y nivel de confianza γ . Las flechas muestran que el margen de error máximo para un tamaño de muestra de 1000 es ±3,1% con un nivel de confianza del 95% y ±4,1% con un nivel de confianza del 99%. La parábola insertada ilustra la relación entre at y at . En el ejemplo, MOE 95 (0,71) ≈ 0,9 × ±3,1% ≈ ±2,8%.

Dado que en , podemos establecer arbitrariamente , calcular , y para obtener el margen de error máximo para en un nivel de confianza y tamaño de muestra dados , incluso antes de tener los resultados reales.

También es útil para cualquier denuncia

Márgenes de error específicos

Si una encuesta tiene resultados de porcentajes múltiples (por ejemplo, una encuesta que mide una sola preferencia de opción múltiple), el resultado más cercano al 50% tendrá el margen de error más alto. Por lo general, es este número el que se informa como el margen de error para toda la encuesta. Imagine informes de encuestas como

(como en la figura de arriba)

A medida que un porcentaje dado se acerca a los extremos de 0% o 100%, su margen de error se acerca a ±0%.

Comparando porcentajes

Imaginemos que los informes de encuestas de opción múltiple son como . Como se describió anteriormente, el margen de error informado para la encuesta sería típicamente , ya que es el más cercano al 50%. Sin embargo, la noción popular de empate estadístico o de empate estadístico no se ocupa de la precisión de los resultados individuales, sino de la clasificación de los resultados. ¿Cuál está en primer lugar?

Si, hipotéticamente, realizáramos una encuesta sobre muestras subsiguientes de encuestados (recién extraídos de ) y reportáramos el resultado , podríamos usar el error estándar de la diferencia para entender cómo se espera que caiga alrededor de . Para esto, necesitamos aplicar la suma de varianzas para obtener una nueva varianza, ,

¿Dónde está la covarianza de y ?

Así (después de simplificar),

Tenga en cuenta que esto supone que es casi constante, es decir, los encuestados que eligen A o B casi nunca elegirían C (lo que hace que y estén casi perfectamente correlacionados negativamente ). Con tres o más opciones en disputa, elegir una fórmula correcta para se vuelve más complicado.

Efecto del tamaño finito de la población

Las fórmulas anteriores para el margen de error suponen que hay una población infinitamente grande y, por lo tanto, no dependen del tamaño de la población , sino solo del tamaño de la muestra . Según la teoría del muestreo , esta suposición es razonable cuando la fracción de muestreo es pequeña. El margen de error para un método de muestreo en particular es esencialmente el mismo independientemente de si la población de interés es del tamaño de una escuela, una ciudad, un estado o un país, siempre que la fracción de muestreo sea pequeña.

En los casos en que la fracción de muestreo es mayor (en la práctica, mayor del 5%), los analistas pueden ajustar el margen de error utilizando una corrección de población finita para tener en cuenta la precisión adicional obtenida al muestrear un porcentaje mucho mayor de la población. El FPC se puede calcular utilizando la fórmula [2]

...y entonces, si la encuesta se realizara sobre el 24% de, digamos, un electorado de 300.000 votantes,

Intuitivamente, para un tamaño apropiado ,

En el primer caso, es tan pequeño que no requiere corrección. En el segundo caso, la encuesta se convierte en un censo y el error de muestreo se vuelve irrelevante.

Véase también

Referencias

  1. ^ Siegfried, Tom (3 de julio de 2014). "La comprensión de los intervalos de confianza por parte de los científicos no inspira confianza | Science News". Science News . Consultado el 6 de agosto de 2024 .
  2. ^ Isserlis, L. (1918). "Sobre el valor de una media calculada a partir de una muestra". Journal of the Royal Statistical Society . 81 (1). Blackwell Publishing: 75–81. doi :10.2307/2340569. JSTOR  2340569.(Ecuación 1)

Fuentes

Enlaces externos