stringtranslate.com

Determinación del tamaño de la muestra

La determinación o estimación del tamaño de la muestra es el acto de elegir el número de observaciones o réplicas a incluir en una muestra estadística . El tamaño de la muestra es una característica importante de cualquier estudio empírico en el que el objetivo sea hacer inferencias sobre una población a partir de una muestra. En la práctica, el tamaño de la muestra utilizada en un estudio generalmente se determina en función del costo, el tiempo o la conveniencia de recopilar los datos y la necesidad de que ofrezcan suficiente poder estadístico . En estudios complejos, se pueden asignar diferentes tamaños de muestra, como en encuestas estratificadas o diseños experimentales con múltiples grupos de tratamiento. En un censo se buscan datos de toda una población, de ahí que el tamaño de muestra previsto sea igual al de la población. En el diseño experimental , donde un estudio puede dividirse en diferentes grupos de tratamiento , puede haber diferentes tamaños de muestra para cada grupo.

Los tamaños de muestra se pueden elegir de varias maneras:

Introducción

La determinación del tamaño de la muestra es un aspecto crucial de la metodología de investigación que desempeña un papel importante para garantizar la confiabilidad y validez de los hallazgos del estudio. Para influir en la precisión de las estimaciones, el poder de las pruebas estadísticas y la solidez general de los hallazgos de la investigación, implica elegir cuidadosamente el número de participantes o puntos de datos que se incluirán en un estudio.

Por ejemplo, si estamos realizando una encuesta para determinar el nivel medio de satisfacción de los clientes con respecto a un nuevo producto. Para determinar un tamaño de muestra apropiado, debemos considerar factores como el nivel deseado de confianza, el margen de error y la variabilidad en las respuestas. Podríamos decidir que queremos un nivel de confianza del 95%, lo que significa que tenemos un 95% de confianza en que el verdadero nivel promedio de satisfacción se encuentra dentro del rango calculado. También decidimos un margen de error, de ±3%, que indica el rango aceptable de diferencia entre nuestra estimación de muestra y el parámetro de población real. Además, podemos tener alguna idea de la variabilidad esperada en los niveles de satisfacción con base en datos o suposiciones anteriores.

Importancia

Los tamaños de muestra más grandes generalmente conducen a una mayor precisión al estimar parámetros desconocidos. Por ejemplo, para determinar con precisión la prevalencia de la infección por patógenos en una especie específica de pez, es preferible examinar una muestra de 200 peces en lugar de 100 peces. Varios hechos fundamentales de la estadística matemática describen este fenómeno, incluida la ley de los grandes números y el teorema del límite central .

En algunas situaciones, el aumento de la precisión para tamaños de muestra más grandes es mínimo o incluso inexistente. Esto puede deberse a la presencia de errores sistemáticos o una fuerte dependencia en los datos, o si los datos siguen una distribución de cola pesada, o porque los datos son fuertemente dependientes o sesgados.

Los tamaños de las muestras pueden evaluarse según la calidad de las estimaciones resultantes, de la siguiente manera. Generalmente se determina sobre la base del costo, el tiempo o la conveniencia de la recopilación de datos y la necesidad de suficiente poder estadístico. Por ejemplo, si se estima una proporción, es posible que desee que el intervalo de confianza del 95% tenga menos de 0,06 unidades de ancho. Alternativamente, el tamaño de la muestra puede evaluarse en función del poder de una prueba de hipótesis. Por ejemplo, si comparamos el apoyo a un determinado candidato político entre las mujeres con el apoyo a ese candidato entre los hombres, es posible que deseemos tener un poder del 80% para detectar una diferencia en los niveles de apoyo de 0,04 unidades.

Estimacion

Estimación de una proporción

Una situación relativamente simple es la estimación de una proporción . Es un aspecto fundamental del análisis estadístico, particularmente cuando se mide la prevalencia de una característica específica dentro de una población. Por ejemplo, es posible que deseemos estimar la proporción de residentes de una comunidad que tienen al menos 65 años.

El estimador de una proporción es , donde X es el número de "positivos" (por ejemplo, el número de personas de las n muestras que tienen al menos 65 años). Cuando las observaciones son independientes , este estimador tiene una distribución binomial (escalada) (y también es la media muestral de los datos de una distribución de Bernoulli ). La varianza máxima de esta distribución es 0,25, lo que ocurre cuando el parámetro verdadero es p = 0,5. En aplicaciones prácticas, donde se desconoce el verdadero parámetro p , a menudo se emplea la varianza máxima para evaluaciones del tamaño de la muestra. Si se conoce una estimación razonable de p, se puede utilizar la cantidad en lugar de 0,25.

A medida que el tamaño de la muestra n crece lo suficiente, la distribución de se aproximará mucho a una distribución normal . [1] Al utilizar este método y el de Wald para la distribución binomial , se obtiene un intervalo de confianza, donde Z representa la puntuación Z estándar para el nivel de confianza deseado (p. ej., 1,96 para un intervalo de confianza del 95 %), en la forma:

Para determinar un tamaño de muestra n apropiado para estimar proporciones, se puede resolver la siguiente ecuación, donde W representa el ancho deseado del intervalo de confianza. La fórmula del tamaño de muestra resultante a menudo se aplica con una estimación conservadora de p (p. ej., 0,5):

para n , obteniendo el tamaño de la muestra

tamaños de muestra para proporciones binomiales dados diferentes niveles de confianza y márgenes de error

, en el caso de utilizar .5 como estimación más conservadora de la proporción. (Nota: W/2 = margen de error ).

En la siguiente figura se puede observar cómo cambian los tamaños de muestra para proporciones binomiales dados diferentes niveles de confianza y márgenes de error.


De lo contrario, la fórmula sería , que da como resultado . Por ejemplo, al estimar la proporción de la población estadounidense que apoya a un candidato presidencial con un intervalo de confianza del 95% de 2 puntos porcentuales (0,02), se requiere un tamaño de muestra de (1,96) 2 / (0,02 2 ) = 9604 con el margen El error en este caso es de 1 punto porcentual. Es razonable utilizar la estimación de 0,5 para p en este caso porque las elecciones presidenciales suelen ser cercanas al 50/50, y también es prudente utilizar una estimación conservadora. El margen de error en este caso es de 1 punto porcentual (la mitad de 0,02).

En la práctica, la fórmula : se utiliza comúnmente para formar un intervalo de confianza del 95% para la proporción real. La ecuación se puede resolver para n , proporcionando un tamaño de muestra mínimo necesario para alcanzar el margen de error deseado. Lo anterior se simplifica comúnmente: "Inferencia para regresión". utdallas.edu .</ref> [2] n  = 4/ W 2  = 1/ B 2 donde B es el límite de error en la estimación, es decir, la estimación generalmente se da dentro de ± B . Para B = 10% se requiere n = 100, para B = 5% se necesita n = 400, para B = 3% el requisito se aproxima a n = 1000, mientras que para B = 1% se requiere un tamaño de muestra de n = 10000 . Estas cifras se citan a menudo en informes noticiosos de encuestas de opinión y otras encuestas por muestreo . Sin embargo, es posible que los resultados informados no sean el valor exacto, ya que es preferible que los números se redondeen hacia arriba. Sabiendo que el valor de n es el número mínimo de puntos de muestra necesarios para adquirir el resultado deseado, el número de encuestados debe estar en el mínimo o por encima de él.

Estimación de una media

En pocas palabras, si intentamos estimar el tiempo promedio que tardan las personas en viajar al trabajo en una ciudad. En lugar de encuestar a toda la población, se puede tomar una muestra aleatoria de 100 personas, registrar sus tiempos de viaje y luego calcular el tiempo medio (promedio) de viaje para esa muestra. Por ejemplo, la persona 1 tarda 25 minutos, la persona 2 tarda 30 minutos,..., la persona 100 tarda 20 minutos. Sume todos los tiempos de viaje y divídalos por el número de personas de la muestra (100 en este caso). El resultado sería su estimación del tiempo medio de viaje para toda la población. Este método es práctico cuando no es posible medir a todos los miembros de la población y proporciona una aproximación razonable basada en una muestra representativa.

De una manera precisamente matemática, al estimar la media poblacional utilizando una muestra independiente e idénticamente distribuida (iid) de tamaño n , donde cada valor de datos tiene varianza σ 2 , el error estándar de la media muestral es:

Esta expresión describe cuantitativamente cómo la estimación se vuelve más precisa a medida que aumenta el tamaño de la muestra. El uso del teorema del límite central para justificar la aproximación de la media muestral con una distribución normal produce un intervalo de confianza de la forma

,
donde Z es una puntuación Z estándar para el nivel de confianza deseado (1,96 para un intervalo de confianza del 95%).

Para determinar el tamaño de muestra n requerido para un intervalo de confianza de ancho W, con W/2 como margen de error a cada lado de la media muestral, la ecuación

puede ser resuelto. Esto produce la fórmula del tamaño de la muestra, para n :

.

Por ejemplo, si se estima el efecto de un fármaco sobre la presión arterial con un intervalo de confianza del 95% de seis unidades de ancho y la desviación estándar conocida de la presión arterial en la población es 15, el tamaño de muestra requerido sería , que se redondearía. hasta 97, ya que los tamaños de muestra deben ser números enteros y deben cumplir o exceder el valor mínimo calculado . Comprender estos cálculos es esencial para los investigadores que diseñan estudios para estimar con precisión las medias poblacionales dentro de un nivel deseado de confianza.

Tamaños de muestra requeridos para las pruebas de hipótesis

Uno de los desafíos más frecuentes que enfrentan los estadísticos gira en torno a la tarea de calcular el tamaño de muestra necesario para alcanzar un poder estadístico específico para una prueba, manteniendo al mismo tiempo una tasa de error tipo I predeterminada α, que significa el nivel de significancia en la prueba de hipótesis. . Se obtiene una determinada potencia para una prueba, dada una determinada cantidad. De la siguiente manera, esto puede estimarse mediante tablas predeterminadas para ciertos valores, mediante la ecuación de recursos de Mead o, más generalmente, mediante la función de distribución acumulativa :

Mesas

La tabla que se muestra a la derecha se puede utilizar en una prueba t de dos muestras para estimar los tamaños de muestra de un grupo experimental y un grupo de control que son del mismo tamaño, es decir, el número total de individuos en el ensayo es el doble que del número dado, y el nivel de significancia deseado es 0,05. [3] Los parámetros utilizados son:

La ecuación de recursos de Mead

La ecuación de recursos de Mead se utiliza a menudo para estimar tamaños de muestras de animales de laboratorio , así como en muchos otros experimentos de laboratorio. Puede que no sea tan preciso como utilizar otros métodos para estimar el tamaño de la muestra, pero da una idea de cuál es el tamaño de muestra apropiado cuando parámetros como las desviaciones estándar esperadas o las diferencias esperadas en los valores entre grupos se desconocen o son muy difíciles de estimar. [4]

Todos los parámetros de la ecuación son, de hecho, los grados de libertad del número de sus conceptos y, por lo tanto, sus números se restan en 1 antes de insertarlos en la ecuación.

La ecuación es: [4]

dónde:

Por ejemplo, si se planifica un estudio con animales de laboratorio con cuatro grupos de tratamiento ( T =3), con ocho animales por grupo, lo que hace un total de 32 animales ( N =31), sin ninguna estratificación adicional ( B =0), entonces E igual a 28, que está por encima del límite de 20, lo que indica que el tamaño de la muestra puede ser demasiado grande y que seis animales por grupo podrían ser más apropiados. [5]

Función de distribución acumulativa

Sean X i , i = 1, 2, ..., n observaciones independientes tomadas de una distribución normal con media desconocida μ y varianza conocida σ 2 . Consideremos dos hipótesis, una hipótesis nula :

y una hipótesis alternativa:

para alguna 'diferencia significativa más pequeña' μ *  > 0. Este es el valor más pequeño para el cual nos interesa observar una diferencia. Ahora, para (1) rechazar H 0 con una probabilidad de al menos 1 −  β cuando H a es verdadera (es decir, una potencia de 1 −  β ), y (2) rechazar H 0 con probabilidad α cuando H 0 es verdadera, es necesario lo siguiente: Si z α es el punto porcentual α superior de la distribución normal estándar, entonces

y entonces

'Rechace H 0 si nuestro promedio muestral ( ) es mayor que '

es una regla de decisión que satisface (2). (Esta es una prueba de una cola). En tal escenario, lograr esto con una probabilidad de al menos 1 − β cuando la hipótesis alternativa H a es verdadera se vuelve imperativo. Aquí, el promedio de la muestra se origina a partir de una distribución normal con una media de μ * . Así, el requisito se expresa como:

Mediante una manipulación cuidadosa, se puede demostrar que esto sucede (ver Ejemplo de poder estadístico ) cuando

donde es la función de distribución acumulativa normal .

Tamaño de muestra estratificado

Con técnicas de muestreo más complicadas, como el muestreo estratificado , la muestra a menudo se puede dividir en submuestras. Normalmente, si hay H tales submuestras (de H estratos diferentes), entonces cada una de ellas tendrá un tamaño de muestra n h , h = 1, 2, ..., H . Estos n h deben ajustarse a la regla de que n 1 + n 2 + ... + n H = n (es decir, que el tamaño total de la muestra viene dado por la suma de los tamaños de las submuestras). La selección óptima de estos n h se puede realizar de varias maneras, utilizando (por ejemplo) la asignación óptima de Neyman.

Hay muchas razones para utilizar el muestreo estratificado: [6] disminuir las varianzas de las estimaciones de la muestra, utilizar métodos parcialmente no aleatorios o estudiar los estratos individualmente. Un método útil, en parte no aleatorio, sería tomar muestras de individuos cuando sean fácilmente accesibles y, cuando no, muestrear conglomerados para ahorrar costos de viaje. [7]

En general, para los estratos H , una media muestral ponderada es

con

[8]

Los pesos, frecuentemente, pero no siempre, representan las proporciones de los elementos de la población en los estratos, y . Para un tamaño de muestra fijo, es decir ,

[9]

que puede ser mínimo si la tasa de muestreo dentro de cada estrato se hace proporcional a la desviación estándar dentro de cada estrato: , donde y es una constante tal que .

Se alcanza una "asignación óptima" cuando las tasas de muestreo dentro de los estratos se hacen directamente proporcionales a las desviaciones estándar dentro de los estratos e inversamente proporcionales a la raíz cuadrada del costo de muestreo por elemento dentro de los estratos :

[10]

donde es una constante tal que , o, más generalmente, cuando

[11]

Investigación cualitativa

La investigación cualitativa aborda la determinación del tamaño de la muestra con una metodología distintiva que difiere de los métodos cuantitativos. En lugar de depender de fórmulas predeterminadas o cálculos estadísticos, implica un juicio subjetivo e iterativo a lo largo del proceso de investigación. En los estudios cualitativos, los investigadores a menudo adoptan una postura subjetiva y toman determinaciones a medida que se desarrolla el estudio. La determinación del tamaño de la muestra en estudios cualitativos adopta un enfoque diferente. Generalmente es un juicio subjetivo, tomado a medida que avanza la investigación. [12] Un enfoque común es incluir continuamente participantes o materiales adicionales hasta que se alcance un punto de "saturación". La saturación ocurre cuando nuevos participantes o datos dejan de proporcionar nuevos conocimientos, lo que indica que el estudio ha capturado adecuadamente la diversidad de perspectivas o experiencias dentro de la muestra elegida. Se alcanza la saturación . [13] El número necesario para alcanzar la saturación se ha investigado empíricamente. [14] [15] [16] [17]

A diferencia de la investigación cuantitativa, los estudios cualitativos enfrentan una escasez de orientación confiable con respecto a la estimación del tamaño de la muestra antes de comenzar la investigación. Imagine realizar entrevistas en profundidad con sobrevivientes de cáncer; los investigadores cualitativos pueden utilizar la saturación de datos para determinar el tamaño de muestra adecuado. Si, a lo largo de varias entrevistas, no aparecen temas o ideas nuevas, se ha alcanzado la saturación y es posible que más entrevistas no aporten mucho a nuestro conocimiento de la experiencia del superviviente. Así, en lugar de seguir una fórmula estadística preestablecida, el concepto de alcanzar la saturación sirve como una guía dinámica para determinar el tamaño de la muestra en la investigación cualitativa. Hay escasez de orientación confiable sobre la estimación del tamaño de las muestras antes de comenzar la investigación, con una variedad de sugerencias. [15] [18] [19] [20] En un esfuerzo por introducir cierta estructura en el proceso de determinación del tamaño de la muestra en la investigación cualitativa, se ha propuesto una herramienta análoga a los cálculos de poder cuantitativos. Esta herramienta, basada en la distribución binomial negativa , está especialmente diseñada para el análisis temático . [21] [20]

Ver también

Referencias

  1. ^ NIST / SEMATECH , "7.2.4.2. Tamaños de muestra requeridos", Manual electrónico de métodos estadísticos.
  2. ^ "Intervalo de confianza para una proporción" Archivado el 23 de agosto de 2011 en la Wayback Machine.
  3. ^ ab Capítulo 13, página 215, en: Kenny, David A. (1987). Estadística para las ciencias sociales y del comportamiento . Boston: pequeño, marrón. ISBN 978-0-316-48915-7.
  4. ^ ab Kirkwood, James; Robert Hubrecht (2010). Manual de la UFAW sobre el cuidado y manejo de animales de laboratorio y otros animales de investigación . Wiley-Blackwell. pag. 29.ISBN 978-1-4051-7523-4.en línea Página 29
  5. ^ Isogenic.info > Ecuación de recursos de Michael FW Festing. Actualizado en septiembre de 2006
  6. ^ Kish (1965, sección 3.1)
  7. ^ Kish (1965), pág. 148.
  8. ^ Kish (1965), pág. 78.
  9. ^ Kish (1965), pág. 81.
  10. ^ Kish (1965), pág. 93.
  11. ^ Kish (1965), pág. 94.
  12. ^ Sandelowski, M. (1995). Tamaño de la muestra en la investigación cualitativa. Investigación en enfermería y salud , 18, 179–183
  13. ^ Glaser, B. (1965). El método comparativo constante del análisis cualitativo. Problemas sociales , 12, 436–445
  14. ^ Francisco, Jill J.; Johnston, María; Robertson, Clara; Glidewell, Liz; Enroscar, Vikki; Eccles, Martín P.; Grimshaw, Jeremy M. (2010). "¿Qué es un tamaño de muestra adecuado? Operacionalizar la saturación de datos para estudios de entrevistas basados ​​en teoría" (PDF) . Psicología y Salud . 25 (10): 1229-1245. doi :10.1080/08870440903194015. PMID  20204937. S2CID  28152749.
  15. ^ ab Invitado, Greg; Bunce, Arwen; Johnson, Laura (2006). "¿Cuántas entrevistas son suficientes?". Métodos de campo . 18 : 59–82. doi :10.1177/1525822X05279903. S2CID  62237589.
  16. ^ Wright, Adán; Maloney, Francine L.; Feblowitz, Joshua C. (2011). "Actitudes de los médicos hacia y el uso de listas de problemas electrónicos: un análisis temático". BMC Informática Médica y Toma de Decisiones . 11 : 36. doi : 10.1186/1472-6947-11-36 . PMC 3120635 . PMID  21612639. 
  17. ^ Mason, Mark (2010). "Tamaño de muestra y saturación en estudios de doctorado mediante entrevistas cualitativas". Foro Cualitativo Sozialforschung . 11 (3): 8.
  18. ^ Emmel, N. (2013). Muestreo y elección de casos en investigación cualitativa: un enfoque realista. Londres: sabio.
  19. ^ Onwuegbuzie, Anthony J.; Sanguijuela, Nancy L. (2007). "Un llamado a análisis de poder cualitativo". Calidad cantidad . 41 : 105-121. doi :10.1007/s11135-005-1098-1. S2CID  62179911.
  20. ^ ab Fugard AJB; Potts HWW (10 de febrero de 2015). "Apoyar el pensamiento sobre tamaños de muestra para análisis temáticos: una herramienta cuantitativa" (PDF) . Revista Internacional de Metodología de la Investigación Social . 18 (6): 669–684. doi : 10.1080/13645579.2015.1005453 . S2CID  59047474.
  21. ^ Galvin R (2015). ¿Cuántas entrevistas son suficientes? ¿Las entrevistas cualitativas en la investigación del consumo de energía de los edificios producen conocimientos confiables? Revista de ingeniería de la construcción, 1:2–12.

Referencias generales

Otras lecturas

enlaces externos