stringtranslate.com

Pseudorreplicación

La pseudorreplicación (a veces error de unidad de análisis [1] ) tiene muchas definiciones. La pseudorreplicación fue definida originalmente en 1984 por Stuart H. Hurlbert [2] como el uso de estadísticas inferenciales para probar los efectos del tratamiento con datos de experimentos en los que los tratamientos no se replican (aunque las muestras pueden sí) o las réplicas no son estadísticamente independientes. Posteriormente, Millar y Anderson [3] lo identificaron como un caso especial de especificación inadecuada de factores aleatorios donde están presentes tanto factores aleatorios como fijos. A veces se interpreta estrictamente como una inflación del número de muestras o réplicas que no son estadísticamente independientes. [4] Esta definición omite la confusión de los efectos de la unidad y del tratamiento en una relación F mal especificada . En la práctica, los ratios F incorrectos para pruebas estadísticas de efectos fijos a menudo surgen de un ratio F predeterminado que se forma sobre el error en lugar del término mixto.

Lazic [5] definió la pseudorreplicación como un problema de muestras correlacionadas (por ejemplo, de estudios longitudinales ) donde la correlación no se tiene en cuenta al calcular el intervalo de confianza para la media de la muestra. Para conocer el efecto de la correlación serial o temporal, consulte también el teorema del límite central de la cadena de Markov .

Pseudorreplicación debida a la correlación de muestras: sin tener en cuenta la correlación, el intervalo de confianza del 90% para la media de la muestra es demasiado pequeño. Para solucionar este problema, por ejemplo, se puede aplicar el método de bloqueo , donde primero se agrupan las muestras correlacionadas y luego (para cada bloque) se calculan las medias de las muestras correspondientes. A partir de estas dos "medias de muestra en bloque", la media total de la muestra se calcula como su promedio y como su desviación estándar. Esto proporciona una mejor estimación del intervalo de confianza de la media muestral. [5]

El problema de la especificación inadecuada surge cuando los tratamientos se asignan a unidades que están submuestreadas y la relación F del tratamiento en una tabla de análisis de varianza ( ANOVA ) se forma con respecto al cuadrado medio residual en lugar de con respecto al cuadrado medio entre unidades. La relación F relativa al cuadrado medio dentro de la unidad es vulnerable a la confusión de los efectos del tratamiento y de la unidad, especialmente cuando el número de unidades experimentales es pequeño (por ejemplo, cuatro unidades de tanque, dos tanques tratados, dos no tratados, varias submuestras por tanque). El problema se elimina formando la relación F relativa al cuadrado medio correcto en la tabla ANOVA (tanque por tratamiento MS en el ejemplo anterior), cuando esto sea posible. El problema se aborda mediante el uso de modelos mixtos. [3]

Hurlbert informó "pseudorreplicación" en el 48% de los estudios que examinó, que utilizaban estadística inferencial. [2] Varios estudios que examinaron artículos científicos publicados hasta 2016 encontraron de manera similar que aproximadamente la mitad de los artículos eran sospechosos de pseudorreplicación. [4] Cuando el tiempo y los recursos limitan el número de unidades experimentales , y los efectos unitarios no pueden eliminarse estadísticamente probando la varianza unitaria, es importante utilizar otras fuentes de información para evaluar el grado en que una relación F se confunde con efectos unitarios.

Replicación

La replicación aumenta la precisión de una estimación, mientras que la aleatorización aborda la aplicabilidad más amplia de una muestra a una población. La replicación debe ser apropiada: se debe considerar la replicación a nivel de unidad experimental, además de la replicación dentro de las unidades.

Evaluación de la hipótesis

Las pruebas estadísticas (por ejemplo, la prueba t y la familia de pruebas ANOVA relacionadas) se basan en una replicación adecuada para estimar la significación estadística . Las pruebas basadas en las distribuciones t y F suponen errores homogéneos, normales e independientes. Los errores correlacionados pueden dar lugar a una precisión falsa y a valores p demasiado pequeños. [6]

Tipos

Hurlbert (1984) definió cuatro tipos de pseudorreplicación.

Ver también

Referencias

  1. ^ Hurlbert, Stuart H. (2009). "El antiguo arte negro y el alcance transdisciplinario de la pseudorreplicación". Revista de Psicología Comparada . 123 (4): 434–443. doi :10.1037/a0016221. ISSN  1939-2087. PMID  19929111.
  2. ^ ab Hurlbert, Stuart H. (1984). "Pseudoreplicación y diseño de experimentos ecológicos de campo" (PDF) . Monografías Ecológicas . 54 (2). Sociedad Ecológica de América: 187–211. Código Bib : 1984EcoM...54..187H. doi :10.2307/1942661. JSTOR  1942661.
  3. ^ ab Millar, RB; Anderson, señor (2004). "Remedios para la pseudorreplicación". Investigación pesquera . 70 (2–3): 397–407. doi :10.1016/j.fishres.2004.08.016.
  4. ^ ab Gholipour, Bahar (15 de marzo de 2018). "Los errores estadísticos pueden afectar hasta la mitad de los estudios con ratones". Espectro | Noticias de investigación sobre el autismo . Consultado el 24 de marzo de 2018 .
  5. ^ ab E, Lazic, Stanley (14 de enero de 2010). "El problema de la pseudorreplicación en los estudios neurocientíficos: ¿está afectando a su análisis?". BMC Neurociencia . 11 . BioMed Central Ltd: 5. doi : 10.1186/1471-2202-11-5 . OCLC  805414397. PMC 2817684 . PMID  20074371. {{cite journal}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
  6. ^ Lazic, SE (2010). "El problema de la pseudorreplicación en los estudios neurocientíficos: ¿está afectando a su análisis?". BMC Neurociencia . 11 (5): 5. doi : 10.1186/1471-2202-11-5 . PMC 2817684 . PMID  20074371.