Pseudorreplicación

La pseudorreplicación (a veces error de unidad de análisis ^[1] ) tiene muchas definiciones. La pseudorreplicación fue definida originalmente en 1984 por Stuart H. Hurlbert ^[2] como el uso de estadísticas inferenciales para probar los efectos del tratamiento con datos de experimentos en los que los tratamientos no se replican (aunque las muestras pueden sí) o las réplicas no son estadísticamente independientes. Posteriormente, Millar y Anderson ^[3] lo identificaron como un caso especial de especificación inadecuada de factores aleatorios donde están presentes tanto factores aleatorios como fijos. A veces se interpreta estrictamente como una inflación del número de muestras o réplicas que no son estadísticamente independientes. ^[4] Esta definición omite la confusión de los efectos de la unidad y del tratamiento en una relación F mal especificada . En la práctica, los ratios F incorrectos para pruebas estadísticas de efectos fijos a menudo surgen de un ratio F predeterminado que se forma sobre el error en lugar del término mixto.

Lazic ^[5] definió la pseudorreplicación como un problema de muestras correlacionadas (por ejemplo, de estudios longitudinales ) donde la correlación no se tiene en cuenta al calcular el intervalo de confianza para la media de la muestra. Para conocer el efecto de la correlación serial o temporal, consulte también el teorema del límite central de la cadena de Markov .

El problema de la especificación inadecuada surge cuando los tratamientos se asignan a unidades que están submuestreadas y la relación F del tratamiento en una tabla de análisis de varianza ( ANOVA ) se forma con respecto al cuadrado medio residual en lugar de con respecto al cuadrado medio entre unidades. La relación F relativa al cuadrado medio dentro de la unidad es vulnerable a la confusión de los efectos del tratamiento y de la unidad, especialmente cuando el número de unidades experimentales es pequeño (por ejemplo, cuatro unidades de tanque, dos tanques tratados, dos no tratados, varias submuestras por tanque). El problema se elimina formando la relación F relativa al cuadrado medio correcto en la tabla ANOVA (tanque por tratamiento MS en el ejemplo anterior), cuando esto sea posible. El problema se aborda mediante el uso de modelos mixtos. ^[3]

Hurlbert informó "pseudorreplicación" en el 48% de los estudios que examinó, que utilizaban estadística inferencial. ^[2] Varios estudios que examinaron artículos científicos publicados hasta 2016 encontraron de manera similar que aproximadamente la mitad de los artículos eran sospechosos de pseudorreplicación. ^[4] Cuando el tiempo y los recursos limitan el número de unidades experimentales , y los efectos unitarios no pueden eliminarse estadísticamente probando la varianza unitaria, es importante utilizar otras fuentes de información para evaluar el grado en que una relación F se confunde con efectos unitarios.

Replicación

La replicación aumenta la precisión de una estimación, mientras que la aleatorización aborda la aplicabilidad más amplia de una muestra a una población. La replicación debe ser apropiada: se debe considerar la replicación a nivel de unidad experimental, además de la replicación dentro de las unidades.

Evaluación de la hipótesis

Las pruebas estadísticas (por ejemplo, la prueba t y la familia de pruebas ANOVA relacionadas) se basan en una replicación adecuada para estimar la significación estadística . Las pruebas basadas en las distribuciones t y F suponen errores homogéneos, normales e independientes. Los errores correlacionados pueden dar lugar a una precisión falsa y a valores p demasiado pequeños. ^[6]

Tipos

Hurlbert (1984) definió cuatro tipos de pseudorreplicación.

La pseudorreplicación simple (Figura 5a en Hurlbert 1984) ocurre cuando hay una unidad experimental por tratamiento. La estadística inferencial no puede separar la variabilidad debida al tratamiento de la variabilidad debida a unidades experimentales cuando sólo hay una medida por unidad.
La pseudorreplicación temporal (Figura 5c en Hurlbert 1984) ocurre cuando las unidades experimentales difieren lo suficiente en el tiempo como para que sean probables los efectos temporales entre las unidades, y los efectos del tratamiento se correlacionan con los efectos temporales. La estadística inferencial no puede separar la variabilidad debida al tratamiento de la variabilidad debida a unidades experimentales cuando sólo hay una medida por unidad.
La pseudorreplicación sacrificial (Figura 5b en Hurlbert 1984) ocurre cuando las medias dentro de un tratamiento se utilizan en un análisis y estas medias se prueban sobre la varianza dentro de la unidad. En la Figura 5b, la relación F errónea tendrá 1 gl en el cuadrado medio del numerador (tratamiento) y 4 gl en el cuadrado medio del denominador (2-1 = 1 gl para cada unidad experimental). La relación F correcta tendrá 1 gl en el numerador (tratamiento) y 2 gl en el denominador (2-1 = 1 gl para cada tratamiento). La relación F correcta controla los efectos de las unidades experimentales, pero con 2 gl en el denominador tendrá poco poder para detectar diferencias de tratamiento.
La pseudorreplicación implícita ocurre cuando se estiman errores estándar (o límites de confianza) dentro de unidades experimentales. Como ocurre con otras fuentes de pseudorreplicación, los efectos del tratamiento no pueden separarse estadísticamente de los efectos debidos a la variación entre las unidades experimentales.

Ver también

Referencias

^ Hurlbert, Stuart H. (2009). "El antiguo arte negro y el alcance transdisciplinario de la pseudorreplicación". Revista de Psicología Comparada . 123 (4): 434–443. doi :10.1037/a0016221. ISSN 1939-2087. PMID 19929111.
^ ab Hurlbert, Stuart H. (1984). "Pseudoreplicación y diseño de experimentos ecológicos de campo" (PDF) . Monografías Ecológicas . 54 (2). Sociedad Ecológica de América: 187–211. Código Bib : 1984EcoM...54..187H. doi :10.2307/1942661. JSTOR 1942661.
^ ab Millar, RB; Anderson, señor (2004). "Remedios para la pseudorreplicación". Investigación pesquera . 70 (2–3): 397–407. doi :10.1016/j.fishres.2004.08.016.
^ ab Gholipour, Bahar (15 de marzo de 2018). "Los errores estadísticos pueden afectar hasta la mitad de los estudios con ratones". Espectro | Noticias de investigación sobre el autismo . Consultado el 24 de marzo de 2018 .
^ ab E, Lazic, Stanley (14 de enero de 2010). "El problema de la pseudorreplicación en los estudios neurocientíficos: ¿está afectando a su análisis?". BMC Neurociencia . 11 . BioMed Central Ltd: 5. doi : 10.1186/1471-2202-11-5 . OCLC 805414397. PMC 2817684 . PMID 20074371. {{cite journal}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
^ Lazic, SE (2010). "El problema de la pseudorreplicación en los estudios neurocientíficos: ¿está afectando a su análisis?". BMC Neurociencia . 11 (5): 5. doi : 10.1186/1471-2202-11-5 . PMC 2817684 . PMID 20074371.