La pseudorreplicación (a veces error de unidad de análisis [1] ) tiene muchas definiciones. La pseudorreplicación fue definida originalmente en 1984 por Stuart H. Hurlbert [2] como el uso de estadísticas inferenciales para probar los efectos del tratamiento con datos de experimentos donde los tratamientos no se replican (aunque las muestras pueden serlo) o las réplicas no son estadísticamente independientes. Posteriormente, Millar y Anderson [3] lo identificaron como un caso especial de especificación inadecuada de factores aleatorios donde están presentes tanto factores aleatorios como fijos. A veces se interpreta de manera estricta como una inflación del número de muestras o réplicas que no son estadísticamente independientes. [4] Esta definición omite la confusión de los efectos de la unidad y del tratamiento en una razón F mal especificada . En la práctica, las razones F incorrectas para pruebas estadísticas de efectos fijos a menudo surgen de una razón F predeterminada que se forma sobre el error en lugar del término mixto.
Lazic [5] definió la pseudorreplicación como un problema de muestras correlacionadas (por ejemplo, de estudios longitudinales ) donde la correlación no se tiene en cuenta al calcular el intervalo de confianza para la media de la muestra. Para el efecto de la correlación serial o temporal, véase también el teorema del límite central de la cadena de Markov .
El problema de la especificación inadecuada surge cuando los tratamientos se asignan a unidades que son submuestreadas y el F-ratio del tratamiento en una tabla de análisis de varianza ( ANOVA ) se forma con respecto al cuadrado medio residual en lugar de con respecto al cuadrado medio entre unidades. El F-ratio relativo al cuadrado medio dentro de la unidad es vulnerable a la confusión de los efectos del tratamiento y de la unidad, especialmente cuando el número de unidades experimentales es pequeño (por ejemplo, cuatro unidades de tanque, dos tanques tratados, dos no tratados, varias submuestras por tanque). El problema se elimina formando el F-ratio relativo al cuadrado medio correcto en la tabla ANOVA (tanque por tratamiento MS en el ejemplo anterior), cuando esto es posible. El problema se aborda mediante el uso de modelos mixtos. [3]
Hurlbert informó "pseudorreplicación" en el 48% de los estudios que examinó, que utilizaron estadísticas inferenciales. [2] Varios estudios que examinaron artículos científicos publicados hasta 2016 encontraron de manera similar que aproximadamente la mitad de los artículos eran sospechosos de pseudorreplicación. [4] Cuando el tiempo y los recursos limitan el número de unidades experimentales , y los efectos de la unidad no se pueden eliminar estadísticamente probando sobre la varianza de la unidad, es importante utilizar otras fuentes de información para evaluar el grado en el que una razón F se confunde por los efectos de la unidad.
Replicación
La replicación aumenta la precisión de una estimación, mientras que la aleatorización aborda la aplicabilidad más amplia de una muestra a una población. La replicación debe ser apropiada: se debe considerar la replicación a nivel de la unidad experimental, además de la replicación dentro de las unidades.
Prueba de hipótesis
Las pruebas estadísticas (por ejemplo, la prueba t y la familia de pruebas ANOVA relacionadas) se basan en una replicación adecuada para estimar la significación estadística . Las pruebas basadas en las distribuciones t y F suponen errores homogéneos, normales e independientes. Los errores correlacionados pueden dar lugar a una precisión falsa y a valores p demasiado pequeños. [6]
Tipos
Hurlbert (1984) definió cuatro tipos de pseudorreplicación.
La pseudorreplicación simple (Figura 5a en Hurlbert 1984) ocurre cuando hay una unidad experimental por tratamiento. Las estadísticas inferenciales no pueden separar la variabilidad debida al tratamiento de la variabilidad debida a las unidades experimentales cuando solo hay una medición por unidad.
La pseudorreplicación temporal (Figura 5c en Hurlbert 1984) ocurre cuando las unidades experimentales difieren lo suficiente en el tiempo como para que los efectos temporales entre las unidades sean probables y los efectos del tratamiento estén correlacionados con los efectos temporales. Las estadísticas inferenciales no pueden separar la variabilidad debida al tratamiento de la variabilidad debida a las unidades experimentales cuando solo hay una medición por unidad.
La pseudorreplicación sacrificial (Figura 5b en Hurlbert 1984) ocurre cuando se utilizan las medias dentro de un tratamiento en un análisis, y estas medias se prueban sobre la varianza dentro de la unidad. En la Figura 5b, el F-ratio erróneo tendrá 1 gl en el cuadrado medio del numerador (tratamiento) y 4 gl en el cuadrado medio del denominador (2-1 = 1 gl para cada unidad experimental). El F-ratio correcto tendrá 1 gl en el numerador (tratamiento) y 2 gl en el denominador (2-1 = 1 gl para cada tratamiento). El F-ratio correcto controla los efectos de las unidades experimentales, pero con 2 gl en el denominador tendrá poco poder para detectar diferencias entre tratamientos.
La pseudorreplicación implícita ocurre cuando los errores estándar (o límites de confianza) se estiman dentro de las unidades experimentales. Al igual que con otras fuentes de pseudorreplicación, los efectos del tratamiento no se pueden separar estadísticamente de los efectos debidos a la variación entre las unidades experimentales.
^ Hurlbert, Stuart H. (2009). "El antiguo arte negro y el alcance transdisciplinario de la pseudorreplicación". Revista de Psicología Comparada . 123 (4): 434–443. doi :10.1037/a0016221. ISSN 1939-2087. PMID 19929111.
^ ab Hurlbert, Stuart H. (1984). "Pseudorreplicación y el diseño de experimentos ecológicos de campo" (PDF) . Monografías ecológicas . 54 (2). Sociedad Ecológica de América: 187–211. Bibcode :1984EcoM...54..187H. doi :10.2307/1942661. JSTOR 1942661.
^ ab Millar, RB; Anderson, MR (2004). "Remedios para la pseudorreplicación". Investigación pesquera . 70 (2–3): 397–407. doi :10.1016/j.fishres.2004.08.016.
^ ab Gholipour, Bahar (15 de marzo de 2018). "Los errores estadísticos pueden afectar hasta la mitad de los estudios con ratones". Spectrum | Autism Research News . Consultado el 24 de marzo de 2018 .
^ ab E, Lazic, Stanley (14 de enero de 2010). "El problema de la pseudorreplicación en los estudios neurocientíficos: ¿está afectando a su análisis?". BMC Neuroscience . 11 . BioMed Central Ltd: 5. doi : 10.1186/1471-2202-11-5 . OCLC 805414397. PMC 2817684 . PMID 20074371.{{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Lazic, SE (2010). "El problema de la pseudorreplicación en los estudios neurocientíficos: ¿está afectando a su análisis?". BMC Neuroscience . 11 (5): 5. doi : 10.1186/1471-2202-11-5 . PMC 2817684 . PMID 20074371.