stringtranslate.com

Pseudorreplicación

La pseudorreplicación (a veces error de unidad de análisis [1] ) tiene muchas definiciones. La pseudorreplicación fue definida originalmente en 1984 por Stuart H. Hurlbert [2] como el uso de estadísticas inferenciales para probar los efectos del tratamiento con datos de experimentos donde los tratamientos no se replican (aunque las muestras pueden serlo) o las réplicas no son estadísticamente independientes. Posteriormente, Millar y Anderson [3] lo identificaron como un caso especial de especificación inadecuada de factores aleatorios donde están presentes tanto factores aleatorios como fijos. A veces se interpreta de manera estricta como una inflación del número de muestras o réplicas que no son estadísticamente independientes. [4] Esta definición omite la confusión de los efectos de la unidad y del tratamiento en una razón F mal especificada . En la práctica, las razones F incorrectas para pruebas estadísticas de efectos fijos a menudo surgen de una razón F predeterminada que se forma sobre el error en lugar del término mixto.

Lazic [5] definió la pseudorreplicación como un problema de muestras correlacionadas (por ejemplo, de estudios longitudinales ) donde la correlación no se tiene en cuenta al calcular el intervalo de confianza para la media de la muestra. Para el efecto de la correlación serial o temporal, véase también el teorema del límite central de la cadena de Markov .

Pseudorreplicación debido a la correlación de muestras: sin tener en cuenta la correlación, el intervalo de confianza del 90% para la media de la muestra es demasiado pequeño. Para evitar este problema, por ejemplo, se puede aplicar el método de bloques , en el que primero se agrupan las muestras correlacionadas y luego se calculan las medias de muestra correspondientes (para cada bloque). A partir de estas dos "medias de muestra de bloque", se calcula la media total de la muestra como su promedio y la desviación estándar. Esto proporciona una mejor estimación del intervalo de confianza de la media de la muestra. [5]

El problema de la especificación inadecuada surge cuando los tratamientos se asignan a unidades que son submuestreadas y el F-ratio del tratamiento en una tabla de análisis de varianza ( ANOVA ) se forma con respecto al cuadrado medio residual en lugar de con respecto al cuadrado medio entre unidades. El F-ratio relativo al cuadrado medio dentro de la unidad es vulnerable a la confusión de los efectos del tratamiento y de la unidad, especialmente cuando el número de unidades experimentales es pequeño (por ejemplo, cuatro unidades de tanque, dos tanques tratados, dos no tratados, varias submuestras por tanque). El problema se elimina formando el F-ratio relativo al cuadrado medio correcto en la tabla ANOVA (tanque por tratamiento MS en el ejemplo anterior), cuando esto es posible. El problema se aborda mediante el uso de modelos mixtos. [3]

Hurlbert informó "pseudorreplicación" en el 48% de los estudios que examinó, que utilizaron estadísticas inferenciales. [2] Varios estudios que examinaron artículos científicos publicados hasta 2016 encontraron de manera similar que aproximadamente la mitad de los artículos eran sospechosos de pseudorreplicación. [4] Cuando el tiempo y los recursos limitan el número de unidades experimentales , y los efectos de la unidad no se pueden eliminar estadísticamente probando sobre la varianza de la unidad, es importante utilizar otras fuentes de información para evaluar el grado en el que una razón F se confunde por los efectos de la unidad.

Replicación

La replicación aumenta la precisión de una estimación, mientras que la aleatorización aborda la aplicabilidad más amplia de una muestra a una población. La replicación debe ser apropiada: se debe considerar la replicación a nivel de la unidad experimental, además de la replicación dentro de las unidades.

Prueba de hipótesis

Las pruebas estadísticas (por ejemplo, la prueba t y la familia de pruebas ANOVA relacionadas) se basan en una replicación adecuada para estimar la significación estadística . Las pruebas basadas en las distribuciones t y F suponen errores homogéneos, normales e independientes. Los errores correlacionados pueden dar lugar a una precisión falsa y a valores p demasiado pequeños. [6]

Tipos

Hurlbert (1984) definió cuatro tipos de pseudorreplicación.

Véase también

Referencias

  1. ^ Hurlbert, Stuart H. (2009). "El antiguo arte negro y el alcance transdisciplinario de la pseudorreplicación". Revista de Psicología Comparada . 123 (4): 434–443. doi :10.1037/a0016221. ISSN  1939-2087. PMID  19929111.
  2. ^ ab Hurlbert, Stuart H. (1984). "Pseudorreplicación y el diseño de experimentos ecológicos de campo" (PDF) . Monografías ecológicas . 54 (2). Sociedad Ecológica de América: 187–211. Bibcode :1984EcoM...54..187H. doi :10.2307/1942661. JSTOR  1942661.
  3. ^ ab Millar, RB; Anderson, MR (2004). "Remedios para la pseudorreplicación". Investigación pesquera . 70 (2–3): 397–407. doi :10.1016/j.fishres.2004.08.016.
  4. ^ ab Gholipour, Bahar (15 de marzo de 2018). "Los errores estadísticos pueden afectar hasta la mitad de los estudios con ratones". Spectrum | Autism Research News . Consultado el 24 de marzo de 2018 .
  5. ^ ab E, Lazic, Stanley (14 de enero de 2010). "El problema de la pseudorreplicación en los estudios neurocientíficos: ¿está afectando a su análisis?". BMC Neuroscience . 11 . BioMed Central Ltd: 5. doi : 10.1186/1471-2202-11-5 . OCLC  805414397. PMC 2817684 . PMID  20074371. {{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
  6. ^ Lazic, SE (2010). "El problema de la pseudorreplicación en los estudios neurocientíficos: ¿está afectando a su análisis?". BMC Neuroscience . 11 (5): 5. doi : 10.1186/1471-2202-11-5 . PMC 2817684 . PMID  20074371.