Diseño de medidas repetidas

El diseño de medidas repetidas es un diseño de investigación que involucra múltiples medidas de la misma variable tomadas en sujetos iguales o emparejados, ya sea en diferentes condiciones o durante dos o más períodos de tiempo. ^[1] Por ejemplo, las mediciones repetidas se recopilan en un estudio longitudinal en el que se evalúa el cambio a lo largo del tiempo.

Estudios cruzados

Un diseño popular de medidas repetidas es el estudio cruzado . Un estudio cruzado es un estudio longitudinal en el que los sujetos reciben una secuencia de diferentes tratamientos (o exposiciones). Si bien los estudios cruzados pueden ser estudios observacionales , muchos estudios cruzados importantes son experimentos controlados . Los diseños cruzados son comunes para experimentos en muchas disciplinas científicas , por ejemplo, psicología , educación , ciencia farmacéutica y atención médica , especialmente medicina.

Los experimentos aleatorios , controlados y cruzados son especialmente importantes en la atención sanitaria. En un ensayo clínico aleatorizado , a los sujetos se les asignan tratamientos aleatoriamente . Cuando dicho ensayo tiene un diseño de medidas repetidas, los sujetos se asignan aleatoriamente a una secuencia de tratamientos. Un ensayo clínico cruzado es un diseño de medidas repetidas en el que cada paciente es asignado aleatoriamente a una secuencia de tratamientos, que incluye al menos dos tratamientos (de los cuales uno puede ser un tratamiento estándar o un placebo ): por lo tanto, cada paciente pasa de un tratamiento a otro. a otro.

Casi todos los diseños cruzados tienen "equilibrio", lo que significa que todos los sujetos deben recibir la misma cantidad de tratamientos y que todos los sujetos participan durante la misma cantidad de períodos. En la mayoría de los ensayos cruzados, cada sujeto recibe todos los tratamientos.

Sin embargo, muchos diseños de medidas repetidas no son cruzados: el estudio longitudinal de los efectos secuenciales de tratamientos repetidos no necesita utilizar ningún " cruzado ", por ejemplo (Vonesh y Chinchili; Jones y Kenward).

Usos

Número limitado de participantes: el diseño de medidas repetidas reduce la varianza de las estimaciones de los efectos del tratamiento, lo que permite realizar inferencias estadísticas con menos sujetos. ^[2]
Eficiencia: los diseños de medidas repetidas permiten que muchos experimentos se completen más rápidamente, ya que es necesario capacitar a menos grupos para completar un experimento completo. Por ejemplo, experimentos en los que cada condición lleva sólo unos minutos, mientras que el entrenamiento para completar las tareas lleva tanto tiempo, si no más.
Análisis longitudinal: los diseños de medidas repetidas permiten a los investigadores monitorear cómo los participantes cambian con el tiempo, tanto en situaciones de largo como de corto plazo.

Efectos de orden

Los efectos de orden pueden ocurrir cuando un participante en un experimento puede realizar una tarea y luego volver a realizarla. Ejemplos de efectos de orden incluyen la mejora o disminución del rendimiento, que puede deberse a efectos de aprendizaje, aburrimiento o fatiga. El impacto de los efectos de orden puede ser menor en estudios longitudinales a largo plazo o al contrarrestarlos mediante un diseño cruzado .

contrapeso

En esta técnica, dos grupos realizan cada uno las mismas tareas o experimentan las mismas condiciones, pero en orden inverso. Con dos tareas o condiciones se forman cuatro grupos.

El contrapeso intenta tener en cuenta dos fuentes importantes de variación sistemática en este tipo de diseño: la práctica y los efectos del aburrimiento. De lo contrario, ambos podrían dar lugar a un rendimiento diferente de los participantes debido a la familiaridad o el cansancio de los tratamientos.

Limitaciones

Puede que no sea posible que cada participante se encuentre en todas las condiciones del experimento (es decir, limitaciones de tiempo, ubicación del experimento, etc.). Los sujetos con enfermedades graves tienden a abandonar los estudios longitudinales, lo que potencialmente sesga los resultados. En estos casos, serían preferibles los modelos de efectos mixtos, ya que pueden abordar valores faltantes.

La regresión media puede afectar las condiciones con repeticiones significativas. La maduración puede afectar los estudios que se extienden en el tiempo. Eventos fuera del experimento pueden cambiar la respuesta entre repeticiones.

ANOVA de medidas repetidas

El análisis de varianza de medidas repetidas (rANOVA) es un enfoque estadístico comúnmente utilizado para diseños de medidas repetidas. ^[3] Con tales diseños, el factor de medición repetida (la variable cualitativa independiente) es el factor intrasujetos, mientras que la variable cuantitativa dependiente con la que se mide a cada participante es la variable dependiente.

Partición de error

Una de las mayores ventajas de rANOVA, como es el caso de los diseños de medidas repetidas en general, es la capacidad de dividir la variabilidad debida a diferencias individuales. Considere la estructura general del estadístico F :

F = _Tratamiento MS / _Error MS = ( _Tratamiento SS / _Tratamiento df )/( _Error SS / _Error df )

En un diseño entre sujetos hay un elemento de varianza debido a la diferencia individual que se combina con los términos de tratamiento y error:

SS _Total = _Tratamiento SS + _{Error SS}

gl _Total = n − 1

En un diseño de medidas repetidas es posible separar la variabilidad del sujeto de los términos de tratamiento y error. En tal caso, la variabilidad se puede dividir en variabilidad entre tratamientos (o efectos dentro de los sujetos, excluyendo las diferencias individuales) y variabilidad dentro de los tratamientos. La variabilidad dentro de los tratamientos se puede dividir a su vez en variabilidad entre sujetos (diferencias individuales) y error (excluyendo las diferencias individuales): ^[4]

SS _Total = _{Tratamiento SS (excluyendo diferencia individual)} + _Sujetos SS + _{Error SS}

gl _Total = gl _{Tratamiento (dentro de los sujetos)} + gl _{entre sujetos} + _error gl = ( k − 1) + ( n − 1) + (( n − k )( n − 1))

En referencia a la estructura general del estadístico F, está claro que al dividir la variabilidad entre sujetos, el valor F aumentará porque el término de error de la suma de cuadrados será menor, lo que dará como resultado un MSError más pequeño. Es de destacar que la variabilidad de partición reduce los grados de libertad de la prueba F, por lo tanto, la variabilidad entre sujetos debe ser lo suficientemente significativa como para compensar la pérdida en grados de libertad. Si la variabilidad entre sujetos es pequeña, este proceso puede en realidad reducir el valor F. ^[4]

Suposiciones

Como ocurre con todos los análisis estadísticos, se deben cumplir supuestos específicos para justificar el uso de esta prueba. Las infracciones pueden afectar los resultados de moderada a grave y, a menudo, provocar una inflación del error tipo 1 . Con el rANOVA, se aplican supuestos estándar univariados y multivariados. ^[5] Los supuestos univariados son:

Normalidad: para cada nivel del factor intrasujetos, la variable dependiente debe tener una distribución normal .
Esfericidad : las puntuaciones de diferencia calculadas entre dos niveles de un factor intrasujetos deben tener la misma varianza para la comparación de dos niveles cualesquiera. (Este supuesto solo se aplica si hay más de 2 niveles de la variable independiente).
Aleatoriedad: los casos deben derivarse de una muestra aleatoria y las puntuaciones de diferentes participantes deben ser independientes entre sí.

El rANOVA también requiere que se cumplan ciertos supuestos multivariados, porque se realiza una prueba multivariada sobre puntuaciones de diferencias. Estos supuestos incluyen:

Normalidad multivariada: las puntuaciones de diferencia se distribuyen normalmente de forma multivariada en la población.
Aleatoriedad: los casos individuales deben derivarse de una muestra aleatoria y las puntuaciones de diferencia para cada participante son independientes de las de otro participante.

prueba F

Al igual que con otros análisis de pruebas de varianza, el rANOVA utiliza una estadística F para determinar la significancia. Dependiendo del número de factores intrasujetos y violaciones de supuestos, es necesario seleccionar la más adecuada de tres pruebas: ^[5]

Prueba ANOVA F univariante estándar: esta prueba se usa comúnmente dados solo dos niveles del factor intrasujetos (es decir, punto temporal 1 y punto temporal 2). Esta prueba no se recomienda dados más de 2 niveles del factor intrasujetos porque en tales casos comúnmente se viola el supuesto de esfericidad.
Prueba univariada alternativa ^[6] : estas pruebas tienen en cuenta las violaciones del supuesto de esfericidad y se pueden utilizar cuando el factor intrasujetos supera los 2 niveles. El estadístico F es el mismo que en la prueba ANOVA F univariada estándar, pero está asociado con un valor p más preciso. Esta corrección se realiza ajustando los grados de libertad hacia abajo para determinar el valor F crítico. Normalmente se utilizan dos correcciones: la corrección de Greenhouse-Geisser y la corrección de Huynh-Feldt. La corrección de Greenhouse-Geisser es más conservadora, pero aborda un problema común de variabilidad creciente a lo largo del tiempo en un diseño de medidas repetidas. ^[7] La corrección de Huynh-Feldt es menos conservadora, pero no aborda cuestiones de variabilidad creciente. Se ha sugerido que se utilice Huynh-Feldt inferior con desviaciones más pequeñas de la esfericidad, mientras que Greenhouse-Geisser se utilice cuando las desviaciones sean grandes.
Prueba multivariada: esta prueba no supone esfericidad, pero también es muy conservadora.

Tamaño del efecto

Una de las estadísticas del tamaño del efecto más comúnmente reportadas para rANOVA es el eta cuadrado parcial (η _p² ). También es común utilizar el multivariado η ² cuando se ha violado el supuesto de esfericidad y se informa el estadístico de prueba multivariado. Una tercera estadística del tamaño del efecto que se informa es el η ² generalizado , que es comparable al η _p² en un ANOVA de medidas repetidas unidireccionales. Se ha demostrado que es una mejor estimación del tamaño del efecto que otras pruebas intrasujetos. ^[8]^[9]

Precauciones

rANOVA no siempre es el mejor análisis estadístico para diseños de medidas repetidas. El rANOVA es vulnerable a los efectos de valores faltantes, imputación, puntos de tiempo no equivalentes entre sujetos y violaciones de la esfericidad. ^[3] Estos problemas pueden dar lugar a sesgos de muestreo y tasas infladas de error de tipo I. ^[10] En tales casos, puede ser mejor considerar el uso de un modelo lineal mixto . ^[11]

Ver también

Notas

^ Kraska; Marie (2010), "Diseño de medidas repetidas", Enciclopedia de diseño de investigación , California, EE. UU.: SAGE Publications, Inc., doi :10.4135/9781412961288.n378, ISBN 978-1-4129-6127-1, S2CID 149337088
^ Barret, Julia R. (2013). "Partículas y enfermedades cardiovasculares: los investigadores prestan atención a los cambios microvasculares". Perspectivas de salud ambiental . 121 (9): a282. doi :10.1289/ehp.121-A282. PMC 3764084 . PMID 24004855.
^ ab Gueorguieva; Kristal (2004). "Moverse sobre ANOVA". Psiquiatría Arch Gen. 61 (3): 310–7. doi : 10.1001/archpsyc.61.3.310. PMID 14993119.
^ ab Howell, David C. (2010). Métodos estadísticos para la psicología (7ª ed.). Belmont, California: Thomson Wadsworth. ISBN 978-0-495-59784-1.
^ ab Salkind, Samuel B. Green, Neil J. (2011). Uso de SPSS para Windows y Macintosh: análisis y comprensión de datos (6ª ed.). Boston: Prentice Hall. ISBN 978-0-205-02040-9.{{cite book}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
^ Vasey; Thayer (1987). "El problema continuo de los falsos positivos en ANOVA de medidas repetidas en psicofisiología: una solución multivariada". Psicofisiología . 24 (4): 479–486. doi :10.1111/j.1469-8986.1987.tb00324.x. PMID 3615759.
^ Parque (1993). "Una comparación del enfoque de ecuación de estimación generalizada con el enfoque de máxima verosimilitud para mediciones repetidas". Estadísticas médicas . 12 (18): 1723-1732. doi :10.1002/sim.4780121807. PMID 8248664.
^ Panadero (2005). "Estadísticas del tamaño del efecto recomendadas para diseños de medidas repetidas". Métodos de investigación del comportamiento . 37 (3): 379–384. doi : 10.3758/bf03192707 . PMID 16405133.
^ Olejnik; Algina (2003). "Estadísticas generalizadas de eta y omega cuadrados: medidas del tamaño del efecto para algunos diseños de investigación comunes". Métodos psicológicos . 8 (4): 434–447. doi :10.1037/1082-989x.8.4.434. PMID 14664681. S2CID 6931663.
^ Müller; Bartón (1989). "Potencia aproximada para ANOVA de medidas repetidas que carecen de esfericidad". Revista de la Asociación Estadounidense de Estadística . 84 (406): 549–555. doi :10.1080/01621459.1989.10478802.
^ Kruger; Tian (2004). "Una comparación del modelo mixto lineal general y ANOVA de medidas repetidas utilizando un conjunto de datos con múltiples puntos de datos faltantes". Investigación Biológica para Enfermería . 6 (2): 151-157. doi :10.1177/1099800404267682. PMID 15388912. S2CID 23173349.

Referencias

Diseño y análisis de experimentos

Jones, Byron; Kenward, Michael G. (2003). Diseño y análisis de ensayos cruzados (Segunda ed.). Londres: Chapman y Hall.
Vonesh, Edward F. y Chinchili, Vernon G. (1997). Modelos lineales y no lineales para el análisis de medidas repetidas . Londres: Chapman y Hall.

Exploración de datos longitudinales.

Davidiano, María ; David M. Giltinan (1995). Modelos no lineales para datos de mediciones repetidas . Monografías de Chapman & Hall/CRC sobre estadística y probabilidad aplicada. ISBN 978-0-412-98341-2.
Fitzmaurice, Garrett; Davidiano, María; Verbeke, Geert; Molenberghs, Geert, eds. (2008). Análisis de datos longitudinales . Boca Ratón, Florida: Chapman y Hall/CRC. ISBN 978-1-58488-658-7.
Jones, Byron; Kenward, Michael G. (2003). Diseño y análisis de ensayos cruzados (Segunda ed.). Londres: Chapman y Hall.
Kim, Kevin y Timm, Neil (2007). "“MGLM Restringido y Modelo de Curva de Crecimiento” (Capítulo 7)”. Modelos lineales generales univariados y multivariados: Teoría y aplicaciones con SAS (con 1 CD-ROM para Windows y UNIX) . Estadística: Libros de Texto y Monografías (Segunda ed.). Boca Ratón, Florida: Chapman & Hall/CRC ISBN . 978-1-58488-634-1.
Kollo, Tõnu y von Rosen, Dietrich (2005). ""Modelos lineales multivariados" (capítulo 4), especialmente "El modelo de la curva de crecimiento y sus extensiones" (Capítulo 4.1)". Estadística multivariada avanzada con matrices . Matemáticas y sus aplicaciones. Vol. 579. Nueva York: Springer. ISBN 978-1-4020-3418-3.
Kshirsagar, Anant M. y Smith, William Boyce (1995). Curvas de crecimiento . Estadística: Libros de texto y Monografías. vol. 145. Nueva York: Marcel Dekker, Inc. ISBN 0-8247-9341-2.
Pan, Jian-Xin y Fang, Kai-Tai (2002). Modelos de curvas de crecimiento y diagnóstico estadístico . Serie Springer en Estadística. Nueva York: Springer-Verlag. ISBN 0-387-95053-2.
Seber, GAF y Wild, CJ (1989). ""Modelos de crecimiento (Capítulo 7)"". Regresión no lineal . Serie Wiley en probabilidad y estadística matemática: probabilidad y estadística matemática. Nueva York: John Wiley & Sons, Inc. págs. 325–367. ISBN 0-471-61760-1.
Timm, Neil H. (2002). ""El modelo MANOVA general (GMANOVA)" (Capítulo 3.6.d)". Análisis multivariado aplicado . Springer Texts in Statistics. Nueva York: Springer-Verlag. ISBN 0-387-95347-7.
Vonesh, Edward F. y Chinchili, Vernon G. (1997). Modelos lineales y no lineales para el análisis de medidas repetidas . Londres: Chapman y Hall.(Tratamiento integral de la teoría y la práctica)
Conaway, M. (1999, 11 de octubre). Diseño de Medidas Repetidas. Obtenido el 18 de febrero de 2008 de http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF
Minke, A. (1997, enero). Realización de análisis de medidas repetidas: consideraciones de diseño experimental. Obtenido el 18 de febrero de 2008 de Ericae.net: http://ericae.net/ft/tamu/Rm.htm
Shaughnessy, JJ (2006). Métodos de investigación en psicología. Nueva York: McGraw-Hill.

enlaces externos

Ejemplos de todos los modelos ANOVA y ANCOVA con hasta tres factores de tratamiento, incluidos bloques aleatorios, diagramas divididos, medidas repetidas y cuadrados latinos, y su análisis en R (Universidad de Southampton)