El diseño de medidas repetidas es un diseño de investigación que implica múltiples medidas de la misma variable tomadas en los mismos sujetos o en sujetos emparejados, ya sea en diferentes condiciones o durante dos o más períodos de tiempo. [1] Por ejemplo, las mediciones repetidas se recopilan en un estudio longitudinal en el que se evalúa el cambio a lo largo del tiempo.
Los experimentos aleatorios , controlados y cruzados son especialmente importantes en el ámbito de la atención sanitaria. En un ensayo clínico aleatorio , los sujetos reciben tratamientos de forma aleatoria . Cuando dicho ensayo es un diseño de medidas repetidas, los sujetos son asignados aleatoriamente a una secuencia de tratamientos. Un ensayo clínico cruzado es un diseño de medidas repetidas en el que cada paciente es asignado aleatoriamente a una secuencia de tratamientos, que incluye al menos dos tratamientos (de los cuales uno puede ser un tratamiento estándar o un placebo ): De esta forma, cada paciente pasa de un tratamiento a otro.
Casi todos los diseños cruzados tienen "equilibrio", lo que significa que todos los sujetos deben recibir la misma cantidad de tratamientos y que todos los sujetos participan durante la misma cantidad de períodos. En la mayoría de los ensayos cruzados, cada sujeto recibe todos los tratamientos.
Sin embargo, muchos diseños de medidas repetidas no son cruces: el estudio longitudinal de los efectos secuenciales de tratamientos repetidos no necesita utilizar ningún " cruce ", por ejemplo (Vonesh y Chinchilli; Jones y Kenward).
Usos
Número limitado de participantes: el diseño de medidas repetidas reduce la varianza de las estimaciones de los efectos del tratamiento, lo que permite realizar inferencias estadísticas con menos sujetos. [2]
Eficiencia: los diseños de medidas repetidas permiten que muchos experimentos se completen más rápidamente, ya que se necesita entrenar a menos grupos para completar un experimento completo. Por ejemplo, experimentos en los que cada condición toma solo unos minutos, mientras que el entrenamiento para completar las tareas toma tanto tiempo, o incluso más.
Análisis longitudinal: los diseños de medidas repetidas permiten a los investigadores monitorear cómo cambian los participantes con el tiempo, tanto en situaciones a largo como a corto plazo.
Efectos del pedido
Los efectos de orden pueden ocurrir cuando un participante en un experimento es capaz de realizar una tarea y luego realizarla nuevamente. Algunos ejemplos de efectos de orden incluyen la mejora o disminución del rendimiento, que puede deberse a efectos de aprendizaje, aburrimiento o fatiga. El impacto de los efectos de orden puede ser menor en estudios longitudinales a largo plazo o al contrarrestarlos utilizando un diseño cruzado .
Contrapeso
En esta técnica, dos grupos realizan las mismas tareas o experimentan las mismas condiciones, pero en orden inverso. Con dos tareas o condiciones, se forman cuatro grupos.
Los intentos de contrarrestar estos efectos intentan tener en cuenta dos fuentes importantes de variación sistemática en este tipo de diseño: la práctica y el aburrimiento. Ambos podrían, de otro modo, dar lugar a un rendimiento diferente de los participantes debido a la familiaridad con los tratamientos o al cansancio que estos generan.
Limitaciones
Puede que no sea posible que cada participante se encuentre en todas las condiciones del experimento (es decir, limitaciones de tiempo, ubicación del experimento, etc.). Los sujetos gravemente enfermos tienden a abandonar los estudios longitudinales, lo que puede sesgar los resultados. En estos casos, los modelos de efectos mixtos serían preferibles, ya que pueden abordar los valores faltantes.
La regresión media puede afectar las condiciones con repeticiones significativas. La maduración puede afectar los estudios que se extienden en el tiempo. Los eventos fuera del experimento pueden cambiar la respuesta entre repeticiones.
ANOVA de medidas repetidas
El análisis de varianza de medidas repetidas (rANOVA) es un enfoque estadístico comúnmente utilizado para los diseños de medidas repetidas. [3] Con dichos diseños, el factor de medida repetida (la variable independiente cualitativa) es el factor intra-sujetos, mientras que la variable cuantitativa dependiente sobre la que se mide a cada participante es la variable dependiente.
Particionado de errores
Una de las mayores ventajas del rANOVA, como ocurre con los diseños de medidas repetidas en general, es la capacidad de eliminar la variabilidad debida a las diferencias individuales. Consideremos la estructura general del estadístico F :
F = Tratamiento de EM / Error de EM = ( Tratamiento de SS / Tratamiento de gl ) / ( Error de SS / Error de gl )
En un diseño entre sujetos hay un elemento de variación debido a la diferencia individual que se combina con los términos de tratamiento y error:
SS Total = Tratamiento SS + Error SS
gl Total = n − 1
En un diseño de medidas repetidas es posible separar la variabilidad de los sujetos de los términos de tratamiento y error. En tal caso, la variabilidad se puede desglosar en variabilidad entre tratamientos (o efectos dentro de los sujetos, excluyendo las diferencias individuales) y variabilidad dentro de los tratamientos. La variabilidad dentro de los tratamientos se puede dividir a su vez en variabilidad entre sujetos (diferencias individuales) y error (excluyendo las diferencias individuales): [4]
SS Total = SS Tratamiento (excluyendo diferencia individual) + SS Sujetos + SS Error
df Total = df Tratamiento (dentro de los sujetos) + df entre sujetos + df error = ( k − 1) + ( s − 1) + (( k - 1 )( s − 1)) = ks -1= n-1, donde k es el número de niveles de tiempo y s es el número de sujetos.
En referencia a la estructura general de la estadística F, es claro que al particionar la variabilidad entre sujetos, el valor F aumentará porque el término de error de suma de cuadrados será menor, lo que dará como resultado un error MSE menor. Cabe destacar que al particionar la variabilidad se reducen los grados de libertad de la prueba F, por lo tanto, la variabilidad entre sujetos debe ser lo suficientemente significativa para compensar la pérdida de grados de libertad. Si la variabilidad entre sujetos es pequeña, este proceso puede en realidad reducir el valor F. [4]
Supuestos
Al igual que con todos los análisis estadísticos, se deben cumplir supuestos específicos para justificar el uso de esta prueba. Las violaciones pueden afectar moderadamente a gravemente los resultados y, a menudo, conducen a una inflación del error de tipo 1. Con el rANOVA, se aplican supuestos univariados y multivariados estándar. [5] Los supuestos univariados son:
Normalidad: para cada nivel del factor intrasujetos, la variable dependiente debe tener una distribución normal .
Esfericidad : los puntajes de diferencia calculados entre dos niveles de un factor intrasujeto deben tener la misma varianza para la comparación de dos niveles cualesquiera. (Esta suposición solo se aplica si hay más de dos niveles de la variable independiente).
Aleatoriedad: los casos deben derivarse de una muestra aleatoria y las puntuaciones de los diferentes participantes deben ser independientes entre sí.
El rANOVA también requiere que se cumplan ciertos supuestos multivariados, ya que se realiza una prueba multivariada sobre puntuaciones diferenciales. Estos supuestos incluyen:
Normalidad multivariada: las puntuaciones de diferencia se distribuyen normalmente de forma multivariada en la población.
Aleatoriedad: los casos individuales deben derivarse de una muestra aleatoria y las puntuaciones de diferencia de cada participante son independientes de las de otro participante.
Prueba F
Al igual que con otras pruebas de análisis de varianza, el rANOVA utiliza una estadística F para determinar la significancia. Dependiendo del número de factores intra-sujetos y de violaciones de supuestos, es necesario seleccionar la más apropiada de tres pruebas: [5]
Prueba F de ANOVA univariante estándar: esta prueba se utiliza comúnmente cuando solo hay dos niveles del factor intrasujeto (es decir, el punto temporal 1 y el punto temporal 2). No se recomienda esta prueba cuando hay más de dos niveles del factor intrasujeto porque en tales casos se viola comúnmente el supuesto de esfericidad.
Prueba univariante alternativa [6] —Estas pruebas tienen en cuenta las violaciones del supuesto de esfericidad y se pueden utilizar cuando el factor intra-sujetos supera los 2 niveles. La estadística F es la misma que en la prueba F ANOVA univariante estándar, pero está asociada con un valor p más preciso. Esta corrección se realiza ajustando los grados de libertad hacia abajo para determinar el valor F crítico. Se utilizan dos correcciones comúnmente: la corrección de Greenhouse-Geisser y la corrección de Huynh-Feldt. La corrección de Greenhouse-Geisser es más conservadora, pero aborda un problema común de aumento de la variabilidad a lo largo del tiempo en un diseño de medidas repetidas. [7] La corrección de Huynh-Feldt es menos conservadora, pero no aborda problemas de aumento de la variabilidad. Se ha sugerido que se utilice un Huynh-Feldt más bajo con desviaciones más pequeñas de la esfericidad, mientras que Greenhouse-Geisser se utilice cuando las desviaciones son grandes.
Prueba multivariada: esta prueba no asume esfericidad, pero también es muy conservadora.
Tamaño del efecto
Una de las estadísticas de tamaño del efecto que se informa con más frecuencia para el rANOVA es el eta cuadrado parcial (η p 2 ). También es común utilizar el η 2 multivariado cuando se ha violado el supuesto de esfericidad y se informa la estadística de prueba multivariada. Una tercera estadística de tamaño del efecto que se informa es el η 2 generalizado , que es comparable a η p 2 en un ANOVA de medidas repetidas de una vía. Se ha demostrado que es una mejor estimación del tamaño del efecto con otras pruebas intra-sujetos. [8] [9]
Precauciones
El rANOVA no siempre es el mejor análisis estadístico para diseños de medidas repetidas. El rANOVA es vulnerable a los efectos de los valores faltantes, la imputación, los puntos temporales no equivalentes entre los sujetos y las violaciones de la esfericidad. [3] Estos problemas pueden dar lugar a sesgos de muestreo y a tasas infladas de error de tipo I. [10] En tales casos, puede ser mejor considerar el uso de un modelo lineal mixto . [11]
^ Kraska; Marie (2010), "Diseño de medidas repetidas", Enciclopedia de diseño de investigación , California, EE. UU.: SAGE Publications, Inc., doi : 10.4135/9781412961288.n378, ISBN 978-1-4129-6127-1, Número de identificación del sujeto 149337088
^ Barret, Julia R. (2013). "Materia particulada y enfermedad cardiovascular: los investigadores se fijan en los cambios microvasculares". Environmental Health Perspectives . 121 (9): a282. doi :10.1289/ehp.121-A282. PMC 3764084 . PMID 24004855.
^ ab Gueorguieva; Krystal (2004). "ANOVA de cambio de dirección". Arch Gen Psychiatry . 61 (3): 310–7. doi :10.1001/archpsyc.61.3.310. PMID 14993119.
^ ab Howell, David C. (2010). Métodos estadísticos para la psicología (7.ª ed.). Belmont, CA: Thomson Wadsworth. ISBN978-0-495-59784-1.
^ ab Salkind, Samuel B. Green, Neil J. (2011). Uso de SPSS para Windows y Macintosh: análisis y comprensión de datos (6.ª ed.). Boston: Prentice Hall. ISBN978-0-205-02040-9.{{cite book}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Vasey; Thayer (1987). "El problema continuo de los falsos positivos en ANOVA de medidas repetidas en psicofisiología: una solución multivariante". Psicofisiología . 24 (4): 479–486. doi :10.1111/j.1469-8986.1987.tb00324.x. PMID 3615759.
^ Park (1993). "Una comparación del enfoque de la ecuación de estimación generalizada con el enfoque de máxima verosimilitud para mediciones repetidas". Stat Med . 12 (18): 1723–1732. doi :10.1002/sim.4780121807. PMID 8248664.
^ Bakeman (2005). "Estadísticas recomendadas del tamaño del efecto para diseños de medidas repetidas". Métodos de investigación del comportamiento . 37 (3): 379–384. doi : 10.3758/bf03192707 . PMID 16405133.
^ Olejnik; Algina (2003). "Estadísticas generalizadas de eta y omega cuadrados: Medidas del tamaño del efecto para algunos diseños de investigación comunes". Métodos psicológicos . 8 (4): 434–447. doi :10.1037/1082-989x.8.4.434. PMID 14664681. S2CID 6931663.
^ Muller; Barton (1989). "Potencia aproximada para ANOVA de medidas repetidas sin esfericidad". Revista de la Asociación Estadounidense de Estadística . 84 (406): 549–555. doi :10.1080/01621459.1989.10478802.
^ Kreuger; Tian (2004). "Una comparación del modelo lineal mixto general y el ANOVA de medidas repetidas utilizando un conjunto de datos con múltiples puntos de datos faltantes". Investigación biológica para enfermería . 6 (2): 151–157. doi :10.1177/1099800404267682. PMID 15388912. S2CID 23173349.
Vonesh, Edward F. y Chinchilli, Vernon G. (1997). Modelos lineales y no lineales para el análisis de mediciones repetidas . Londres: Chapman and Hall.
Exploración de datos longitudinales
Davidian, Marie ; David M. Giltinan (1995). Modelos no lineales para datos de medición repetida . Monografías de Chapman & Hall/CRC sobre estadística y probabilidad aplicada. ISBN 978-0-412-98341-2.
Fitzmaurice, Garrett; Davidiano, María; Verbeke, Geert; Molenberghs, Geert, eds. (2008). Análisis de datos longitudinales . Boca Ratón, Florida: Chapman y Hall/CRC. ISBN 978-1-58488-658-7.
Kim, Kevin y Timm, Neil (2007). ""MGLM restringido y modelo de curva de crecimiento" (Capítulo 7)". Modelos lineales generales univariados y multivariados: teoría y aplicaciones con SAS (con 1 CD-ROM para Windows y UNIX) . Estadística: libros de texto y monografías (segunda edición). Boca Raton, Florida: Chapman & Hall/CRC. ISBN 978-1-58488-634-1.
Kollo, Tõnu y von Rosen, Dietrich (2005). ""Modelos lineales multivariados" (capítulo 4), especialmente "El modelo de curva de crecimiento y extensiones" (capítulo 4.1)". Estadísticas multivariadas avanzadas con matrices . Matemáticas y sus aplicaciones. Vol. 579. Nueva York: Springer. ISBN 978-1-4020-3418-3.
Kshirsagar, Anant M. y Smith, William Boyce (1995). Curvas de crecimiento . Estadística: libros de texto y monografías. Vol. 145. Nueva York: Marcel Dekker, Inc. ISBN 0-8247-9341-2.
Pan, Jian-Xin y Fang, Kai-Tai (2002). Modelos de curvas de crecimiento y diagnósticos estadísticos . Springer Series in Statistics. Nueva York: Springer-Verlag. ISBN 0-387-95053-2.
Seber, GAF y Wild, CJ (1989). ""Modelos de crecimiento (Capítulo 7)"". Regresión no lineal . Serie Wiley en probabilidad y estadística matemática: Probabilidad y estadística matemática. Nueva York: John Wiley & Sons, Inc. págs. 325–367. ISBN 0-471-61760-1.
""El modelo general MANOVA (GMANOVA)" (Capítulo 3.6.d)". Análisis multivariante aplicado . Springer Texts in Statistics. Nueva York: Springer-Verlag. ISBN 0-387-95347-7.
Vonesh, Edward F. y Chinchilli, Vernon G. (1997). Modelos lineales y no lineales para el análisis de mediciones repetidas . Londres: Chapman and Hall.(Tratamiento integral de teoría y práctica)
Conaway, M. (11 de octubre de 1999). Repeated Measures Design. Recuperado el 18 de febrero de 2008 de http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF
Minke, A. (1997, enero). Realización de análisis de medidas repetidas: consideraciones sobre el diseño experimental. Recuperado el 18 de febrero de 2008 de Ericae.net: http://ericae.net/ft/tamu/Rm.htm
Shaughnessy, JJ (2006). Métodos de investigación en psicología. Nueva York: McGraw-Hill.
Enlaces externos
Ejemplos de todos los modelos ANOVA y ANCOVA con hasta tres factores de tratamiento, incluidos bloques aleatorios, gráficos divididos, medidas repetidas y cuadrados latinos, y su análisis en R (Universidad de Southampton)