En medicina , un ensayo de cuña escalonada (o SWT ) es un tipo de ensayo controlado aleatorio (ECA). Un ECA es un experimento científico diseñado para reducir el sesgo al probar un nuevo tratamiento médico , una intervención social u otra hipótesis comprobable .
En un RCT tradicional, el investigador divide aleatoriamente a los participantes del experimento en dos grupos al mismo tiempo:
En una terapia SWT, una restricción logística generalmente impide el tratamiento simultáneo de algunos participantes y, en cambio, todos o la mayoría de los participantes reciben el tratamiento en oleadas o "pasos".
Por ejemplo, un investigador quiere medir si enseñar a los estudiantes universitarios a preparar varias comidas aumenta su propensión a cocinar en casa en lugar de comer fuera.
- En un ensayo clínico aleatorizado tradicional , se seleccionaría una muestra de estudiantes y algunos recibirían capacitación sobre cómo cocinar estas comidas, mientras que los demás no. Se haría un seguimiento de ambos grupos para ver con qué frecuencia comían fuera de casa. Al final, se compararía el número de veces que el grupo de tratamiento comió fuera de casa con el número de veces que comía fuera de casa el grupo de control, probablemente con una prueba t o alguna variante.
- Sin embargo, si el investigador sólo pudiera capacitar a un número limitado de estudiantes cada semana, entonces podría emplear un SWT, asignando aleatoriamente a los estudiantes a qué semana serían capacitados.
El término "cuña escalonada" fue acuñado por el Estudio de Intervención contra la Hepatitis de Gambia debido a la forma de cuña escalonada que se aprecia en una ilustración esquemática del diseño . [1] [2] El cruce se realiza en una dirección, normalmente del control a la intervención, y la intervención no se elimina una vez implementada. El diseño de cuña escalonada se puede utilizar para ensayos aleatorizados individuales, [3] [4] es decir, ensayos en los que se trata a cada individuo de forma secuencial, pero se utiliza más comúnmente como ensayo aleatorizado por grupos (CRT) . [5]
Diseño de experimentos
El diseño de cuña escalonada implica la recopilación de observaciones durante un período de referencia en el que ningún conglomerado está expuesto a la intervención. A continuación, a intervalos regulares o pasos, se asigna aleatoriamente un conglomerado (o grupo de conglomerados) para que reciba la intervención [5] [6] y se vuelve a medir a todos los participantes. [7] Este proceso continúa hasta que todos los conglomerados hayan recibido la intervención. Por último, se realiza una medición más después de que todos los conglomerados hayan recibido la intervención. [8]
Oportunidad
Hargreaves y sus colegas ofrecen una serie de cinco preguntas que los investigadores deberían responder para decidir si la terapia con ondas de choque es realmente el diseño óptimo y cómo proceder en cada paso del estudio. [9] En concreto, los investigadores deberían poder identificar:
- Las razones por las que SWT es el diseño preferido
- Si la medición del efecto de un tratamiento es el objetivo principal de la investigación, la SWT puede no ser el diseño óptimo. Las SWT son apropiadas cuando el enfoque de la investigación se centra en la eficacia del tratamiento en lugar de en su mera existencia. En general, si el estudio es pragmático (es decir, busca principalmente implementar una determinada política), las preocupaciones logísticas y otras preocupaciones prácticas se consideran las mejores razones para recurrir a un diseño de cuña escalonada. Además, si se espera que el tratamiento sea beneficioso y no sería ético negárselo a algunos participantes, entonces la SWT permite que todos los participantes reciban el tratamiento y al mismo tiempo permite una comparación con un grupo de control. Al final del estudio, todos los participantes tendrán la oportunidad de probar el tratamiento. Tenga en cuenta que aún pueden surgir problemas éticos al retrasar el acceso al tratamiento para algunos participantes. [ cita requerida ]
- ¿Qué diseño de SWT es más adecuado?
- Los SWT pueden tener tres diseños principales que emplean una cohorte cerrada , una cohorte abierta y un reclutamiento continuo con exposición corta. [10] En la cohorte cerrada, todos los sujetos participan en el experimento desde el principio hasta el final. Todos los resultados se miden repetidamente en puntos de tiempo fijos que pueden o no estar relacionados con cada paso. [ cita requerida ]
- En el diseño de cohorte abierta, los resultados se miden de manera similar al diseño anterior, pero pueden ingresar nuevos sujetos al estudio y algunos participantes de una etapa temprana pueden abandonarlo antes de que finalice. Solo una parte de los sujetos son expuestos desde el comienzo y se expone a más sujetos gradualmente en etapas posteriores. Por lo tanto, el tiempo de exposición varía para cada sujeto.
- En el diseño de reclutamiento continuo con exposición breve, muy pocos o ningún sujeto participa al comienzo del experimento, pero más se vuelven elegibles y se exponen a una intervención breve de manera gradual. En este diseño, cada sujeto se asigna al grupo de tratamiento o al grupo de control. Dado que los participantes se asignan al grupo de tratamiento o al grupo de control, el riesgo de efectos de arrastre, que pueden ser un desafío para los diseños de cohorte cerrados y abiertos, es mínimo. [ cita requerida ]
- ¿Qué estrategia de análisis es la adecuada?
- Los modelos lineales mixtos (LMM), los modelos lineales mixtos generalizados (GLMM) y las ecuaciones de estimación generalizadas (GEE) son los principales estimadores recomendados para analizar los resultados. Si bien el LMM ofrece mayor potencia que el GLMM y el GEE, puede resultar ineficiente si el tamaño de los grupos varía y la respuesta no es continua ni se distribuye normalmente. Si se viola alguna de esas suposiciones, se prefieren el GLMM y el GEE. [ cita requerida ]
- ¿Qué tan grande debe ser la muestra?
- Se encuentran disponibles análisis de potencia y cálculo del tamaño de la muestra. En general, las SWT requieren un tamaño de muestra más pequeño para detectar efectos, ya que aprovechan tanto las comparaciones entre grupos como las comparaciones dentro de ellos. [11] [12]
- Mejores prácticas para informar el diseño y los resultados del ensayo
- Informar sobre el diseño, el perfil de la muestra y los resultados puede ser un desafío, ya que no se han designado estándares consolidados para la presentación de informes de ensayos (CONSORT) para los ensayos de trabajo de campo. Sin embargo, algunos estudios han proporcionado formalizaciones y diagramas de flujo que ayudan a informar los resultados y a mantener una muestra equilibrada en todas las oleadas. [13]
Modelo
Si bien existen varios otros métodos potenciales para modelar resultados en una SWT, [14] el trabajo de Hussey y Hughes [7] "describió por primera vez métodos para determinar el poder estadístico disponible cuando se utiliza un diseño de cuña escalonada". [14] Lo que sigue es su diseño.
Supongamos que hay muestras divididas en grupos. En cada punto temporal , preferiblemente espaciados de manera uniforme en el tiempo real, se tratan una cierta cantidad de grupos. Sea si el grupo ha sido tratado en el momento y en los demás casos. En particular, observe que si entonces .
Para cada participante del grupo , mida el resultado que se va a estudiar en el momento . Tenga en cuenta que la notación permite la agrupación al incluir en el subíndice de , , y . Modelamos estos resultados como: donde:
- es un gran medio ,
- es un efecto aleatorio a nivel de grupo sobre el resultado,
- es un efecto fijo específico del punto de tiempo,
- es el efecto medido del tratamiento, y
- es el ruido residual.
Este modelo puede verse como un modelo lineal jerárquico donde en el nivel más bajo, donde es la media de un grupo determinado en un momento determinado, y en el nivel de grupo, la media de cada grupo .
Estimación de la varianza
El efecto de diseño (estimación de la varianza unitaria) de un diseño de cuña escalonada se da mediante la fórmula: [11]
dónde:
- ρ es la correlación intra-clúster (ICC) ,
- n es el número de sujetos dentro de un grupo (que se supone que es constante),
- k es el número de pasos,
- t es el número de mediciones después de cada paso, y
- bis es el número de mediciones de referencia.
Para calcular el tamaño de la muestra es necesario aplicar la sencilla fórmula: [11]
dónde:
- N sw es el tamaño de muestra requerido para el SWT
- N u es el tamaño total de muestra no ajustado que se requeriría para un RCT tradicional.
Tenga en cuenta que aumentar k , t o b resultará en una disminución del tamaño de muestra requerido para una SWT.
Además, el tamaño del clúster c requerido viene dado por: [11]
Para calcular cuántos clústeres c s necesitan pasar de la condición de control a la condición de tratamiento, se dispone de la siguiente fórmula: [11]
Si c y c s no son números enteros , deben redondearse al siguiente entero mayor y distribuirse lo más uniformemente posible entre k.
Ventajas
El diseño de cuña escalonada presenta muchas ventajas comparativas con respecto a los RCT tradicionales ( ensayos controlados aleatorios ).
- En primer lugar, las intervenciones de terapia de sustitución son más adecuadas, tanto desde el punto de vista ético como práctico, cuando se espera que la intervención produzca un resultado positivo. Dado que todos los sujetos recibirán finalmente los beneficios de la intervención, se pueden apaciguar las preocupaciones éticas y el reclutamiento de participantes puede resultar más fácil. [11]
- En segundo lugar, las SWT “pueden conciliar la necesidad de evaluaciones sólidas con las limitaciones políticas o logísticas ”. [14] En concreto, se pueden utilizar para medir los efectos del tratamiento cuando los recursos para realizar una intervención son escasos.
- En tercer lugar, dado que cada grupo recibe tanto la condición de control como la de tratamiento al final del ensayo, es posible realizar comparaciones entre grupos y dentro de ellos. De esta manera, la potencia estadística aumenta y la muestra se mantiene significativamente más pequeña de lo que sería necesario en un ensayo clínico aleatorio tradicional. [11]
- En cuarto lugar, se ha establecido un efecto de diseño (utilizado para inflar el tamaño de la muestra de un ensayo aleatorizado individual al requerido en un ensayo por grupos), [11] que ha demostrado que la CRT de cuña escalonada podría reducir el número de pacientes necesarios en el ensayo en comparación con otros diseños. [11] [15]
- Por último, como cada grupo cambia aleatoriamente de la condición de control a la de tratamiento en diferentes puntos temporales, es posible examinar los efectos temporales. [11] Por ejemplo, es posible estudiar cómo la exposición repetida o prolongada a estímulos experimentales afecta la eficiencia del tratamiento. Las mediciones repetidas en marcos temporales regulares pueden promediar el ruido, lo que a su vez aumenta la precisión de las estimaciones. Esta ventaja se hace más evidente cuando la medición es ruidosa y la autocorrelación de los resultados es baja. [16]
Desventajas
SWT puede sufrir ciertos inconvenientes.
- En primer lugar, dado que en las SWT el período de estudio dura más tiempo y todos los sujetos reciben finalmente el tratamiento, los costos pueden aumentar significativamente. [11] Debido a que el diseño puede ser costoso, las SWT pueden no ser la solución óptima cuando la precisión de la medición y la autocorrelación de los resultados son altas. [16] Además, dado que todos son tratados finalmente, las SWT no facilitan el análisis posterior.
- En segundo lugar, en un SWT, más grupos están expuestos a la intervención en períodos de tiempo posteriores que en períodos anteriores. Por lo tanto, es posible que una tendencia temporal subyacente pueda confundir el efecto de la intervención, por lo que el efecto de confusión del tiempo debe tenerse en cuenta tanto en los cálculos de potencia previos al ensayo como en el análisis posterior al ensayo. [5] [17] [14] En concreto, en el análisis posterior al ensayo, se recomienda el uso de modelos lineales mixtos generalizados o ecuaciones de estimación generalizadas . [11]
- Por último, el diseño y análisis de los ensayos de cuña escalonada es, por lo tanto, más complejo que el de otros tipos de ensayos aleatorizados. Las revisiones sistemáticas anteriores destacaron la mala información sobre los cálculos del tamaño de la muestra y la falta de coherencia en el análisis de dichos ensayos. [5] [6] Hussey y Hughes fueron los primeros autores en sugerir una estructura y una fórmula para estimar la potencia en los estudios de cuña escalonada en los que se recogían datos en todos y cada uno de los pasos. [7] Esto se ha ampliado ahora para los diseños en los que no se realizan observaciones en cada paso, así como para los múltiples niveles de agrupamiento. [18]
Trabajo en curso
El número de estudios que utilizan este diseño ha ido en aumento. En 2015, se publicó una serie temática en la revista Trials . [19] En 2016, se celebró la primera conferencia internacional dedicada al tema en la Universidad de York . [20] [21]
Referencias
- ^ Wang, Mei; Jin, Yanling; Hu, Zheng Jing; Thabane, Alex; Dennis, Brittany; Gajic-Veljanoski, Olga; Paul, James; Thabane, Lehana (1 de diciembre de 2017). "La calidad de los resúmenes de los ensayos aleatorizados escalonados es subóptima: una encuesta sistemática de la literatura". Comunicaciones de ensayos clínicos contemporáneos . 8 : 1–10. doi :10.1016/j.conctc.2017.08.009. ISSN 2451-8654. PMC 5898470 . PMID 29696191.
- ^ The Gambia Hepatitis Study Group (noviembre de 1987). "The Gambia Hepatitis Intervention Study". Investigación sobre el cáncer . 47 (21): 5782–7. PMID 2822233.
- ^ Ratanawongsa N, Handley MA, Quan J, Sarkar U, Pfeifer K, Soria C, Schillinger D (enero de 2012). "Ensayo cuasiexperimental de asistencia telefónica automatizada y en tiempo real para el autocontrol de la diabetes (SMARTSteps) en un plan de atención administrada de Medicaid: protocolo de estudio". BMC Health Services Research . 12 : 22. doi : 10.1186/1472-6963-12-22 . PMC 3276419 . PMID 22280514.
- ^ Løhaugen GC, Beneventi H, Andersen GL, Sundberg C, Østgård HF, Bakkan E, Walther G, Vik T, Skranes J (julio de 2014). "¿Los niños con parálisis cerebral se benefician del entrenamiento de la memoria de trabajo por ordenador? Protocolo de estudio para un ensayo controlado aleatorio". Trials . 15 : 269. doi : 10.1186/1745-6215-15-269 . PMC 4226979 . PMID 24998242.
- ^ abcd Brown CA, Lilford RJ (noviembre de 2006). "El diseño del ensayo de cuña escalonada: una revisión sistemática". BMC Medical Research Methodology . 6 : 54. doi : 10.1186/1471-2288-6-54 . PMC 1636652 . PMID 17092344.
- ^ ab Mdege ND, Man MS, Taylor Nee Brown CA, Torgerson DJ (septiembre de 2011). "Una revisión sistemática de ensayos aleatorios por conglomerados en cuña escalonada muestra que el diseño se utiliza particularmente para evaluar intervenciones durante la implementación rutinaria". Journal of Clinical Epidemiology . 64 (9): 936–48. doi :10.1016/j.jclinepi.2010.12.003. PMID 21411284.
- ^ abc Hussey MA, Hughes JP (febrero de 2007). "Diseño y análisis de ensayos aleatorizados por conglomerados en cuña escalonada". Ensayos clínicos contemporáneos . 28 (2): 182–91. doi : 10.1016/j.cct.2006.05.007 . PMID 16829207.
- ^ Mulfinger N, Sander A, Stuber F, Brinster R, Junne F, Limprecht R, et al. (diciembre de 2019). "Ensayo aleatorizado por grupos que evalúa una intervención compleja para mejorar la salud mental y el bienestar de los empleados que trabajan en el hospital: un protocolo para el ensayo SEEGEN". BMC Public Health . 19 (1): 1694. doi : 10.1186/s12889-019-7909-4 . PMC 6918673 . PMID 31847898.
- ^ Hargreaves JR, Copas AJ, Beard E, Osrin D, Lewis JJ, Davey C, Thompson JA, Baio G, Fielding KL, Prost A (agosto de 2015). "Cinco preguntas a tener en cuenta antes de realizar un ensayo de cuña escalonada". Ensayos . 16 (1): 350. doi : 10.1186/s13063-015-0841-8 . PMC 4538743 . PMID 26279013.
- ^ Copas AJ, Lewis JJ, Thompson JA, Davey C, Baio G, Hargreaves JR (agosto de 2015). "Diseño de un ensayo de cuña escalonada: tres diseños principales, efectos de arrastre y enfoques de aleatorización". Ensayos . 16 (1): 352. doi : 10.1186/s13063-015-0842-7 . PMC 4538756 . PMID 26279154.
- ^ abcdefghijkl Woertman W, de Hoop E, Moerbeek M, Zuidema SU, Gerritsen DL, Teerenstra S (julio de 2013). "Los diseños de cuña escalonada podrían reducir el tamaño de muestra requerido en ensayos aleatorizados por conglomerados". Journal of Clinical Epidemiology . 66 (7): 752–8. doi : 10.1016/j.jclinepi.2013.01.009 . hdl : 2066/117688 . PMID 23523551.
- ^ Baio G, Copas A, Ambler G, Hargreaves J, Beard E, Omar RZ (agosto de 2015). "Cálculo del tamaño de la muestra para un ensayo de cuña escalonada". Ensayos . 16 (1): 354. doi : 10.1186/s13063-015-0840-9 . PMC 4538764 . PMID 26282553.
- ^ Gruber JS, Reygadas F, Arnold BF, Ray I, Nelson K, Colford JM (agosto de 2013). "Un ensayo aleatorizado por grupos, de cuña escalonada, de una intervención de desinfección por rayos UV y almacenamiento seguro de agua potable en zonas rurales de Baja California Sur, México". The American Journal of Tropical Medicine and Hygiene . 89 (2): 238–45. doi :10.4269/ajtmh.13-0017. PMC 3741243 . PMID 23732255.
- ^ abcd Hemming K, Haines TP, Chilton PJ, Girling AJ, Lilford RJ (febrero de 2015). "El ensayo aleatorio por conglomerados de cuña escalonada: fundamento, diseño, análisis e informe". BMJ . 350 : h391. doi : 10.1136/bmj.h391 . PMID 25662947.
- ^ Keriel-Gascou M, Buchet-Poyau K, Rabilloud M, Duclos A, Colin C (julio de 2014). "Un ensayo aleatorio por conglomerados en cuña escalonada es preferible para evaluar intervenciones sanitarias complejas". Journal of Clinical Epidemiology . 67 (7): 831–3. doi : 10.1016/j.jclinepi.2014.02.016 . PMID 24774471.
- ^ ab McKenzie D (noviembre de 2012). "Más allá de la línea base y el seguimiento: el caso de más T en los experimentos Enlaces de autor abrir panel superpuesto" (PDF) . Revista de Economía del Desarrollo . 99 (2): 210–221. doi :10.1016/j.jdeveco.2012.01.002. hdl : 10986/3403 . S2CID 15923427.
- ^ Van den Heuvel ER, Zwanenburg RJ, Van Ravenswaaij-Arts CM (abril de 2017). "Un diseño de cuña escalonada para probar un efecto de la insulina intranasal en el desarrollo cognitivo de niños con síndrome de Phelan-McDermid: una comparación de diferentes diseños". Métodos estadísticos en investigación médica . 26 (2): 766–775. doi :10.1177/0962280214558864. PMID 25411323. S2CID 4703466.
- ^ Hemming K, Lilford R, Girling AJ (enero de 2015). "Ensayos controlados aleatorizados por conglomerados escalonados: un marco genérico que incluye diseños paralelos y de múltiples niveles". Estadísticas en Medicina . 34 (2): 181–96. doi :10.1002/sim.6325. PMC 4286109 . PMID 25346484.
- ^ Torgerson D (2015). "Ensayos controlados aleatorios de cuña escalonada". Ensayos . 16 : 350 . Consultado el 17 de febrero de 2017 .
- ^ "Primera conferencia internacional sobre diseño de ensayos con cuña escalonada". Universidad de York.
- ^ Kanaan M, et al. (julio de 2016). "Actas de la primera conferencia internacional sobre diseño de ensayos de cuña escalonada: York, Reino Unido, 10 de marzo de 2016". Ensayos . 17 (Supl 1): 311. doi : 10.1186/s13063-016-1436-8 . PMC 4959349 . PMID 27454562.