Un ensayo controlado aleatorio (o ensayo controlado aleatorio ; [2] RCT ) es una forma de experimento científico utilizado para controlar factores que no están bajo control experimental directo. Ejemplos de RCT son los ensayos clínicos que comparan los efectos de medicamentos, técnicas quirúrgicas, dispositivos médicos , procedimientos de diagnóstico , dietas u otros tratamientos médicos. [3] [4]
Los participantes que participan en los RCT difieren entre sí de maneras conocidas y desconocidas que pueden influir en los resultados del estudio, pero que no se pueden controlar directamente. Al asignar aleatoriamente a los participantes entre los tratamientos comparados, un RCT permite el control estadístico de estas influencias. Siempre que esté bien diseñado, se lleve a cabo correctamente e inscriba a suficientes participantes, un RCT puede lograr un control suficiente sobre estos factores de confusión para ofrecer una comparación útil de los tratamientos estudiados.
Definición y ejemplos
Un ensayo clínico controlado aleatorio (ECA) suele comparar un nuevo tratamiento propuesto con un tratamiento estándar existente ; estos tratamientos se denominan entonces tratamientos "experimentales" y "de control", respectivamente. Cuando no se dispone de un tratamiento generalmente aceptado, se puede utilizar un placebo en el grupo de control para que los participantes no conozcan sus asignaciones de tratamiento. Lo ideal es que este principio de cegamiento se extienda lo más posible a otras partes, incluidos investigadores, técnicos, analistas de datos y evaluadores. Un cegamiento eficaz aísla experimentalmente los efectos fisiológicos de los tratamientos de varias fuentes psicológicas de sesgo . [ cita requerida ]
La aleatoriedad en la asignación de participantes a los tratamientos reduce el sesgo de selección y el sesgo de asignación, equilibrando tanto los factores pronósticos conocidos como los desconocidos en la asignación de tratamientos. [5] El cegamiento reduce otras formas de sesgo del experimentador y del sujeto .
Un ensayo clínico aleatorizado y controlado se considera el estándar de oro para los ensayos clínicos. Los ensayos clínicos aleatorizados y controlados se utilizan comúnmente para probar la eficacia de las intervenciones médicas y, además, pueden proporcionar información sobre los efectos adversos, como las reacciones a los medicamentos . Un ensayo controlado aleatorizado puede proporcionar evidencia convincente de que el tratamiento del estudio causa un efecto en la salud humana. [6]
Los términos "ECA" y "ensayo aleatorizado" a veces se utilizan como sinónimos, pero el último término omite la mención de los controles y, por lo tanto, puede describir estudios que comparan múltiples grupos de tratamiento entre sí en ausencia de un grupo de control. [7] De manera similar, la sigla a veces se expande como "ensayo clínico aleatorizado" o "ensayo comparativo aleatorizado", lo que genera ambigüedad en la literatura científica . [8] [9] No todos los ECA son ensayos controlados aleatorizados (y algunos de ellos nunca podrían serlo, como en los casos en que los controles serían poco prácticos o poco éticos de usar). El término ensayo clínico controlado aleatorizado es un término alternativo utilizado en la investigación clínica; [10] sin embargo, los ECA también se emplean en otras áreas de investigación, incluidas muchas de las ciencias sociales.
Historia
El primer ensayo clínico del que se tiene noticia fue realizado por James Lind en 1747 para identificar un tratamiento para el escorbuto . [11] El primer experimento a ciegas fue realizado por la Comisión Real Francesa sobre Magnetismo Animal en 1784 para investigar las afirmaciones del mesmerismo . Un ensayo temprano que abogaba por el cegamiento de los investigadores provino de Claude Bernard en la segunda mitad del siglo XIX. [ vago ] Bernard recomendó que el observador de un experimento no debería tener conocimiento de la hipótesis que se estaba probando. Esta sugerencia contrastaba marcadamente con la actitud prevaleciente de la era de la Ilustración de que la observación científica solo puede ser objetivamente válida cuando la lleva a cabo un científico bien educado e informado. [12] El primer estudio registrado que tuvo un investigador cegado fue publicado en 1907 por WHR Rivers y HN Webber para investigar los efectos de la cafeína. [13]
A principios del siglo XX, los experimentos aleatorios aparecieron en la agricultura gracias a Jerzy Neyman [21] y Ronald A. Fisher . La investigación experimental de Fisher y sus escritos popularizaron los experimentos aleatorios. [22]
A finales del siglo XX, los RCT fueron reconocidos como el método estándar para la "terapéutica racional" en medicina. [28] En 2004, había más de 150.000 RCT en la Biblioteca Cochrane . [26] Para mejorar la presentación de informes de RCT en la literatura médica, un grupo internacional de científicos y editores publicó las Declaraciones de Normas Consolidadas de Informes de Ensayos (CONSORT) en 1996, 2001 y 2010, y estas han sido ampliamente aceptadas. [1] [5] La aleatorización es el proceso de asignar sujetos de ensayo a grupos de tratamiento o control utilizando un elemento de azar para determinar las asignaciones con el fin de reducir el sesgo.
Ética
Aunque el principio de equilibrio clínico ("incertidumbre genuina dentro de la comunidad médica experta... sobre el tratamiento preferido") común a los ensayos clínicos [29] se ha aplicado a los RCT, la ética de los RCT tiene consideraciones especiales. Por un lado, se ha argumentado que el equilibrio en sí mismo es insuficiente para justificar los RCT. [30] Por otro lado, el "equilibrio colectivo" puede entrar en conflicto con una falta de equilibrio personal (por ejemplo, una creencia personal de que una intervención es efectiva). [31] Finalmente, el diseño de Zelen , que se ha utilizado para algunos RCT, aleatoriza a los sujetos antes de que brinden su consentimiento informado, lo que puede ser ético para los RCT de detección y terapias seleccionadas, pero es probable que no sea ético "para la mayoría de los ensayos terapéuticos". [32] [33]
Aunque los sujetos casi siempre dan su consentimiento informado para su participación en un ensayo clínico aleatorizado, estudios realizados desde 1982 han documentado que los sujetos de un ensayo clínico aleatorizado pueden creer que están seguros de recibir el tratamiento que es mejor para ellos personalmente; es decir, no entienden la diferencia entre investigación y tratamiento. [34] [35] Se necesitan más investigaciones para determinar la prevalencia de este " concepto terapéutico erróneo " y las formas de abordarlo . [35]
Las variaciones en el método RCT también pueden crear efectos culturales que no se han comprendido bien. [36] Por ejemplo, los pacientes con enfermedades terminales pueden participar en ensayos con la esperanza de curarse, incluso cuando es poco probable que los tratamientos tengan éxito.
Registro de prueba
En 2004, el Comité Internacional de Editores de Revistas Médicas (ICMJE) anunció que todos los ensayos cuyo registro se inició después del 1 de julio de 2005 deben registrarse antes de ser considerados para su publicación en una de las 12 revistas miembro del comité. [37] Sin embargo, el registro de ensayos puede ocurrir tarde o no ocurrir en absoluto. [38] [39]
Las revistas médicas han sido lentas en adaptar políticas que requieren el registro obligatorio de ensayos clínicos como requisito previo para la publicación. [40]
Clasificaciones
Por diseño de estudio
Una forma de clasificar los RCT es por el diseño del estudio . De más común a menos común en la literatura médica, las principales categorías de diseños de estudios RCT son: [41]
Grupo paralelo : cada participante se asigna aleatoriamente a un grupo y todos los participantes del grupo reciben (o no reciben) una intervención. [42] [43]
Cruce : a lo largo del tiempo, cada participante recibe (o no recibe) una intervención en una secuencia aleatoria. [44] [45]
Grupo : grupos preexistentes de participantes (por ejemplo, aldeas, escuelas) se seleccionan aleatoriamente para recibir (o no recibir) una intervención. [46] [47]
Factorial : cada participante se asigna aleatoriamente a un grupo que recibe una combinación particular de intervenciones o no intervenciones (por ejemplo, el grupo 1 recibe vitamina X y vitamina Y, el grupo 2 recibe vitamina X y placebo Y, el grupo 3 recibe placebo X y vitamina Y, y el grupo 4 recibe placebo X y placebo Y).
Un análisis de los 616 RCTs indexados en PubMed durante diciembre de 2006 encontró que el 78% eran ensayos de grupos paralelos, el 16% eran cruzados, el 2% eran de cuerpo dividido, el 2% eran de conglomerados y el 2% eran factoriales. [41]
Por resultado de interés (eficacia vs. efectividad)
Los RCT pueden clasificarse como "explicativos" o "pragmáticos". [48] Los RCT explicativos prueban la eficacia en un entorno de investigación con participantes altamente seleccionados y bajo condiciones altamente controladas. [48] Por el contrario, los RCT pragmáticos (pRCT) prueban la efectividad en la práctica diaria con participantes relativamente no seleccionados y bajo condiciones flexibles; de esta manera, los RCT pragmáticos pueden "informar decisiones sobre la práctica". [48]
Por hipótesis (superioridad vs. no inferioridad vs. equivalencia)
Otra clasificación de los RCT los categoriza como "ensayos de superioridad", "ensayos de no inferioridad" y "ensayos de equivalencia", que difieren en la metodología y la presentación de informes. [49] La mayoría de los RCT son ensayos de superioridad, en los que se plantea la hipótesis de que una intervención es superior a otra de una manera estadísticamente significativa . [49] Algunos RCT son ensayos de no inferioridad "para determinar si un nuevo tratamiento no es peor que un tratamiento de referencia". [49] Otros RCT son ensayos de equivalencia en los que la hipótesis es que dos intervenciones son indistinguibles entre sí. [49]
"Facilita el cegamiento (enmascaramiento) de la identidad de los tratamientos por parte de investigadores, participantes y evaluadores".
"Permite utilizar la teoría de la probabilidad para expresar la probabilidad de que cualquier diferencia en el resultado entre los grupos de tratamiento simplemente indique casualidad".
Existen dos procesos involucrados en la asignación aleatoria de pacientes a diferentes intervenciones. El primero es la elección de un procedimiento de asignación aleatoria para generar una secuencia impredecible de asignaciones; esto puede ser una asignación aleatoria simple de pacientes a cualquiera de los grupos con probabilidades iguales, puede ser "restringida" o puede ser "adaptativa". Una segunda cuestión, más práctica, es el ocultamiento de la asignación , que se refiere a las estrictas precauciones que se toman para asegurar que la asignación grupal de los pacientes no se revele antes de asignarlos definitivamente a sus respectivos grupos. Los métodos "sistemáticos" no aleatorios de asignación grupal, como alternar sujetos entre un grupo y el otro, pueden causar "posibilidades ilimitadas de contaminación" y pueden causar una violación del ocultamiento de la asignación. [51]
Sin embargo, ha sido difícil detectar evidencia empírica de que una aleatorización adecuada cambia los resultados en relación con una aleatorización inadecuada. [52]
Procedimientos
La asignación del tratamiento es la proporción deseada de pacientes en cada grupo de tratamiento.
Un procedimiento de aleatorización ideal lograría los siguientes objetivos: [53]
Maximizar el poder estadístico , especialmente en los análisis de subgrupos . Generalmente, los tamaños de grupo iguales maximizan el poder estadístico, sin embargo, los tamaños de grupo desiguales pueden ser más poderosos para algunos análisis (por ejemplo, comparaciones múltiples de placebo versus varias dosis utilizando el procedimiento de Dunnett [54] ), y a veces son deseables por razones no analíticas (por ejemplo, los pacientes pueden estar más motivados a inscribirse si hay una mayor probabilidad de obtener el tratamiento de prueba, o las agencias reguladoras pueden requerir un número mínimo de pacientes expuestos al tratamiento). [55]
Minimizar el sesgo de selección. Esto puede ocurrir si los investigadores pueden, consciente o inconscientemente, inscribir de forma preferente a los pacientes entre los grupos de tratamiento. Un buen procedimiento de aleatorización será impredecible, de modo que los investigadores no puedan adivinar la asignación de grupo del siguiente sujeto basándose en asignaciones de tratamientos anteriores. El riesgo de sesgo de selección es mayor cuando se conocen las asignaciones de tratamientos anteriores (como en estudios no ciegos) o se pueden adivinar (quizás si un fármaco tiene efectos secundarios distintivos).
Minimizar el sesgo de asignación (o confusión). Esto puede ocurrir cuando las covariables que afectan el resultado no están distribuidas de manera uniforme entre los grupos de tratamiento y el efecto del tratamiento se confunde con el efecto de las covariables (es decir, un "sesgo accidental" [50] [56] ). Si el procedimiento de aleatorización causa un desequilibrio en las covariables relacionadas con el resultado entre los grupos, las estimaciones del efecto pueden estar sesgadas si no se ajustan para las covariables (que pueden no medirse y, por lo tanto, ser imposibles de ajustar).
Sin embargo, ningún procedimiento de aleatorización cumple esos objetivos en todas las circunstancias, por lo que los investigadores deben seleccionar un procedimiento para un estudio determinado en función de sus ventajas y desventajas.
Simple
Se trata de un procedimiento intuitivo y de uso común, similar a un “lanzamiento repetido de una moneda”. [50] También conocido como aleatorización “completa” o “sin restricciones”, es robusto tanto frente a sesgos de selección como accidentales. Sin embargo, su principal inconveniente es la posibilidad de que los grupos tengan tamaños desequilibrados en los RCT pequeños. Por lo tanto, se recomienda únicamente para los RCT con más de 200 sujetos. [57]
Restringido
Para equilibrar el tamaño de los grupos en RCT más pequeños, se recomienda alguna forma de aleatorización "restringida" . [57] Los principales tipos de aleatorización restringida utilizados en RCT son:
Aleatorización en bloques permutados o aleatorización en bloques: se especifica un "tamaño de bloque" y una "ratio de asignación" (número de sujetos en un grupo frente al otro grupo), y los sujetos se asignan aleatoriamente dentro de cada bloque. [51] Por ejemplo, un tamaño de bloque de 6 y un ratio de asignación de 2:1 daría lugar a una asignación aleatoria de 4 sujetos a un grupo y 2 al otro. Este tipo de aleatorización se puede combinar con una " aleatorización estratificada ", por ejemplo por centro en un ensayo multicéntrico , para "garantizar un buen equilibrio de las características de los participantes en cada grupo". [5] Un caso especial de aleatorización en bloques permutados es la asignación aleatoria , en la que toda la muestra se trata como un bloque. [51] La principal desventaja de la aleatorización en bloques permutados es que incluso si los tamaños de bloque son grandes y varían aleatoriamente, el procedimiento puede dar lugar a un sesgo de selección. [53] Otra desventaja es que el análisis "adecuado" de los datos de los RCT aleatorizados en bloques permutados requiere una estratificación por bloques. [57]
Métodos de aleatorización de monedas sesgadas y adaptativas (de los cuales la aleatorización de urnas es el tipo más conocido): en estos métodos relativamente poco comunes, la probabilidad de ser asignado a un grupo disminuye si el grupo está sobrerrepresentado y aumenta si el grupo está subrepresentado. [51] Se cree que los métodos se ven menos afectados por el sesgo de selección que la aleatorización de bloques permutados. [57]
Adaptado
En los RCT se han utilizado al menos dos tipos de procedimientos de aleatorización "adaptativa", pero con mucha menos frecuencia que la aleatorización simple o restringida:
Aleatorización adaptativa de covariables, de la cual un tipo es la minimización : la probabilidad de ser asignado a un grupo varía para minimizar el "desequilibrio de covariables". [57] Se informa que la minimización tiene "partidarios y detractores" [51] debido a que solo la asignación al grupo del primer sujeto se elige verdaderamente al azar, el método no necesariamente elimina el sesgo sobre factores desconocidos. [5]
Aleatorización adaptativa a la respuesta, también conocida como aleatorización adaptativa a los resultados: la probabilidad de ser asignado a un grupo aumenta si las respuestas de los pacientes anteriores en el grupo fueron favorables. [57] Aunque se han presentado argumentos de que este enfoque es más ético que otros tipos de aleatorización cuando la probabilidad de que un tratamiento sea efectivo o ineficaz aumenta durante el curso de un ECA, los especialistas en ética aún no han estudiado el enfoque en detalle. [58]
Ocultación de la asignación
El "ocultamiento de la asignación" (definido como "el procedimiento para proteger el proceso de aleatorización de modo que el tratamiento que se asignará no se conozca antes de que el paciente ingrese al estudio") es importante en los RCT. [59] En la práctica, los investigadores clínicos en los RCT a menudo encuentran difícil mantener la imparcialidad. Abundan las historias de investigadores que sostienen sobres sellados a la luz o saquean oficinas para determinar las asignaciones de grupo con el fin de dictar la asignación de su próximo paciente. [51] Tales prácticas introducen sesgo de selección y factores de confusión (ambos deben minimizarse mediante la aleatorización), posiblemente distorsionando los resultados del estudio. [51] El ocultamiento adecuado de la asignación debería evitar que los pacientes y los investigadores descubran la asignación del tratamiento una vez que un estudio está en marcha y después de que el estudio ha concluido. Los efectos secundarios o eventos adversos relacionados con el tratamiento pueden ser lo suficientemente específicos como para revelar la asignación a los investigadores o pacientes, introduciendo así sesgo o influyendo en cualquier parámetro subjetivo recopilado por los investigadores o solicitado a los sujetos. [ cita requerida ]
Algunos métodos estándar para asegurar el ocultamiento de la asignación incluyen sobres sellados, opacos y numerados secuencialmente (SNOSE); contenedores numerados secuencialmente; aleatorización controlada por farmacia; y aleatorización central. [51] Se recomienda que los métodos de ocultamiento de la asignación se incluyan en el protocolo de un ECA , y que los métodos de ocultamiento de la asignación se informen en detalle en una publicación de los resultados de un ECA; sin embargo, un estudio de 2005 determinó que la mayoría de los ECA tienen un ocultamiento de la asignación poco claro en sus protocolos, en sus publicaciones o en ambos. [60] Por otro lado, un estudio de 2008 de 146 metanálisis concluyó que los resultados de los ECA con un ocultamiento de la asignación inadecuado o poco claro tendían a estar sesgados hacia los efectos beneficiosos solo si los resultados de los ECA eran subjetivos en lugar de objetivos . [61]
Tamaño de la muestra
El número de unidades de tratamiento (sujetos o grupos de sujetos) asignados a los grupos de control y de tratamiento afecta la fiabilidad de un RCT. Si el efecto del tratamiento es pequeño, el número de unidades de tratamiento en cualquiera de los grupos puede ser insuficiente para rechazar la hipótesis nula en la prueba estadística respectiva . El hecho de no rechazar la hipótesis nula implicaría que el tratamiento no muestra un efecto estadísticamente significativo sobre los tratados en una prueba determinada. Pero a medida que aumenta el tamaño de la muestra, el mismo RCT puede ser capaz de demostrar un efecto significativo del tratamiento, incluso si este efecto es pequeño. [62]
Cegador
Un ECA puede ser ciego (también llamado "enmascarado") mediante "procedimientos que impiden que los participantes del estudio, los cuidadores o los evaluadores de resultados sepan qué intervención se recibió". [61] A diferencia del ocultamiento de la asignación, el cegamiento a veces es inapropiado o imposible de realizar en un ECA; por ejemplo, si un ECA implica un tratamiento en el que es necesaria la participación activa del paciente (por ejemplo, fisioterapia ), los participantes no pueden ser cegados a la intervención. [ cita requerida ]
Tradicionalmente, los RCT ciegos se han clasificado como "simple ciego", "doble ciego" o "triple ciego"; sin embargo, en 2001 y 2006 dos estudios mostraron que estos términos tienen diferentes significados para diferentes personas. [63] [64] La Declaración CONSORT de 2010 especifica que los autores y editores no deben utilizar los términos "simple ciego", "doble ciego" y "triple ciego"; en cambio, los informes de RCT ciegos deben discutir "Si se realizó, quién fue cegado después de la asignación a las intervenciones (por ejemplo, participantes, proveedores de atención, aquellos que evalúan los resultados) y cómo". [5]
Los RCT sin cegamiento se denominan "no ciegos", [65] "abiertos", [66] o (si la intervención es un medicamento) " abiertos ". [67] En 2008, un estudio concluyó que los resultados de los RCT sin cegamiento tendían a estar sesgados hacia los efectos beneficiosos solo si los resultados de los RCT eran subjetivos en lugar de objetivos; [61] por ejemplo, en un RCT de tratamientos para la esclerosis múltiple , los neurólogos sin cegamiento (pero no los neurólogos cegados) sintieron que los tratamientos eran beneficiosos. [68] En los RCT pragmáticos, aunque los participantes y los proveedores a menudo no están cegados, "sigue siendo deseable y a menudo posible cegar al evaluador u obtener una fuente objetiva de datos para la evaluación de los resultados". [48]
Análisis de datos
Los tipos de métodos estadísticos utilizados en los RCT dependen de las características de los datos e incluyen:
Independientemente de los métodos estadísticos utilizados, las consideraciones importantes en el análisis de datos de ECA incluyen:
Si un ensayo clínico aleatorizado debe interrumpirse antes de tiempo debido a los resultados provisionales. Por ejemplo, los ensayos clínicos aleatorizados pueden interrumpirse antes de tiempo si una intervención produce "un beneficio o daño mayor que el esperado" o si "los investigadores encuentran evidencia de que no hay diferencias importantes entre las intervenciones experimentales y de control". [5]
El grado en que los grupos pueden analizarse exactamente como existían en el momento de la aleatorización (es decir, si se utiliza un análisis denominado "por intención de tratar "). Un análisis "puro" por intención de tratar "sólo es posible cuando se dispone de datos completos de los resultados" de todos los sujetos aleatorizados; [72] cuando faltan algunos datos de los resultados, las opciones incluyen analizar sólo los casos con resultados conocidos y utilizar datos imputados . [5] Sin embargo, cuanto más puedan incluir los análisis a todos los participantes de los grupos a los que fueron aleatorizados, menos sesgo tendrá un ECA. [5]
Si se debe realizar un análisis de subgrupos . Estos análisis se suelen desaconsejar porque las comparaciones múltiples pueden producir resultados falsos positivos que no se pueden confirmar con otros estudios. [5]
Informe de resultados
La Declaración CONSORT 2010 es "un conjunto mínimo de recomendaciones basadas en evidencia para la presentación de informes de ECA". [73] La lista de verificación CONSORT 2010 contiene 25 elementos (muchos con subelementos) centrados en "ensayos aleatorizados individuales, de dos grupos y paralelos", que son el tipo más común de ECA. [1]
Declaración de Consort 2010: Extensión a los ensayos aleatorizados por grupos [74]
Declaración de Consort 2010: Intervenciones de tratamiento no farmacológico [75] [76]
"Informe de criterios de valoración sustitutos en informes de ensayos controlados aleatorizados (CONSORT-Surrogate): lista de verificación de extensión con explicación y elaboración" [77]
Importancia relativa y estudios observacionales
Dos estudios publicados en The New England Journal of Medicine en 2000 encontraron que los estudios observacionales y los RCT en general produjeron resultados similares. [78] [79] Los autores de los hallazgos de 2000 cuestionaron la creencia de que "los estudios observacionales no deberían usarse para definir la atención médica basada en evidencia" y que los resultados de los RCT son "evidencia del más alto grado". [78] [79] Sin embargo, un estudio de 2001 publicado en Journal of the American Medical Association concluyó que "ocurren discrepancias más allá del azar y las diferencias en la magnitud estimada del efecto del tratamiento son muy comunes" entre los estudios observacionales y los RCT. [80] Según una revisión Cochrane de 2014 (actualizada en 2024), hay poca evidencia de diferencias significativas en el efecto entre los estudios observacionales y los ensayos controlados aleatorios. [81] Para evaluar las diferencias es necesario considerar cosas distintas al diseño, como la heterogeneidad, la población, la intervención o el comparador. [81]
Otras dos líneas de razonamiento cuestionan la contribución de los ECA al conocimiento científico más allá de otros tipos de estudios:
Si los diseños de estudios se clasifican según su potencial para nuevos descubrimientos, entonces la evidencia anecdótica [ ancla rota ] estaría en la parte superior de la lista, seguida por los estudios observacionales, seguidos por los RCT. [82]
Los RCTs pueden ser innecesarios para tratamientos que tienen efectos dramáticos y rápidos en relación con el curso natural esperado estable o progresivamente peor de la condición tratada. [83] [84] Un ejemplo es la quimioterapia combinada que incluye cisplatino para el cáncer testicular metastásico , que aumentó la tasa de curación del 5% al 60% en un estudio no aleatorizado de 1977. [84] [85]
Interpretación de resultados estadísticos
Al igual que todos los métodos estadísticos, los RCT están sujetos a errores estadísticos de tipo I ("falso positivo") y de tipo II ("falso negativo") . Con respecto a los errores de tipo I, un RCT típico utilizará 0,05 (es decir, 1 en 20) como la probabilidad de que el RCT encuentre falsamente que dos tratamientos igualmente efectivos son significativamente diferentes. [86] Con respecto a los errores de tipo II, a pesar de la publicación de un artículo de 1978 que señalaba que los tamaños de muestra de muchos RCT "negativos" eran demasiado pequeños para sacar conclusiones definitivas sobre los resultados negativos, [87] en 2005-2006 una proporción considerable de RCT todavía tenían cálculos de tamaño de muestra inexactos o informados de forma incompleta. [88]
Revisión por pares
La revisión por pares de los resultados es una parte importante del método científico . Los revisores examinan los resultados del estudio en busca de posibles problemas de diseño que podrían llevar a resultados poco fiables (por ejemplo, creando un sesgo sistemático ), evalúan el estudio en el contexto de estudios relacionados y otras pruebas, y evalúan si se puede considerar razonablemente que el estudio ha demostrado sus conclusiones. Para subrayar la necesidad de la revisión por pares y el peligro de generalizar excesivamente las conclusiones, dos investigadores médicos del área de Boston realizaron un ensayo controlado aleatorio en el que asignaron aleatoriamente un paracaídas o una mochila vacía a 23 voluntarios que saltaron desde un biplano o un helicóptero. El estudio pudo informar con precisión que los paracaídas no reducen las lesiones en comparación con las mochilas vacías. El contexto clave que limitó la aplicabilidad general de esta conclusión fue que la aeronave estaba estacionada en el suelo y los participantes solo habían saltado unos dos pies. [89]
Ventajas
Los RCT se consideran la forma más confiable de evidencia científica en la jerarquía de evidencia que influye en las políticas y prácticas de atención médica porque reducen la causalidad espuria y el sesgo. Los resultados de los RCT se pueden combinar en revisiones sistemáticas que se utilizan cada vez más en la realización de la práctica basada en la evidencia . Algunos ejemplos de organizaciones científicas que consideran que los RCT o las revisiones sistemáticas de RCT son la evidencia de mayor calidad disponible son:
A partir de 1998, el Consejo Nacional de Salud e Investigación Médica de Australia designó la evidencia de "Nivel I" como aquella "obtenida a partir de una revisión sistemática de todos los ensayos controlados aleatorios relevantes" y la evidencia de "Nivel II" como aquella "obtenida a partir de al menos un ensayo controlado aleatorio adecuadamente diseñado". [90]
El Grupo de Trabajo GRADE concluyó en 2008 que “los ensayos aleatorios sin limitaciones importantes constituyen evidencia de alta calidad”. [92]
Para cuestiones que involucran “Terapia/Prevención, Etiología/Daño”, el Centro de Medicina Basada en la Evidencia de Oxford definió en 2011 la evidencia de “Nivel 1a” como una revisión sistemática de ECA que son consistentes entre sí, y la evidencia de “Nivel 1b” como un “ECA individual (con un intervalo de confianza estrecho )”. [93]
Entre los ECA notables con resultados inesperados que contribuyeron a generar cambios en la práctica clínica se incluyen los siguientes:
Después de la aprobación de la Administración de Alimentos y Medicamentos , los agentes antiarrítmicos flecainida y encainida llegaron al mercado en 1986 y 1987 respectivamente. [94] Los estudios no aleatorios sobre los fármacos se caracterizaron como "brillantes", [95] y sus ventas aumentaron hasta un total combinado de aproximadamente 165.000 recetas por mes a principios de 1989. [94] Sin embargo, en ese año, un informe preliminar de un ensayo clínico aleatorio concluyó que los dos fármacos aumentaban la mortalidad. [96] Las ventas de los fármacos luego disminuyeron. [94]
Antes de 2002, basándose en estudios observacionales, era rutinario que los médicos prescribieran terapia de reemplazo hormonal para mujeres posmenopáusicas para prevenir el infarto de miocardio . [95] Sin embargo, en 2002 y 2004, los ECA publicados de la Iniciativa de Salud de la Mujer afirmaron que las mujeres que tomaban terapia de reemplazo hormonal con estrógeno más progestina tenían una tasa más alta de infartos de miocardio que las mujeres que tomaban placebo, y que la terapia de reemplazo hormonal con solo estrógeno no causaba ninguna reducción en la incidencia de enfermedad cardíaca coronaria. [71] [97] Las posibles explicaciones para la discrepancia entre los estudios observacionales y los ECA involucraban diferencias en la metodología, en los regímenes hormonales utilizados y en las poblaciones estudiadas. [98] [99] El uso de la terapia de reemplazo hormonal disminuyó después de la publicación de los ECA. [100]
Desventajas
Numerosos artículos analizan las desventajas de los RCT. [83] [101] [102] Entre las desventajas citadas con más frecuencia se encuentran:
La realización de un RCT lleva varios años hasta su publicación; por lo tanto, los datos están restringidos a la comunidad médica durante muchos años y pueden ser de menor relevancia en el momento de la publicación. [104]
Es costoso mantener ECA durante los años o décadas que serían ideales para evaluar algunas intervenciones. [83] [102]
Las intervenciones para prevenir eventos que ocurren con poca frecuencia (por ejemplo, el síndrome de muerte súbita del lactante ) y resultados adversos poco comunes (por ejemplo, un efecto secundario poco frecuente de un medicamento) requerirían ECA con tamaños de muestra extremadamente grandes y, por lo tanto, podrían evaluarse mejor mediante estudios observacionales. [83]
Un estudio de 2011 realizado para revelar posibles conflictos de intereses en los estudios de investigación subyacentes utilizados para los metanálisis médicos revisó 29 metanálisis y encontró que los conflictos de intereses en los estudios subyacentes a los metanálisis rara vez se revelaron. Los 29 metanálisis incluyeron 11 de revistas de medicina general; 15 de revistas de medicina especializada y 3 de la Base de Datos Cochrane de Revisiones Sistemáticas. Los 29 metanálisis revisaron un agregado de 509 ensayos controlados aleatorios (ECA). De estos, 318 ECA informaron fuentes de financiamiento y 219 (69%) fueron financiados por la industria. 132 de los 509 ECA informaron divulgaciones de conflictos de intereses de los autores, y 91 estudios (69%) revelaron vínculos financieros de la industria con uno o más autores. Sin embargo, la información rara vez se reflejó en los metanálisis. Solo dos (7%) informaron fuentes de financiamiento de ECA y ninguno informó vínculos entre el autor del ECA y la industria. Los autores concluyeron que "sin el reconocimiento de los conflictos de intereses debido a la financiación de la industria o los vínculos financieros de los autores con la industria a partir de los RCT incluidos en los metanálisis, la comprensión y la evaluación de la evidencia del metanálisis por parte de los lectores pueden verse comprometidas". [105]
Algunos RCTs son financiados total o parcialmente por la industria de la atención médica (por ejemplo, la industria farmacéutica ) en lugar de por el gobierno, organizaciones sin fines de lucro u otras fuentes. Una revisión sistemática publicada en 2003 encontró cuatro artículos de 1986-2002 que comparaban RCTs patrocinados por la industria y no patrocinados por la industria, y en todos los artículos hubo una correlación entre el patrocinio de la industria y el resultado positivo del estudio. [106] Un estudio de 2004 de RCTs de 1999-2001 publicados en revistas médicas y quirúrgicas líderes determinó que los RCTs financiados por la industria "tienen más probabilidades de estar asociados con hallazgos pro-industria estadísticamente significativos". [107] Estos resultados se han reflejado en ensayos en cirugía, donde aunque la financiación de la industria no afectó la tasa de interrupción del ensayo, sin embargo se asoció con menores probabilidades de publicación para los ensayos completados. [108] Una posible razón para los resultados pro-industria en RCTs publicados financiados por la industria es el sesgo de publicación . [107] Otros autores han citado los diferentes objetivos de la investigación patrocinada por la academia y la industria como factores que contribuyen a la diferencia. Los patrocinadores comerciales pueden estar más centrados en realizar ensayos de medicamentos que ya han demostrado ser prometedores en ensayos de etapa temprana y en replicar resultados positivos previos para cumplir con los requisitos regulatorios para la aprobación de medicamentos. [109]
Ética
Si se desarrolla una innovación disruptiva en tecnología médica, puede resultar difícil probarla éticamente en un ensayo clínico aleatorizado si resulta "obvio" que los sujetos de control obtienen peores resultados, ya sea debido a otras pruebas previas o dentro de la fase inicial del ensayo clínico aleatorizado en sí. Desde el punto de vista ético, puede resultar necesario abortar el ensayo clínico aleatorizado de forma prematura, y puede que no sea factible obtener la aprobación ética (y el acuerdo de los pacientes) para impedir que el grupo de control utilice la innovación en futuros ensayos clínicos aleatorizados. [ cita requerida ]
Los ensayos de control histórico (ECH) explotan los datos de ECA anteriores para reducir el tamaño de la muestra; sin embargo, estos enfoques son controvertidos en la comunidad científica y deben manejarse con cuidado. [110]
En ciencias sociales
Debido a la reciente aparición de los ensayos controlados aleatorios en las ciencias sociales, su uso en dichas ciencias es un tema controvertido. Algunos autores de formación médica o sanitaria han sostenido que la investigación existente en diversas disciplinas de las ciencias sociales carece de rigor y debería mejorarse mediante un mayor uso de ensayos controlados aleatorios. [111]
Ciencia del transporte
Los investigadores en el campo del transporte sostienen que el gasto público en programas como los planes de transporte escolar no se puede justificar a menos que su eficacia se demuestre mediante ensayos controlados aleatorios. [112] Graham-Rowe y sus colegas [113] revisaron 77 evaluaciones de intervenciones de transporte encontradas en la literatura, clasificándolas en 5 "niveles de calidad". Llegaron a la conclusión de que la mayoría de los estudios eran de baja calidad y abogaron por el uso de ensayos controlados aleatorios siempre que fuera posible en futuras investigaciones sobre el transporte.
El Dr. Steve Melia [114] cuestionó estas conclusiones, argumentando que se habían exagerado las afirmaciones sobre las ventajas de los RCT para establecer la causalidad y evitar el sesgo. Propuso los siguientes ocho criterios para el uso de los RCT en contextos en los que las intervenciones deben cambiar el comportamiento humano para ser efectivas:
La intervención:
No se ha aplicado a todos los miembros de un grupo único de personas (por ejemplo, la población de todo un país, todos los empleados de una organización única, etc.)
Se aplica en un contexto o entorno similar al que se aplica al grupo de control.
Puede aislarse de otras actividades y el propósito del estudio es evaluar este efecto aislado.
Tiene un plazo corto entre su implementación y la madurez de sus efectos.
Y los mecanismos causales:
O bien son conocidas por los investigadores, o bien se pueden probar todas las alternativas posibles.
No implican mecanismos de retroalimentación significativos entre el grupo de intervención y los entornos externos
Tienen una relación estable y predecible con factores exógenos.
Actuaría de la misma manera si el grupo de control y el grupo de intervención estuvieran invertidos.
Criminología
Una revisión de 2005 encontró 83 experimentos aleatorios en criminología publicados entre 1982 y 2004, en comparación con sólo 35 publicados entre 1957 y 1981. [115] Los autores clasificaron los estudios que encontraron en cinco categorías: "vigilancia", "prevención", "correcciones", "tribunal" y "comunidad". [115] Centrándose sólo en los programas de conducta delictiva, Hollin (2008) argumentó que los RCT pueden ser difíciles de implementar (por ejemplo, si un RCT requiere "dictar sentencias que asignen aleatoriamente a los delincuentes a los programas") y, por lo tanto, los experimentos con diseño cuasiexperimental siguen siendo necesarios. [116]
Educación
Los RCT se han utilizado para evaluar una serie de intervenciones educativas. Entre 1980 y 2016, se han publicado más de 1000 informes de RCT. [117] Por ejemplo, un estudio de 2009 asignó aleatoriamente las aulas de 260 maestros de escuela primaria para recibir o no recibir un programa de detección de conducta, intervención en el aula y capacitación para padres, y luego midió el desempeño conductual y académico de sus estudiantes. [118] Otro estudio de 2009 asignó aleatoriamente las aulas de 678 niños de primer grado para recibir una intervención centrada en el aula, una intervención centrada en los padres o ninguna intervención, y luego siguió sus resultados académicos hasta los 19 años. [119]
Crítica
Una revisión de 2018 de los 10 ensayos controlados aleatorizados más citados observó una distribución deficiente de los rasgos de fondo, dificultades con el cegamiento y analizó otros supuestos y sesgos inherentes a los ensayos controlados aleatorizados. Estos incluyen el "sesgo de evaluación de período de tiempo único", el "supuesto de que los rasgos de fondo permanecen constantes", la "limitación de los efectos promedio del tratamiento", la "limitación del tratamiento simple a nivel individual", el "supuesto de que se cumplen plenamente todas las condiciones previas", la "limitación de la variable cuantitativa" y la "limitación del tratamiento solo con placebo o solo con tratamiento convencional". [120]
^ abc Schulz KF, Altman DG, Moher D, et al. (Grupo CONSORT) (marzo de 2010). "Declaración CONSORT 2010: directrices actualizadas para la presentación de informes de ensayos aleatorios de grupos paralelos". BMJ . 340 : c332. doi :10.1136/bmj.c332. PMC 2844940 . PMID 20332509.
^ Chalmers TC, Smith H, Blackburn B, et al. (mayo de 1981). "Un método para evaluar la calidad de un ensayo controlado aleatorio". Ensayos clínicos controlados . 2 (1): 31–49. doi :10.1016/0197-2456(81)90056-8. PMID 7261638.
^ "¿Qué son los ensayos y estudios clínicos?". Instituto Nacional sobre el Envejecimiento, Institutos Nacionales de Salud de EE. UU. 22 de marzo de 2023. Consultado el 9 de marzo de 2024 .
^ "¿Cuáles son los diferentes tipos de investigación clínica?". Administración de Alimentos y Medicamentos de Estados Unidos. 4 de enero de 2018. Consultado el 9 de marzo de 2024 .
^ abcdefghi Moher D, Hopewell S, Schulz KF, et al. (marzo de 2010). "Explicación y elaboración de CONSORT 2010: directrices actualizadas para la presentación de informes de ensayos aleatorios de grupos paralelos". BMJ . 340 : c869. doi :10.1136/bmj.c869. PMC 2844943 . PMID 20332511.
^ Hannan EL (junio de 2008). "Ensayos clínicos aleatorizados y estudios observacionales: pautas para evaluar las respectivas fortalezas y limitaciones". JACC. Cardiovascular Interventions . 1 (3): 211–217. doi : 10.1016/j.jcin.2008.01.008 . PMID 19463302.
^ Ranjith G (2005). "Depresión inducida por interferón alfa: cuando un ensayo aleatorizado no es un ensayo controlado aleatorizado". Psicoterapia y psicosomática . 74 (6): 387, respuesta del autor 387-387, respuesta del autor 388. doi :10.1159/000087787. PMID 16244516. S2CID 143644933.
^ Peto R, Pike MC, Armitage P, et al. (diciembre de 1976). "Diseño y análisis de ensayos clínicos aleatorizados que requieren una observación prolongada de cada paciente. I. Introducción y diseño". British Journal of Cancer . 34 (6): 585–612. doi :10.1038/bjc.1976.220. PMC 2025229 . PMID 795448.
^ Peto R, Pike MC, Armitage P, et al. (enero de 1977). "Diseño y análisis de ensayos clínicos aleatorizados que requieren una observación prolongada de cada paciente. II. Análisis y ejemplos". British Journal of Cancer . 35 (1): 1–39. doi :10.1038/bjc.1977.1. PMC 2025310 . PMID 831755.
^ Wollert KC, Meyer GP, Lotz J, et al. (2004). "Transferencia intracoronaria de células de médula ósea autólogas después de un infarto de miocardio: ensayo clínico controlado aleatorizado BOOST". Lancet . 364 (9429): 141–148. doi :10.1016/S0140-6736(04)16626-9. PMID 15246726. S2CID 24361586.
^ Dunn PM (enero de 1997). "James Lind (1716-94) de Edimburgo y el tratamiento del escorbuto". Archivos de enfermedades de la infancia. Edición fetal y neonatal . 76 (1): F64–F65. doi :10.1136/fn.76.1.f64. PMC 1720613. PMID 9059193 .
^ Daston L (2005). "Error científico y el ethos de la creencia". Investigación social . 72 (1): 18. doi :10.1353/sor.2005.0016. S2CID 141036212.
^ Rivers WH, Webber HN (agosto de 1907). "La acción de la cafeína sobre la capacidad de trabajo muscular". The Journal of Physiology . 36 (1): 33–47. doi :10.1113/jphysiol.1907.sp001215. PMC 1533733 . PMID 16992882.
^ Peirce CS , Jastrow J (1885). "Sobre pequeñas diferencias en la sensación". Memorias de la Academia Nacional de Ciencias . 3 : 73–83.http://psychclassics.yorku.ca/Peirce/small-diffs.htm
^ Hacking I (septiembre de 1988). "Telepatía: Orígenes de la aleatorización en el diseño experimental". Isis . Un número especial sobre artefactos y experimentos. 79 (3): 427–451. doi :10.1086/354775. JSTOR 234674. MR 1013489. S2CID 52201011.
^ Stigler SM (noviembre de 1992). "Una visión histórica de los conceptos estadísticos en psicología e investigación educativa". Revista estadounidense de educación . 101 (1): 60–70. doi :10.1086/444032. S2CID 143685203.
^ Dehue T (diciembre de 1997). "Decepción, eficiencia y grupos aleatorios. Psicología y el origen gradual del diseño de grupos aleatorios" (PDF) . Isis; una revista internacional dedicada a la historia de la ciencia y sus influencias culturales . 88 (4): 653–673. doi :10.1086/383850. PMID 9519574. S2CID 23526321.
^ Woodworth RS, Thorndike EL (1901). "La influencia de la mejora de una función mental sobre la eficiencia de otras funciones (I)" (PDF) . Psychological Review . 8 (3): 247.
^ Coover JE, Angell F (1907). "Efecto de la práctica general del ejercicio especial". Revista estadounidense de psicología . 18 (3): 328–340. doi :10.2307/1412596. ISSN 0002-9556.
^ Dehue T (2000). "De los ensayos de engaño a los reactivos de control: la introducción del grupo de control hace aproximadamente un siglo" (PDF) . American Psychologist . 55 (2): 264–268. doi :10.1037/0003-066X.55.2.264. ISSN 1935-990X. Archivado desde el original el 12 de julio de 2024.
^ Neyman, Jerzy. 1923 [1990]. "Sobre la aplicación de la teoría de la probabilidad a los experimentos agrícolas. Ensayo sobre principios. Sección 9". Statistical Science 5 (4): 465–472. Trad. Dorota M. Dabrowska y Terence P. Speed.
^
Según Denis Conniffe:
Ronald A. Fisher estaba "interesado en la aplicación y en la popularización de los métodos estadísticos y su primer libro Métodos estadísticos para investigadores , publicado en 1925, tuvo muchas ediciones y motivó e influyó en el uso práctico de la estadística en muchos campos de estudio. Su Diseño de experimentos (1935) [promocionó] la técnica estadística y su aplicación. En ese libro hizo hincapié en los ejemplos y en cómo diseñar experimentos sistemáticamente desde un punto de vista estadístico. No se hizo hincapié en la justificación matemática de los métodos descritos y, de hecho, las pruebas a menudo apenas se esbozaban o se omitían por completo..., un hecho que llevó a HB Mann a llenar los vacíos con un tratamiento matemático riguroso en su conocido tratado, Mann (1949)".
Conniffe D (1990–1991). "RA Fisher y el desarrollo de la estadística: una visión en el año de su centenario". Revista de la Sociedad de Investigación Social y Estadística de Irlanda . Vol. XXVI, núm. 3. Dublín: Sociedad de Investigación Social y Estadística de Irlanda . pág. 87. hdl :2262/2764. ISSN 0081-4776.
Mann HB (1949). Análisis y diseño de experimentos: análisis de varianza y diseños de análisis de varianza . Nueva York: Dover Publications. MR 0032177.
^ Streptomycin in Tuberculosis Trials Committee (octubre de 1948). "Tratamiento de la tuberculosis pulmonar con ESTREPTOMICINA". British Medical Journal . 2 (4582): 769–782. doi :10.1136/bmj.2.4582.769. PMC 2091872 . PMID 18890300.
^ Brown D (2 de noviembre de 1998). "Un estudio de referencia logró que la investigación fuera resistente al sesgo". Washington Post .
^ Shikata S, Nakayama T, Noguchi Y, et al. (noviembre de 2006). "Comparación de los efectos en ensayos controlados aleatorizados con estudios observacionales en cirugía digestiva". Anales de Cirugía . 244 (5): 668–676. doi :10.1097/01.sla.0000225356.04304.bc. PMC 1856609 . PMID 17060757.
^ ab Stolberg HO, Norman G, Trop I (diciembre de 2004). "Ensayos controlados aleatorizados". AJR. American Journal of Roentgenology . 183 (6): 1539–1544. doi :10.2214/ajr.183.6.01831539. PMID 15547188. S2CID 5376391.
^ Ferry G (2 de noviembre de 2020). "Obituario de Peter Sleight". The Guardian . Consultado el 3 de noviembre de 2020 .
^ Meldrum ML (agosto de 2000). "Una breve historia del ensayo controlado aleatorio. De naranjas y limones al estándar de oro". Clínicas de Hematología/Oncología de Norteamérica . 14 (4): 745–60, vii. doi :10.1016/S0889-8588(05)70309-9. PMID 10949771.
^ Freedman B (julio de 1987). "Equilibrio y ética de la investigación clínica". The New England Journal of Medicine . 317 (3): 141–145. doi :10.1056/NEJM198707163170304. PMID 3600702.
^ Gifford F (abril de 1995). "Equilibrio comunitario y ética de los ensayos clínicos aleatorizados". Bioética . 9 (2): 127–148. doi :10.1111/j.1467-8519.1995.tb00306.x. PMID 11653056.
^ Edwards SJ, Lilford RJ, Hewison J (octubre de 1998). "La ética de los ensayos controlados aleatorios desde la perspectiva de los pacientes, el público y los profesionales sanitarios". BMJ . 317 (7167): 1209–1212. doi :10.1136/bmj.317.7167.1209. PMC 1114158 . PMID 9794861.
^ Zelen M (mayo de 1979). "Un nuevo diseño para ensayos clínicos aleatorizados". The New England Journal of Medicine . 300 (22): 1242–1245. doi :10.1056/NEJM197905313002203. PMID 431682.
^ Torgerson DJ, Roland M (febrero de 1998). "¿Cuál es el diseño de Zelen?". BMJ . 316 (7131): 606. doi :10.1136/bmj.316.7131.606. PMC 1112637 . PMID 9518917.
^ Appelbaum PS, Roth LH, Lidz C (1982). "El error terapéutico: el consentimiento informado en la investigación psiquiátrica". Revista Internacional de Derecho y Psiquiatría . 5 (3–4): 319–329. doi :10.1016/0160-2527(82)90026-7. PMID 6135666.
^ ab Henderson GE, Churchill LR, Davis AM, et al. (noviembre de 2007). "Ensayos clínicos y atención médica: definición de la idea errónea terapéutica". PLOS Medicine . 4 (11): e324. doi : 10.1371/journal.pmed.0040324 . PMC 2082641 . PMID 18044980.
^ Jain SL (2010). "El efecto de la mortalidad: conteo de los muertos en el ensayo del cáncer" (PDF) . Public Culture . 21 (1): 89–117. doi :10.1215/08992363-2009-017. S2CID 143641293. Archivado desde el original (PDF) el 2020-02-20.
^ De Angelis C, Drazen JM, Frizelle FA, et al. (septiembre de 2004). "Registro de ensayos clínicos: una declaración del Comité Internacional de Editores de Revistas Médicas". The New England Journal of Medicine . 351 (12): 1250–1251. doi : 10.1056/NEJMe048225 . PMID 15356289.
^ Law MR, Kawasumi Y, Morgan SG (diciembre de 2011). "A pesar de la ley, menos de uno de cada ocho estudios completados de medicamentos y productos biológicos se informan a tiempo en ClinicalTrials.gov". Health Affairs . 30 (12): 2338–2345. doi : 10.1377/hlthaff.2011.0172 . PMID 22147862.
^ Mathieu S, Boutron I, Moher D, et al. (septiembre de 2009). "Comparación de resultados primarios registrados y publicados en ensayos controlados aleatorizados". JAMA . 302 (9): 977–984. doi : 10.1001/jama.2009.1242 . PMID 19724045.
^ Bhaumik S, Biswas T (marzo de 2013). "Políticas editoriales de las revistas indias indexadas en MEDLINE sobre el registro de ensayos clínicos". Indian Pediatrics . 50 (3): 339–340. doi :10.1007/s13312-013-0092-2. PMID 23680610. S2CID 40317464.
^ ab Hopewell S, Dutton S, Yu LM, et al. (marzo de 2010). "La calidad de los informes de ensayos aleatorizados en 2000 y 2006: estudio comparativo de artículos indexados en PubMed". BMJ . 340 : c723. doi :10.1136/bmj.c723. PMC 2844941 . PMID 20332510.
^ Kaiser J, Niesen W, Probst P, et al. (junio de 2019). "Drenaje abdominal versus no drenaje después de pancreatectomía distal: protocolo de estudio para un ensayo controlado aleatorizado". Ensayos . 20 (1): 332. doi : 10.1186/s13063-019-3442-0 . PMC 6555976 . PMID 31174583.
^ Farag SM, Mohammed MO, El-Sobky TA, et al. (marzo de 2020). "Inyección de toxina botulínica A en el tratamiento de la espasticidad de las extremidades superiores en niños con parálisis cerebral: una revisión sistemática de ensayos controlados aleatorizados". JBJS Reviews . 8 (3): e0119. doi : 10.2106/JBJS.RVW.19.00119 . PMC 7161716 . PMID 32224633.
^ Jones B, Kenward MG (2003). Diseño y análisis de ensayos cruzados (segunda edición). Londres: Chapman y Hall.
^ Vonesh EF, Chinchilli VG (1997). "Experimentos de cruce". Modelos lineales y no lineales para el análisis de mediciones repetidas . Londres: Chapman and Hall. págs. 111–202.
^ Gall S, Adams L, Joubert N, et al. (8 de noviembre de 2018). "Efecto de una intervención de actividad física de 20 semanas sobre la atención selectiva y el rendimiento académico en niños que viven en barrios desfavorecidos: un ensayo controlado aleatorizado por grupos". PLOS ONE . 13 (11): e0206908. Bibcode :2018PLoSO..1306908G. doi : 10.1371/journal.pone.0206908 . PMC 6224098 . PMID 30408073.
^ Gladstone MJ, Chandna J, Kandawasvika G, et al. (marzo de 2019). "Efectos independientes y combinados de la mejora del agua, el saneamiento y la higiene (WASH) y de la alimentación complementaria mejorada en el desarrollo neurológico temprano entre los niños nacidos de madres VIH-negativas en la zona rural de Zimbabwe: subestudio de un ensayo aleatorizado por grupos". PLOS Medicine . 16 (3): e1002766. doi : 10.1371/journal.pmed.1002766 . PMC 6428259 . PMID 30897095.
^ abcd Zwarenstein M, Treweek S, Gagnier JJ, et al. (noviembre de 2008). "Mejora de la presentación de informes de ensayos pragmáticos: una extensión de la declaración CONSORT". BMJ . 337 : a2390. doi :10.1136/bmj.a2390. PMC 3266844 . PMID 19001484.
^ abcd Piaggio G, Elbourne DR, Altman DG, et al. (marzo de 2006). "Informe de ensayos aleatorios de no inferioridad y equivalencia: una extensión de la declaración CONSORT" (PDF) . JAMA . 295 (10): 1152–1160. doi :10.1001/jama.295.10.1152. PMID 16522836.
^ abc Schulz KF, Grimes DA (febrero de 2002). "Generación de secuencias de asignación en ensayos aleatorios: azar, no elección". Lancet . 359 (9305): 515–519. doi :10.1016/S0140-6736(02)07683-3. PMID 11853818. S2CID 291300.[ enlace muerto ]
^ abcdefgh Schulz KF, Grimes DA (febrero de 2002). "Ocultamiento de la asignación en ensayos aleatorios: defensa contra el desciframiento" (PDF) . Lancet . 359 (9306): 614–618. doi :10.1016/S0140-6736(02)07750-4. PMID 11867132. S2CID 12902486. Archivado desde el original (PDF) el 11 de septiembre de 2012.
^ Howick J, Mebius A (diciembre de 2014). "En busca de justificación para la paradoja de la imprevisibilidad". Trials . 15 : 480. doi : 10.1186/1745-6215-15-480 . PMC 4295227 . PMID 25490908.
^ ab Lachin JM (diciembre de 1988). "Propiedades estadísticas de la aleatorización en ensayos clínicos". Ensayos clínicos controlados . 9 (4): 289–311. doi :10.1016/0197-2456(88)90045-1. PMID 3060315.
^ Rosenberger J. "STAT 503 - Design of Experiments". Universidad Estatal de Pensilvania . Consultado el 24 de septiembre de 2012 .
^ Avins AL (diciembre de 1998). "¿Puede la desigualdad ser más justa? Ética, asignación de sujetos y ensayos clínicos aleatorios". Journal of Medical Ethics . 24 (6): 401–408. doi :10.1136/jme.24.6.401. PMC 479141 . PMID 9873981.
^ Buyse ME (diciembre de 1989). "Análisis de los resultados de los ensayos clínicos: algunos comentarios sobre los análisis de subgrupos". Controlled Clinical Trials . 10 (4 Suppl): 187S–194S. doi :10.1016/0197-2456(89)90057-3. PMID 2605967.
^ abcdef Lachin JM, Matts JP, Wei LJ (diciembre de 1988). "Aleatorización en ensayos clínicos: conclusiones y recomendaciones". Controlled Clinical Trials . 9 (4): 365–374. doi :10.1016/0197-2456(88)90049-9. hdl : 2027.42/27041 . PMID 3203526.
^ Rosenberger WF, Lachin JM (diciembre de 1993). "El uso de diseños adaptativos a la respuesta en ensayos clínicos". Ensayos clínicos controlados . 14 (6): 471–484. doi :10.1016/0197-2456(93)90028-C. PMID 8119063.
^ Forder PM, Gebski VJ, Keech AC (enero de 2005). "Ocultación y cegamiento de la asignación: cuando la ignorancia es una bendición". The Medical Journal of Australia . 182 (2): 87–89. doi :10.5694/j.1326-5377.2005.tb06584.x. PMID 15651970. S2CID 202149.
^ Pildal J, Chan AW, Hróbjartsson A, et al. (mayo de 2005). "Comparación de las descripciones de ocultamiento de la asignación en los protocolos de los ensayos y los informes publicados: estudio de cohorte". BMJ . 330 (7499): 1049. doi :10.1136/bmj.38414.422650.8F. PMC 557221 . PMID 15817527.
^ abc Wood L, Egger M, Gluud LL, et al. (marzo de 2008). "Evidencia empírica de sesgo en las estimaciones del efecto del tratamiento en ensayos controlados con diferentes intervenciones y resultados: estudio metaepidemiológico". BMJ . 336 (7644): 601–605. doi :10.1136/bmj.39465.451748.AD. PMC 2267990 . PMID 18316340.
^ Glennerster R, Kudzai T (2013). ""Capítulo 6"". Ejecución de evaluaciones aleatorias: una guía práctica . Princeton: Princeton University Press. doi :10.2307/j.ctt4cgd52. ISBN 978-0-691-15924-9.JSTOR j.ctt4cgd52 .
^ Devereaux PJ, Manns BJ, Ghali WA, et al. (abril de 2001). "Interpretaciones médicas y definiciones de libros de texto sobre la terminología del cegamiento en ensayos controlados aleatorizados". JAMA . 285 (15): 2000–2003. doi : 10.1001/jama.285.15.2000 . PMID 11308438.
^ Haahr MT, Hróbjartsson A (2006). "¿Quién está cegado en los ensayos clínicos aleatorizados? Un estudio de 200 ensayos y una encuesta a los autores". Ensayos clínicos . 3 (4): 360–365. doi :10.1177/1740774506069153. PMID 17060210. S2CID 23818514.
^ Marson AG, Al-Kharusi AM, Alwaidh M, et al. (marzo de 2007). "Estudio SANAD sobre la eficacia del valproato, la lamotrigina o el topiramato para la epilepsia generalizada e inclasificable: un ensayo controlado aleatorio sin enmascaramiento". Lancet . 369 (9566): 1016–1026. doi :10.1016/S0140-6736(07)60461-9. PMC 2039891 . PMID 17382828.
^ Chan R, Hemeryck L, O'Regan M, et al. (mayo de 1995). "Antibióticos orales versus intravenosos para la infección de las vías respiratorias inferiores adquirida en la comunidad en un hospital general: ensayo controlado abierto y aleatorizado". BMJ . 310 (6991): 1360–1362. doi :10.1136/bmj.310.6991.1360. PMC 2549744 . PMID 7787537.
^ Fukase K, Kato M, Kikuchi S, et al. (agosto de 2008). "Efecto de la erradicación de Helicobacter pylori en la incidencia de carcinoma gástrico metacrónico después de la resección endoscópica de cáncer gástrico temprano: un ensayo controlado aleatorizado y abierto". Lancet . 372 (9636): 392–397. doi :10.1016/S0140-6736(08)61159-9. hdl : 2115/34681 . PMID 18675689. S2CID 13741892.
^ Noseworthy JH , Ebers GC, Vandervoort MK, et al. (enero de 1994). "El impacto del cegamiento en los resultados de un ensayo clínico aleatorizado y controlado con placebo sobre esclerosis múltiple". Neurología . 44 (1): 16–20. doi :10.1212/wnl.44.1.16. PMID 8290055. S2CID 2663997. Archivado desde el original el 10 de mayo de 2005. Consultado el 25 de marzo de 2010 .
^ Manns MP, McHutchison JG, Gordon SC, et al. (septiembre de 2001). "Peginterferón alfa-2b más ribavirina en comparación con interferón alfa-2b más ribavirina para el tratamiento inicial de la hepatitis C crónica: un ensayo aleatorizado". Lancet . 358 (9286): 958–965. doi :10.1016/S0140-6736(01)06102-5. PMID 11583749. S2CID 14583372.
^ Schwartz GG, Olsson AG, Ezekowitz MD, et al. (abril de 2001). "Efectos de la atorvastatina en eventos isquémicos recurrentes tempranos en síndromes coronarios agudos: el estudio MIRACL: un ensayo controlado aleatorizado". JAMA . 285 (13): 1711–1718. doi : 10.1001/jama.285.13.1711 . PMID 11277825.
^ ab Rossouw JE, Anderson GL, Prentice RL, et al. (julio de 2002). "Riesgos y beneficios del estrógeno más progestina en mujeres posmenopáusicas sanas: resultados principales del ensayo controlado aleatorizado de la Women's Health Initiative". JAMA . 288 (3): 321–333. doi : 10.1001/jama.288.3.321 . PMID 12117397. S2CID 20149703.
^ Hollis S, Campbell F (septiembre de 1999). "¿Qué se entiende por análisis por intención de tratar? Encuesta de ensayos controlados aleatorios publicados". BMJ . 319 (7211): 670–674. doi :10.1136/bmj.319.7211.670. PMC 28218 . PMID 10480822.
^ Grupo CONSORT. «Bienvenidos al sitio web de la declaración CONSORT». Archivado desde el original el 9 de mayo de 2019. Consultado el 29 de marzo de 2010 .
^ Campbell MK, Piaggio G, Elbourne DR, et al. (septiembre de 2012). "Declaración de Consort 2010: extensión a los ensayos aleatorizados por conglomerados". BMJ . 345 : e5661. doi : 10.1136/bmj.e5661 . hdl : 2164/2742 . PMID 22951546.
^ Boutron I, Moher D, Altman DG, et al. (febrero de 2008). "Extensión de la declaración CONSORT a ensayos aleatorios de tratamiento no farmacológico: explicación y elaboración". Anales de Medicina Interna . 148 (4): 295–309. doi : 10.7326/0003-4819-148-4-200802190-00008 . PMID 18283207.
^ Boutron I, Moher D, Altman DG, et al. (febrero de 2008). "Métodos y procesos del Grupo CONSORT: ejemplo de una extensión para ensayos que evalúan tratamientos no farmacológicos". Annals of Internal Medicine . 148 (4): W60–W66. doi : 10.7326/0003-4819-148-4-200802190-00008-w1 . PMID 18283201.
^ Manyara AM, Davies P, Stewart D, et al. (julio de 2024). "Informe de criterios de valoración sustitutos en informes de ensayos controlados aleatorizados (CONSORT-Surrogate): lista de verificación de extensión con explicación y elaboración". BMJ . 386 : e078524. doi : 10.1136/bmj-2023-078524 . PMC 11231881 . PMID 38981645.
^ ab Benson K, Hartz AJ (junio de 2000). "Una comparación de estudios observacionales y ensayos controlados aleatorizados". The New England Journal of Medicine . 342 (25): 1878–1886. doi : 10.1056/NEJM200006223422506 . PMID 10861324.
^ ab Concato J, Shah N, Horwitz RI (junio de 2000). "Ensayos controlados aleatorios, estudios observacionales y la jerarquía de los diseños de investigación". The New England Journal of Medicine . 342 (25): 1887–1892. doi :10.1056/NEJM200006223422507. PMC 1557642 . PMID 10861325.
^ Ioannidis JP, Haidich AB, Pappa M, et al. (agosto de 2001). "Comparación de la evidencia de los efectos del tratamiento en estudios aleatorizados y no aleatorizados". JAMA . 286 (7): 821–830. CiteSeerX 10.1.1.590.2854 . doi :10.1001/jama.286.7.821. PMID 11497536.
^ ab Toews I, Anglemyer A, Nyirenda JL, et al. (4 de enero de 2024). "Resultados de la atención sanitaria evaluados con diseños de estudios observacionales en comparación con los evaluados en ensayos aleatorizados: un estudio metaepidemiológico". Base de datos Cochrane de revisiones sistemáticas . 1 (1): MR000034. doi :10.1002/14651858.MR000034.pub3. ISSN 1469-493X. PMC 10765475. PMID 38174786.
^ Vandenbroucke JP (marzo de 2008). "Investigación observacional, ensayos aleatorios y dos puntos de vista sobre la ciencia médica". PLOS Medicine . 5 (3): e67. doi : 10.1371/journal.pmed.0050067 . PMC 2265762 . PMID 18336067.
^ abcd Black N (mayo de 1996). "Por qué necesitamos estudios observacionales para evaluar la efectividad de la atención médica". BMJ . 312 (7040): 1215–1218. doi :10.1136/bmj.312.7040.1215. PMC 2350940 . PMID 8634569.
^ ab Glasziou P, Chalmers I, Rawlins M, et al. (febrero de 2007). "¿Cuándo son innecesarios los ensayos aleatorios? Cómo distinguir la señal del ruido". BMJ . 334 (7589): 349–351. doi :10.1136/bmj.39070.527986.68. PMC 1800999 . PMID 17303884.
^ Einhorn LH (abril de 2002). "Curar el cáncer testicular metastásico". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 99 (7): 4592–4595. doi : 10.1073/pnas.072067999 . PMC 123692 . PMID 11904381.
^ Wittes J (2002). "Cálculos del tamaño de la muestra para ensayos controlados aleatorios". Epidemiologic Reviews . 24 (1): 39–53. doi : 10.1093/epirev/24.1.39 . PMID 12119854.
^ Freiman JA, Chalmers TC, Smith H, et al. (septiembre de 1978). "La importancia de beta, el error de tipo II y el tamaño de la muestra en el diseño e interpretación del ensayo controlado aleatorio. Encuesta de 71 ensayos "negativos". The New England Journal of Medicine . 299 (13): 690–694. doi :10.1056/NEJM197809282991304. PMID 355881.
^ Charles P, Giraudeau B, Dechartres A, et al. (mayo de 2009). "Informe del cálculo del tamaño de la muestra en ensayos controlados aleatorizados: revisión". BMJ . 338 : b1732. doi : 10.1136/bmj.b1732 . PMC 2680945 . PMID 19435763.
^ Harris R (22 de diciembre de 2018). "Los investigadores demuestran que los paracaídas no funcionan, pero hay una trampa". NPR . Archivado desde el original el 17 de enero de 2024.
^ Consejo Nacional de Salud e Investigación Médica (16 de noviembre de 1998). Una guía para el desarrollo, la implementación y la evaluación de las guías de práctica clínica (PDF) . Canberra: Commonwealth of Australia. p. 56. ISBN978-1-86496-048-8Archivado desde el original (PDF) el 14 de octubre de 2017. Consultado el 28 de marzo de 2010 .
^ ab Harris RP, Helfand M, Woolf SH, et al. (Grupo de trabajo sobre métodos; Tercer grupo de trabajo de servicios preventivos de EE. UU.) (abril de 2001). "Métodos actuales del grupo de trabajo de servicios preventivos de EE. UU.: una revisión del proceso". American Journal of Preventive Medicine . 20 (3 Suppl): 21–35. doi :10.1016/S0749-3797(01)00261-6. PMID 11306229.
^ Guyatt GH, Oxman AD, Kunz R, et al. (Grupo de trabajo GRADE) (mayo de 2008). "¿Qué es la "calidad de la evidencia" y por qué es importante para los médicos?". BMJ . 336 (7651): 995–998. doi :10.1136/bmj.39490.551019.BE. PMC 2364804 . PMID 18456631.
^ Oxford Centre for Evidence-based Medicine (16 de septiembre de 2011). «Niveles de evidencia» . Consultado el 15 de febrero de 2012 .
^ abc Anderson JL, Pratt CM, Waldo AL, et al. (enero de 1997). "Impacto de la aprobación de la flecainida y la encainida por parte de la Administración de Alimentos y Medicamentos en la mortalidad por enfermedad de la arteria coronaria: poniendo a prueba la "medicina mortal"". The American Journal of Cardiology . 79 (1): 43–47. doi :10.1016/S0002-9149(96)00673-X. PMID 9024734.
^ ab Rubin R (16 de octubre de 2006). "En medicina, la evidencia puede ser confusa: inundados de estudios, los médicos intentan determinar qué funciona y qué no". USA Today . Consultado el 22 de marzo de 2010 .
^ Investigadores del ensayo de supresión de arritmias cardíacas (CAST) (agosto de 1989). "Informe preliminar: efecto de la encainida y la flecainida sobre la mortalidad en un ensayo aleatorio de supresión de arritmias después de un infarto de miocardio". The New England Journal of Medicine . 321 (6): 406–412. doi :10.1056/NEJM198908103210629. PMID 2473403.
^ Anderson GL, Limacher M, Assaf AR, et al. (abril de 2004). "Efectos del estrógeno equino conjugado en mujeres posmenopáusicas con histerectomía: ensayo controlado aleatorizado de la Women's Health Initiative". JAMA . 291 (14): 1701–1712. doi : 10.1001/jama.291.14.1701 . PMID 15082697.
^ Grodstein F, Clarkson TB, Manson JE (febrero de 2003). "Entender los datos divergentes sobre la terapia hormonal posmenopáusica". The New England Journal of Medicine . 348 (7): 645–650. doi :10.1056/NEJMsb022365. PMID 12584376.
^ Vandenbroucke JP (abril de 2009). "La controversia sobre la terapia de reemplazo hormonal: los estudios observacionales y los ensayos controlados aleatorios coinciden". Lancet . 373 (9671): 1233–1235. doi :10.1016/S0140-6736(09)60708-X. PMID 19362661. S2CID 44991220.
^ Hsu A, Card A, Lin SX, et al. (diciembre de 2009). "Cambios en el uso de la terapia de reemplazo hormonal posmenopáusica entre mujeres con alto riesgo cardiovascular". American Journal of Public Health . 99 (12): 2184–2187. doi :10.2105/AJPH.2009.159889. PMC 2775780 . PMID 19833984.
^ Bell SH, Peck LR (2012). "Obstáculos y limitaciones de los experimentos sociales: 15 falsas alarmas". Serie de artículos sobre liderazgo intelectual de Abt .
^ abc Sanson-Fisher RW, Bonevski B, Green LW, et al. (agosto de 2007). "Limitaciones del ensayo controlado aleatorio en la evaluación de intervenciones de salud basadas en la población". American Journal of Preventive Medicine . 33 (2): 155–161. doi :10.1016/j.amepre.2007.04.007. PMID 17673104.
^ ab Johnston SC, Rootenberg JD, Katrak S, et al. (abril de 2006). "Efecto de un programa de ensayos clínicos de los Institutos Nacionales de Salud de EE. UU. sobre la salud pública y los costos". Lancet . 367 (9519): 1319–1327. doi :10.1016/S0140-6736(06)68578-4. PMID 16631910. S2CID 41035177.
^ ab Yitschaky O, Yitschaky M, Zadik Y (mayo de 2011). "Informe de caso en juicio: ¿Jura usted, doctor, decir la verdad, toda la verdad y nada más que la verdad?". Journal of Medical Case Reports . 5 (1): 179. doi : 10.1186/1752-1947-5-179 . PMC 3113995 . PMID 21569508.
^ "¿Qué tan bien revelan los metaanálisis los conflictos de intereses en los estudios de investigación subyacentes? | La Colaboración Cochrane". Cochrane.org. Archivado desde el original el 16 de diciembre de 2014. Consultado el 19 de agosto de 2011 .
^ Bekelman JE, Li Y, Gross CP (2003). "Alcance e impacto de los conflictos de intereses financieros en la investigación biomédica: una revisión sistemática". JAMA . 289 (4): 454–465. doi :10.1001/jama.289.4.454. PMID 12533125.
^ ab Bhandari M, Busse JW, Jackowski D, et al. (febrero de 2004). "Asociación entre la financiación de la industria y hallazgos estadísticamente significativos a favor de la industria en ensayos aleatorizados médicos y quirúrgicos". CMAJ . 170 (4): 477–480. PMC 332713 . PMID 14970094.
^ Chapman SJ, Shelton B, Mahmood H, et al. (diciembre de 2014). "Interrupción y no publicación de ensayos controlados aleatorios quirúrgicos: estudio observacional". BMJ . 349 : g6870. doi :10.1136/bmj.g6870. PMC 4260649 . PMID 25491195.
^ Ridker PM, Torres J (mayo de 2006). "Resultados informados en los principales ensayos clínicos cardiovasculares financiados por organizaciones con y sin fines de lucro: 2000-2005". JAMA . 295 (19): 2270–2274. doi : 10.1001/jama.295.19.2270 . PMID 16705108.
^ Zhang S, Cao J, Ahn C (agosto de 2010). "Cálculo del tamaño de la muestra en ensayos utilizando controles históricos". Ensayos clínicos . 7 (4): 343–353. doi :10.1177/1740774510373629. PMC 3085081 . PMID 20573638.
^ Deaton A, Cartwright N (agosto de 2018). "Comprensión y malentendido de los ensayos controlados aleatorios". Ciencias sociales y medicina . Ensayos controlados aleatorios y políticas basadas en evidencia: un diálogo multidisciplinario. 210 : 2–21. doi :10.1016/j.socscimed.2017.12.005. PMC 6019115. PMID 29331519 .
^ Rowland D, DiGuiseppi C, Gross M, et al. (enero de 2003). "Ensayo controlado aleatorizado de asesoramiento específico para cada sitio sobre patrones de viajes escolares". Archivos de enfermedades en la infancia . 88 (1): 8–11. doi :10.1136/adc.88.1.8. PMC 1719287 . PMID 12495948.
^ Graham-Rowe E, Skippon S, Gardner B, et al. (2011). "¿Podemos reducir el uso del automóvil y, de ser así, cómo? Una revisión de la evidencia disponible". Transportation Research Part A: Policy and Practice . 44 (5): 401–418. Bibcode :2011TRPA...45..401G. doi :10.1016/j.tra.2011.02.001.
^ Melia S (2011). "¿Ofrecen los ensayos controlados aleatorios una solución a la investigación de transporte de 'baja calidad'?". Investigación sobre el transporte, parte A. Bristol: Universidad del Oeste de Inglaterra.
^ ab Farrington DP, Welsh BC (2005). "Experimentos aleatorios en criminología: ¿Qué hemos aprendido en las últimas dos décadas?". Journal of Experimental Criminology . 1 (1): 9–38. doi :10.1007/s11292-004-6460-0. S2CID 145758503.
^ Hollin CR (2008). "Evaluación de programas de conducta delictiva: ¿solo brilla la aleatorización?". Criminología y justicia penal . 8 (1): 89–106. doi :10.1177/1748895807085871. S2CID 141222135.
^ Connolly P, Keenan C, Urbanska K (9 de julio de 2018). "Los ensayos de práctica basada en evidencia en educación: una revisión sistemática de ensayos controlados aleatorios en investigación educativa 1980-2016". Investigación educativa . 60 (3): 276–291. doi : 10.1080/00131881.2018.1493353 . ISSN 0013-1881.
^ Walker HM, Seeley JR, Small J, et al. (2009). "Un ensayo controlado aleatorio de la intervención temprana First Step to Success. Demostración de los resultados de eficacia del programa en un distrito escolar urbano diverso". Journal of Emotional and Behavioral Disorders . 17 (4): 197–212. doi :10.1177/1063426609341645. S2CID 144571336.
^ Bradshaw CP, Zmuda JH, Kellam SG, et al. (noviembre de 2009). "Impacto longitudinal de dos intervenciones preventivas universales en primer grado sobre los resultados educativos en la escuela secundaria". Revista de psicología educativa . 101 (4): 926–937. doi :10.1037/a0016586. PMC 3678772 . PMID 23766545.
^ Krauss A (junio de 2018). "Por qué todos los ensayos controlados aleatorios producen resultados sesgados". Annals of Medicine . 50 (4): 312–322. doi : 10.1080/07853890.2018.1453233 . PMID 29616838.
Lectura adicional
Bland M (19 de marzo de 2008). "Directorio de software y servicios de aleatorización". Universidad de York .
Evans I, Thornton H, Chalmers I (2010). Pruebas de tratamientos: mejor investigación para una mejor atención sanitaria (PDF) . Londres: Pinter & Martin. ISBN 978-1-905177-35-6. Archivado desde el original (PDF) el 25 de diciembre de 2010.
Gelband H (1983). El impacto de los ensayos clínicos aleatorizados en las políticas sanitarias y la práctica médica: documento de antecedentes (PDF) . Washington, DC: Congreso de los Estados Unidos, Oficina de Evaluación de Tecnología. OTA-BP-H-22. Archivado desde el original (PDF) el 2016-03-03.
"Declaración REFLECT (Directrices de presentación de informes para ensayos controlados aleatorios sobre seguridad alimentaria y ganadera)".
Wathen JK, Cook JD (12 de julio de 2006). "Poder y sesgo en ensayos clínicos aleatorizados adaptativos" (PDF) . MD Anderson Cancer Center, Universidad de Texas .