En estadística , la heterogeneidad (entre) estudios es un fenómeno que ocurre comúnmente cuando se intenta realizar un metanálisis . En un escenario simplista, todos los estudios cuyos resultados se combinarán en el metanálisis se llevarían a cabo de la misma manera y con los mismos protocolos experimentales. Las diferencias entre los resultados se deberían únicamente a errores de medición (y, por tanto, los estudios serían homogéneos ). La heterogeneidad del estudio denota la variabilidad en los resultados que va más allá de lo que se esperaría (o podría explicarse) debido únicamente al error de medición. [1]
El metanálisis es un método utilizado para combinar los resultados de diferentes ensayos con el fin de obtener una síntesis cuantitativa. El tamaño de los ensayos clínicos individuales suele ser demasiado pequeño para detectar de forma fiable los efectos del tratamiento. El metanálisis aumenta el poder de los análisis estadísticos al combinar los resultados de todos los ensayos disponibles.
Cuando se intenta utilizar el metanálisis para estimar un efecto combinado de un grupo de estudios similares, los efectos encontrados en los estudios individuales deben ser lo suficientemente similares como para que uno pueda estar seguro de que una estimación combinada será una descripción significativa del conjunto de estudios. estudios. Sin embargo, las estimaciones individuales del efecto del tratamiento variarán por casualidad; Se espera alguna variación debido a errores de observación . Cualquier exceso de variación (ya sea aparente o detectable o no) se denomina heterogeneidad (estadística) . [2] La presencia de cierta heterogeneidad no es inusual; por ejemplo, también se encuentran comúnmente efectos análogos incluso dentro de los estudios, en ensayos multicéntricos (heterogeneidad entre centros ).
Las razones de la variabilidad adicional suelen ser diferencias en los propios estudios, las poblaciones investigadas, los programas de tratamiento, las definiciones de los criterios de valoración u otras circunstancias ("diversidad clínica"), o la forma en que se analizaron los datos, qué modelos se emplearon o si se han realizado estimaciones. ajustado de alguna manera ("diversidad metodológica"). [1] Los diferentes tipos de medidas de efectos (p. ej., odds ratio versus riesgo relativo ) también pueden ser más o menos susceptibles a la heterogeneidad. [3]
En caso de que pueda identificarse el origen de la heterogeneidad y atribuirse a determinadas características del estudio, el análisis puede estratificarse (considerando subgrupos de estudios, que con suerte serían más homogéneos) o ampliando el análisis a una metarregresión . contabilización de variables moderadoras (continuas o categóricas ) . Desafortunadamente, es posible que el metanálisis basado en la literatura a menudo no permita recopilar datos sobre todos los moderadores (potencialmente) relevantes. [4]
Además, la heterogeneidad generalmente se adapta mediante el uso de un modelo de efectos aleatorios , en el que la heterogeneidad constituye un componente de la varianza . [5] El modelo representa la falta de conocimiento sobre por qué los efectos del tratamiento pueden diferir al tratar las diferencias (potenciales) como incógnitas. El centro de esta distribución simétrica describe el promedio de los efectos, mientras que su ancho describe el grado de heterogeneidad. La elección obvia y convencional de distribución es una distribución normal . Es difícil establecer la validez de cualquier supuesto distributivo, y ésta es una crítica común a los metanálisis de efectos aleatorios. Sin embargo, las variaciones de la forma distributiva exacta pueden no marcar una gran diferencia [6] y las simulaciones han demostrado que los métodos son relativamente sólidos incluso bajo supuestos distributivos extremos, tanto en la estimación de la heterogeneidad [7] como en el cálculo del tamaño del efecto general. [8]
La inclusión de un efecto aleatorio en el modelo tiene el efecto de hacer que las inferencias (en cierto sentido) sean más conservadoras o cautelosas, ya que una heterogeneidad (distinta de cero) conducirá a una mayor incertidumbre (y evitará el exceso de confianza) en la estimación de los efectos generales. En el caso especial de una varianza de heterogeneidad cero, el modelo de efectos aleatorios se reduce nuevamente al caso especial del modelo de efectos comunes . [9]
Sin embargo, los modelos de metanálisis comunes, por supuesto, no deberían aplicarse de forma ciega o ingenua a conjuntos de estimaciones recopilados. En caso de que los resultados que se van a fusionar difieran sustancialmente (en sus contextos o en sus efectos estimados), un promedio metanalítico derivado puede eventualmente no corresponder a una estimación razonable . [10] [11] Cuando los estudios individuales muestran resultados contradictorios, es probable que existan algunas razones por las cuales los resultados difieren; por ejemplo, dos subpoblaciones pueden experimentar vías farmacocinéticas diferentes . [12] En tal escenario, sería importante conocer y considerar las covariables relevantes en un análisis.
Las pruebas estadísticas para una varianza de heterogeneidad distinta de cero a menudo se realizan basándose en la Q de Cochran [13] o procedimientos de prueba relacionados. Sin embargo, este procedimiento común es cuestionable por varias razones, a saber, el bajo poder de dichas pruebas [14], especialmente en el caso muy común de que solo se combinen unas pocas estimaciones en el análisis, [15] [7] así como la especificación de homogeneidad. como hipótesis nula que sólo se rechaza en presencia de pruebas suficientes en su contra. [dieciséis]
Si bien el objetivo principal de un metanálisis suele ser la estimación del efecto principal , la investigación de la heterogeneidad también es crucial para su interpretación. Se encuentra disponible una gran cantidad de estimadores ( frecuentistas y bayesianos ) . [17] La estimación bayesiana de la heterogeneidad generalmente requiere la especificación de una distribución previa apropiada . [9] [18]
Si bien muchos de estos estimadores se comportan de manera similar en el caso de un gran número de estudios, surgen diferencias en particular en su comportamiento en el caso común de sólo unas pocas estimaciones. [19] Con frecuencia se obtiene una estimación incorrecta de la varianza cero entre estudios, lo que lleva a una suposición de homogeneidad falsa. En general, parece que la heterogeneidad se subestima constantemente en los metanálisis. [7]
La varianza de heterogeneidad comúnmente se denota por τ², o la desviación estándar (su raíz cuadrada) por τ. La heterogeneidad probablemente sea más fácilmente interpretable en términos de τ, ya que éste es el parámetro de escala de la distribución de heterogeneidad , que se mide en las mismas unidades que el efecto general mismo. [18]
Otra medida común de heterogeneidad es I², una estadística que indica el porcentaje de varianza en un metanálisis que es atribuible a la heterogeneidad del estudio (algo similar a un coeficiente de determinación ). [20] I² relaciona la magnitud de la varianza de la heterogeneidad con el tamaño de las varianzas de las estimaciones individuales ( errores estándar al cuadrado ); Sin embargo, con esta normalización no es del todo obvio qué constituiría exactamente cantidades "pequeñas" o "grandes" de heterogeneidad. Para una heterogeneidad constante (τ), la disponibilidad de estudios más pequeños o más grandes (con errores estándar correspondientemente diferentes asociados) afectaría la medida I²; por lo que la interpretación real de un valor I² no es sencilla. [21] [22]
La consideración conjunta de un intervalo de predicción junto con un intervalo de confianza para el efecto principal puede ayudar a tener una mejor idea de la contribución de la heterogeneidad a la incertidumbre en torno a la estimación del efecto. [5] [23] [24] [25]