stringtranslate.com

Confuso

Mientras que un mediador es un factor en la cadena causal (arriba), un factor de confusión es un factor espurio que implica incorrectamente causalidad (abajo).

En la inferencia causal , un factor de confusión [a] es una variable que influye tanto en la variable dependiente como en la variable independiente , causando una asociación espuria . La confusión es un concepto causal y, como tal, no se puede describir en términos de correlaciones o asociaciones. [1] [2] [3] La existencia de factores de confusión es una explicación cuantitativa importante de por qué la correlación no implica causalidad . Algunas notaciones están diseñadas explícitamente para identificar la existencia, posible existencia o inexistencia de factores de confusión en las relaciones causales entre elementos de un sistema.

Los factores de confusión son amenazas a la validez interna . [4]

Ejemplo sencillo

Supongamos que una empresa de transporte de camiones posee una flota de camiones de dos fabricantes diferentes. Los camiones fabricados por un fabricante se denominan "Camiones A" y los camiones fabricados por el otro fabricante se denominan "Camiones B". Queremos averiguar si los Camiones A o los Camiones B obtienen un mejor ahorro de combustible. Medimos el combustible y las millas recorridas durante un mes y calculamos el MPG de cada camión. Luego realizamos el análisis apropiado, que determina que existe una tendencia estadísticamente significativa de que los Camiones A son más eficientes en el consumo de combustible que los Camiones B. Sin embargo, tras una reflexión más profunda, también observamos que es más probable que a los Camiones A se les asignen rutas de autopista, y a los Camiones B, rutas de ciudad. Esta es una variable de confusión. La variable de confusión hace que los resultados del análisis no sean confiables. Es muy probable que solo estemos midiendo el hecho de que conducir en autopista da como resultado un mejor ahorro de combustible que conducir en ciudad.

En términos estadísticos, la marca del camión es la variable independiente, el consumo de combustible (MPG) es la variable dependiente y la cantidad de conducción en ciudad es la variable de confusión. Para solucionar este estudio, tenemos varias opciones. Una es aleatorizar las asignaciones de camiones de modo que los camiones A y los camiones B terminen con cantidades iguales de conducción en ciudad y carretera. Eso elimina la variable de confusión. Otra opción es cuantificar la cantidad de conducción en ciudad y usarla como una segunda variable independiente. Una tercera opción es segmentar el estudio, primero comparando el MPG durante la conducción en ciudad para todos los camiones y luego realizar un estudio separado comparando el MPG durante la conducción en carretera.

Definición

La confusión se define en términos del modelo de generación de datos. Sea X una variable independiente e Y una variable dependiente . Para estimar el efecto de X sobre Y , el estadístico debe suprimir los efectos de las variables extrañas que influyen tanto en X como en Y. Decimos que X e Y están confundidas por alguna otra variable Z siempre que Z influya causalmente tanto en X como en Y.

Sea la probabilidad del evento Y = y bajo la intervención hipotética X = x . X e Y no se confunden si y solo si se cumple lo siguiente:

para todos los valores X = x e Y = y , donde es la probabilidad condicional de ver X = x . Intuitivamente, esta igualdad establece que X e Y no se confunden siempre que la asociación observada entre ellos sea la misma que la asociación que se mediría en un experimento controlado , con x aleatorizado .

En principio, la igualdad definitoria se puede verificar a partir del modelo generador de datos, suponiendo que tenemos todas las ecuaciones y probabilidades asociadas con el modelo. Esto se hace simulando una intervención (ver red bayesiana ) y verificando si la probabilidad resultante de Y es igual a la probabilidad condicional . Sin embargo, resulta que la estructura gráfica por sí sola es suficiente para verificar la igualdad .

Control

Consideremos a un investigador que intenta evaluar la eficacia del fármaco X a partir de datos de población en los que el uso del fármaco fue una elección del paciente. Los datos muestran que el género ( Z ) influye en la elección del fármaco por parte del paciente, así como en sus posibilidades de recuperación ( Y ). En este escenario, el género Z confunde la relación entre X e Y, ya que Z es una causa tanto de X como de Y :

Diagrama causal del género como causa común del consumo de drogas y su recuperación

Nosotros tenemos eso

porque la cantidad observacional contiene información sobre la correlación entre X y Z , y la cantidad intervencionista no (ya que X no está correlacionada con Z en un experimento aleatorio). Se puede demostrar [5] que, en casos en los que solo se dispone de datos observacionales, se puede obtener una estimación imparcial de la cantidad deseada "ajustando" todos los factores de confusión, es decir, condicionando sus diversos valores y promediando el resultado. En el caso de un único factor de confusión Z , esto conduce a la "fórmula de ajuste":

que da una estimación imparcial del efecto causal de X sobre Y . La misma fórmula de ajuste funciona cuando hay múltiples factores de confusión excepto que, en este caso, la elección de un conjunto Z de variables que garantizaría estimaciones imparciales debe hacerse con cautela. El criterio para una elección adecuada de variables se llama la puerta trasera [5] [6] y requiere que el conjunto Z elegido "bloquee" (o intercepte) cada camino entre X e Y que contenga una flecha hacia X. Estos conjuntos se llaman "puerta trasera admisible" y pueden incluir variables que no son causas comunes de X e Y , sino simplemente sustitutos de las mismas.

Volviendo al ejemplo del consumo de drogas, dado que Z cumple con el requisito de puerta trasera (es decir, intercepta la única ruta de puerta trasera ), la fórmula de ajuste de puerta trasera es válida:

De esta manera, el médico puede predecir el efecto probable de la administración del fármaco a partir de estudios observacionales en los que las probabilidades condicionales que aparecen en el lado derecho de la ecuación se pueden estimar mediante regresión.

Contrariamente a la creencia común, agregar covariables al conjunto de ajuste Z puede introducir sesgo. [7] Un contraejemplo típico ocurre cuando Z es un efecto común de X e Y , [8] un caso en el que Z no es un factor de confusión (es decir, el conjunto nulo es admisible por puerta trasera) y el ajuste de Z crearía un sesgo conocido como " sesgo del colisionador " o " paradoja de Berkson ". Los controles que no son buenos factores de confusión a veces se denominan malos controles .

En general, la confusión se puede controlar mediante un ajuste si y solo si hay un conjunto de covariables observadas que satisfacen la condición de puerta trasera. Además, si Z es un conjunto de este tipo, entonces la fórmula de ajuste de la ecuación (3) es válida. [5] [6] El cálculo do de Pearl proporciona todas las condiciones posibles bajo las cuales se puede estimar, no necesariamente mediante un ajuste. [9]

Historia

Según Morabia (2011), [10] la palabra "confundir " deriva del verbo latino medieval "confundere", que significaba "mezclar", y probablemente fue elegida para representar la confusión (del latín: con=con + fusus=mezclar o fusionar) entre la causa que se desea evaluar y otras causas que pueden afectar el resultado y, por lo tanto, confundir o interponerse en el camino de la evaluación deseada. Greenland, Robins y Pearl [11] señalan un uso temprano del término "confundir" en la inferencia causal por parte de John Stuart Mill en 1843.

Fisher introdujo la palabra "confusión" en su libro de 1935 "El diseño de experimentos" [12] para referirse específicamente a una consecuencia del bloqueo (es decir, la partición ) del conjunto de combinaciones de tratamientos en un experimento factorial , por el cual ciertas interacciones pueden ser "confundidas con bloques". Esto popularizó la noción de confusión en estadística, aunque Fisher estaba preocupado por el control de la heterogeneidad en las unidades experimentales, no por la inferencia causal.

Según Vandenbroucke (2004) [13], fue Kish [14] quien utilizó la palabra "confusión" en el sentido de "incomparabilidad" de dos o más grupos (por ejemplo, expuestos y no expuestos) en un estudio observacional. Las condiciones formales que definen lo que hace que ciertos grupos sean "comparables" y otros "incomparables" fueron desarrolladas posteriormente en epidemiología por Greenland y Robins (1986) [15] utilizando el lenguaje contrafactual de Neyman (1935) [16] y Rubin (1974). [17] Estas fueron complementadas posteriormente con criterios gráficos como la condición de la puerta trasera ( Pearl 1993; Greenland, Robins y Pearl 1999). [11] [5]

Se demostró que los criterios gráficos eran formalmente equivalentes a la definición contrafactual [18] pero más transparentes para los investigadores que se basan en modelos de proceso.

Tipos

En el caso de las evaluaciones de riesgo que evalúan la magnitud y la naturaleza del riesgo para la salud humana , es importante controlar los factores de confusión para aislar el efecto de un peligro particular, como un aditivo alimentario, un pesticida o un medicamento nuevo. En el caso de los estudios prospectivos, es difícil reclutar y seleccionar voluntarios con los mismos antecedentes (edad, dieta, educación, geografía, etc.) y, en los estudios históricos, puede haber una variabilidad similar. Debido a la incapacidad de controlar la variabilidad de los voluntarios y los estudios humanos, los factores de confusión son un desafío particular. Por estas razones, los experimentos ofrecen una forma de evitar la mayoría de las formas de confusión.

En algunas disciplinas, la confusión se clasifica en diferentes tipos. En epidemiología , un tipo es la "confusión por indicación", [19] que se relaciona con la confusión de los estudios observacionales . Debido a que los factores pronósticos pueden influir en las decisiones de tratamiento (y sesgar las estimaciones de los efectos del tratamiento), controlar los factores pronósticos conocidos puede reducir este problema, pero siempre es posible que no se haya incluido un factor olvidado o desconocido o que los factores interactúen de manera compleja. La confusión por indicación se ha descrito como la limitación más importante de los estudios observacionales. Los ensayos aleatorizados no se ven afectados por la confusión por indicación debido a la asignación aleatoria .

Las variables de confusión también pueden clasificarse según su origen: la elección del instrumento de medición (confusión operativa), las características situacionales (confusión procedimental) o las diferencias interindividuales (confusión personal).

Ejemplos

Supongamos que se está estudiando la relación entre el orden de nacimiento (primer hijo, segundo hijo, etc.) y la presencia de síndrome de Down en el niño. En este escenario, la edad materna sería una variable de confusión: [ cita requerida ]

  1. La mayor edad materna está directamente asociada con el síndrome de Down en el niño
  2. Una mayor edad materna está directamente asociada con el síndrome de Down, independientemente del orden de nacimiento (una madre que tiene su primer hijo a los 50 años o su tercer hijo a los 50 años conlleva el mismo riesgo).
  3. La edad materna está directamente asociada al orden de nacimiento (el 2º hijo, salvo en el caso de gemelos, nace cuando la madre es mayor que cuando nació el 1er hijo)
  4. La edad materna no es consecuencia del orden de nacimiento (tener un segundo hijo no cambia la edad de la madre)

En las evaluaciones de riesgo , factores como la edad, el género y el nivel educativo a menudo afectan el estado de salud y, por lo tanto, deben controlarse. Más allá de estos factores, los investigadores pueden no considerar o no tener acceso a datos sobre otros factores causales. Un ejemplo es el estudio del tabaquismo en la salud humana. Fumar, beber alcohol y la dieta son actividades de estilo de vida que están relacionadas. Una evaluación de riesgo que analiza los efectos del tabaquismo pero no controla el consumo de alcohol o la dieta puede sobreestimar el riesgo de fumar. [22] El tabaquismo y los factores de confusión se revisan en las evaluaciones de riesgo ocupacional, como la seguridad de la minería de carbón. [23] Cuando no hay una gran muestra de población de no fumadores o no bebedores en una ocupación particular, la evaluación de riesgo puede estar sesgada hacia la búsqueda de un efecto negativo en la salud. [24]

Disminuir el potencial de confusión

Se puede reducir la posibilidad de que se produzcan y tengan efecto factores de confusión aumentando los tipos y números de comparaciones realizadas en un análisis. Si las medidas o manipulaciones de los constructos centrales están confundidas (es decir, existen factores de confusión operativos o procedimentales), el análisis de subgrupos puede no revelar problemas en el análisis. Además, aumentar el número de comparaciones puede crear otros problemas (consulte comparaciones múltiples ).

La revisión por pares es un proceso que puede ayudar a reducir los casos de confusión, ya sea antes de la implementación del estudio o después de que se haya realizado el análisis. La revisión por pares se basa en la experiencia colectiva dentro de una disciplina para identificar posibles debilidades en el diseño y el análisis del estudio, incluidas las formas en que los resultados pueden depender de la confusión. De manera similar, la replicación puede probar la solidez de los hallazgos de un estudio en condiciones de estudio alternativas o análisis alternativos (por ejemplo, controlando posibles factores de confusión no identificados en el estudio inicial).

Es menos probable que se produzcan efectos de confusión y que estos actúen de manera similar en múltiples momentos y lugares. [ cita requerida ] Al seleccionar los sitios de estudio, se puede caracterizar detalladamente el entorno en los sitios de estudio para garantizar que los sitios sean ecológicamente similares y, por lo tanto, sea menos probable que tengan variables de confusión. Por último, se puede estudiar la relación entre las variables ambientales que posiblemente confundan el análisis y los parámetros medidos. La información relativa a las variables ambientales se puede utilizar luego en modelos específicos del sitio para identificar la varianza residual que puede deberse a efectos reales. [25]

Dependiendo del tipo de diseño de estudio implementado, existen varias maneras de modificar ese diseño para excluir o controlar activamente las variables de confusión: [26]

Todos estos métodos tienen sus inconvenientes:

  1. La mejor defensa disponible contra la posibilidad de obtener resultados espurios debido a factores de confusión es a menudo prescindir de los esfuerzos de estratificación y, en su lugar, realizar un estudio aleatorio de una muestra suficientemente grande tomada en su conjunto, de modo que todas las posibles variables de confusión (conocidas y desconocidas) se distribuyan al azar entre todos los grupos de estudio y, por lo tanto, no estén correlacionadas con la variable binaria de inclusión/exclusión en ningún grupo.
  2. Consideraciones éticas: En los ensayos controlados aleatorizados y doble ciego, los participantes no son conscientes de que están recibiendo tratamientos simulados y se les pueden negar tratamientos efectivos. [27] Existe la posibilidad de que los pacientes solo acepten una cirugía invasiva (que conlleva riesgos médicos reales) bajo el entendimiento de que están recibiendo tratamiento. Aunque esto es una preocupación ética, no es una descripción completa de la situación. En el caso de las cirugías que se realizan actualmente con regularidad, pero para las que no hay evidencia concreta de un efecto genuino, puede haber problemas éticos para continuar con dichas cirugías. En tales circunstancias, muchas personas están expuestas a los riesgos reales de la cirugía, pero estos tratamientos posiblemente no ofrezcan ningún beneficio discernible. El control de la cirugía simulada es un método que puede permitir a la ciencia médica determinar si un procedimiento quirúrgico es eficaz o no. Dado que existen riesgos conocidos asociados con las operaciones médicas, es cuestionable éticamente permitir que se realicen cirugías no verificadas ad infinitum en el futuro.

Artefactos

Los artefactos son variables que deberían haber variado sistemáticamente, ya sea dentro o entre estudios, pero que accidentalmente se mantuvieron constantes. Por lo tanto, los artefactos son amenazas a la validez externa . Los artefactos son factores que covarían con el tratamiento y el resultado. Campbell y Stanley [28] identifican varios artefactos. Las principales amenazas a la validez interna son la historia, la maduración, las pruebas, la instrumentación, la regresión estadística , la selección, la mortalidad experimental y las interacciones entre la selección y la historia.

Una forma de minimizar la influencia de los artefactos es utilizar un diseño de grupo de control de pre-prueba y post-prueba . Dentro de este diseño, "grupos de personas que inicialmente son equivalentes (en la fase de pre-prueba) son asignados aleatoriamente para recibir el tratamiento experimental o una condición de control y luego evaluados nuevamente después de esta experiencia diferencial (fase de post-prueba)". [29] Por lo tanto, cualquier efecto de los artefactos se distribuye (idealmente) de manera igualitaria entre los participantes tanto en la condición de tratamiento como en la de control.

Véase también


Notas

  1. ^ También conocido como variable de confusión , factor de confusión , determinante extraño o variable oculta .

Referencias

  1. ^ Pearl, J., (2009). Paradoja de Simpson , confusión y colapsibilidad en causalidad: modelos, razonamiento e inferencia (2.ª ed.). Nueva York: Cambridge University Press.
  2. ^ VanderWeele, TJ; Shpitser, I. (2013). "Sobre la definición de un factor de confusión". Anales de Estadística . 41 (1): 196–220. arXiv : 1304.0564 . doi :10.1214/12-aos1058. PMC  4276366 . PMID  25544784.
  3. ^ Groenlandia, S.; Robins, JM; Pearl, J. (1999). "Confusión y colapsibilidad en la inferencia causal". Ciencia estadística . 14 (1): 29–46. doi : 10.1214/ss/1009211805 .
  4. ^ Shadish, WR; Cook, TD; Campbell, DT (2002). Diseños experimentales y cuasiexperimentales para inferencia causal generalizada . Boston, MA: Houghton-Mifflin .
  5. ^ abcd Pearl, J., (1993). "Aspectos de los modelos gráficos relacionados con la causalidad", en Actas de la 49.ª sesión del Instituto Internacional de Ciencias Estadísticas, págs. 391-401.
  6. ^ ab Pearl, J. (2009). Diagramas causales e identificación de efectos causales en causalidad: modelos, razonamiento e inferencia (2.ª ed.). Nueva York, NY, EE. UU.: Cambridge University Press.
  7. ^ Cinelli, C.; Forney, A.; Pearl, J. (marzo de 2022). "Un curso intensivo sobre buenos y malos controles" (PDF) . Laboratorio de sistemas cognitivos de la UCLA, Informe técnico (R-493) .
  8. ^ Lee, PH (2014). "¿Deberíamos realizar ajustes para tener en cuenta un factor de confusión si los criterios empíricos y teóricos arrojan resultados contradictorios? Un estudio de simulación". Sci Rep . 4 : 6085. Bibcode :2014NatSR...4E6085L. doi :10.1038/srep06085. PMC 5381407 . PMID  25124526. 
  9. ^ Shpitser, I.; Pearl, J. (2008). "Métodos de identificación completos para la jerarquía causal". The Journal of Machine Learning Research . 9 : 1941–1979.
  10. ^ Morabia, A (2011). "Historia del concepto epidemiológico moderno de confusión" (PDF) . Revista de Epidemiología y Salud Comunitaria . 65 (4): 297–300. doi : 10.1136/jech.2010.112565 . PMID  20696848. S2CID  9068532.
  11. ^ ab Greenland, S.; Robins, JM; Pearl, J. (1999). "Confusión y colapsibilidad en la inferencia causal". Ciencia estadística . 14 (1): 31. doi : 10.1214/ss/1009211805 .
  12. ^ Fisher, RA (1935). El diseño de experimentos (pp. 114-145).
  13. ^ Vandenbroucke, JP (2004). "La historia de la confusión". Soz Praventivmed . 47 (4): 216–224. doi :10.1007/BF01326402. PMID  12415925. S2CID  198174446.
  14. ^ Kish, L (1959). "Algunos problemas estadísticos en el diseño de la investigación". Am Sociol . 26 (3): 328–338. doi :10.2307/2089381. JSTOR  2089381.
  15. ^ Groenlandia, S.; Robins, JM (1986). "Identificabilidad, intercambiabilidad y confusión epidemiológica". Revista Internacional de Epidemiología . 15 (3): 413–419. CiteSeerX 10.1.1.157.6445 . doi :10.1093/ije/15.3.413. PMID  3771081. 
  16. ^ Neyman, J., con la colaboración de K. Iwaskiewics y St. Kolodziejczyk (1935). Problemas estadísticos en la experimentación agrícola (con discusión). Suppl J Roy Statist Soc Ser B 2 107-180.
  17. ^ Rubin, DB (1974). "Estimación de los efectos causales de los tratamientos en estudios aleatorios y no aleatorios". Revista de Psicología Educativa . 66 (5): 688–701. doi :10.1037/h0037350. S2CID  52832751.
  18. ^ Pearl, J., (2009). Causalidad: modelos, razonamiento e inferencia (2.ª ed.). Nueva York, NY, EE. UU.: Cambridge University Press.
  19. ^ Johnston, SC (2001). "Identificación de factores de confusión por indicación a través de una revisión prospectiva ciega". American Journal of Epidemiology . 154 (3): 276–284. doi : 10.1093/aje/154.3.276 . PMID  11479193.
  20. ^ ab Pelham, Brett (2006). Realización de investigaciones en psicología . Belmont: Wadsworth. ISBN 978-0-534-53294-9.
  21. ^ Steg, L.; Buunk, AP; Rothengatter, T. (2008). "Capítulo 4". Psicología social aplicada: comprensión y gestión de los problemas sociales . Cambridge, Reino Unido: Cambridge University Press.
  22. ^ Tjønneland, Anne; Grønbæk, Morten; Stripp, Connie; Overvad, Kim (enero de 1999). "Ingesta de vino y dieta en una muestra aleatoria de 48763 hombres y mujeres daneses". The American Journal of Clinical Nutrition . 69 (1): 49–54. doi : 10.1093/ajcn/69.1.49 . PMID  9925122.
  23. ^ Axelson, O. (1989). "Factores de confusión derivados del tabaquismo en la epidemiología ocupacional". British Journal of Industrial Medicine . 46 (8): 505–07. doi :10.1136/oem.46.8.505. PMC 1009818 . PMID  2673334. 
  24. ^ James, Gareth; Witten, Daniela; Hastie, Trevor; Tibshirani, Robert (2021). Introducción al aprendizaje estadístico: con aplicaciones en R (segunda edición). Nueva York, NY: Springer. pág. 150. ISBN 978-1-0716-1418-1. Recuperado el 9 de noviembre de 2024 .
  25. ^ Calow, Peter P. (2009) Manual de evaluación y gestión de riesgos ambientales , Wiley
  26. ^ Mayrent, Sherry L (1987). Epidemiología en medicina . Lippincott Williams & Wilkins . ISBN. 978-0-316-35636-7.
  27. ^ Emanuel, Ezekiel J; Miller, Franklin G (20 de septiembre de 2001). "La ética de los ensayos controlados con placebo: un punto intermedio". New England Journal of Medicine . 345 (12): 915–9. doi :10.1056/nejm200109203451211. PMID  11565527.
  28. ^ Campbell, DT; Stanley, JC (1966). Diseños experimentales y cuasiexperimentales para la investigación . Chicago: Rand McNally.
  29. ^ Crano, WD; Brewer, MB (2002). Principios y métodos de investigación social (2.ª ed.). Mahwah, NJ: Lawrence Erlbaum Associates . pág. 28.

Lectura adicional

Enlaces externos