stringtranslate.com

confuso

Mientras que un mediador es un factor en la cadena causal (arriba), un factor de confusión es un factor espurio que implica incorrectamente causalidad (abajo)

En la inferencia causal , un factor de confusión (también variable de confusión , factor de confusión , determinante extraño o variable al acecho ) es una variable que influye tanto en la variable dependiente como en la variable independiente , provocando una asociación espuria . La confusión es un concepto causal y, como tal, no puede describirse en términos de correlaciones o asociaciones. [1] [2] [3] La existencia de factores de confusión es una explicación cuantitativa importante de por qué la correlación no implica causalidad . Algunas notaciones están diseñadas explícitamente para identificar la existencia, posible existencia o no existencia de factores de confusión en las relaciones causales entre elementos de un sistema.

Las confusiones son amenazas a la validez interna . [4]

Definición

La confusión se define en términos del modelo de generación de datos. Sea X alguna variable independiente e Y alguna variable dependiente . Para estimar el efecto de X sobre Y , el estadístico debe suprimir los efectos de variables extrañas que influyen tanto en X como en Y. Decimos que X e Y se confunden con alguna otra variable Z siempre que Z influya causalmente tanto en X como en Y.

Sea la probabilidad del evento Y = y bajo la intervención hipotética X = x . X e Y no se confunden si y sólo si se cumple lo siguiente:

para todos los valores X = x e Y = y , donde es la probabilidad condicional de ver X = x . Intuitivamente, esta igualdad establece que X e Y no se confunden siempre que la asociación observada entre ellos sea la misma que la asociación que se mediría en un experimento controlado , con x aleatorizado .

En principio, la igualdad definitoria se puede verificar a partir del modelo generador de datos, asumiendo que tenemos todas las ecuaciones y probabilidades asociadas con el modelo. Esto se hace simulando una intervención (ver red bayesiana ) y verificando si la probabilidad resultante de Y es igual a la probabilidad condicional . Sin embargo, resulta que la estructura gráfica por sí sola es suficiente para verificar la igualdad .

Control

Consideremos un investigador que intenta evaluar la eficacia del fármaco X , a partir de datos de población en los que el uso del fármaco era elección del paciente. Los datos muestran que el género ( Z ) influye en la elección del fármaco por parte del paciente, así como en sus posibilidades de recuperación ( Y ). En este escenario, el género Z confunde la relación entre X e Y ya que Z es causa tanto de X como de Y :

Diagrama causal de Género como causa común del Consumo de Drogas y Recuperación

tenemos eso

porque la cantidad observacional contiene información sobre la correlación entre X y Z , y la cantidad intervencionista no (ya que X no está correlacionada con Z en un experimento aleatorio). Se puede demostrar [5] que, en los casos en los que sólo se dispone de datos de observación, se puede obtener una estimación insesgada de la cantidad deseada "ajustando" todos los factores de confusión, es decir, condicionando sus diversos valores y promediando el resultado. En el caso de un único factor de confusión Z , esto conduce a la "fórmula de ajuste":

lo que da una estimación insesgada del efecto causal de X sobre Y. La misma fórmula de ajuste funciona cuando hay múltiples factores de confusión excepto que, en este caso, la elección de un conjunto Z de variables que garantice estimaciones insesgadas debe hacerse con precaución. El criterio para una elección adecuada de variables se llama puerta trasera [5] [6] y requiere que el conjunto Z elegido "bloquee" (o intercepte) cada camino entre X e Y que contenga una flecha hacia X. Dichos conjuntos son se denomina "puerta trasera admisible" y puede incluir variables que no son causas comunes de X e Y , sino meros sustitutos de las mismas.

Volviendo al ejemplo del uso de drogas, dado que Z cumple con el requisito de la puerta trasera (es decir, intercepta la ruta de la puerta trasera ), la fórmula de ajuste de la puerta trasera es válida:

De esta manera, el médico puede predecir el efecto probable de administrar el fármaco a partir de estudios observacionales en los que las probabilidades condicionales que aparecen en el lado derecho de la ecuación pueden estimarse mediante regresión.

Contrariamente a la creencia común, agregar covariables al conjunto de ajuste Z puede introducir sesgos. [7] Un contraejemplo típico ocurre cuando Z es un efecto común de X e Y , [8] un caso en el que Z no es un factor de confusión (es decir, el conjunto nulo es admisible por la puerta trasera) y ajustar por Z crearía un sesgo conocido. como " sesgo del colisionador " o " paradoja de Berkson ". Los controles que no son buenos factores de confusión a veces se denominan malos controles .

En general, la confusión puede controlarse mediante ajuste si y sólo si existe un conjunto de covariables observadas que satisfaga la condición de puerta trasera. Además, si Z es tal conjunto, entonces la fórmula de ajuste de la ecuación. (3) es válido. [5] [6] El cálculo do de Pearl proporciona todas las condiciones posibles bajo las cuales se pueden estimar, no necesariamente mediante ajuste. [9]

Historia

Según Morabia (2011), [10] la palabra confundir deriva del verbo latino medieval "confundere", que significaba "mezclar", y probablemente fue elegida para representar la confusión (del latín: con=con + fusus=mezclar o fusionar juntos) entre la causa que se desea evaluar y otras causas que pueden afectar el resultado y, por lo tanto, confundir o interponerse en el camino de la evaluación deseada. Greenland, Robins y Pearl [11] señalan un uso temprano del término "confusión" en la inferencia causal por parte de John Stuart Mill en 1843.

Fisher introdujo la palabra "confusión" en su libro de 1935 "El diseño de experimentos" [12] para referirse específicamente a una consecuencia de bloquear (es decir, dividir ) el conjunto de combinaciones de tratamientos en un experimento factorial , mediante el cual ciertas interacciones pueden "confundirse". con bloques". Esto popularizó la noción de confusión en estadística, aunque a Fisher le preocupaba el control de la heterogeneidad en las unidades experimentales, no la inferencia causal.

Según Vandenbroucke (2004) [13] fue Kish [14] quien utilizó la palabra "confusión" en el sentido de "incomparabilidad" de dos o más grupos (por ejemplo, expuestos y no expuestos) en un estudio observacional. Las condiciones formales que definen lo que hace que ciertos grupos sean "comparables" y otros "incomparables" fueron desarrolladas posteriormente en epidemiología por Greenland y Robins (1986) [15] utilizando el lenguaje contrafactual de Neyman (1935) [16] y Rubin (1974). [17] Posteriormente se complementaron con criterios gráficos como la condición de puerta trasera ( Pearl 1993; Greenland, Robins y Pearl 1999). [11] [5]

Se demostró que los criterios gráficos eran formalmente equivalentes a la definición contrafactual [18] pero más transparentes para los investigadores que se basan en modelos de procesos.

Tipos

En el caso de evaluaciones de riesgos que evalúan la magnitud y la naturaleza del riesgo para la salud humana , es importante controlar los factores de confusión para aislar el efecto de un peligro particular, como un aditivo alimentario, un pesticida o un medicamento nuevo. Para los estudios prospectivos, es difícil reclutar y seleccionar voluntarios con los mismos antecedentes (edad, dieta, educación, geografía, etc.), y en los estudios históricos puede haber una variabilidad similar. Debido a la incapacidad de controlar la variabilidad de los voluntarios y los estudios en humanos, la confusión es un desafío particular. Por estas razones, los experimentos ofrecen una manera de evitar la mayoría de las formas de confusión.

En algunas disciplinas, la confusión se clasifica en diferentes tipos. En epidemiología , un tipo es el de "confusión por indicación", [19] que se relaciona con la confusión procedente de estudios observacionales . Debido a que los factores de pronóstico pueden influir en las decisiones de tratamiento (y en las estimaciones sesgadas de los efectos del tratamiento), controlar los factores de pronóstico conocidos puede reducir este problema, pero siempre es posible que no se haya incluido un factor olvidado o desconocido o que los factores interactúen de manera compleja. La confusión por indicación se ha descrito como la limitación más importante de los estudios observacionales. Los ensayos aleatorios no se ven afectados por factores de confusión por indicación debido a la asignación aleatoria .

Las variables de confusión también pueden clasificarse según su fuente. La elección del instrumento de medición (confusión operativa), características situacionales (confusión de procedimiento) o diferencias interindividuales (confusión de persona).

Ejemplos

Digamos que se está estudiando la relación entre el orden de nacimiento (primer hijo, segundo hijo, etc.) y la presencia del síndrome de Down en el niño. En este escenario, la edad materna sería una variable de confusión: [ cita necesaria ]

  1. La mayor edad materna se asocia directamente con el Síndrome de Down en el niño
  2. La mayor edad materna está directamente asociada con el síndrome de Down, independientemente del orden de nacimiento (una madre que tiene su primer o tercer hijo a los 50 años confiere el mismo riesgo)
  3. La edad materna está directamente asociada con el orden de nacimiento (el 2º hijo, excepto en el caso de gemelos, nace cuando la madre tiene más edad que la que tenía cuando nació el 1º hijo)
  4. La edad materna no es consecuencia del orden de nacimiento (tener un segundo hijo no cambia la edad de la madre)

En las evaluaciones de riesgos , factores como la edad, el género y los niveles educativos a menudo afectan el estado de salud y, por lo tanto, deben controlarse. Más allá de estos factores, es posible que los investigadores no consideren ni tengan acceso a datos sobre otros factores causales. Un ejemplo es el estudio del consumo de tabaco en la salud humana. Fumar, beber alcohol y hacer dieta son actividades de estilo de vida que están relacionadas. Una evaluación de riesgos que analice los efectos del tabaquismo pero no controle el consumo de alcohol o la dieta puede sobreestimar el riesgo de fumar. [22] El tabaquismo y la confusión se examinan en las evaluaciones de riesgos laborales, como la seguridad de la minería del carbón. [23] Cuando no hay una muestra de población grande de no fumadores o no bebedores en una ocupación particular, la evaluación de riesgos puede estar sesgada hacia la búsqueda de un efecto negativo sobre la salud.

Disminución del potencial de confusión

Se puede obtener una reducción en el potencial de aparición y efecto de factores de confusión aumentando los tipos y números de comparaciones realizadas en un análisis. Si las medidas o manipulaciones de los constructos centrales están confundidas (es decir, si existen confusiones operativas o de procedimiento), el análisis de subgrupos puede no revelar problemas en el análisis. Además, aumentar el número de comparaciones puede crear otros problemas (consulte comparaciones múltiples ).

La revisión por pares es un proceso que puede ayudar a reducir los casos de confusión, ya sea antes de la implementación del estudio o después de que se haya realizado el análisis. La revisión por pares se basa en la experiencia colectiva dentro de una disciplina para identificar posibles debilidades en el diseño y análisis del estudio, incluidas las formas en que los resultados pueden depender de factores de confusión. De manera similar, la replicación puede probar la solidez de los hallazgos de un estudio en condiciones de estudio alternativas o análisis alternativos (por ejemplo, controlando posibles factores de confusión no identificados en el estudio inicial).

Es posible que sea menos probable que se produzcan efectos de confusión y que actúen de manera similar en múltiples momentos y lugares. [ cita necesaria ] Al seleccionar los sitios de estudio, el medio ambiente se puede caracterizar en detalle en los sitios de estudio para garantizar que los sitios sean ecológicamente similares y, por lo tanto, sea menos probable que tengan variables de confusión. Por último, se puede estudiar la relación entre las variables ambientales que posiblemente confundan el análisis y los parámetros medidos. La información relativa a las variables ambientales se puede utilizar luego en modelos específicos del sitio para identificar la variación residual que puede deberse a efectos reales. [24]

Dependiendo del tipo de diseño de estudio implementado, hay varias formas de modificar ese diseño para excluir o controlar activamente las variables de confusión: [25]

Todos estos métodos tienen sus inconvenientes:

  1. La mejor defensa disponible contra la posibilidad de resultados espurios debido a factores de confusión es a menudo prescindir de los esfuerzos de estratificación y en su lugar realizar un estudio aleatorio de una muestra suficientemente grande tomada en su conjunto, de modo que todas las posibles variables de confusión (conocidas y desconocidas) sean consideradas. distribuido al azar en todos los grupos de estudio y, por lo tanto, no estará correlacionado con la variable binaria para inclusión/exclusión en ningún grupo.
  2. Consideraciones éticas: En ensayos controlados aleatorios y doble ciego, los participantes no son conscientes de que están recibiendo tratamientos simulados y se les pueden negar tratamientos efectivos. [26] Existe la posibilidad de que los pacientes sólo acepten someterse a una cirugía invasiva (que conlleva riesgos médicos reales) en el entendido de que están recibiendo tratamiento. Aunque se trata de una preocupación ética, no es una descripción completa de la situación. Para las cirugías que actualmente se realizan regularmente, pero para las cuales no hay evidencia concreta de un efecto genuino, puede haber problemas éticos para continuar con dichas cirugías. En tales circunstancias, muchas personas están expuestas a los riesgos reales de la cirugía, pero es posible que estos tratamientos no ofrezcan ningún beneficio discernible. El control de la cirugía simulada es un método que puede permitir a la ciencia médica determinar si un procedimiento quirúrgico es eficaz o no. Dado que existen riesgos conocidos asociados con las operaciones médicas, es cuestionablemente ético permitir que se realicen cirugías no verificadas hasta el infinito en el futuro.

Artefactos

Los artefactos son variables que deberían haberse variado sistemáticamente, ya sea dentro o entre estudios, pero que accidentalmente se mantuvieron constantes. Los artefactos son, por tanto, amenazas a la validez externa . Los artefactos son factores que covarían con el tratamiento y el resultado. Campbell y Stanley [27] identifican varios artefactos. Las principales amenazas a la validez interna son la historia, la maduración, las pruebas, la instrumentación, la regresión estadística , la selección, la mortalidad experimental y las interacciones selección-historia.

Una forma de minimizar la influencia de los artefactos es utilizar un diseño de grupo de control pretest-postest . Dentro de este diseño, "grupos de personas que inicialmente son equivalentes (en la fase previa a la prueba) son asignados aleatoriamente para recibir el tratamiento experimental o una condición de control y luego son evaluados nuevamente después de esta experiencia diferencial (fase posterior a la prueba)". [28] Por lo tanto, cualquier efecto de los artefactos se distribuye (idealmente) equitativamente entre los participantes tanto en las condiciones de tratamiento como de control.

Ver también

Referencias

  1. ^ Perla, J., (2009). La paradoja , la confusión y la colapsabilidad de Simpson en la causalidad: modelos, razonamiento e inferencia (2ª ed.). Nueva York: Cambridge University Press.
  2. ^ VanderWeele, TJ; Shpitser, I. (2013). "Sobre la definición de factor de confusión". Anales de Estadística . 41 (1): 196–220. arXiv : 1304.0564 . doi :10.1214/12-aos1058. PMC  4276366 . PMID  25544784.
  3. ^ Groenlandia, S.; Robins, JM; Perla, J. (1999). "Confusión y colapsabilidad en la inferencia causal". Ciencia estadística . 14 (1): 29–46. doi : 10.1214/ss/1009211805 .
  4. ^ Sádish, WR; Cocinero, TD; Campbell, DT (2002). Diseños experimentales y cuasiexperimentales para inferencia causal generalizada . Boston, MA: Houghton-Mifflin .
  5. ^ abcd Perla, J., (1993). "Aspectos de los modelos gráficos relacionados con la causalidad", en actas de la 49.ª sesión del Instituto Internacional de Ciencias Estadísticas, págs.
  6. ^ ab Perla, J. (2009). Diagramas causales e identificación de efectos causales en causalidad: modelos, razonamiento e inferencia (2ª ed.). Nueva York, NY, Estados Unidos: Cambridge University Press.
  7. ^ Cinelli, C.; Forney, A.; Pearl, J. (marzo de 2022). "Un curso intensivo sobre buenos y malos controles" (PDF) . Laboratorio de Sistemas Cognitivos de UCLA, Informe Técnico (R-493) .
  8. ^ Lee, PH (2014). "¿Deberíamos ajustarnos a un factor de confusión si los criterios empíricos y teóricos producen resultados contradictorios? Un estudio de simulación". Representante de ciencia . 4 : 6085. Código Bib : 2014NatSR...4E6085L. doi :10.1038/srep06085. PMC 5381407 . PMID  25124526. 
  9. ^ Shpitser, yo; Perla, J. (2008). "Métodos completos de identificación de la jerarquía causal". La revista de investigación sobre aprendizaje automático . 9 : 1941-1979.
  10. ^ Morabia, A (2011). "Historia del concepto epidemiológico moderno de confusión" (PDF) . Revista de Epidemiología y Salud Comunitaria . 65 (4): 297–300. doi : 10.1136/jech.2010.112565 . PMID  20696848. S2CID  9068532.
  11. ^ ab Groenlandia, S.; Robins, JM; Perla, J. (1999). "Confusión y colapsabilidad en la inferencia causal". Ciencia estadística . 14 (1): 31. doi : 10.1214/ss/1009211805 .
  12. ^ Pescador, RA (1935). El diseño de experimentos (págs. 114-145).
  13. ^ Vandenbroucke, JP (2004). "La historia de la confusión". Soz Praventivmed . 47 (4): 216–224. doi :10.1007/BF01326402. PMID  12415925. S2CID  198174446.
  14. ^ Kish, L (1959). "Algunos problemas estadísticos en el diseño de investigaciones". Soy Sociol . 26 (3): 328–338. doi :10.2307/2089381. JSTOR  2089381.
  15. ^ Groenlandia, S.; Robins, JM (1986). "Identificabilidad, intercambiabilidad y confusión epidemiológica". Revista Internacional de Epidemiología . 15 (3): 413–419. CiteSeerX 10.1.1.157.6445 . doi :10.1093/ije/15.3.413. PMID  3771081. 
  16. ^ Neyman, J., con la cooperación de K. Iwaskiewics y St. Kolodziejczyk (1935). Problemas estadísticos en la experimentación agrícola (con discusión). Suppl J Roy Statist Soc Ser B 2 107-180.
  17. ^ Rubin, DB (1974). "Estimación de los efectos causales de los tratamientos en estudios aleatorios y no aleatorios". Revista de Psicología Educativa . 66 (5): 688–701. doi :10.1037/h0037350. S2CID  52832751.
  18. ^ Perla, J., (2009). Causalidad: modelos, razonamiento e inferencia (2ª ed.). Nueva York, NY, Estados Unidos: Cambridge University Press.
  19. ^ Johnston, Carolina del Sur (2001). "Identificación de factores de confusión por indicación mediante revisión prospectiva ciega". Revista Estadounidense de Epidemiología . 154 (3): 276–284. doi : 10.1093/aje/154.3.276 . PMID  11479193.
  20. ^ ab Pelham, Brett (2006). Realización de investigaciones en psicología . Belmont: Wadsworth. ISBN 978-0-534-53294-9.
  21. ^ Steg, L.; Buunk, AP; Rothengatter, T. (2008). "Capítulo 4". Psicología Social Aplicada: Comprensión y gestión de los problemas sociales . Cambridge, Reino Unido: Cambridge University Press.
  22. ^ Tjønneland, Anne; Grønbæk, Morten; Desnúdate, Connie; Overvad, Kim (enero de 1999). "Consumo de vino y dieta en una muestra aleatoria de 48763 hombres y mujeres daneses". La Revista Estadounidense de Nutrición Clínica . 69 (1): 49–54. doi : 10.1093/ajcn/69.1.49 . PMID  9925122.
  23. ^ Axelson, O. (1989). "Confusión del tabaquismo en epidemiología ocupacional". Revista británica de medicina industrial . 46 (8): 505–07. doi :10.1136/oem.46.8.505. PMC 1009818 . PMID  2673334. 
  24. ^ Calow, Peter P. (2009) Manual de evaluación y gestión de riesgos ambientales , Wiley
  25. ^ Mayrent, Sherry L. (1987). Epidemiología en Medicina . Lippincott Williams y Wilkins . ISBN 978-0-316-35636-7.
  26. ^ Emanuel, Ezequiel J; Miller, Franklin G (20 de septiembre de 2001). "La ética de los ensayos controlados con placebo: un término medio". Revista de Medicina de Nueva Inglaterra . 345 (12): 915–9. doi :10.1056/nejm200109203451211. PMID  11565527.
  27. ^ Campbell, DT; Stanley, JC (1966). Diseños experimentales y cuasiexperimentales para la investigación . Chicago: Rand McNally.
  28. ^ Crano, WD; Cervecero, MB (2002). Principios y métodos de investigación social (2ª ed.). Mahwah, Nueva Jersey: Lawrence Erlbaum Associates . pag. 28.

Otras lecturas

enlaces externos