confuso

En la inferencia causal , un factor de confusión ^[a] es una variable que influye tanto en la variable dependiente como en la variable independiente , provocando una asociación espuria . La confusión es un concepto causal y, como tal, no puede describirse en términos de correlaciones o asociaciones. ^[1]^[2]^[3] La existencia de factores de confusión es una explicación cuantitativa importante de por qué la correlación no implica causalidad . Algunas notaciones están diseñadas explícitamente para identificar la existencia, posible existencia o no existencia de factores de confusión en las relaciones causales entre elementos de un sistema.

Las confusiones son amenazas a la validez interna . ^[4]

Ejemplo sencillo

Supongamos que una empresa de transporte posee una flota de camiones fabricados por dos fabricantes diferentes. Los camiones fabricados por un fabricante se denominan "camiones A" y los camiones fabricados por el otro fabricante se denominan "camiones B". Queremos saber si los camiones A o B obtienen una mejor economía de combustible. Medimos el combustible y las millas recorridas durante un mes y calculamos las MPG de cada camión. Luego ejecutamos el análisis apropiado, que determina que existe una tendencia estadísticamente significativa de que los camiones A son más eficientes en combustible que los camiones B. Sin embargo, tras una mayor reflexión, también notamos que a los camiones A es más probable que se les asignen rutas de carretera, y a los camiones B es más probable que se les asigne rutas urbanas. Ésta es una variable de confusión. La variable de confusión hace que los resultados del análisis no sean fiables. Es muy probable que simplemente estemos midiendo el hecho de que conducir en carretera produce una mejor economía de combustible que conducir en ciudad.

En términos estadísticos, la marca del camión es la variable independiente, el consumo de combustible (MPG) es la variable dependiente y la cantidad de conducción en ciudad es la variable de confusión. Para arreglar este estudio, tenemos varias opciones. Una es aleatorizar las asignaciones de camiones para que los camiones A y B terminen con cantidades iguales de conducción en ciudad y carretera. Eso elimina la variable de confusión. Otra opción es cuantificar la cantidad de conducción en ciudad y utilizarla como segunda variable independiente. Una tercera opción es segmentar el estudio, comparando primero las MPG durante la conducción en ciudad para todos los camiones y luego realizar un estudio separado que compare las MPG durante la conducción en carretera.

Definición

La confusión se define en términos del modelo de generación de datos. Sea X alguna variable independiente e Y alguna variable dependiente . Para estimar el efecto de X sobre Y , el estadístico debe suprimir los efectos de variables extrañas que influyen tanto en X como en Y. Decimos que X e Y se confunden con alguna otra variable Z siempre que Z influya causalmente tanto en X como en Y.

Sea la probabilidad del evento Y = y bajo la intervención hipotética X = x . X e Y no se confunden si y sólo si se cumple lo siguiente: $P(y\mid {\text{do}}(x))$

para todos los valores X = x e Y = y , donde es la probabilidad condicional de ver X = x . Intuitivamente, esta igualdad establece que X e Y no se confunden siempre que la asociación observada entre ellos sea la misma que la asociación que se mediría en un experimento controlado , con x aleatorizado . $P(y\mid x)$

En principio, la igualdad definitoria se puede verificar a partir del modelo generador de datos, asumiendo que tenemos todas las ecuaciones y probabilidades asociadas con el modelo. Esto se hace simulando una intervención (ver red bayesiana ) y verificando si la probabilidad resultante de Y es igual a la probabilidad condicional . Sin embargo, resulta que la estructura gráfica por sí sola es suficiente para verificar la igualdad . $P(y\mid {\text{do}}(x))=P(y\mid x)$ ${\text{hacer}}(X=x)$ $P(y\mid x)$ $P(y\mid {\text{do}}(x))=P(y\mid x)$

Control

Consideremos un investigador que intenta evaluar la eficacia del fármaco X , a partir de datos de población en los que el uso del fármaco era elección del paciente. Los datos muestran que el género ( Z ) influye en la elección del fármaco por parte del paciente, así como en sus posibilidades de recuperación ( Y ). En este escenario, el género Z confunde la relación entre X e Y ya que Z es causa tanto de X como de Y :

Diagrama causal de Género como causa común del Consumo de Drogas y Recuperación

tenemos eso

porque la cantidad observacional contiene información sobre la correlación entre X y Z , y la cantidad intervencionista no (ya que X no está correlacionada con Z en un experimento aleatorio). Se puede demostrar ^[5] que, en los casos en los que sólo se dispone de datos de observación, se puede obtener una estimación insesgada de la cantidad deseada "ajustando" todos los factores de confusión, es decir, condicionando sus diversos valores y promediando el resultado. En el caso de un único factor de confusión Z , esto conduce a la "fórmula de ajuste": $P(y\mid {\text{do}}(x))$

lo que da una estimación insesgada del efecto causal de X sobre Y. La misma fórmula de ajuste funciona cuando hay múltiples factores de confusión excepto que, en este caso, la elección de un conjunto Z de variables que garantice estimaciones insesgadas debe hacerse con precaución. El criterio para una elección adecuada de variables se llama puerta trasera ^[5]^[6] y requiere que el conjunto Z elegido "bloquee" (o intercepte) cada camino entre X e Y que contenga una flecha hacia X. Dichos conjuntos son se denomina "puerta trasera admisible" y puede incluir variables que no son causas comunes de X e Y , sino meros sustitutos de las mismas.

Volviendo al ejemplo del uso de drogas, dado que Z cumple con el requisito de la puerta trasera (es decir, intercepta la ruta de la puerta trasera ), la fórmula de ajuste de la puerta trasera es válida: $X\leftarrow Z\rightarrow Y$

De esta manera, el médico puede predecir el efecto probable de administrar el fármaco a partir de estudios observacionales en los que las probabilidades condicionales que aparecen en el lado derecho de la ecuación pueden estimarse mediante regresión.

Contrariamente a la creencia común, agregar covariables al conjunto de ajuste Z puede introducir sesgos. ^[7] Un contraejemplo típico ocurre cuando Z es un efecto común de X e Y , ^[8] un caso en el que Z no es un factor de confusión (es decir, el conjunto nulo es admisible por la puerta trasera) y ajustar por Z crearía un sesgo conocido. como " sesgo del colisionador " o " paradoja de Berkson ". Los controles que no son buenos factores de confusión a veces se denominan malos controles .

En general, la confusión puede controlarse mediante ajuste si y sólo si existe un conjunto de covariables observadas que satisfaga la condición de puerta trasera. Además, si Z es tal conjunto, entonces la fórmula de ajuste de la ecuación. (3) es válido. ^[5]^[6] El cálculo do de Pearl proporciona todas las condiciones posibles bajo las cuales se pueden estimar, no necesariamente mediante ajuste. ^[9] $P(y\mid {\text{do}}(x))$

Historia

Según Morabia (2011), ^[10] la palabra confundir deriva del verbo latino medieval "confundere", que significaba "mezclar", y probablemente fue elegida para representar la confusión (del latín: con=con + fusus=mezclar o fusionar juntos) entre la causa que se desea evaluar y otras causas que pueden afectar el resultado y, por lo tanto, confundir o interponerse en el camino de la evaluación deseada. Greenland, Robins y Pearl ^[11] señalan un uso temprano del término "confusión" en la inferencia causal por parte de John Stuart Mill en 1843.

Fisher introdujo la palabra "confusión" en su libro de 1935 "El diseño de experimentos" ^[12] para referirse específicamente a una consecuencia de bloquear (es decir, dividir ) el conjunto de combinaciones de tratamientos en un experimento factorial , mediante el cual ciertas interacciones pueden "confundirse". con bloques". Esto popularizó la noción de confusión en estadística, aunque a Fisher le preocupaba el control de la heterogeneidad en las unidades experimentales, no la inferencia causal.

Según Vandenbroucke (2004) ^[13] fue Kish ^[14] quien utilizó la palabra "confusión" en el sentido de "incomparabilidad" de dos o más grupos (por ejemplo, expuestos y no expuestos) en un estudio observacional. Las condiciones formales que definen lo que hace que ciertos grupos sean "comparables" y otros "incomparables" fueron desarrolladas posteriormente en epidemiología por Greenland y Robins (1986) ^[15] utilizando el lenguaje contrafactual de Neyman (1935) ^[16] y Rubin (1974). ^[17] Posteriormente se complementaron con criterios gráficos como la condición de puerta trasera ( Pearl 1993; Greenland, Robins y Pearl 1999). ^[11]^[5]

Se demostró que los criterios gráficos eran formalmente equivalentes a la definición contrafactual ^[18] pero más transparentes para los investigadores que se basan en modelos de procesos.

Tipos

En el caso de evaluaciones de riesgos que evalúan la magnitud y la naturaleza del riesgo para la salud humana , es importante controlar los factores de confusión para aislar el efecto de un peligro particular, como un aditivo alimentario, un pesticida o un medicamento nuevo. Para los estudios prospectivos, es difícil reclutar y seleccionar voluntarios con los mismos antecedentes (edad, dieta, educación, geografía, etc.), y en los estudios históricos puede haber una variabilidad similar. Debido a la incapacidad de controlar la variabilidad de los voluntarios y los estudios en humanos, la confusión es un desafío particular. Por estas razones, los experimentos ofrecen una manera de evitar la mayoría de las formas de confusión.

En algunas disciplinas, la confusión se clasifica en diferentes tipos. En epidemiología , un tipo es el de "confusión por indicación", ^[19] que se relaciona con la confusión procedente de estudios observacionales . Debido a que los factores de pronóstico pueden influir en las decisiones de tratamiento (y en las estimaciones sesgadas de los efectos del tratamiento), controlar los factores de pronóstico conocidos puede reducir este problema, pero siempre es posible que un factor olvidado o desconocido no se haya incluido o que los factores interactúen de manera compleja. La confusión por indicación se ha descrito como la limitación más importante de los estudios observacionales. Los ensayos aleatorios no se ven afectados por factores de confusión por indicación debido a la asignación aleatoria .

Las variables de confusión también pueden clasificarse según su fuente. La elección del instrumento de medición (confusión operativa), características situacionales (confusión de procedimiento) o diferencias interindividuales (confusión de persona).

Puede producirse una confusión operativa tanto en diseños de investigación experimentales como no experimentales. Este tipo de confusión ocurre cuando una medida diseñada para evaluar un constructo en particular mide inadvertidamente también algo más. ^[20]
Una confusión de procedimiento puede ocurrir en un experimento de laboratorio o en un cuasiexperimento . Este tipo de confusión ocurre cuando el investigador permite por error que otra variable cambie junto con la variable independiente manipulada. ^[20]
Un factor de confusión de persona ocurre cuando dos o más grupos de unidades se analizan juntos (por ejemplo, trabajadores de diferentes ocupaciones), a pesar de variar según una o más características (observadas o no observadas) (por ejemplo, género). ^[21]

Ejemplos

Digamos que se está estudiando la relación entre el orden de nacimiento (primer hijo, segundo hijo, etc.) y la presencia del síndrome de Down en el niño. En este escenario, la edad materna sería una variable de confusión: ^{[ cita necesaria ]}

La mayor edad materna se asocia directamente con el Síndrome de Down en el niño
La mayor edad materna está directamente asociada con el síndrome de Down, independientemente del orden de nacimiento (una madre que tiene su primer o tercer hijo a los 50 años confiere el mismo riesgo)
La edad materna está directamente asociada con el orden de nacimiento (el 2º hijo, excepto en el caso de gemelos, nace cuando la madre tiene más edad que la que tenía cuando nació el 1º hijo)
La edad materna no es consecuencia del orden de nacimiento (tener un segundo hijo no cambia la edad de la madre)

En las evaluaciones de riesgos , factores como la edad, el género y los niveles educativos a menudo afectan el estado de salud y, por lo tanto, deben controlarse. Más allá de estos factores, es posible que los investigadores no consideren ni tengan acceso a datos sobre otros factores causales. Un ejemplo es el estudio del consumo de tabaco en la salud humana. Fumar, beber alcohol y hacer dieta son actividades de estilo de vida que están relacionadas. Una evaluación de riesgos que analice los efectos del tabaquismo pero no controle el consumo de alcohol o la dieta puede sobreestimar el riesgo de fumar. ^[22] El tabaquismo y la confusión se examinan en las evaluaciones de riesgos laborales, como la seguridad de la minería del carbón. ^[23] Cuando no hay una muestra de población grande de no fumadores o no bebedores en una ocupación particular, la evaluación de riesgos puede estar sesgada hacia la búsqueda de un efecto negativo sobre la salud.

Disminución del potencial de confusión

Se puede obtener una reducción en el potencial de aparición y efecto de factores de confusión aumentando los tipos y números de comparaciones realizadas en un análisis. Si las medidas o manipulaciones de los constructos centrales están confundidas (es decir, si existen confusiones operativas o de procedimiento), es posible que el análisis de subgrupos no revele problemas en el análisis. Además, aumentar el número de comparaciones puede crear otros problemas (consulte comparaciones múltiples ).

La revisión por pares es un proceso que puede ayudar a reducir los casos de confusión, ya sea antes de la implementación del estudio o después de que se haya realizado el análisis. La revisión por pares se basa en la experiencia colectiva dentro de una disciplina para identificar posibles debilidades en el diseño y análisis del estudio, incluidas las formas en que los resultados pueden depender de factores de confusión. De manera similar, la replicación puede probar la solidez de los hallazgos de un estudio en condiciones de estudio alternativas o análisis alternativos (por ejemplo, controlando posibles factores de confusión no identificados en el estudio inicial).

Es menos probable que se produzcan efectos de confusión y actúen de manera similar en múltiples momentos y lugares. ^{[ cita necesaria ]} Al seleccionar los sitios de estudio, el medio ambiente se puede caracterizar en detalle en los sitios de estudio para garantizar que los sitios sean ecológicamente similares y, por lo tanto, sea menos probable que tengan variables de confusión. Por último, se puede estudiar la relación entre las variables ambientales que posiblemente confundan el análisis y los parámetros medidos. La información relativa a las variables ambientales se puede utilizar luego en modelos específicos del sitio para identificar la variación residual que puede deberse a efectos reales. ^[24]

Dependiendo del tipo de diseño de estudio implementado, hay varias formas de modificar ese diseño para excluir o controlar activamente las variables de confusión: ^[25]

Los estudios de casos y controles asignan factores de confusión a ambos grupos, casos y controles, por igual. Por ejemplo, si alguien quisiera estudiar la causa del infarto de miocardio y piensa que la edad es una probable variable de confusión, cada paciente de 67 años con infarto será emparejado con una persona sana de "control" de 67 años. En los estudios de casos y controles, las variables emparejadas con mayor frecuencia son la edad y el sexo. Inconveniente: Los estudios de casos y controles son viables sólo cuando es fácil encontrar controles, es decir , personas cuyo estado frente a todos los posibles factores de confusión conocidos es el mismo que el del paciente del caso: Supongamos que un estudio de casos y controles intenta encontrar la causa de una enfermedad determinada en una persona que tiene 1) 45 años, 2) afroamericano, 3) de Alaska , 4) un ávido jugador de fútbol, 5) vegetariano y 6) que trabaja en educación. Un control teóricamente perfecto sería una persona que, además de no tener la enfermedad que se investiga, cumpla con todas estas características y no tenga enfermedades que el paciente no tenga también, pero encontrar ese control sería una tarea enorme.
Estudios de cohortes : también es posible cierto grado de emparejamiento y, a menudo, se realiza admitiendo solo ciertos grupos de edad o un determinado sexo en la población de estudio, creando una cohorte de personas que comparten características similares y, por lo tanto, todas las cohortes son comparables con respecto a las posibles variable de confusión. Por ejemplo, si se cree que la edad y el sexo son factores de confusión, sólo los hombres de 40 a 50 años participarían en un estudio de cohorte que evaluaría el riesgo de infarto de miocardio en cohortes que son físicamente activas o inactivas. Inconveniente: en los estudios de cohortes, la sobreexclusión de los datos de entrada puede llevar a los investigadores a definir de manera demasiado estricta el conjunto de personas en situaciones similares para quienes afirman que el estudio es útil, de modo que otras personas a quienes la relación causal en realidad se aplica pueden perder la ventaja. oportunidad de beneficiarse de las recomendaciones del estudio. De manera similar, la "sobreestratificación" de los datos de entrada dentro de un estudio puede reducir el tamaño de la muestra en un estrato determinado hasta el punto en que las generalizaciones extraídas únicamente de la observación de los miembros de ese estrato no sean estadísticamente significativas .
Doble ciego : oculta a la población del ensayo y a los observadores la pertenencia de los participantes al grupo experimental. Al evitar que los participantes sepan si están recibiendo tratamiento o no, el efecto placebo debería ser el mismo para los grupos de control y de tratamiento. Al evitar que los observadores conozcan su membresía, no debería haber sesgo por parte de los investigadores que tratan a los grupos de manera diferente o interpretan los resultados de manera diferente.
Ensayo controlado aleatorio : método en el que la población del estudio se divide aleatoriamente para mitigar las posibilidades de autoselección por parte de los participantes o sesgo por parte de los diseñadores del estudio. Antes de que comience el experimento, los evaluadores asignarán a los miembros del grupo de participantes a sus grupos (control, intervención, paralelo), utilizando un proceso de aleatorización como el uso de un generador de números aleatorios. Por ejemplo, en un estudio sobre los efectos del ejercicio, las conclusiones serían menos válidas si a los participantes se les diera la opción de pertenecer al grupo de control que no haría ejercicio o al grupo de intervención que estaría dispuesto a participar en un ejercicio. programa de ejercicio. Luego, el estudio capturaría otras variables además del ejercicio, como los niveles de salud previos al experimento y la motivación para adoptar actividades saludables. Desde el lado del observador, el experimentador puede elegir candidatos que tengan más probabilidades de mostrar los resultados que el estudio quiere ver o pueden interpretar los resultados subjetivos (más enérgicos, actitud positiva) de una manera favorable a sus deseos.
Estratificación : como en el ejemplo anterior, se cree que la actividad física es un comportamiento que protege del infarto de miocardio; y se supone que la edad es un posible factor de confusión. Los datos muestreados luego se estratifican por grupo de edad; esto significa que la asociación entre actividad e infarto se analizaría por cada grupo de edad. Si los diferentes grupos de edad (o estratos de edad) arrojan índices de riesgo muy diferentes , la edad debe considerarse como una variable de confusión. Existen herramientas estadísticas, entre ellas los métodos de Mantel-Haenszel, que tienen en cuenta la estratificación de conjuntos de datos.
Controlar los factores de confusión midiendo los factores de confusión conocidos e incluyéndolos como covariables es un análisis multivariable como el análisis de regresión . Los análisis multivariados revelan mucha menos información sobre la fuerza o polaridad de la variable de confusión que los métodos de estratificación. Por ejemplo, si el análisis multivariado controla los antidepresivos y no estratifica los antidepresivos según los ATC y los ISRS , entonces ignorará que estas dos clases de antidepresivos tienen efectos opuestos sobre el infarto de miocardio y que uno es mucho más fuerte que el otro.

Todos estos métodos tienen sus inconvenientes:

La mejor defensa disponible contra la posibilidad de resultados espurios debido a factores de confusión es a menudo prescindir de los esfuerzos de estratificación y en su lugar realizar un estudio aleatorio de una muestra suficientemente grande tomada en su conjunto, de modo que todas las posibles variables de confusión (conocidas y desconocidas) sean consideradas. distribuido al azar en todos los grupos de estudio y, por lo tanto, no estará correlacionado con la variable binaria para inclusión/exclusión en ningún grupo.
Consideraciones éticas: En ensayos controlados aleatorios y doble ciego, los participantes no son conscientes de que están recibiendo tratamientos simulados y se les pueden negar tratamientos efectivos. ^[26] Existe la posibilidad de que los pacientes sólo acepten someterse a una cirugía invasiva (que conlleva riesgos médicos reales) en el entendido de que están recibiendo tratamiento. Aunque se trata de una preocupación ética, no es una descripción completa de la situación. Para las cirugías que actualmente se realizan regularmente, pero para las cuales no hay evidencia concreta de un efecto genuino, puede haber problemas éticos para continuar con dichas cirugías. En tales circunstancias, muchas personas están expuestas a los riesgos reales de la cirugía, pero es posible que estos tratamientos no ofrezcan ningún beneficio discernible. El control de la cirugía simulada es un método que puede permitir a la ciencia médica determinar si un procedimiento quirúrgico es eficaz o no. Dado que existen riesgos conocidos asociados con las operaciones médicas, es cuestionablemente ético permitir que se realicen cirugías no verificadas hasta el infinito en el futuro.

Artefactos

Los artefactos son variables que deberían haberse variado sistemáticamente, ya sea dentro o entre estudios, pero que accidentalmente se mantuvieron constantes. Los artefactos son, por tanto, amenazas a la validez externa . Los artefactos son factores que covarían con el tratamiento y el resultado. Campbell y Stanley ^[27] identifican varios artefactos. Las principales amenazas a la validez interna son la historia, la maduración, las pruebas, la instrumentación, la regresión estadística , la selección, la mortalidad experimental y las interacciones selección-historia.

Una forma de minimizar la influencia de los artefactos es utilizar un diseño de grupo de control pretest-postest . Dentro de este diseño, "grupos de personas que inicialmente son equivalentes (en la fase previa a la prueba) son asignados aleatoriamente para recibir el tratamiento experimental o una condición de control y luego son evaluados nuevamente después de esta experiencia diferencial (fase posterior a la prueba)". ^[28] Por lo tanto, cualquier efecto de los artefactos se distribuye (idealmente) equitativamente entre los participantes tanto en las condiciones de tratamiento como de control.

Ver también

Pruebas anecdóticas – Pruebas basadas en testimonios personales
Inferencia causal : rama de la estadística que se ocupa de inferir relaciones causales entre variables.
Método epidemiológico – Método científico en el campo específico
Paradoja de Simpson – Error en el razonamiento estadístico con grupos
Sesgo de variable omitida

Notas

^ También conocida como variable de confusión , factor de confusión , determinante extraño o variable al acecho .

Referencias

^ Perla, J., (2009). La paradoja , la confusión y la colapsabilidad de Simpson en la causalidad: modelos, razonamiento e inferencia (2ª ed.). Nueva York: Cambridge University Press.
^ VanderWeele, TJ; Shpitser, I. (2013). "Sobre la definición de factor de confusión". Anales de Estadística . 41 (1): 196–220. arXiv : 1304.0564 . doi :10.1214/12-aos1058. PMC 4276366 . PMID 25544784.
^ Groenlandia, S.; Robins, JM; Perla, J. (1999). "Confusión y colapsabilidad en la inferencia causal". Ciencia estadística . 14 (1): 29–46. doi : 10.1214/ss/1009211805 .
^ Sádish, WR; Cocinero, TD; Campbell, DT (2002). Diseños experimentales y cuasiexperimentales para inferencia causal generalizada . Boston, MA: Houghton-Mifflin .
^ abcd Perla, J., (1993). "Aspectos de los modelos gráficos relacionados con la causalidad", en actas de la 49.ª sesión del Instituto Internacional de Ciencias Estadísticas, págs.
^ ab Perla, J. (2009). Diagramas causales e identificación de efectos causales en causalidad: modelos, razonamiento e inferencia (2ª ed.). Nueva York, NY, Estados Unidos: Cambridge University Press.
^ Cinelli, C.; Forney, A.; Pearl, J. (marzo de 2022). "Un curso intensivo sobre buenos y malos controles" (PDF) . Laboratorio de Sistemas Cognitivos de UCLA, Informe Técnico (R-493) .
^ Lee, PH (2014). "¿Deberíamos ajustarnos a un factor de confusión si los criterios empíricos y teóricos producen resultados contradictorios? Un estudio de simulación". Representante de ciencia . 4 : 6085. Código Bib : 2014NatSR...4E6085L. doi :10.1038/srep06085. PMC 5381407 . PMID 25124526.
^ Shpitser, yo; Perla, J. (2008). "Métodos completos de identificación de la jerarquía causal". La revista de investigación sobre aprendizaje automático . 9 : 1941-1979.
^ Morabia, A (2011). "Historia del concepto epidemiológico moderno de confusión" (PDF) . Revista de Epidemiología y Salud Comunitaria . 65 (4): 297–300. doi : 10.1136/jech.2010.112565 . PMID 20696848. S2CID 9068532.
^ ab Groenlandia, S.; Robins, JM; Perla, J. (1999). "Confusión y colapsabilidad en la inferencia causal". Ciencia estadística . 14 (1): 31. doi : 10.1214/ss/1009211805 .
^ Pescador, RA (1935). El diseño de experimentos (págs. 114-145).
^ Vandenbroucke, JP (2004). "La historia de la confusión". Soz Praventivmed . 47 (4): 216–224. doi :10.1007/BF01326402. PMID 12415925. S2CID 198174446.
^ Kish, L (1959). "Algunos problemas estadísticos en el diseño de investigaciones". Soy Sociol . 26 (3): 328–338. doi :10.2307/2089381. JSTOR 2089381.
^ Groenlandia, S.; Robins, JM (1986). "Identificabilidad, intercambiabilidad y confusión epidemiológica". Revista Internacional de Epidemiología . 15 (3): 413–419. CiteSeerX 10.1.1.157.6445 . doi :10.1093/ije/15.3.413. PMID 3771081.
^ Neyman, J., con la cooperación de K. Iwaskiewics y St. Kolodziejczyk (1935). Problemas estadísticos en la experimentación agrícola (con discusión). Suplente J Roy Statist Soc Ser B 2 107-180.
^ Rubin, DB (1974). "Estimación de los efectos causales de los tratamientos en estudios aleatorios y no aleatorios". Revista de Psicología Educativa . 66 (5): 688–701. doi :10.1037/h0037350. S2CID 52832751.
^ Perla, J., (2009). Causalidad: modelos, razonamiento e inferencia (2ª ed.). Nueva York, NY, Estados Unidos: Cambridge University Press.
^ Johnston, Carolina del Sur (2001). "Identificación de factores de confusión por indicación mediante revisión prospectiva ciega". Revista Estadounidense de Epidemiología . 154 (3): 276–284. doi : 10.1093/aje/154.3.276 . PMID 11479193.
^ ab Pelham, Brett (2006). Realización de investigaciones en psicología . Belmont: Wadsworth. ISBN 978-0-534-53294-9.
^ Steg, L.; Buunk, AP; Rothengatter, T. (2008). "Capítulo 4". Psicología Social Aplicada: Comprensión y gestión de los problemas sociales . Cambridge, Reino Unido: Cambridge University Press.
^ Tjønneland, Anne; Grønbæk, Morten; Desnúdate, Connie; Overvad, Kim (enero de 1999). "Consumo de vino y dieta en una muestra aleatoria de 48763 hombres y mujeres daneses". La Revista Estadounidense de Nutrición Clínica . 69 (1): 49–54. doi : 10.1093/ajcn/69.1.49 . PMID 9925122.
^ Axelson, O. (1989). "Confusión del tabaquismo en epidemiología ocupacional". Revista británica de medicina industrial . 46 (8): 505–07. doi :10.1136/oem.46.8.505. PMC 1009818 . PMID 2673334.
^ Calow, Peter P. (2009) Manual de evaluación y gestión de riesgos ambientales , Wiley
^ Mayrent, Sherry L. (1987). Epidemiología en Medicina . Lippincott Williams y Wilkins . ISBN 978-0-316-35636-7.
^ Emanuel, Ezequiel J; Miller, Franklin G (20 de septiembre de 2001). "La ética de los ensayos controlados con placebo: un término medio". Revista de Medicina de Nueva Inglaterra . 345 (12): 915–9. doi :10.1056/nejm200109203451211. PMID 11565527.
^ Campbell, DT; Stanley, JC (1966). Diseños experimentales y cuasiexperimentales para la investigación . Chicago: Rand McNally.
^ Crano, WD; Cervecero, MB (2002). Principios y métodos de investigación social (2ª ed.). Mahwah, Nueva Jersey: Lawrence Erlbaum Associates . pag. 28.

Otras lecturas

Pearl, J. (enero de 1998). "Por qué no existe una prueba estadística de confusión, por qué muchos piensan que sí y por qué casi tienen razón" (PDF) . Departamento de Ciencias de la Computación de UCLA, Informe técnico R-256 .
Montgomery, DC (2001). "Bloqueo y confusión en el diseño factorial". Diseño y análisis de experimentos (5ª ed.). Wiley. págs. 287–302. Este libro de texto ofrece una descripción general de los factores de confusión y cómo tenerlos en cuenta en el diseño de experimentos. $2^{k}$ {{cite book}}: Mantenimiento CS1: posdata ( enlace )
Cervecero, MB (2000). "Diseño de la investigación y cuestiones de validez". En Reis, HT; Judd, CM (eds.). Manual de investigación . Nueva York: Cambridge University Press . págs. 3–16. ISBN 9780521551281.
Smith, ER (2000). "Diseño de la investigación". En Reis, HT; Judd, CM (eds.). Manual de métodos de investigación en psicología social y de la personalidad . Nueva York: Cambridge University Press. págs. 17–39. ISBN 9780521551281.

enlaces externos

Tutorial: Modificación de medidas de confusión y efecto (Escuela de Salud Pública de la Universidad de Boston)
Regresión lineal (Universidad de Yale)
Tutorial de la Universidad de Nueva Inglaterra