Confuso

En la inferencia causal , un factor de confusión ^[a] es una variable que influye tanto en la variable dependiente como en la variable independiente , causando una asociación espuria . La confusión es un concepto causal y, como tal, no se puede describir en términos de correlaciones o asociaciones. ^[1]^[2]^[3] La existencia de factores de confusión es una explicación cuantitativa importante de por qué la correlación no implica causalidad . Algunas notaciones están diseñadas explícitamente para identificar la existencia, posible existencia o inexistencia de factores de confusión en las relaciones causales entre elementos de un sistema.

Los factores de confusión son amenazas a la validez interna . ^[4]

Ejemplo sencillo

Supongamos que una empresa de transporte de camiones posee una flota de camiones de dos fabricantes diferentes. Los camiones fabricados por un fabricante se denominan "Camiones A" y los camiones fabricados por el otro fabricante se denominan "Camiones B". Queremos averiguar si los Camiones A o los Camiones B obtienen un mejor ahorro de combustible. Medimos el combustible y las millas recorridas durante un mes y calculamos el MPG de cada camión. Luego realizamos el análisis apropiado, que determina que existe una tendencia estadísticamente significativa de que los Camiones A son más eficientes en el consumo de combustible que los Camiones B. Sin embargo, tras una reflexión más profunda, también observamos que es más probable que a los Camiones A se les asignen rutas de autopista, y a los Camiones B, rutas de ciudad. Esta es una variable de confusión. La variable de confusión hace que los resultados del análisis no sean confiables. Es muy probable que solo estemos midiendo el hecho de que conducir en autopista da como resultado un mejor ahorro de combustible que conducir en ciudad.

En términos estadísticos, la marca del camión es la variable independiente, el consumo de combustible (MPG) es la variable dependiente y la cantidad de conducción en ciudad es la variable de confusión. Para solucionar este estudio, tenemos varias opciones. Una es aleatorizar las asignaciones de camiones de modo que los camiones A y los camiones B terminen con cantidades iguales de conducción en ciudad y carretera. Eso elimina la variable de confusión. Otra opción es cuantificar la cantidad de conducción en ciudad y usarla como una segunda variable independiente. Una tercera opción es segmentar el estudio, primero comparando el MPG durante la conducción en ciudad para todos los camiones y luego realizar un estudio separado comparando el MPG durante la conducción en carretera.

Definición

La confusión se define en términos del modelo de generación de datos. Sea X una variable independiente e Y una variable dependiente . Para estimar el efecto de X sobre Y , el estadístico debe suprimir los efectos de las variables extrañas que influyen tanto en X como en Y. Decimos que X e Y están confundidas por alguna otra variable Z siempre que Z influya causalmente tanto en X como en Y.

Sea la probabilidad del evento Y = y bajo la intervención hipotética X = x . X e Y no se confunden si y solo si se cumple lo siguiente: $P(y\mid {\text{do}}(x))$

para todos los valores X = x e Y = y , donde es la probabilidad condicional de ver X = x . Intuitivamente, esta igualdad establece que X e Y no se confunden siempre que la asociación observada entre ellos sea la misma que la asociación que se mediría en un experimento controlado , con x aleatorizado . $P(y\mid x)$

En principio, la igualdad definitoria se puede verificar a partir del modelo generador de datos, suponiendo que tenemos todas las ecuaciones y probabilidades asociadas con el modelo. Esto se hace simulando una intervención (ver red bayesiana ) y verificando si la probabilidad resultante de Y es igual a la probabilidad condicional . Sin embargo, resulta que la estructura gráfica por sí sola es suficiente para verificar la igualdad . $P(y\mid {\text{do}}(x))=P(y\mid x)$ ${\text{hacer}}(X=x)$ $P(y\mid x)$ $P(y\mid {\text{do}}(x))=P(y\mid x)$

Control

Consideremos a un investigador que intenta evaluar la eficacia del fármaco X a partir de datos de población en los que el uso del fármaco fue una elección del paciente. Los datos muestran que el género ( Z ) influye en la elección del fármaco por parte del paciente, así como en sus posibilidades de recuperación ( Y ). En este escenario, el género Z confunde la relación entre X e Y, ya que Z es una causa tanto de X como de Y :

Diagrama causal del género como causa común del consumo de drogas y su recuperación

Nosotros tenemos eso

porque la cantidad observacional contiene información sobre la correlación entre X y Z , y la cantidad intervencionista no (ya que X no está correlacionada con Z en un experimento aleatorio). Se puede demostrar ^[5] que, en casos en los que solo se dispone de datos observacionales, se puede obtener una estimación imparcial de la cantidad deseada "ajustando" todos los factores de confusión, es decir, condicionando sus diversos valores y promediando el resultado. En el caso de un único factor de confusión Z , esto conduce a la "fórmula de ajuste": $P(y\mid {\text{do}}(x))$

que da una estimación imparcial del efecto causal de X sobre Y . La misma fórmula de ajuste funciona cuando hay múltiples factores de confusión excepto que, en este caso, la elección de un conjunto Z de variables que garantizaría estimaciones imparciales debe hacerse con cautela. El criterio para una elección adecuada de variables se llama Back-Door ^[5]^[6] y requiere que el conjunto Z elegido "bloquee" (o intercepte) cada camino entre X e Y que contenga una flecha hacia X. Estos conjuntos se denominan "Back-Door admisible" y pueden incluir variables que no son causas comunes de X e Y , sino simplemente sustitutos de las mismas.

Volviendo al ejemplo del consumo de drogas, dado que Z cumple con el requisito de puerta trasera (es decir, intercepta la única ruta de puerta trasera ), la fórmula de ajuste de puerta trasera es válida: $X\leftarrow Z\rightarrow Y$

De esta manera, el médico puede predecir el efecto probable de la administración del medicamento a partir de estudios observacionales en los que las probabilidades condicionales que aparecen en el lado derecho de la ecuación se pueden estimar mediante regresión.

Contrariamente a la creencia común, agregar covariables al conjunto de ajuste Z puede introducir sesgo. ^[7] Un contraejemplo típico ocurre cuando Z es un efecto común de X e Y , ^[8] un caso en el que Z no es un factor de confusión (es decir, el conjunto nulo es admisible por puerta trasera) y el ajuste para Z crearía un sesgo conocido como " sesgo del colisionador " o " paradoja de Berkson ". Los controles que no son buenos factores de confusión a veces se denominan malos controles .

En general, la confusión se puede controlar mediante un ajuste si y solo si hay un conjunto de covariables observadas que satisfacen la condición de la puerta trasera. Además, si Z es un conjunto de este tipo, entonces la fórmula de ajuste de la ecuación (3) es válida. ^[5]^[6] El cálculo do de Pearl proporciona todas las condiciones posibles bajo las cuales se puede estimar, no necesariamente mediante un ajuste. ^[9] $P(y\mid {\text{do}}(x))$

Historia

Según Morabia (2011), ^[10] la palabra " confundir " deriva del verbo latino medieval "confundere", que significaba "mezclar", y probablemente fue elegida para representar la confusión (del latín: con=con + fusus=mezclar o fusionar) entre la causa que se desea evaluar y otras causas que pueden afectar el resultado y, por lo tanto, confundir o interponerse en el camino de la evaluación deseada. Greenland, Robins y Pearl ^[11] señalan un uso temprano del término "confundir" en la inferencia causal por parte de John Stuart Mill en 1843.

Fisher introdujo la palabra "confusión" en su libro de 1935 "El diseño de experimentos" ^[12] para referirse específicamente a una consecuencia del bloqueo (es decir, la partición ) del conjunto de combinaciones de tratamientos en un experimento factorial , por el cual ciertas interacciones pueden ser "confundidas con bloques". Esto popularizó la noción de confusión en estadística, aunque Fisher estaba preocupado por el control de la heterogeneidad en las unidades experimentales, no por la inferencia causal.

Según Vandenbroucke (2004) ^[13], fue Kish ^[14] quien utilizó la palabra "confusión" en el sentido de "incomparabilidad" de dos o más grupos (por ejemplo, expuestos y no expuestos) en un estudio observacional. Las condiciones formales que definen lo que hace que ciertos grupos sean "comparables" y otros "incomparables" fueron desarrolladas posteriormente en epidemiología por Greenland y Robins (1986) ^[15] utilizando el lenguaje contrafactual de Neyman (1935) ^[16] y Rubin (1974). ^[17] Estas fueron complementadas posteriormente con criterios gráficos como la condición de la puerta trasera ( Pearl 1993; Greenland, Robins y Pearl 1999). ^[11]^[5]

Se demostró que los criterios gráficos eran formalmente equivalentes a la definición contrafactual ^[18] pero más transparentes para los investigadores que se basan en modelos de proceso.

Tipos

En el caso de las evaluaciones de riesgo que evalúan la magnitud y la naturaleza del riesgo para la salud humana , es importante controlar los factores de confusión para aislar el efecto de un peligro particular, como un aditivo alimentario, un pesticida o un medicamento nuevo. En el caso de los estudios prospectivos, es difícil reclutar y seleccionar voluntarios con los mismos antecedentes (edad, dieta, educación, geografía, etc.) y, en los estudios históricos, puede haber una variabilidad similar. Debido a la incapacidad de controlar la variabilidad de los voluntarios y los estudios humanos, los factores de confusión son un desafío particular. Por estas razones, los experimentos ofrecen una forma de evitar la mayoría de las formas de confusión.

En algunas disciplinas, la confusión se clasifica en diferentes tipos. En epidemiología , un tipo es la "confusión por indicación", ^[19] que se relaciona con la confusión de los estudios observacionales . Debido a que los factores pronósticos pueden influir en las decisiones de tratamiento (y sesgar las estimaciones de los efectos del tratamiento), controlar los factores pronósticos conocidos puede reducir este problema, pero siempre es posible que no se haya incluido un factor olvidado o desconocido o que los factores interactúen de manera compleja. La confusión por indicación se ha descrito como la limitación más importante de los estudios observacionales. Los ensayos aleatorizados no se ven afectados por la confusión por indicación debido a la asignación aleatoria .

Las variables de confusión también pueden clasificarse según su origen: la elección del instrumento de medición (confusión operativa), las características situacionales (confusión procedimental) o las diferencias interindividuales (confusión personal).

La confusión operativa puede ocurrir tanto en diseños de investigación experimentales como no experimentales. Este tipo de confusión ocurre cuando una medida diseñada para evaluar un constructo particular mide inadvertidamente algo más también. ^[20]
Una confusión procedimental puede ocurrir en un experimento de laboratorio o en un cuasi-experimento . Este tipo de confusión ocurre cuando el investigador permite por error que otra variable cambie junto con la variable independiente manipulada. ^[20]
Se produce una confusión de personas cuando se analizan juntos dos o más grupos de unidades (por ejemplo, trabajadores de diferentes ocupaciones), a pesar de que varían según una o más características (observadas o no observadas) (por ejemplo, el género). ^[21]

Ejemplos

Supongamos que se está estudiando la relación entre el orden de nacimiento (primer hijo, segundo hijo, etc.) y la presencia de síndrome de Down en el niño. En este escenario, la edad materna sería una variable de confusión: ^{[ cita requerida ]}

La mayor edad materna está directamente asociada con el síndrome de Down en el niño
Una mayor edad materna está directamente asociada con el síndrome de Down, independientemente del orden de nacimiento (una madre que tiene su primer hijo a los 50 años o su tercer hijo a los 50 años conlleva el mismo riesgo).
La edad materna está directamente asociada al orden de nacimiento (el 2º hijo, salvo en caso de gemelos, nace cuando la madre es mayor que cuando nació el 1er hijo)
La edad materna no es consecuencia del orden de nacimiento (tener un segundo hijo no cambia la edad de la madre)

En las evaluaciones de riesgos , factores como la edad, el género y los niveles educativos a menudo afectan el estado de salud y, por lo tanto, deben controlarse. Más allá de estos factores, los investigadores pueden no considerar o no tener acceso a datos sobre otros factores causales. Un ejemplo es el estudio del tabaquismo en la salud humana. Fumar, beber alcohol y la dieta son actividades de estilo de vida que están relacionadas. Una evaluación de riesgos que analiza los efectos del tabaquismo pero no controla el consumo de alcohol o la dieta puede sobreestimar el riesgo de fumar. ^[22] El tabaquismo y los factores de confusión se revisan en las evaluaciones de riesgos laborales, como la seguridad de la minería del carbón. ^[23] Cuando no hay una gran muestra de población de no fumadores o no bebedores en una ocupación particular, la evaluación de riesgos puede estar sesgada hacia la búsqueda de un efecto negativo en la salud.

Disminuir el potencial de confusión

Se puede reducir la posibilidad de que se produzcan y tengan efecto factores de confusión aumentando los tipos y números de comparaciones realizadas en un análisis. Si las medidas o manipulaciones de los constructos centrales están confundidas (es decir, existen factores de confusión operativos o procedimentales), el análisis de subgrupos puede no revelar problemas en el análisis. Además, aumentar el número de comparaciones puede crear otros problemas (consulte comparaciones múltiples ).

La revisión por pares es un proceso que puede ayudar a reducir los casos de confusión, ya sea antes de la implementación del estudio o después de que se haya realizado el análisis. La revisión por pares se basa en la experiencia colectiva dentro de una disciplina para identificar posibles debilidades en el diseño y el análisis del estudio, incluidas las formas en que los resultados pueden depender de la confusión. De manera similar, la replicación puede probar la solidez de los hallazgos de un estudio en condiciones de estudio alternativas o análisis alternativos (por ejemplo, controlando posibles factores de confusión no identificados en el estudio inicial).

Es menos probable que se produzcan efectos de confusión y que estos actúen de manera similar en múltiples momentos y lugares. ^{[ cita requerida ]} Al seleccionar los sitios de estudio, se puede caracterizar detalladamente el entorno en los sitios de estudio para garantizar que los sitios sean ecológicamente similares y, por lo tanto, sea menos probable que tengan variables de confusión. Por último, se puede estudiar la relación entre las variables ambientales que posiblemente confundan el análisis y los parámetros medidos. La información relativa a las variables ambientales se puede utilizar luego en modelos específicos del sitio para identificar la varianza residual que puede deberse a efectos reales. ^[24]

Dependiendo del tipo de diseño de estudio implementado, existen varias maneras de modificar ese diseño para excluir o controlar activamente las variables de confusión: ^[25]

Los estudios de casos y controles asignan factores de confusión a ambos grupos, casos y controles, por igual. Por ejemplo, si alguien quisiera estudiar la causa de un infarto de miocardio y piensa que la edad es una probable variable de confusión, cada paciente de 67 años con infarto se emparejará con una persona "de control" sana de 67 años. En los estudios de casos y controles, las variables emparejadas con mayor frecuencia son la edad y el sexo. Desventaja: Los estudios de casos y controles son factibles solo cuando es fácil encontrar controles, es decir, personas cuyo estado con respecto a todos los factores de confusión potenciales conocidos sea el mismo que el del paciente del caso: supongamos que un estudio de casos y controles intenta encontrar la causa de una enfermedad dada en una persona que tiene 1) 45 años, 2) es afroamericana, 3) es de Alaska , 4) es un ávido jugador de fútbol, 5) es vegetariana y 6) trabaja en educación. Un control teóricamente perfecto sería una persona que, además de no tener la enfermedad que se investiga, reúna todas esas características y no tenga ninguna enfermedad que el paciente no tenga también, pero encontrar un control así sería una tarea enorme.
Estudios de cohorte : También es posible un cierto grado de emparejamiento y, a menudo, se realiza admitiendo solo ciertos grupos de edad o un cierto sexo en la población de estudio, creando una cohorte de personas que comparten características similares y, por lo tanto, todas las cohortes son comparables con respecto a la posible variable de confusión. Por ejemplo, si se cree que la edad y el sexo son factores de confusión, solo los hombres de 40 a 50 años participarían en un estudio de cohorte que evaluaría el riesgo de infarto de miocardio en cohortes que son físicamente activas o inactivas. Desventaja: en los estudios de cohorte, la sobreexclusión de datos de entrada puede llevar a los investigadores a definir demasiado estrechamente el conjunto de personas en situaciones similares para las que afirman que el estudio es útil, de modo que otras personas a las que de hecho se aplica la relación causal pueden perder la oportunidad de beneficiarse de las recomendaciones del estudio. De manera similar, la "sobreestratificación" de los datos de entrada dentro de un estudio puede reducir el tamaño de la muestra en un estrato determinado hasta el punto en que las generalizaciones extraídas observando solo a los miembros de ese estrato no sean estadísticamente significativas .
Doble ciego : oculta a la población del ensayo y a los observadores la pertenencia a los grupos experimentales de los participantes. Al impedir que los participantes sepan si están recibiendo tratamiento o no, el efecto placebo debería ser el mismo para los grupos de control y de tratamiento. Al impedir que los observadores sepan quiénes son sus miembros, no debería haber sesgo por parte de los investigadores que tratan a los grupos de manera diferente o que interpretan los resultados de manera diferente.
Ensayo controlado aleatorio : método en el que la población de estudio se divide aleatoriamente para mitigar las posibilidades de autoselección por parte de los participantes o de sesgo por parte de los diseñadores del estudio. Antes de que comience el experimento, los evaluadores asignarán a los miembros del grupo de participantes a sus grupos (control, intervención, paralelo), utilizando un proceso de aleatorización como el uso de un generador de números aleatorios. Por ejemplo, en un estudio sobre los efectos del ejercicio, las conclusiones serían menos válidas si a los participantes se les diera la opción de pertenecer al grupo de control que no haría ejercicio o al grupo de intervención que estaría dispuesto a participar en un programa de ejercicio. El estudio capturaría entonces otras variables además del ejercicio, como los niveles de salud previos al experimento y la motivación para adoptar actividades saludables. Desde el lado del observador, el experimentador puede elegir candidatos que tengan más probabilidades de mostrar los resultados que el estudio quiere ver o puede interpretar los resultados subjetivos (más enérgicos, actitud positiva) de una manera favorable a sus deseos.
Estratificación : como en el ejemplo anterior, se considera que la actividad física es una conducta que protege contra el infarto de miocardio y se supone que la edad es un posible factor de confusión. Los datos muestreados se estratifican por grupo de edad, lo que significa que la asociación entre la actividad y el infarto se analizaría por cada grupo de edad. Si los diferentes grupos de edad (o estratos de edad) arrojan razones de riesgo muy diferentes , la edad debe considerarse una variable de confusión. Existen herramientas estadísticas, entre ellas los métodos de Mantel-Haenszel, que tienen en cuenta la estratificación de los conjuntos de datos.
El control de los factores de confusión midiendo los factores de confusión conocidos e incluyéndolos como covariables es un análisis multivariable, como el análisis de regresión . Los análisis multivariables revelan mucha menos información sobre la fuerza o polaridad de la variable de confusión que los métodos de estratificación. Por ejemplo, si el análisis multivariable controla los antidepresivos y no estratifica los antidepresivos para los ATC y los ISRS , entonces ignorará que estas dos clases de antidepresivos tienen efectos opuestos sobre el infarto de miocardio, y uno es mucho más fuerte que el otro.

Todos estos métodos tienen sus inconvenientes:

La mejor defensa disponible contra la posibilidad de obtener resultados espurios debido a factores de confusión es a menudo prescindir de los esfuerzos de estratificación y, en su lugar, realizar un estudio aleatorio de una muestra suficientemente grande tomada en su conjunto, de modo que todas las posibles variables de confusión (conocidas y desconocidas) se distribuyan al azar entre todos los grupos de estudio y, por lo tanto, no estén correlacionadas con la variable binaria de inclusión/exclusión en ningún grupo.
Consideraciones éticas: En los ensayos controlados aleatorizados y doble ciego, los participantes no son conscientes de que están recibiendo tratamientos simulados y se les pueden negar tratamientos efectivos. ^[26] Existe la posibilidad de que los pacientes sólo acepten una cirugía invasiva (que conlleva riesgos médicos reales) bajo el entendimiento de que están recibiendo tratamiento. Aunque esto es una preocupación ética, no es una descripción completa de la situación. En el caso de las cirugías que se realizan actualmente con regularidad, pero para las que no hay evidencia concreta de un efecto genuino, puede haber problemas éticos para continuar con dichas cirugías. En tales circunstancias, muchas personas están expuestas a los riesgos reales de la cirugía, pero estos tratamientos posiblemente no ofrezcan ningún beneficio discernible. El control de la cirugía simulada es un método que puede permitir a la ciencia médica determinar si un procedimiento quirúrgico es eficaz o no. Dado que existen riesgos conocidos asociados con las operaciones médicas, es cuestionable éticamente permitir que se realicen cirugías no verificadas ad infinitum en el futuro.

Artefactos

Los artefactos son variables que deberían haber variado sistemáticamente, ya sea dentro o entre estudios, pero que accidentalmente se mantuvieron constantes. Por lo tanto, los artefactos son amenazas a la validez externa . Los artefactos son factores que covarían con el tratamiento y el resultado. Campbell y Stanley ^[27] identifican varios artefactos. Las principales amenazas a la validez interna son la historia, la maduración, las pruebas, la instrumentación, la regresión estadística , la selección, la mortalidad experimental y las interacciones entre la selección y la historia.

Una forma de minimizar la influencia de los artefactos es utilizar un diseño de grupo de control pretest-postest . Dentro de este diseño, "grupos de personas que inicialmente son equivalentes (en la fase pretest) son asignados aleatoriamente para recibir el tratamiento experimental o una condición de control y luego evaluados nuevamente después de esta experiencia diferencial (fase postest)". ^[28] Por lo tanto, cualquier efecto de los artefactos se distribuye (idealmente) de manera igualitaria entre los participantes tanto en la condición de tratamiento como en la de control.

Véase también

Prueba anecdótica : prueba basada en testimonios personales
Inferencia causal : rama de la estadística que se ocupa de inferir relaciones causales entre variables.
Método epidemiológico – Método científico en el campo específico
Paradoja de Simpson – Error en el razonamiento estadístico con grupos
Sesgo por variable omitida

Notas

^ También conocido como variable de confusión , factor de confusión , determinante extraño o variable oculta .

Referencias

^ Pearl, J., (2009). Paradoja de Simpson , confusión y colapsibilidad en causalidad: modelos, razonamiento e inferencia (2.ª ed.). Nueva York: Cambridge University Press.
^ VanderWeele, TJ; Shpitser, I. (2013). "Sobre la definición de un factor de confusión". Anales de Estadística . 41 (1): 196–220. arXiv : 1304.0564 . doi :10.1214/12-aos1058. PMC 4276366 . PMID 25544784.
^ Groenlandia, S.; Robins, JM; Pearl, J. (1999). "Confusión y colapsibilidad en la inferencia causal". Ciencia estadística . 14 (1): 29–46. doi : 10.1214/ss/1009211805 .
^ Shadish, WR; Cook, TD; Campbell, DT (2002). Diseños experimentales y cuasiexperimentales para la inferencia causal generalizada . Boston, MA: Houghton-Mifflin .
^ abcd Pearl, J., (1993). "Aspectos de los modelos gráficos relacionados con la causalidad", en Actas de la 49.ª sesión del Instituto Internacional de Ciencias Estadísticas, págs. 391-401.
^ ab Pearl, J. (2009). Diagramas causales e identificación de efectos causales en la causalidad: modelos, razonamiento e inferencia (2.ª ed.). Nueva York, NY, EE. UU.: Cambridge University Press.
^ Cinelli, C.; Forney, A.; Pearl, J. (marzo de 2022). "Un curso intensivo sobre buenos y malos controles" (PDF) . Laboratorio de sistemas cognitivos de la UCLA, Informe técnico (R-493) .
^ Lee, PH (2014). "¿Deberíamos realizar ajustes para tener en cuenta un factor de confusión si los criterios empíricos y teóricos arrojan resultados contradictorios? Un estudio de simulación". Sci Rep . 4 : 6085. Bibcode :2014NatSR...4E6085L. doi :10.1038/srep06085. PMC 5381407 . PMID 25124526.
^ Shpitser, I.; Pearl, J. (2008). "Métodos de identificación completos para la jerarquía causal". The Journal of Machine Learning Research . 9 : 1941–1979.
^ Morabia, A (2011). "Historia del concepto epidemiológico moderno de confusión" (PDF) . Revista de Epidemiología y Salud Comunitaria . 65 (4): 297–300. doi : 10.1136/jech.2010.112565 . PMID 20696848. S2CID 9068532.
^ ab Greenland, S.; Robins, JM; Pearl, J. (1999). "Confusión y colapsibilidad en la inferencia causal". Ciencia estadística . 14 (1): 31. doi : 10.1214/ss/1009211805 .
^ Fisher, RA (1935). El diseño de experimentos (pp. 114–145).
^ Vandenbroucke, JP (2004). "La historia de la confusión". Soz Praventivmed . 47 (4): 216–224. doi :10.1007/BF01326402. PMID 12415925. S2CID 198174446.
^ Kish, L (1959). "Algunos problemas estadísticos en el diseño de la investigación". Am Sociol . 26 (3): 328–338. doi :10.2307/2089381. JSTOR 2089381.
^ Groenlandia, S.; Robins, JM (1986). "Identificabilidad, intercambiabilidad y confusión epidemiológica". Revista Internacional de Epidemiología . 15 (3): 413–419. CiteSeerX 10.1.1.157.6445 . doi :10.1093/ije/15.3.413. PMID 3771081.
^ Neyman, J., con la colaboración de K. Iwaskiewics y St. Kolodziejczyk (1935). Problemas estadísticos en la experimentación agrícola (con discusión). Suppl J Roy Statist Soc Ser B 2 107-180.
^ Rubin, DB (1974). "Estimación de los efectos causales de los tratamientos en estudios aleatorios y no aleatorios". Revista de Psicología Educativa . 66 (5): 688–701. doi :10.1037/h0037350. S2CID 52832751.
^ Pearl, J., (2009). Causalidad: modelos, razonamiento e inferencia (2.ª ed.). Nueva York, NY, EE. UU.: Cambridge University Press.
^ Johnston, SC (2001). "Identificación de factores de confusión por indicación a través de una revisión prospectiva ciega". American Journal of Epidemiology . 154 (3): 276–284. doi : 10.1093/aje/154.3.276 . PMID 11479193.
^ ab Pelham, Brett (2006). Realización de investigaciones en psicología . Belmont: Wadsworth. ISBN 978-0-534-53294-9.
^ Steg, L.; Buunk, AP; Rothengatter, T. (2008). "Capítulo 4". Psicología social aplicada: comprensión y gestión de los problemas sociales . Cambridge, Reino Unido: Cambridge University Press.
^ Tjønneland, Anne; Grønbæk, Morten; Stripp, Connie; Overvad, Kim (enero de 1999). "Ingesta de vino y dieta en una muestra aleatoria de 48763 hombres y mujeres daneses". The American Journal of Clinical Nutrition . 69 (1): 49–54. doi : 10.1093/ajcn/69.1.49 . PMID 9925122.
^ Axelson, O. (1989). "Factores de confusión derivados del tabaquismo en la epidemiología ocupacional". British Journal of Industrial Medicine . 46 (8): 505–07. doi :10.1136/oem.46.8.505. PMC 1009818 . PMID 2673334.
^ Calow, Peter P. (2009) Manual de evaluación y gestión de riesgos ambientales , Wiley
^ Mayrent, Sherry L (1987). Epidemiología en medicina . Lippincott Williams & Wilkins . ISBN. 978-0-316-35636-7.
^ Emanuel, Ezekiel J; Miller, Franklin G (20 de septiembre de 2001). "La ética de los ensayos controlados con placebo: un punto intermedio". New England Journal of Medicine . 345 (12): 915–9. doi :10.1056/nejm200109203451211. PMID 11565527.
^ Campbell, DT; Stanley, JC (1966). Diseños experimentales y cuasiexperimentales para la investigación . Chicago: Rand McNally.
^ Crano, WD; Brewer, MB (2002). Principios y métodos de investigación social (2.ª ed.). Mahwah, NJ: Lawrence Erlbaum Associates . pág. 28.

Lectura adicional

Pearl, J. (enero de 1998). "Por qué no existe una prueba estadística para la confusión, por qué muchos piensan que sí la hay y por qué casi tienen razón" (PDF) . Departamento de Informática de la UCLA, Informe técnico R-256 .
Montgomery, DC (2001). "Bloqueo y confusión en el diseño factorial". Diseño y análisis de experimentos (5.ª ed.). Wiley. págs. 287–302. Este libro de texto ofrece una descripción general de los factores de confusión y cómo tenerlos en cuenta en el diseño de experimentos. ${\estilo de visualización 2^{k}}$ {{cite book}}: Mantenimiento de CS1: postscript ( enlace )
Brewer, MB (2000). "Diseño de investigación y cuestiones de validez". En Reis, HT; Judd, CM (eds.). Handbook of Research . Nueva York: Cambridge University Press . págs. 3–16. ISBN 9780521551281.
Smith, ER (2000). "Diseño de investigación". En Reis, HT; Judd, CM (eds.). Manual de métodos de investigación en psicología social y de la personalidad . Nueva York: Cambridge University Press. pp. 17–39. ISBN 9780521551281.

Enlaces externos

Tutorial: Confusión y modificación de medidas de efecto (Escuela de Salud Pública de la Universidad de Boston)
Regresión lineal (Universidad de Yale)
Tutorial de la Universidad de Nueva Inglaterra