stringtranslate.com

Controlar una variable

En los modelos causales , controlar una variable significa clasificar los datos según los valores medidos de la variable. Esto se hace normalmente para que la variable ya no pueda actuar como factor de confusión en, por ejemplo, un estudio observacional o un experimento .

Al estimar el efecto de las variables explicativas sobre un resultado mediante regresión , se incluyen como entradas las variables controladas para separar sus efectos de las variables explicativas. [1]

Una limitación del control de variables es que se necesita un modelo causal para identificar factores de confusión importantes ( se utiliza el criterio de puerta trasera para la identificación). Sin uno, un posible factor de confusión podría pasar desapercibido. Otro problema asociado es que si se controla una variable que no es un factor de confusión real, puede de hecho hacer que otras variables (posiblemente no tomadas en cuenta) se conviertan en factores de confusión mientras que antes no lo eran. En otros casos, controlar una variable no confusora puede causar una subestimación del verdadero efecto causal de las variables explicativas sobre un resultado (por ejemplo, cuando se controla un mediador o su descendiente ). [2] [3] El razonamiento contrafactual mitiga la influencia de los factores de confusión sin este inconveniente . [3]

Experimentos

Los experimentos intentan evaluar el efecto de manipular una o más variables independientes sobre una o más variables dependientes . Para garantizar que el efecto medido no se vea influenciado por factores externos, las demás variables deben mantenerse constantes. Las variables que se mantienen constantes durante un experimento se denominan variables de control .

Por ejemplo, si se llevase a cabo un experimento al aire libre para comparar cómo los distintos diseños de alas de un avión de papel (la variable independiente) afectan la distancia que puede volar (la variable dependiente), sería conveniente asegurarse de que el experimento se llevase a cabo en momentos en que el tiempo fuera el mismo, porque no se querría que el tiempo afectara al experimento. En este caso, las variables de control pueden ser la velocidad y la dirección del viento y las precipitaciones. Si el experimento se llevase a cabo cuando estaba soleado y no había viento, pero el tiempo cambiase, sería conveniente posponer la finalización del experimento hasta que las variables de control (el viento y el nivel de precipitaciones) fuesen las mismas que cuando comenzó el experimento.

En experimentos controlados de opciones de tratamiento médico en humanos, los investigadores asignan aleatoriamente a los individuos a un grupo de tratamiento o a un grupo de control . Esto se hace para reducir el efecto de confusión de variables irrelevantes que no se están estudiando, como el efecto placebo .

Estudios observacionales

En un estudio observacional , los investigadores no tienen control sobre los valores de las variables independientes, como quién recibe el tratamiento. En cambio, deben controlar las variables mediante estadísticas .

Los estudios observacionales se utilizan cuando los experimentos controlados pueden ser poco éticos o poco prácticos. Por ejemplo, si un investigador quisiera estudiar el efecto del desempleo ( la variable independiente ) sobre la salud ( la variable dependiente ), los comités de revisión institucional considerarían poco ético asignar aleatoriamente a algunos participantes para que tengan trabajo y a otros para que no lo tengan. En cambio, el investigador tendrá que crear una muestra que incluya a algunas personas empleadas y a algunas personas desempleadas. Sin embargo, podría haber factores que afecten tanto a si alguien está empleado como a su salud. Parte de cualquier asociación observada entre la variable independiente (situación laboral) y la variable dependiente (salud) podría deberse a estos factores externos y espurios en lugar de indicar un verdadero vínculo entre ellos. Esto puede ser problemático incluso en una muestra verdaderamente aleatoria . Al controlar las variables extrañas, el investigador puede acercarse a comprender el verdadero efecto de la variable independiente sobre la variable dependiente.

En este contexto, las variables extrañas se pueden controlar mediante la regresión múltiple . La regresión utiliza como variables independientes no sólo aquellas cuyos efectos sobre la variable dependiente se están estudiando, sino también cualquier variable de confusión potencial, evitando así el sesgo de variable omitida . "Variables de confusión" en este contexto significa otros factores que no sólo influyen en la variable dependiente (el resultado) sino que también influyen en la variable independiente principal. [3]

Regresiones MCO y variables de control

Los ejemplos más simples de variables de control en el análisis de regresión provienen de los estimadores de Mínimos Cuadrados Ordinarios (MCO). El marco de MCO supone lo siguiente:

En consecuencia, una variable de control puede interpretarse como una variable explicativa lineal que afecta el valor medio de Y (Supuesto 1), pero que no presenta la variable principal de investigación, y que también satisface los otros supuestos anteriores. [4]

Ejemplo

Consideremos un estudio sobre si el envejecimiento afecta la satisfacción vital de una persona . (Algunos investigadores perciben una "forma de U": la satisfacción vital parece disminuir primero y luego aumentar después de la mediana edad. [5] ) Para identificar las variables de control necesarias aquí, uno podría preguntarse qué otras variables determinan no solo la satisfacción vital de una persona sino también su edad. Muchas otras variables determinan la satisfacción vital. Pero ninguna otra variable determina la edad de una persona (mientras siga viva). (Todas las personas siguen envejeciendo, al mismo ritmo, sin importar cuáles sean sus otras características.) Por lo tanto, aquí no se necesitan variables de control. [6]

Para determinar las variables de control necesarias, puede ser útil construir un gráfico acíclico dirigido . [3]

Véase también

Referencias

  1. ^ Frost, Jim. "Un tributo al análisis de regresión | Minitab" . Consultado el 4 de agosto de 2015 .
  2. ^ Streiner, David L (febrero de 2016). "¿Control o sobrecontrol de las covariables?". Evid Based Ment Health . 19 (1): 4–5. doi :10.1136/eb-2015-102294. PMC 10699339 . PMID  26755716. S2CID  11155639. 
  3. ^ abcd Pearl, Judea; Mackenzie, Dana (2018). El libro del por qué: la nueva ciencia de la causa y el efecto . Londres: Allen Lane. ISBN 978-0-241-24263-6.
  4. ^ WEISBERG, SANFORD (2021). REGRESIÓN LINEAL APLICADA. JOHN WILEY. ISBN 978-1-119-58014-0.OCLC 1225621417  .
  5. ^ Blanchflower, D.; Oswald, A. (2008). "¿El bienestar tiene forma de U a lo largo del ciclo vital?" (PDF) . Ciencias sociales y medicina . 66 (8): 1733–1749. doi :10.1016/j.socscimed.2008.01.030. PMID  18316146.
  6. ^ Bartram, D. (2020). "Edad y satisfacción vital: cómo controlar las variables de control". Sociología . 55 (2): 421–437. doi : 10.1177/0038038520926871 .

Lectura adicional