stringtranslate.com

La correlación no implica causalidad

La frase " correlación no implica causalidad " se refiere a la incapacidad de deducir legítimamente una relación de causa y efecto entre dos eventos o variables únicamente sobre la base de una asociación o correlación observada entre ellos. [1] [2] La idea de que "correlación implica causalidad" es un ejemplo de una falacia lógica de causa cuestionable , en la que se considera que dos eventos que ocurren juntos han establecido una relación de causa y efecto. Esta falacia también se conoce con la frase latina cum hoc ergo propter hoc ('con esto, luego debido a esto'). Esto difiere de la falacia conocida como post hoc ergo propter hoc ("después de esto, luego debido a esto"), en la que un evento que sigue a otro se ve como una consecuencia necesaria del evento anterior, y de la fusión , la fusión errada de dos eventos, ideas, bases de datos, etc., en uno.

Como sucede con cualquier falacia lógica, identificar que el razonamiento detrás de un argumento es defectuoso no implica necesariamente que la conclusión resultante sea falsa. Se han propuesto métodos estadísticos que utilizan la correlación como base para las pruebas de hipótesis de causalidad, incluida la prueba de causalidad de Granger y la correlación cruzada convergente . Los criterios de Bradford Hill , también conocidos como criterios de Hill para la causalidad, son un grupo de nueve principios que pueden ser útiles para establecer evidencia epidemiológica de una relación causal.

Uso y significado de los términos

"Implicar"

En el uso informal, la palabra "implica" significa vagamente sugiere , en lugar de requiere . Sin embargo, en lógica , el uso técnico de la palabra "implica" significa "es una condición suficiente para". [3] Ese es el significado que pretenden los estadísticos cuando dicen que la causalidad no es cierta. De hecho, p implica q tiene el significado técnico del condicional material : si p entonces q simbolizado como p → q . Es decir, "si la circunstancia p es verdadera, entonces q se sigue". En ese sentido, siempre es correcto decir "La correlación no implica causalidad".

"Causa"

La palabra " causa " (o "causación") tiene múltiples significados en inglés. En la terminología filosófica, "causa" puede referirse a causas necesarias, suficientes o contribuyentes . Al examinar la correlación, "causa" se usa con mayor frecuencia para significar "una causa contribuyente" (pero no necesariamente la única causa contribuyente).

El analfabetismo de los dinosaurios y la extinción pueden estar correlacionados, pero eso no significaría que las variables tuvieran una relación causal.

Análisis causal

El análisis causal es el campo del diseño experimental y de las estadísticas que se ocupa de establecer la relación causa-efecto. [4] Normalmente implica establecer cuatro elementos: correlación , secuencia en el tiempo (es decir, las causas deben ocurrir antes de su efecto propuesto), un mecanismo físico o teórico de la información plausible para que un efecto observado se derive de una causa posible y la eliminación de la posibilidad de causas comunes y alternativas ("especiales") . Este tipo de análisis suele implicar uno o más experimentos artificiales o naturales . [5]

Ejemplos de inferencia ilógica de causalidad a partir de correlación

B causa A (causalidad inversa o causalidad inversa)

La causalidad inversa o dirección incorrecta es una falacia informal de causa cuestionable en la que la causa y el efecto se invierten. Se dice que la causa es el efecto y viceversa.

Ejemplo 1
Cuanto más rápido se observa que giran los molinos de viento, más viento se observa.
Por lo tanto, el viento se produce por la rotación de los molinos de viento. (O, dicho de forma más sencilla: los molinos de viento, como su nombre indica, son máquinas que se utilizan para producir viento).

En este ejemplo, la correlación (simultaneidad) entre la actividad de los molinos de viento y la velocidad del viento no implica que el viento sea causado por los molinos de viento, sino más bien al revés, como lo sugiere el hecho de que el viento no necesita molinos de viento para existir, mientras que los molinos de viento necesitan viento para girar. El viento se puede observar en lugares donde no hay molinos de viento o molinos de viento que no giran, y hay buenas razones para creer que el viento existía antes de la invención de los molinos de viento.

Ejemplo 2
El colesterol bajo se asocia con un aumento de la mortalidad.
Por lo tanto, el colesterol bajo aumenta el riesgo de mortalidad.

En realidad, la causalidad es al revés, ya que algunas enfermedades, como el cáncer, provocan un bajo nivel de colesterol debido a una gran cantidad de factores, como la pérdida de peso, y también provocan un aumento de la mortalidad. [6] Esto también se puede observar en los alcohólicos. [ cita requerida ] Cuando a los alcohólicos se les diagnostica cirrosis hepática, muchos dejan de beber. Sin embargo, también experimentan un mayor riesgo de mortalidad. En estos casos, son las enfermedades las que provocan un mayor riesgo de mortalidad, pero el aumento de la mortalidad se atribuye a los efectos beneficiosos que siguen al diagnóstico, lo que hace que los cambios saludables parezcan nocivos.

Ejemplo 3

En otros casos, puede que simplemente no esté claro cuál es la causa y cuál el efecto. Por ejemplo:

Los niños que ven mucha televisión son los más violentos. Está claro que la televisión hace que los niños sean más violentos .

Esto podría fácilmente ocurrir al revés; es decir, a los niños violentos les gusta ver más televisión que a los menos violentos.

Ejemplo 4

La correlación entre el consumo de drogas recreativas y los trastornos psiquiátricos puede ser de dos tipos: tal vez las drogas causan los trastornos, o tal vez las personas usan drogas para automedicarse por condiciones preexistentes. La teoría de las drogas de entrada puede argumentar que el consumo de marihuana conduce al consumo de drogas más duras, pero el consumo de drogas duras puede conducir al consumo de marihuana (véase también la confusión de la inversa ). De hecho, en las ciencias sociales , donde a menudo no se pueden utilizar experimentos controlados para discernir la dirección de la causalidad, esta falacia puede alimentar argumentos científicos de larga data. Un ejemplo de esto se puede encontrar en la economía de la educación , entre los modelos de selección / señalización y capital humano : podría ser que tener una capacidad innata le permite a uno completar una educación, o que completar una educación desarrolla la propia capacidad.

Ejemplo 5

Un ejemplo histórico de esto es que los europeos en la Edad Media creían que los piojos eran beneficiosos para la salud, ya que rara vez había piojos en las personas enfermas. El razonamiento era que las personas enfermaban porque los piojos se iban. Sin embargo, la verdadera razón es que los piojos son extremadamente sensibles a la temperatura corporal . Un pequeño aumento de la temperatura corporal, como en la fiebre , hace que los piojos busquen otro huésped. El termómetro médico aún no se había inventado y, por lo tanto, ese aumento de temperatura rara vez se notaba. Los síntomas notables llegaron más tarde, lo que dio la impresión de que los piojos se habían ido antes de que la persona enfermara. [7]

En otros casos, dos fenómenos pueden ser causa parcial del otro; pensemos en la pobreza y la falta de educación, o en la postergación de decisiones y la baja autoestima. Sin embargo, quien formule un argumento basado en estos dos fenómenos debe tener cuidado de evitar la falacia de la relación circular de causa y consecuencia . La pobreza es una causa de la falta de educación, pero no es la única causa, y viceversa.

El tercer factor C (la variable causal común) causa tanto A como B

La falacia de la tercera causa (también conocida como ignorar una causa común [8] o causa cuestionable [8] ) es una falacia lógica en la que se confunde una relación espuria con la causalidad . Afirma que X causa Y cuando en realidad, tanto X como Y son causados ​​por Z. Es una variación de la falacia post hoc ergo propter hoc y un miembro del grupo de falacias de causa cuestionable .

Todos esos ejemplos tratan de una variable oculta , que es simplemente una tercera variable oculta que afecta a las dos variables que se observa que están correlacionadas. Esa tercera variable también se conoce como variable de confusión , con la ligera diferencia de que las variables de confusión no necesitan estar ocultas y, por lo tanto, pueden corregirse en un análisis. Tenga en cuenta que el enlace de Wikipedia a la variable oculta redirecciona a la variable de confusión. A menudo también surge una dificultad cuando el tercer factor, aunque fundamentalmente diferente de A y B, está tan estrechamente relacionado con A y/o B que se confunde con ellos o es muy difícil desenredarlos científicamente (ver Ejemplo 4).

Ejemplo 1
Dormir con los zapatos puestos está fuertemente relacionado con despertarse con dolor de cabeza.
Por lo tanto, dormir con los zapatos puestos provoca dolor de cabeza.

El ejemplo anterior comete la falacia de correlación implica causalidad, ya que concluye prematuramente que dormir con los zapatos puestos causa dolor de cabeza. Una explicación más plausible es que ambos factores son causados ​​por un tercer factor, en este caso acostarse borracho , lo que da lugar a una correlación. Por lo tanto, la conclusión es falsa.

Ejemplo 2
Los niños pequeños que duermen con la luz encendida tienen muchas más probabilidades de desarrollar miopía en el futuro.
Por lo tanto, dormir con la luz encendida provoca miopía.

Este es un ejemplo científico que resultó de un estudio en el Centro Médico de la Universidad de Pensilvania . Publicado en la edición del 13 de mayo de 1999 de Nature , [9] el estudio recibió mucha cobertura en ese momento en la prensa popular. [10] Sin embargo, un estudio posterior en la Universidad Estatal de Ohio no encontró que los bebés durmiendo con la luz encendida causaran el desarrollo de la miopía. Sí encontró un fuerte vínculo entre la miopía de los padres y el desarrollo de la miopía infantil, señalando también que los padres miopes eran más propensos a dejar una luz encendida en el dormitorio de sus hijos. [11] [12] [13] [14] En este caso, la causa de ambas afecciones es la miopía de los padres, y la conclusión mencionada anteriormente es falsa.

Ejemplo 3
A medida que aumentan las ventas de helados, la tasa de muertes por ahogamiento aumenta drásticamente.
Por lo tanto, el consumo de helado provoca ahogamiento.

Este ejemplo no reconoce la importancia de la época del año y la temperatura para las ventas de helado. El helado se vende durante los meses calurosos de verano a un ritmo mucho mayor que durante las épocas más frías, y es durante estos meses calurosos que la gente tiene más probabilidades de participar en actividades que impliquen agua, como nadar . El aumento de las muertes por ahogamiento se debe simplemente a una mayor exposición a actividades acuáticas, no al helado. La conclusión planteada es falsa.

Ejemplo 4
Un estudio hipotético muestra una relación entre las puntuaciones de ansiedad ante los exámenes y las puntuaciones de timidez, con un valor estadístico r (fuerza de correlación) de +0,59. [15]
Por lo tanto, se puede concluir simplemente que la timidez, en alguna medida, influye causalmente en la ansiedad ante los exámenes.

Sin embargo, como se ha observado en muchos estudios psicológicos, se ha descubierto que otra variable, una "puntuación de autoconciencia", tiene una correlación más marcada (+0,73) con la timidez. Esto sugiere un posible problema de "tercera variable", pero cuando se encuentran tres medidas tan estrechamente relacionadas, se sugiere además que cada una de ellas puede tener tendencias bidireccionales (véase "variable bidireccional", más arriba), siendo un conjunto de valores correlacionados que se influyen entre sí en cierta medida. Por lo tanto, la simple conclusión anterior puede ser falsa.

Ejemplo 5
Desde la década de 1950, tanto el nivel de CO2 atmosférico como los niveles de obesidad han aumentado drásticamente.
Por lo tanto, el CO2 atmosférico provoca obesidad.

Las poblaciones más ricas tienden a comer más alimentos y producir más CO 2 .

Ejemplo 6
El colesterol HDL ("bueno") está correlacionado negativamente con la incidencia de ataque cardíaco.
Por lo tanto, tomar medicamentos para aumentar el HDL disminuye la posibilidad de sufrir un ataque cardíaco.

Investigaciones posteriores [16] han puesto en tela de juicio esta conclusión. En cambio, es posible que otros factores subyacentes, como los genes, la dieta y el ejercicio, afecten tanto a los niveles de HDL como a la probabilidad de sufrir un ataque cardíaco; es posible que los medicamentos puedan afectar al factor directamente medible, los niveles de HDL, sin afectar la probabilidad de sufrir un ataque cardíaco.

Causalidad bidireccional: A causa B y B causa A

La causalidad no es necesariamente unidireccional; [ dudosodiscutir ] en una relación depredador-presa , el número de depredadores afecta al número de presas, pero el número de presas, es decir, el suministro de alimentos, también afecta al número de depredadores. Otro ejemplo bien conocido es que los ciclistas tienen un índice de masa corporal más bajo que las personas que no montan en bicicleta. Esto a menudo se explica asumiendo que montar en bicicleta aumenta los niveles de actividad física y, por lo tanto, reduce el IMC. Debido a que los resultados de estudios prospectivos sobre personas que aumentan su uso de la bicicleta muestran un efecto menor en el IMC que los estudios transversales, también puede haber cierta causalidad inversa. Por ejemplo, las personas con un IMC más bajo pueden ser más propensas a querer montar en bicicleta en primer lugar. [17]

La relación entre A y B es casualidad.

Las dos variables no están relacionadas en absoluto, sino que se correlacionan por casualidad. Cuanto más se examinen los datos, más probable será que dos variables no relacionadas parezcan estar relacionadas. Por ejemplo:

Uso de la correlación como evidencia científica

Gran parte de la evidencia científica se basa en una correlación de variables [18] que se observa que ocurren juntas. Los científicos tienen cuidado de señalar que la correlación no significa necesariamente causalidad. La suposición de que A causa B simplemente porque A se correlaciona con B no se acepta como una forma legítima de argumentación.

Sin embargo, a veces la gente comete la falacia opuesta de descartar la correlación por completo. Eso descartaría una gran franja de evidencia científica importante. [18] Dado que puede ser difícil o éticamente imposible realizar estudios controlados de doble ciego para abordar ciertas preguntas, la evidencia correlacional desde varios ángulos diferentes puede ser útil para la predicción a pesar de no proporcionar evidencia de causalidad . Por ejemplo, los trabajadores sociales podrían estar interesados ​​​​en saber cómo se relaciona el abuso infantil con el rendimiento académico. Aunque sería poco ético realizar un experimento en el que los niños son asignados aleatoriamente para recibir o no recibir abuso, los investigadores pueden observar grupos existentes utilizando un diseño correlacional no experimental. Si de hecho existe una correlación negativa entre el abuso y el rendimiento académico, los investigadores podrían potencialmente usar este conocimiento de una correlación estadística para hacer predicciones sobre los niños fuera del estudio que experimentan abuso a pesar de que el estudio no proporcionó evidencia causal de que el abuso disminuye el rendimiento académico. [19] La combinación de metodologías disponibles limitadas con la falacia de descartar la correlación se ha utilizado en ocasiones para contrarrestar un hallazgo científico. Por ejemplo, la industria tabacalera históricamente se ha basado en el rechazo de la evidencia correlacional para rechazar un vínculo entre el humo del tabaco y el cáncer de pulmón , [20] como lo hizo el biólogo y estadístico Ronald Fisher (con frecuencia en nombre de la industria). [lista 1]

La correlación es un tipo valioso de evidencia científica en campos como la medicina, la psicología y la sociología. Primero se debe confirmar que las correlaciones son reales y luego se debe explorar sistemáticamente cada posible relación causal. Al final, la correlación por sí sola no puede usarse como evidencia de una relación de causa y efecto entre un tratamiento y un beneficio, un factor de riesgo y una enfermedad, o un factor social o económico y diversos resultados. Es uno de los tipos de evidencia de los que más se abusa porque es fácil e incluso tentador llegar a conclusiones prematuras basándose en la apariencia preliminar de una correlación. [20]

Véase también

Referencias

  1. ^ Tufte 2006, pág. 5
  2. ^ Aldrich, John (1995). "Correlaciones genuinas y espurias en Pearson y Yule" (PDF) . Ciencia estadística . 10 (4): 364–376. doi : 10.1214/ss/1177009870 . JSTOR  2246135.
  3. ^ "Suficiente". Wolfram . 2019-12-02 . Consultado el 2019-12-03 .
  4. ^ Rohlfing, Ingo; Schneider, Carsten Q. (2018). "Un marco unificador para el análisis causal en la investigación multimétodo de teoría de conjuntos" (PDF) . Métodos sociológicos e investigación . 47 (1): 37–63. doi :10.1177/0049124115626170. S2CID  124804330 . Consultado el 29 de febrero de 2020 .
  5. ^ Brady, Henry E. (7 de julio de 2011). "Causación y explicación en las ciencias sociales". The Oxford Handbook of Political Science . doi :10.1093/oxfordhb/9780199604456.013.0049 . Consultado el 29 de febrero de 2020 .
  6. ^ Naveed Sattar; David Preiss (13 de junio de 2017). "Causalidad inversa en la investigación epidemiológica cardiovascular". Circulation . 135 (24): 2369–2372. doi : 10.1161/CIRCULATIONAHA.117.028307 . PMID  28606949.
  7. ^ Willingham, Emily. "De piojos y hombres: una historia que pica". Red de blogs de Scientific American . Consultado el 26 de febrero de 2019 .
  8. ^ ab Labossiere, MC, Páginas de filosofía del Dr. LaBossiere Archivado el 22 de mayo de 2009 en Wayback Machine
  9. ^ Quinn, Graham E.; Shin, Chai H.; Maguire, Maureen G.; Stone, Richard A. (mayo de 1999). "Miopía e iluminación ambiental nocturna". Nature . 399 (6732): 113–114. Bibcode :1999Natur.399..113Q. doi :10.1038/20094. PMID  10335839. S2CID  4419645.
  10. ^ CNN , 13 de mayo de 1999. La luz nocturna puede provocar miopía
  11. ^ Ohio State University Research News, 9 de marzo de 2000. Un estudio sugiere que las luces nocturnas no provocan miopía Archivado el 1 de septiembre de 2006 en Wayback Machine
  12. ^ Zadnik, Karla; Jones, Lisa A.; Irvin, Brett C.; Kleinstein, Robert N.; Manny, Ruth E.; Shin, Julie A.; Mutti, Donald O. (2000). "Visión: miopía e iluminación nocturna ambiental". Nature . 404 (6774): 143–144. Bibcode :2000Natur.404..143Z. doi :10.1038/35004661. PMID  10724157. S2CID  4399332.
  13. ^ Gwiazda, J.; Ong, E.; Held, R.; Thorn, F. (2000). "Visión: miopía e iluminación nocturna ambiental". Nature . 404 (6774): 144. Bibcode :2000Natur.404..144G. doi : 10.1038/35004663 . PMID  10724158.
  14. ^ Stone, Richard A.; Maguire, Maureen G.; Quinn, Graham E. (2000). "Visión: respuesta: miopía e iluminación nocturna ambiental". Nature . 404 (6774): 144. Bibcode :2000Natur.404..144S. doi : 10.1038/35004665 . PMID  10724158.
  15. ^ Carducci, Bernardo J. (2009). La psicología de la personalidad: puntos de vista, investigación y aplicaciones (2.ª ed.). John Wiley & Sons. ISBN 978-1-4051-3635-8.
  16. ^ Ornish, Dean. "Colesterol: lo bueno, lo malo y la verdad" [1] (consultado el 3 de junio de 2011)
  17. ^ Dons, E (2018). "Elección del modo de transporte e índice de masa corporal: evidencia transversal y longitudinal de un estudio a nivel europeo" (PDF) . Environment International . 119 (119): 109–116. doi :10.1016/j.envint.2018.06.023. hdl : 10044/1/61061 . PMID  29957352. S2CID  49607716.
  18. ^ ab Novella (18 de noviembre de 2009). "Evidencia en medicina: correlación y causalidad". Ciencia y medicina . Medicina basada en la ciencia.
  19. ^ Nielsen, Michael (23 de enero de 2012). "Si la correlación no implica causalidad, ¿qué la implica? | DDI". Michaelnielsen.org . Consultado el 8 de octubre de 2017 .
  20. ^ ab "Evidencia en Medicina: Correlación y Causalidad – Medicina Basada en la Ciencia". Sciencebasedmedicine.org. 2009-11-18 . Consultado el 2017-10-08 .
  21. ^ Silver, Nate (2015), La señal y el ruido: por qué tantas predicciones fallan, pero algunas no (2.ª ed.), Nueva York : Penguin Books , págs. 254-255
  22. ^ Fisher, Ronald (6 de julio de 1957), "Peligros de fumar cigarrillos", The British Medical Journal , 2 (5035), Londres : British Medical Association : 43, doi : 10.1136/bmj.2.5035.43, JSTOR  25383068, PMC 1961750 
  23. ^ Fisher, Ronald (3 de agosto de 1957), "Peligros de fumar cigarrillos", The British Medical Journal , 2 (5039), Londres : British Medical Association : 297–298, doi :10.1136/bmj.2.5039.297-b, JSTOR  25383439, PMC 1961712 
  24. ^ Fisher, Ronald (1958), "Cigarrillos, cáncer y estadísticas" (PDF) , The Centennial Review of Arts & Science , 2 , East Lansing, Michigan : Michigan State University Press : 151–166, archivado (PDF) desde el original el 2022-10-09
  25. ^ Fisher, Ronald (1958), "La naturaleza de la probabilidad" (PDF) , The Centennial Review of Arts & Science , 2 , East Lansing, Michigan : Michigan State University Press : 261–274, archivado (PDF) desde el original el 2022-10-09
  26. ^ Fisher, Ronald (12 de julio de 1958), "El cáncer de pulmón y los cigarrillos" (PDF) , Nature , 182 (4628), Londres : Nature Publishing Group : 108, Bibcode :1958Natur.182..108F, doi : 10.1038/182108a0 , PMID  13566198, archivado (PDF) desde el original el 2022-10-09
  27. ^ Fisher, Ronald (30 de agosto de 1958), "El cáncer y el tabaquismo" (PDF) , Nature , 182 (4635), Londres : Nature Publishing Group : 596, Bibcode :1958Natur.182..596F, doi : 10.1038/182596a0 , PMID  13577916, archivado (PDF) desde el original el 2022-10-09
Referencias agrupadas
  1. ^ [21] [22] [23] [24] [25] [26] [27]

Bibliografía