The Book of Why: The New Science of Cause and Effect es un libro de no ficción de 2018 escrito por la científica informática Judea Pearl y la escritora Dana Mackenzie. El libro explora el tema de la causalidad y la inferencia causal desde puntos de vista estadísticos y filosóficos para un público general.
El libro consta de diez capítulos y una introducción.
La introducción describe la inadecuación de los métodos estadísticos de principios del siglo XX para realizar afirmaciones sobre relaciones causales entre variables. A continuación, los autores describen lo que denominan "la revolución causal", que comenzó a mediados del siglo XX y proporcionó nuevas herramientas conceptuales y matemáticas para describir las relaciones causales.
El capítulo 1 presenta la "escalera de causalidad", un diagrama que se utiliza para ilustrar los tres niveles del razonamiento causal. El primer nivel se denomina "asociación" y analiza las asociaciones entre variables. Preguntas como "¿está la variable X asociada con la variable Y?" pueden responderse en este nivel. Sin embargo, es crucial que no se invoque la causalidad. Un ejemplo de razonamiento en este primer nivel es la observación de que un gallo que canta está asociado con el amanecer. Sin embargo, este tipo de razonamiento no puede describir relaciones causales. Por ejemplo, no podemos decir si el amanecer hace que el gallo cante o si el gallo hace que salga el sol. Muchas de las herramientas estadísticas de principios del siglo XX, como la correlación y la regresión, operan en este nivel.
El segundo nivel (o "peldaño") de la escala de causalidad se denomina "Intervención". El razonamiento en este nivel responde a preguntas del tipo "si realizo la intervención X, ¿cómo afectará esto a la probabilidad del resultado Y?". Por ejemplo, la pregunta "¿Fumar aumenta mi probabilidad de cáncer de pulmón?" existe en el segundo nivel de la escala de causalidad. Este tipo de razonamiento invoca la causalidad y puede utilizarse para investigar más preguntas que el razonamiento del primer peldaño.
El tercer peldaño de la escalera de la causalidad se denomina “contrafácticos” y consiste en responder a preguntas que indagan qué podría haber sido si las circunstancias hubieran sido diferentes. Este tipo de razonamiento invoca la causalidad en mayor medida que el nivel anterior. Un ejemplo de pregunta contrafáctica que se da en el libro es “¿Estaría vivo Kennedy si Oswald no lo hubiera matado?”.
El capítulo 2 comienza con un breve resumen de las contribuciones de Francis Galton y Karl Pearson al desarrollo de la estadística a finales del siglo XIX y principios del XX. Los autores culpan a Galton de mantener el estudio de la estadística en el primer peldaño de la escalera de la causalidad y de desalentar cualquier discusión sobre la causalidad en la estadística. A continuación, se introduce el análisis causal mediante diagramas de trayectorias a través de las explicaciones del trabajo de Sewall Wright .
El capítulo 3 presenta una introducción al teorema de Bayes . Luego se presentan las redes bayesianas . Por último, se analizan los vínculos entre las redes bayesianas y los diagramas causales.
En este capítulo se presenta la idea de los factores de confusión y se describe cómo se pueden utilizar los diagramas causales para identificar las variables de confusión y determinar su efecto. Pearl explica que los ensayos controlados aleatorizados (ECA) se pueden utilizar para anular el efecto de los factores de confusión, pero demuestra que, siempre que se cuente con un modelo causal de los factores de confusión, no es necesario realizar necesariamente un ECA para obtener resultados.
En este capítulo se aborda desde un punto de vista histórico la cuestión de si fumar causa cáncer de pulmón, centrándose en los argumentos de Abraham Lilienfeld , Jacob Yerushalmy, Ronald Fisher y Jerome Cornfield . Los autores explican que, aunque el tabaquismo estaba claramente relacionado con el cáncer de pulmón, algunos, como Fisher y Yerushalmy, creían que las dos variables estaban confundidas y argumentaban en contra de la hipótesis de que los cigarrillos causaban el cáncer. A continuación, los autores explican cómo se puede utilizar el razonamiento causal (tal como se desarrolla en el resto del libro) para argumentar que los cigarrillos efectivamente causan cáncer.
En este capítulo se examinan varias paradojas, entre ellas el problema de Monty Hall , la paradoja de Simpson , la paradoja de Berkson y la paradoja de Lord . Los autores muestran cómo se pueden resolver estas paradojas mediante el razonamiento causal.
En este capítulo se examina el "segundo peldaño" de la escalera de causalidad introducida en el capítulo 1. Los autores describen cómo utilizar diagramas causales para determinar el efecto causal de la realización de intervenciones (por ejemplo, el tabaquismo) sobre los resultados (como el cáncer de pulmón). Se presentan el "criterio de la puerta de entrada" y el "cálculo de la acción" como herramientas para hacerlo. El capítulo termina con dos ejemplos, utilizados para presentar el uso de variables instrumentales para estimar relaciones causales. El primero es el descubrimiento de John Snow de que el cólera es causado por suministros de agua insalubres. El segundo es la relación entre los niveles de colesterol y la probabilidad de un ataque cardíaco.
En este capítulo se examina el tercer peldaño de la escalera de la causalidad: los contrafácticos. Se presentan los "modelos causales estructurales", que permiten razonar sobre los contrafácticos de una manera que las estadísticas tradicionales (no causales) no permiten. A continuación, se exploran las aplicaciones del razonamiento contrafáctico en las áreas de la ciencia climática y el derecho.
En este capítulo se analiza la mediación: el mecanismo por el cual una causa conduce a un efecto. Los autores analizan el trabajo de Barbara Stoddard Burks sobre las causas de la inteligencia de los niños, la política de "álgebra para todos" de las escuelas públicas de Chicago y el uso de torniquetes para tratar heridas de combate.
El capítulo final analiza el uso del razonamiento causal en big data e inteligencia artificial (IA) y el problema filosófico de que la IA tendría que reflexionar sobre sus propias acciones, lo que requiere un razonamiento contrafáctico (y, por tanto, causal).
En la página web de Judea Pearl se ofrece información científica, extractos, erratas y una lista de 37 reseñas de El libro del por qué . [1]
Jonathan Knee hizo una reseña de The Book of Why en The New York Times . La reseña fue positiva y Knee calificó el libro como "esclarecedor". Sin embargo, describe algunas partes del libro como "desafiantes" y afirma que el libro "no siempre es completamente accesible para los lectores que no comparten la afición del autor por las ecuaciones". [2]
Tim Maudlin le dio al libro una crítica mixta en The Boston Review , calificándolo de "espléndida descripción general del estado del arte en el análisis causal". Sin embargo, Maudlin critica la inclusión de "contrafácticos" como un peldaño separado en la "escalera de la causalidad", afirmando que "los contrafácticos están tan estrechamente entrelazados con las afirmaciones causales que no es posible pensar causalmente pero no contrafácticamente". Maudlin también critica la sección sobre el libre albedrío por su "imprecisión y falta de familiaridad con la literatura filosófica". Finalmente, señala el trabajo de varios científicos (incluido Clark Glymour ) que desarrollaron ideas similares a Pearl, y afirma que Pearl "podría haberse ahorrado literalmente años de esfuerzo si hubiera estado al tanto de este trabajo". [3] En una refutación, Pearl señala que en ese momento, estaba íntimamente familiarizado con este trabajo.
Zoe Hackett, escribiendo en Chemistry World , le dio a The Book of Why una reseña positiva, con la salvedad de que "requiere concentración y un esfuerzo estudioso para resolver los complejos problemas estadísticos planteados en el texto". La reseña concluye afirmando que "[e]ste libro es imprescindible para cualquier estudiante serio de filosofía de la ciencia, y debería ser lectura obligatoria para cualquier clase de estadística de primer año de pregrado". [4]
Lisa R. Goldberg escribió una revisión técnica detallada en Notices of the American Mathematical Society . [5]