En probabilidad y estadística, la paradoja de Simpson o efecto Yule-Simpson es una paradoja en la cual una tendencia que aparece en varios grupos de datos desaparece cuando estos grupos se combinan y en su lugar aparece la tendencia contraria para los datos agregados.[3][4] Muchos estadísticos creen que se debería informar al público sobre resultados contrarios a la intuición como la paradoja de Simpson.[5][6] El fenómeno fue descrito por vez primera por Edward H. Simpson en un artículo técnico de 1951,[7] pero ya había sido descrito previamente por Karl Pearson, et al., en 1899,[8] y por Udny Yule en 1903[9] El nombre paradoja de Simpson fue usado por vez primera por Colin R. Blyth en 1972.La siguiente tabla muestra para este caso ficticio, igual que en el ejemplo real, los porcentajes de éxito y la cantidad de tratamientos que involucran al problema tipo "1" y al problema tipo "2": En este caso está claro que el estudio no tiene validez por lo extremo de las muestras, pero la paradoja subyacente se conserva: el tratamiento A es mejor en ambos tipos de problema, pero el tratamiento B es mejor en el conjunto.Se hace asimismo más evidente dónde está el riesgo, al haberse explotado en el ejemplo: el hecho de que las muestras estadísticas sean tan dicotómicas entre tipos de problema, provoca la aparente contradicción.