stringtranslate.com

Falacia ecológica

Una falacia ecológica (también falacia de inferencia ecológica [1] o falacia de población ) es una falacia formal en la interpretación de datos estadísticos que ocurre cuando se deducen inferencias sobre la naturaleza de los individuos a partir de inferencias sobre el grupo al que pertenecen esos individuos. "Falacia ecológica" es un término que a veces se utiliza para describir la falacia de división , que no es una falacia estadística. Las cuatro falacias ecológicas estadísticas comunes son: confusión entre correlaciones ecológicas y correlaciones individuales, confusión entre promedio de grupo y promedio total, paradoja de Simpson y confusión entre promedio más alto y mayor probabilidad. Desde un punto de vista estadístico, estas ideas se pueden unificar especificando modelos estadísticos adecuados para hacer inferencias formales, utilizando datos agregados para hacer relaciones no observadas en datos a nivel individual. [2]

Ejemplos

Media y mediana

Un ejemplo de falacia ecológica es la suposición de que la media de una población tiene una interpretación simple cuando se consideran las probabilidades de un individuo.

Por ejemplo, si la puntuación media de un grupo es mayor que cero, esto no implica que un individuo aleatorio de ese grupo tenga más probabilidades de tener una puntuación positiva que una negativa (siempre que haya más puntuaciones negativas que positivas, es más probable que un individuo tenga una puntuación negativa). De manera similar, si se mide que un grupo particular de personas tiene un CI medio más bajo que la población general, es un error concluir que un miembro del grupo seleccionado al azar tiene más probabilidades de tener un CI más bajo que el CI medio de la población general; tampoco es necesariamente el caso de que un miembro del grupo seleccionado al azar tenga más probabilidades de tener un CI más bajo que un miembro seleccionado al azar de la población general. Matemáticamente, esto se deriva del hecho de que una distribución puede tener una media positiva pero una mediana negativa. Esta propiedad está vinculada a la asimetría de la distribución.

Consideremos el siguiente ejemplo numérico:

Correlaciones individuales y agregadas

Las investigaciones que se remontan a Émile Durkheim sugieren que las localidades predominantemente protestantes tienen tasas de suicidio más altas que las localidades predominantemente católicas . [3] Según Freedman, [4] la idea de que los hallazgos de Durkheim vinculan, a nivel individual, la religión de una persona con su riesgo de suicidio es un ejemplo de la falacia ecológica. Una relación a nivel de grupo no caracteriza automáticamente la relación a nivel del individuo.

De manera similar, incluso si a nivel individual la riqueza está correlacionada positivamente con la tendencia a votar por los republicanos en los Estados Unidos , observamos que los estados más ricos tienden a votar por los demócratas . Por ejemplo, en las elecciones presidenciales de 2004 en los Estados Unidos , el candidato republicano, George W. Bush , ganó en los quince estados más pobres, y el candidato demócrata, John Kerry , ganó en 9 de los 11 estados más ricos en el Colegio Electoral . Sin embargo, el 62% de los votantes con ingresos anuales superiores a $200.000 votaron por Bush, pero solo el 36% de los votantes con ingresos anuales de $15.000 o menos votaron por Bush. [5] La correlación a nivel agregado diferirá de la correlación a nivel individual si las preferencias de voto se ven afectadas por la riqueza total del estado incluso después de controlar la riqueza individual. El verdadero factor determinante en la preferencia de voto podría ser la riqueza relativa autopercibida ; tal vez aquellos que se consideran a sí mismos en mejor situación que sus vecinos tengan más probabilidades de votar por los republicanos. En este caso, sería más probable que un individuo votara por un republicano si se volviera más rico, pero sería más probable que votara por un demócrata si la riqueza de su vecino aumentara (lo que daría como resultado un estado más rico).

Sin embargo, la diferencia observada en los hábitos de votación en función de la riqueza a nivel estatal e individual también podría explicarse por la confusión común entre promedios más altos y mayores probabilidades, como se mencionó anteriormente. Los estados pueden no ser más ricos porque contengan más personas ricas (es decir, más personas con ingresos anuales superiores a $200,000), sino más bien porque contienen un pequeño número de individuos súper ricos; la falacia ecológica resulta entonces de suponer incorrectamente que los individuos en los estados más ricos tienen más probabilidades de ser ricos.

Se pueden encontrar muchos ejemplos de falacias ecológicas en los estudios de redes sociales, que a menudo combinan análisis e implicaciones desde diferentes niveles. Esto se ha ilustrado en un artículo académico sobre redes de agricultores en Sumatra . [6]

La paradoja de Robinson

En un artículo de 1950, William S. Robinson calculó la tasa de analfabetismo y la proporción de la población nacida fuera de los EE. UU. para cada estado y para el Distrito de Columbia, a partir del censo de 1930. [7] Demostró que estas dos cifras estaban asociadas con una correlación negativa de −0,53; en otras palabras, cuanto mayor es la proporción de inmigrantes en un estado, menor es su analfabetismo promedio (o, equivalentemente, mayor es su alfabetización promedio). Sin embargo, cuando se consideran los individuos, la correlación entre el analfabetismo y la natividad fue de +0,12 (los inmigrantes eran en promedio más analfabetos que los ciudadanos nativos). Robinson demostró que la correlación negativa a nivel de las poblaciones estatales se debía a que los inmigrantes tendían a establecerse en estados donde la población nativa era más alfabetizada. Advirtió contra la deducción de conclusiones sobre los individuos sobre la base de datos a nivel de población o "ecológicos". En 2011, se descubrió que los cálculos de Robinson de las correlaciones ecológicas se basan en datos a nivel estatal erróneos. La correlación de -0,53 mencionada anteriormente es en realidad -0,46. [8] El artículo de Robinson fue fundamental, pero el término "falacia ecológica" no fue acuñado hasta 1958 por Selvin. [9]

Problema formal

La correlación de cantidades agregadas (o correlación ecológica ) no es igual a la correlación de cantidades individuales. Denotemos por X iY i dos cantidades a nivel individual. La fórmula para la covarianza de las cantidades agregadas en grupos de tamaño N es

La covarianza de dos variables agregadas depende no sólo de la covarianza de dos variables dentro de los mismos individuos, sino también de la covarianza de las variables entre diferentes individuos. En otras palabras, la correlación de variables agregadas tiene en cuenta efectos transversales que no son relevantes a nivel individual.

El problema de las correlaciones implica naturalmente un problema de regresiones sobre variables agregadas: la falacia de correlación es, por lo tanto, un problema importante para un investigador que desea medir los impactos causales. Comience con un modelo de regresión en el que el resultado se vea afectado por

El modelo de regresión a nivel agregado se obtiene sumando las ecuaciones individuales:

Nada impide que los regresores y los errores se correlacionen a nivel agregado. Por lo tanto, en general, ejecutar una regresión con datos agregados no estima el mismo modelo que ejecutar una regresión con datos individuales.

El modelo agregado es correcto si y sólo si

Esto significa que, controlando por , no se determina .

Elegir entre inferencia agregada e individual

No hay nada de malo en realizar regresiones sobre datos agregados si uno está interesado en el modelo agregado. Por ejemplo, para el gobernador de un estado, es correcto realizar regresiones entre la fuerza policial y la tasa de criminalidad a nivel estatal si uno está interesado en la implicación política de un aumento en la fuerza policial. Sin embargo, ocurriría una falacia ecológica si un ayuntamiento dedujera el impacto de un aumento en la fuerza policial en la tasa de criminalidad a nivel de ciudad a partir de la correlación a nivel estatal.

La elección de realizar regresiones individuales o agregadas para comprender los impactos agregados sobre alguna política depende de la siguiente disyuntiva: las regresiones agregadas pierden datos a nivel individual, pero las regresiones individuales añaden fuertes supuestos de modelado. Algunos investigadores sugieren que la correlación ecológica da una mejor idea del resultado de las acciones de política pública, por lo que recomiendan la correlación ecológica en lugar de la correlación a nivel individual para este propósito (Lubinski y Humphreys, 1996). Otros investigadores no están de acuerdo, especialmente cuando las relaciones entre los niveles no están claramente modeladas. Para evitar la falacia ecológica, los investigadores que no tienen datos individuales pueden modelar primero lo que está ocurriendo a nivel individual, luego modelar cómo se relacionan los niveles individual y grupal, y finalmente examinar si algo que ocurre a nivel grupal agrega a la comprensión de la relación. Por ejemplo, al evaluar el impacto de las políticas estatales, es útil saber que los impactos de las políticas varían menos entre los estados que las políticas mismas, lo que sugiere que las diferencias de políticas no se traducen bien en resultados, a pesar de las altas correlaciones ecológicas (Rose, 1973).

Promedios grupales y totales

La falacia ecológica también puede referirse a la siguiente falacia: el promedio de un grupo se aproxima al promedio de la población total dividido por el tamaño del grupo. Supongamos que se conoce el número de protestantes y la tasa de suicidios en los EE. UU., pero no se tienen datos que vinculen la religión y el suicidio a nivel individual. Si se está interesado en la tasa de suicidios de los protestantes, es un error estimarla mediante la tasa total de suicidios dividida por el número de protestantes. Formalmente, denotamos la media del grupo; generalmente tenemos:

Sin embargo, la ley de probabilidad total da

Como sabemos que está entre 0 y 1, esta ecuación da un límite para .

La paradoja de Simpson

Una falacia ecológica llamativa es la paradoja de Simpson : el hecho de que al comparar dos poblaciones divididas en grupos, el promedio de alguna variable en la primera población puede ser mayor en cada grupo y, sin embargo, menor en la población total. Formalmente, cuando cada valor de Z se refiere a un grupo diferente y X se refiere a algún tratamiento, puede suceder que

Cuando no depende de , la paradoja de Simpson es exactamente el sesgo de variable omitida para la regresión de Y sobre X donde el regresor es una variable ficticia y la variable omitida es una variable categórica que define grupos para cada valor que toma. La aplicación es sorprendente porque el sesgo es lo suficientemente alto como para que los parámetros tengan signos opuestos.

Aplicaciones legales

La falacia ecológica fue discutida en una impugnación judicial a las elecciones para gobernador de Washington de 2004 en las que se identificó a varios votantes ilegales, después de la elección; sus votos eran desconocidos, porque la votación fue por votación secreta . Los impugnadores argumentaron que los votos ilegales emitidos en la elección habrían seguido los patrones de votación de los distritos en los que se habían emitido, y por lo tanto se deberían hacer ajustes en consecuencia. [10] Un testigo experto dijo que este enfoque era como tratar de averiguar el promedio de bateo de Ichiro Suzuki mirando el promedio de bateo de todo el equipo de los Marineros de Seattle , ya que los votos ilegales fueron emitidos por una muestra no representativa de los votantes de cada distrito, y podrían ser tan diferentes del votante promedio en el distrito como Ichiro lo era del resto de su equipo. [11] El juez determinó que el argumento de los impugnadores era una falacia ecológica y lo rechazó. [12]

Véase también

Referencias

  1. ^ Charles Ess; Fay Sudweeks (2001). Cultura, tecnología, comunicación: hacia una aldea global intercultural . SUNY Press. pág. 90. ISBN 978-0-7914-5015-4El problema radica en la «falacia ecológica» (o falacia de división): el impulso a aplicar características de nivel grupal o social a individuos dentro de ese grupo .
  2. ^ King, Gary (1997). Una solución al problema de la inferencia ecológica. Princeton University Press. ISBN 978-0-691-01240-7.
  3. ^ Durkheim, (1951/1897). Suicidio: un estudio de sociología . Traducido por John A. Spaulding y George Simpson. Nueva York: The Free Press. ISBN 0-684-83632-7
  4. ^ Freedman, DA (1999). Inferencia ecológica y falacia ecológica. Enciclopedia internacional de ciencias sociales y del comportamiento , Informe técnico n.º 549. https://web.stanford.edu/class/ed260/freedman549.pdf
  5. ^ Gelman, Andrew ; Park, David; Shor, Boris; Bafumi, Joseph; Cortina, Jeronimo (2008). Estado rojo, estado azul, estado rico, estado pobre . Princeton University Press . ISBN 978-0-691-13927-2.
  6. ^ Matous, Petr (2015). "Redes sociales y gestión ambiental a múltiples niveles: conservación del suelo en Sumatra". Ecología y Sociedad . 20 (3): 37. doi : 10.5751/ES-07816-200337 . hdl : 10535/9990 .
  7. ^ Robinson, WS (1950). "Correlaciones ecológicas y el comportamiento de los individuos". American Sociological Review . 15 (3): 351–357. doi :10.2307/2087176. JSTOR  2087176.
  8. ^ La nota de investigación sobre este curioso error de datos se publicó en Te Grotenhuis, Manfred; Eisinga, Rob; Subramanian, SV (2011). "Correlaciones ecológicas de Robinson y el comportamiento de los individuos: correcciones metodológicas". Int J Epidemiol . 40 (4): 1123–1125. doi : 10.1093/ije/dyr081 . hdl : 2066/99678 . PMID  21596762.Los datos que utilizó Robinson y las correcciones están disponibles en http://www.ru.nl/mt/rob/downloads/ [ enlace muerto permanente ‍ ]
  9. ^ Selvin, Hanan C. (1958). " El suicidio de Durkheim y los problemas de la investigación empírica". Revista estadounidense de sociología . 63 (6): 607–619. doi :10.1086/222356. S2CID  143488519.
  10. ^ George Howland Jr. (18 de mayo de 2005). "El juicio de Monkey Wrench: el desafío de Dino Rossi a las elecciones de 2004 se encuentra en un terreno legal inestable. Pero si prevalece, el litigio se convertirá en una opción en las carreras reñidas en todas partes". Seattle Weekly . Archivado desde el original el 1 de diciembre de 2008. Consultado el 17 de diciembre de 2008 .
  11. ^ Christopher Adolph (12 de mayo de 2005). "Informe sobre las elecciones a gobernador de Washington de 2004". Informe de un testigo experto ante el Tribunal Superior del condado de Chelan en el caso Borders et al. contra King County et al.
  12. ^ Borders et al. v. King County et al. Archivado el 18 de octubre de 2008 en Wayback Machine , transcripción de la decisión del juez John Bridges del Tribunal Superior del condado de Chelan , 6 de junio de 2005, publicada: 8 de junio de 2005

Lectura adicional