stringtranslate.com

Falacia ecológica

Una falacia ecológica (también falacia de inferencia ecológica [1] o falacia poblacional ) es una falacia formal en la interpretación de datos estadísticos que ocurre cuando se deducen inferencias sobre la naturaleza de los individuos a partir de inferencias sobre el grupo al que pertenecen esos individuos. Desde el punto de vista conceptual de la mereología , cuatro falacias ecológicas comunes son:

Desde un punto de vista estadístico, estas ideas pueden unificarse especificando modelos estadísticos adecuados para hacer inferencias formales, utilizando datos agregados para establecer relaciones no observadas en datos a nivel individual. [2]

Ejemplos

Media y mediana

Un ejemplo de falacia ecológica es la suposición de que la media poblacional tiene una interpretación simple al considerar las probabilidades de un individuo.

Por ejemplo, si la puntuación media de un grupo es mayor que cero, esto no implica que un individuo aleatorio de ese grupo tenga más probabilidades de tener una puntuación positiva que una negativa (siempre que haya más puntuaciones negativas que positivas). un individuo tiene más probabilidades de obtener una puntuación negativa). De manera similar, si se mide que un grupo particular de personas tiene un CI medio más bajo que la población general, es un error concluir que es más probable que un miembro del grupo seleccionado al azar tenga un CI más bajo que el CI medio. de la población general; Tampoco es necesariamente cierto que un miembro del grupo seleccionado al azar tenga más probabilidades que no tener un coeficiente intelectual más bajo que un miembro de la población general seleccionado al azar. Matemáticamente, esto se debe al hecho de que una distribución puede tener una media positiva pero una mediana negativa. Esta propiedad está ligada a la asimetría de la distribución.

Considere el siguiente ejemplo numérico:

Correlaciones individuales y agregadas

Una investigación que se remonta a Émile Durkheim sugiere que las localidades predominantemente protestantes tienen tasas de suicidio más altas que las localidades predominantemente católicas . [3] Según Freedman, [4] la idea de que los hallazgos de Durkheim vinculan, a nivel individual, la religión de una persona con su riesgo de suicidio es un ejemplo de falacia ecológica. Una relación a nivel de grupo no caracteriza automáticamente la relación a nivel individual.

De manera similar, incluso si a nivel individual la riqueza está correlacionada positivamente con la tendencia a votar por los republicanos en Estados Unidos , observamos que los estados más ricos tienden a votar por los demócratas . Por ejemplo, en las elecciones presidenciales de Estados Unidos de 2004 , el candidato republicano, George W. Bush , ganó en los quince estados más pobres, y el candidato demócrata, John Kerry , ganó en 9 de los 11 estados más ricos en el Colegio Electoral . Sin embargo, el 62% de los votantes con ingresos anuales superiores a 200.000 dólares votaron por Bush, pero sólo el 36% de los votantes con ingresos anuales de 15.000 dólares o menos votaron por Bush. [5] La correlación a nivel agregado diferirá de la correlación a nivel individual si las preferencias de voto se ven afectadas por la riqueza total del estado incluso después de controlar la riqueza individual. El verdadero factor determinante de la preferencia de voto podría ser la riqueza relativa autopercibida ; tal vez aquellos que se consideran mejor que sus vecinos tengan más probabilidades de votar por los republicanos. En este caso, sería más probable que un individuo votara por los republicanos si se volviera más rico, pero sería más probable que votara por un demócrata si la riqueza de su vecino aumentara (lo que resultaría en un estado más rico).

Sin embargo, la diferencia observada en los hábitos de voto basados ​​en la riqueza a nivel estatal e individual también podría explicarse por la confusión común entre promedios más altos y probabilidades más altas, como se discutió anteriormente. Los estados pueden no ser más ricos porque contengan más gente rica (es decir, más personas con ingresos anuales superiores a 200.000 dólares), sino más bien porque contengan un pequeño número de personas súper ricas; la falacia ecológica resulta entonces de asumir incorrectamente que los individuos en los estados más ricos tienen más probabilidades de ser ricos.

Se pueden encontrar muchos ejemplos de falacias ecológicas en los estudios de redes sociales, que a menudo combinan análisis e implicaciones desde diferentes niveles. Esto ha quedado ilustrado en un artículo académico sobre redes de agricultores en Sumatra . [6]

La paradoja de Robinson

Un artículo de 1950 de William S. Robinson calculó la tasa de analfabetismo y la proporción de la población nacida fuera de los EE. UU. para cada estado y para el Distrito de Columbia, según el censo de 1930 . [7] Mostró que estas dos cifras estaban asociadas con una correlación negativa de −0,53; en otras palabras, cuanto mayor es la proporción de inmigrantes en un estado, menor es su analfabetismo promedio (o, de manera equivalente, mayor es su alfabetismo promedio). Sin embargo, cuando se consideran los individuos, la correlación entre analfabetismo y natividad fue de +0,12 (los inmigrantes eran en promedio más analfabetos que los ciudadanos nativos). Robinson demostró que la correlación negativa a nivel de población estatal se debía a que los inmigrantes tendían a establecerse en estados donde la población nativa estaba más alfabetizada. Advirtió contra la deducción de conclusiones sobre los individuos basándose en datos a nivel de población o "ecológicos". En 2011, se descubrió que los cálculos de Robinson de las correlaciones ecológicas se basan en datos incorrectos a nivel estatal. La correlación de −0,53 mencionada anteriormente es de hecho −0,46. [8] El artículo de Robinson fue fundamental, pero el término "falacia ecológica" no fue acuñado hasta 1958 por Selvin. [9]

problema formal

La correlación de cantidades agregadas (o correlación ecológica ) no es igual a la correlación de cantidades individuales. Denota por X iY i dos cantidades a nivel individual. La fórmula para la covarianza de las cantidades agregadas en grupos de tamaño N es

La covarianza de dos variables agregadas depende no sólo de la covarianza de dos variables dentro de los mismos individuos sino también de las covarianzas de las variables entre diferentes individuos. En otras palabras, la correlación de variables agregadas tiene en cuenta efectos transversales que no son relevantes a nivel individual.

El problema de las correlaciones implica naturalmente un problema de regresiones sobre variables agregadas: la falacia de la correlación es, por lo tanto, una cuestión importante para un investigador que quiera medir los impactos causales. Comience con un modelo de regresión donde el resultado se ve afectado por

El modelo de regresión a nivel agregado se obtiene sumando las ecuaciones individuales:

Nada impide que los regresores y los errores estén correlacionados a nivel agregado. Por lo tanto, generalmente, ejecutar una regresión con datos agregados no estima el mismo modelo que ejecutar una regresión con datos individuales.

El modelo agregado es correcto si y sólo si

Esto significa que controlar por , no determina .

Elegir entre inferencia agregada e individual

No hay nada de malo en ejecutar regresiones sobre datos agregados si uno está interesado en el modelo agregado. Por ejemplo, para el gobernador de un estado, es correcto realizar regresiones entre la fuerza policial y la tasa de criminalidad a nivel estatal si uno está interesado en las implicaciones políticas de un aumento en la fuerza policial. Sin embargo, se produciría una falacia ecológica si un ayuntamiento dedujera el impacto de un aumento de la fuerza policial en la tasa de criminalidad a nivel de ciudad de la correlación a nivel estatal.

La elección de ejecutar regresiones agregadas o individuales para comprender los impactos agregados sobre alguna política depende de la siguiente compensación: las regresiones agregadas pierden datos a nivel individual, pero las regresiones individuales agregan supuestos de modelización sólidos. Algunos investigadores sugieren que la correlación ecológica da una mejor imagen del resultado de las acciones de política pública, por lo que recomiendan la correlación ecológica sobre la correlación a nivel individual para este propósito (Lubinski y Humphreys, 1996). Otros investigadores no están de acuerdo, especialmente cuando las relaciones entre los niveles no están claramente modeladas. Para evitar la falacia ecológica, los investigadores que no cuentan con datos individuales pueden modelar primero lo que ocurre a nivel individual, luego modelar cómo se relacionan los niveles individual y grupal, y finalmente examinar si algo que ocurra a nivel grupal contribuye a la comprensión de la relación. Por ejemplo, al evaluar el impacto de las políticas estatales, es útil saber que los impactos de las políticas varían menos entre los estados que las políticas mismas, lo que sugiere que las diferencias de políticas no se traducen bien en resultados, a pesar de las altas correlaciones ecológicas (Rose, 1973). ).

Promedios grupales y totales

La falacia ecológica también puede referirse a la siguiente falacia: el promedio de un grupo se aproxima al promedio de la población total dividido por el tamaño del grupo. Supongamos que conocemos el número de protestantes y la tasa de suicidio en Estados Unidos, pero no tenemos datos que vinculen la religión y el suicidio a nivel individual. Si uno está interesado en la tasa de suicidio de los protestantes, es un error estimarla dividiendo la tasa total de suicidios por el número de protestantes. Formalmente, denotamos la media del grupo, generalmente tenemos:

Sin embargo, la ley de probabilidad total da

Como sabemos que está entre 0 y 1, esta ecuación da un límite para .

La paradoja de Simpson

Una falacia ecológica sorprendente es la paradoja de Simpson : el hecho de que al comparar dos poblaciones divididas en grupos, el promedio de alguna variable en la primera población puede ser mayor en cada grupo y aún menor en la población total. Formalmente, cuando cada valor de Z se refiere a un grupo diferente y X se refiere a algún tratamiento, puede suceder que

Cuando no depende de , la paradoja de Simpson es exactamente el sesgo de la variable omitida para la regresión de Y sobre X donde el regresor es una variable ficticia y la variable omitida es una variable categórica que define grupos para cada valor que toma. La aplicación es sorprendente porque el sesgo es lo suficientemente alto como para que los parámetros tengan signos opuestos.

Aplicaciones legales

La falacia ecológica se discutió en una impugnación judicial de las elecciones para gobernador de Washington de 2004 en la que se identificó a varios votantes ilegales, después de las elecciones; se desconocían sus votos, porque la votación fue secreta . Los impugnantes argumentaron que los votos ilegales emitidos en las elecciones habrían seguido los patrones de votación de los distritos electorales en los que se habían emitido y, por lo tanto, se deberían hacer los ajustes correspondientes. [10] Un testigo experto dijo que este enfoque era como tratar de calcular el promedio de bateo de Ichiro Suzuki observando el promedio de bateo de todo el equipo de los Marineros de Seattle , ya que los votos ilegales fueron emitidos por una muestra no representativa de los votantes de cada distrito electoral, y podría ser tan diferente del votante promedio en el distrito como Ichiro lo era del resto de su equipo. [11] El juez determinó que el argumento de los impugnantes era una falacia ecológica y lo rechazó. [12]

Ver también

Referencias

  1. ^ Carlos Ess; Fay Sudweeks (2001). Cultura, tecnología, comunicación: hacia una aldea global intercultural . Prensa SUNY. pag. 90.ISBN​ 978-0-7914-5015-4. El problema reside en la "falacia ecológica" (o falacia de la división): el impulso de aplicar características de grupo o de nivel social a los individuos dentro de ese grupo.
  2. ^ Rey, Gary (1997). Una solución al problema de la inferencia ecológica. Prensa de la Universidad de Princeton. ISBN 978-0-691-01240-7.{{cite book}}: Mantenimiento CS1: fecha y año ( enlace )
  3. ^ Durkheim, (1951/1897). Suicidio: un estudio de sociología . Traducido por John A. Spaulding y George Simpson. Nueva York: The Free Press. ISBN 0-684-83632-7
  4. ^ Freedman, DA (1999). Inferencia ecológica y falacia ecológica. Enciclopedia Internacional de Ciencias Sociales y del Comportamiento , Informe Técnico No. 549. https://web.stanford.edu/class/ed260/freedman549.pdf
  5. ^ Gelman, Andrés ; Parque, David; Corto, Boris; Bafumi, José; Cortina, Jerónimo (2008). Estado rojo, Estado azul, Estado rico, Estado pobre . Prensa de la Universidad de Princeton . ISBN 978-0-691-13927-2.
  6. ^ Matous, Petr (2015). "Redes sociales y gestión ambiental en múltiples niveles: conservación del suelo en Sumatra". Ecología y Sociedad . 20 (3): 37. doi : 10.5751/ES-07816-200337 . hdl : 10535/9990 .
  7. ^ Robinson, WS (1950). "Correlaciones ecologicas y el comportamiento individual". Revista sociológica estadounidense . 15 (3): 351–357. doi :10.2307/2087176. JSTOR  2087176.
  8. ^ La nota de investigación sobre este curioso error de datos se publica en Te Grotenhuis, Manfred; Eisinga, Rob; Subramanian, SV (2011). "Las correlaciones ecológicas de Robinson y el comportamiento de los individuos: correcciones metodológicas". Int J Epidemiol . 40 (4): 1123-1125. doi : 10.1093/ije/dyr081 . hdl : 2066/99678 . PMID  21596762.Los datos que utilizó Robinson y las correcciones están disponibles en http://www.ru.nl/mt/rob/downloads/
  9. ^ Selvin, Hanan C. (1958). " El suicidio de Durkheim y los problemas de la investigación empírica". Revista Estadounidense de Sociología . 63 (6): 607–619. doi :10.1086/222356. S2CID  143488519.
  10. ^ George Howland Jr. (18 de mayo de 2005). "El juicio de la llave inglesa: el desafío de Dino Rossi a las elecciones de 2004 se encuentra en un terreno legal inestable. Pero si prevalece, observe cómo el litigio se convierte en una opción en contiendas reñidas en todas partes". Seattle semanal . Archivado desde el original el 1 de diciembre de 2008 . Consultado el 17 de diciembre de 2008 .
  11. ^ Christopher Adolph (12 de mayo de 2005). "Informe sobre las elecciones para gobernador de Washington de 2004". Informe de perito ante el Tribunal Superior del condado de Chelan en Borders et al v. King County et al.
  12. ^ Fronteras y otros. contra el condado de King y otros. Archivado el 18 de octubre de 2008 en Wayback Machine , transcripción de la decisión del juez del Tribunal Superior del condado de Chelan, John Bridges, 6 de junio de 2005, publicado: 8 de junio de 2005.

Otras lecturas