El problema de la unidad de área modificable ( MAUP ) es una fuente de sesgo estadístico que puede afectar significativamente los resultados de las pruebas de hipótesis estadísticas . El MAUP afecta los resultados cuando las medidas basadas en puntos de fenómenos espaciales se agregan en particiones espaciales o unidades de área (como regiones o distritos ), como en, por ejemplo, la densidad de población o las tasas de enfermedades . [1] [2] Los valores de resumen resultantes (por ejemplo, totales, tasas, proporciones, densidades) están influenciados tanto por la forma como por la escala de la unidad de agregación. [3]
Por ejemplo, los datos del censo pueden agruparse en distritos de condado, áreas censales, áreas de código postal, comisarías de policía o cualquier otra partición espacial arbitraria. Por lo tanto, los resultados de la agrupación de datos dependen de la elección del cartógrafo de qué "unidad de área modificable" utilizar en su análisis. Un mapa coroplético censal que calcule la densidad de población utilizando los límites estatales arrojará resultados radicalmente diferentes a los de un mapa que calcule la densidad basándose en los límites de los condados. Además, los límites de los distritos censales también están sujetos a cambios con el tiempo, [4] lo que significa que se debe tener en cuenta la MAUP al comparar los datos pasados con los datos actuales.
El problema fue reconocido por primera vez por Gehlke y Biehl en 1934 [5] y luego descrito en detalle en una entrada en la serie Conceptos y técnicas en geografía moderna (CATMOG) de Stan Openshaw (1984) y en el libro de Giuseppe Arbia (1988). En particular, Openshaw (1984) observó que "las unidades de área (objetos zonales) utilizadas en muchos estudios geográficos son arbitrarias, modificables y sujetas a los caprichos y fantasías de quien esté haciendo, o haya hecho, la agregación". [6] El problema es especialmente evidente cuando los datos agregados se utilizan para el análisis de conglomerados para la epidemiología espacial , las estadísticas espaciales o el mapeo coroplético , en los que se pueden hacer fácilmente malas interpretaciones sin darse cuenta. Muchos campos de la ciencia, especialmente la geografía humana, son propensos a ignorar la MAUP al extraer inferencias de las estadísticas basadas en datos agregados. [2] La MAUP está estrechamente relacionada con el tema de la falacia ecológica y el sesgo ecológico (Arbia, 1988). El trabajo de Stan Openshaw sobre este tema llevó a Michael F. Goodchild a sugerir que se lo denomine el "efecto Openshaw". [7]
El sesgo ecológico causado por el MAUP se ha documentado como dos efectos separados que suelen ocurrir simultáneamente durante el análisis de datos agregados. En primer lugar, el efecto de escala causa variación en los resultados estadísticos entre diferentes niveles de agregación (distancia radial). Por lo tanto, la asociación entre variables depende del tamaño de las unidades de área para las que se informan los datos. En general, la correlación aumenta a medida que aumenta el tamaño de la unidad de área. El efecto de zonificación describe la variación en las estadísticas de correlación causada por la reagrupación de datos en diferentes configuraciones a la misma escala (forma de área). [8]
Desde la década de 1930, la investigación ha encontrado una variación adicional en los resultados estadísticos debido a la MAUP. Los métodos estándar para calcular la varianza dentro de los grupos y entre grupos no tienen en cuenta la varianza adicional observada en los estudios MAUP a medida que cambian las agrupaciones. La MAUP se puede utilizar como metodología para calcular los límites superior e inferior, así como los parámetros de regresión promedio para múltiples conjuntos de agrupaciones espaciales. La MAUP es una fuente crítica de error en los estudios espaciales, ya sean observacionales o experimentales. Como tal, la consistencia de las unidades, particularmente en un contexto de corte transversal de series temporales (TSCS), es esencial. Además, se deben realizar de manera rutinaria controles de robustez de la sensibilidad de las unidades a la agregación espacial alternativa para mitigar los sesgos asociados en las estimaciones estadísticas resultantes.
En la literatura se han hecho varias sugerencias para reducir el sesgo de agregación durante el análisis de regresión . Un investigador podría corregir la matriz de varianza-covarianza utilizando muestras de datos a nivel individual. [9] Alternativamente, uno podría centrarse en la regresión espacial local en lugar de la regresión global. Un investigador también podría intentar diseñar unidades de área para maximizar un resultado estadístico particular. [6] Otros han argumentado que puede ser difícil construir un solo conjunto de unidades de agregación óptimas para múltiples variables, cada una de las cuales puede exhibir no estacionariedad y autocorrelación espacial a través del espacio de diferentes maneras. Otros han sugerido desarrollar estadísticas que cambien a través de escalas de una manera predecible, tal vez usando la dimensión fractal como una medida independiente de la escala de las relaciones espaciales. Otros han sugerido modelos jerárquicos bayesianos como una metodología general para combinar datos agregados y a nivel individual para la inferencia ecológica.
Los estudios de la MAUP basados en datos empíricos sólo pueden proporcionar una visión limitada debido a la incapacidad de controlar las relaciones entre múltiples variables espaciales. La simulación de datos es necesaria para tener control sobre varias propiedades de los datos a nivel individual. Los estudios de simulación han demostrado que el soporte espacial de las variables puede afectar la magnitud del sesgo ecológico causado por la agregación de datos espaciales. [10]
Utilizando simulaciones para datos univariados, Larsen abogó por el uso de una razón de varianza para investigar el efecto de la configuración espacial, la asociación espacial y la agregación de datos. [11] Reynolds presenta una descripción detallada de la variación de las estadísticas debido a MAUP, quien demuestra la importancia de la disposición espacial y la autocorrelación espacial de los valores de los datos. [12] Swift amplió los experimentos de simulación de Reynolds, quien en una serie de nueve ejercicios comenzó con análisis de regresión simulada y tendencia espacial, luego se centró en el tema de MAUP en el contexto de la epidemiología espacial. Se presenta un método de análisis de sensibilidad de MAUP que demuestra que MAUP no es completamente un problema. [10] MAUP se puede utilizar como una herramienta analítica para ayudar a comprender la heterogeneidad espacial y la autocorrelación espacial .
Este tema es de particular importancia porque en algunos casos la agregación de datos puede ocultar una fuerte correlación entre variables, haciendo que la relación parezca débil o incluso negativa. Por el contrario, la MAUP puede hacer que las variables aleatorias parezcan tener una asociación significativa cuando no la hay. Los parámetros de regresión multivariante son más sensibles a la MAUP que los coeficientes de correlación. Hasta que se descubra una solución más analítica para la MAUP, se recomienda el análisis de sensibilidad espacial utilizando una variedad de unidades de área como metodología para estimar la incertidumbre de los coeficientes de correlación y regresión debido al sesgo ecológico. Hay disponible un ejemplo de simulación y reagregación de datos utilizando la biblioteca ArcPy. [13] [14]
En la planificación del transporte, el MAUP se asocia con la Zonificación de Análisis de Tráfico (TAZ). Un punto de partida importante para comprender los problemas en el análisis del transporte es el reconocimiento de que el análisis espacial tiene algunas limitaciones asociadas con la discretización del espacio. Entre ellas, las unidades de área modificables y los problemas de límites están relacionados directa o indirectamente con la planificación y el análisis del transporte a través del diseño de zonas de análisis de tráfico : la mayoría de los estudios de transporte requieren directa o indirectamente la definición de TAZ. Los límites modificables y las cuestiones de escala deben recibir atención específica durante la especificación de una TAZ debido a los efectos que estos factores ejercen sobre las propiedades estadísticas y matemáticas de los patrones espaciales (es decir, el problema de la unidad de área modificable, MAUP). En los estudios de Viegas, Martínez y Silva (2009, 2009b) [14], los autores proponen un método donde los resultados obtenidos del estudio de datos espaciales no son independientes de la escala, y los efectos de agregación están implícitos en la elección de los límites zonales. La delineación de los límites zonales de las TAZ tiene un impacto directo en la realidad y la precisión de los resultados obtenidos a partir de los modelos de pronóstico del transporte. En este artículo se miden y analizan los efectos de la MAUP en la definición de la ZAT y en los modelos de demanda de transporte utilizando diferentes cuadrículas (en tamaño y en ubicación de origen). Este análisis se desarrolló mediante la construcción de una aplicación integrada en un software SIG comercial y mediante el uso de un estudio de caso (Área Metropolitana de Lisboa) para probar su implementabilidad y rendimiento. Los resultados revelan el conflicto entre la precisión estadística y geográfica, y su relación con la pérdida de información en el paso de asignación de tráfico de los modelos de planificación del transporte. [14]
Las investigaciones también han identificado el problema de la unidad de área modificable (MAUP, por sus siglas en inglés) como un factor en la acción y la gobernanza climáticas, al afectar la coordinación entre los actores nacionales y locales. Los problemas de escala de los datos asociados con el MAUP pueden generar desajustes en las prioridades climáticas y crear desigualdades en los resultados de la acción climática, lo que podría socavar la eficacia de las políticas diseñadas para abordar el cambio climático en diferentes niveles de gobernanza. [15]
{{cite journal}}
: Mantenimiento de CS1: código bibliográfico ( enlace )