Problema de unidad de área modificable

El problema de la unidad de área modificable ( MAUP ) es una fuente de sesgo estadístico que puede afectar significativamente los resultados de las pruebas de hipótesis estadísticas . MAUP afecta los resultados cuando las medidas puntuales de fenómenos espaciales se agregan en particiones espaciales o unidades de área (como regiones o distritos ) como, por ejemplo, en la densidad de población o las tasas de enfermedad . ^[1]^[2] Los valores resumidos resultantes (por ejemplo, totales, tasas, proporciones, densidades) están influenciados tanto por la forma como por la escala de la unidad de agregación. ^[3]

Por ejemplo, los datos del censo pueden agregarse en distritos de condado, sectores censales, áreas de códigos postales, distritos policiales o cualquier otra partición espacial arbitraria. Por lo tanto, los resultados de la agregación de datos dependen de la elección del cartógrafo de qué "unidad de área modificable" utilizar en su análisis. Un mapa de coropletas del censo que calcula la densidad de población utilizando los límites estatales producirá resultados radicalmente diferentes a los de un mapa que calcula la densidad basándose en los límites del condado. Además, los límites de los distritos censales también están sujetos a cambios con el tiempo, ^[4] lo que significa que se debe considerar el MAUP al comparar datos pasados con datos actuales.

Fondo

La cuestión fue reconocida por primera vez por Gehlke y Biehl en 1934 ^[5] y posteriormente descrita en detalle en una entrada de la serie Conceptos y técnicas en geografía moderna (CATMOG) de Stan Openshaw (1984) y en el libro de Giuseppe Arbia (1988). . En particular, Openshaw (1984) observó que "las unidades de área (objetos zonales) utilizadas en muchos estudios geográficos son arbitrarias, modificables y sujetas a los caprichos y fantasías de quien esté haciendo o haya hecho la agregación". ^[6] El problema es especialmente evidente cuando los datos agregados se utilizan para análisis de conglomerados para epidemiología espacial , estadísticas espaciales o mapeo de coropletas , en los que fácilmente se pueden hacer malas interpretaciones sin darnos cuenta. Muchos campos de la ciencia, especialmente la geografía humana, tienden a ignorar el MAUP al sacar inferencias de estadísticas basadas en datos agregados. ^[2] MAUP está estrechamente relacionado con el tema de la falacia ecológica y el sesgo ecológico (Arbia, 1988). El trabajo de Stan Openshaw sobre este tema ha llevado a Michael F. Goodchild a sugerir que se lo denomine "efecto Openshaw". ^[7]

El sesgo ecológico causado por MAUP se ha documentado como dos efectos separados que generalmente ocurren simultáneamente durante el análisis de datos agregados. Primero, el efecto de escala provoca variación en los resultados estadísticos entre diferentes niveles de agregación (distancia radial). Por lo tanto, la asociación entre variables depende del tamaño de las unidades de área para las cuales se reportan los datos. Generalmente, la correlación aumenta a medida que aumenta el tamaño de la unidad de área. El efecto de zonificación describe la variación en las estadísticas de correlación causada por la reagrupación de datos en diferentes configuraciones en la misma escala (forma de área). ^[8]

Desde la década de 1930, las investigaciones han encontrado una variación adicional en los resultados estadísticos gracias al MAUP. Los métodos estándar para calcular la varianza dentro del grupo y entre grupos no tienen en cuenta la varianza adicional observada en los estudios MAUP a medida que cambian las agrupaciones. MAUP se puede utilizar como metodología para calcular los límites superior e inferior, así como los parámetros de regresión promedio para múltiples conjuntos de agrupaciones espaciales. El MAUP es una fuente crítica de error en estudios espaciales, ya sean observacionales o experimentales. Como tal, la coherencia de las unidades, particularmente en un contexto transversal de series temporales (TSCS), es esencial. Además, se deben realizar periódicamente comprobaciones de solidez de la sensibilidad de las unidades a la agregación espacial alternativa para mitigar los sesgos asociados en las estimaciones estadísticas resultantes.

Un mapa de mano con diferentes patrones espaciales. Nota: p es la probabilidad de q -estadístico; * denota significancia estadística en el nivel 0.05, ** para 0.001, *** para menores de 10 ⁻³ ;(D) los subíndices 1, 2, 3 de q y p denotan los estratos Z1+Z2 con Z3,Z1 con Z2+Z3 , y Z1 y Z2 y Z3 individualmente, respectivamente; (E) los subíndices 1 y 2 de q y p denotan los estratos Z1+Z2 con Z3+Z4 y Z1+Z3 con Z2+Z4, respectivamente.

Las soluciones sugeridas

Se han hecho varias sugerencias en la literatura para reducir el sesgo de agregación durante el análisis de regresión . Un investigador podría corregir la matriz de varianza-covarianza utilizando muestras de datos a nivel individual. ^[9] Alternativamente, uno podría centrarse en la regresión espacial local en lugar de la regresión global. Un investigador también podría intentar diseñar unidades de área para maximizar un resultado estadístico particular. ^[6] Otros han argumentado que puede ser difícil construir un único conjunto de unidades de agregación óptimas para múltiples variables, cada una de las cuales puede exhibir no estacionariedad y autocorrelación espacial en el espacio de diferentes maneras. Otros han sugerido desarrollar estadísticas que cambien entre escalas de manera predecible, tal vez utilizando la dimensión fractal como una medida de relaciones espaciales independiente de la escala. Otros han sugerido modelos jerárquicos bayesianos como una metodología general para combinar datos agregados e individuales para la inferencia ecológica.

Los estudios del MAUP basados en datos empíricos sólo pueden proporcionar información limitada debido a la incapacidad de controlar las relaciones entre múltiples variables espaciales. La simulación de datos es necesaria para tener control sobre diversas propiedades de los datos a nivel individual. Los estudios de simulación han demostrado que el apoyo espacial de las variables puede afectar la magnitud del sesgo ecológico causado por la agregación de datos espaciales. ^[10]

Análisis de sensibilidad MAUP

Utilizando simulaciones para datos univariados, Larsen abogó por el uso de un índice de varianza para investigar el efecto de la configuración espacial, la asociación espacial y la agregación de datos. ^[11] Reynolds presenta una descripción detallada de la variación de las estadísticas debido a MAUP, quien demuestra la importancia de la disposición espacial y la autocorrelación espacial de los valores de los datos. ^[12] Los experimentos de simulación de Reynold fueron ampliados por Swift, quien en una serie de nueve ejercicios comenzó con análisis de regresión simulados y tendencia espacial, luego se centró en el tema de MAUP en el contexto de la epidemiología espacial. Se presenta un método de análisis de sensibilidad de MAUP que demuestra que MAUP no es del todo un problema. ^[10] MAUP se puede utilizar como herramienta analítica para ayudar a comprender la heterogeneidad espacial y la autocorrelación espacial .

Este tema es de particular importancia porque en algunos casos la agregación de datos puede oscurecer una fuerte correlación entre variables, haciendo que la relación parezca débil o incluso negativa. Por el contrario, MAUP puede hacer que las variables aleatorias parezcan tener una asociación significativa donde no la hay. Los parámetros de regresión multivariada son más sensibles a MAUP que los coeficientes de correlación. Hasta que se descubra una solución más analítica para MAUP, se recomienda el análisis de sensibilidad espacial utilizando una variedad de unidades de área como metodología para estimar la incertidumbre de los coeficientes de correlación y regresión debido al sesgo ecológico. Está disponible un ejemplo de simulación y reagregación de datos utilizando la biblioteca ArcPy. ^[13]^[14]

En la planificación del transporte, MAUP está asociado a la Zonificación de Análisis de Tráfico (TAZ). Un punto de partida importante para comprender los problemas del análisis del transporte es el reconocimiento de que el análisis espacial tiene algunas limitaciones asociadas con la discretización del espacio. Entre ellos, las unidades de área modificables y los problemas de límites están directa o indirectamente relacionados con la planificación y el análisis del transporte a través del diseño de zonas de análisis de tráfico ; la mayoría de los estudios de transporte requieren directa o indirectamente la definición de TAZ. Se debe prestar especial atención a las cuestiones de límites modificables y de escala durante la especificación de una TAZ debido a los efectos que estos factores ejercen sobre las propiedades estadísticas y matemáticas de los patrones espaciales (es decir, el problema de la unidad de área modificable, MAUP). En los estudios de Viegas, Martínez y Silva (2009, 2009b) ^[14] los autores proponen un método donde los resultados obtenidos del estudio de datos espaciales no son independientes de la escala, y los efectos de agregación están implícitos en la elección de la escala zonal. límites. La delimitación de los límites zonales de las TAZ tiene un impacto directo en la realidad y precisión de los resultados obtenidos de los modelos de pronóstico del transporte. En este artículo se miden y analizan los efectos de MAUP en la definición de TAZ y los modelos de demanda de transporte utilizando diferentes grillas (en tamaño y en ubicación de origen). Este análisis se desarrolló mediante la construcción de una aplicación integrada en un software SIG comercial y utilizando un estudio de caso (Área Metropolitana de Lisboa) para probar su implementabilidad y rendimiento. Los resultados revelan el conflicto entre la precisión estadística y geográfica, y su relación con la pérdida de información en la etapa de asignación de tráfico de los modelos de planificación del transporte. ^[14]

Ver también

Aplicaciones

Referencias

^ Openshaw, Stan (1983). El problema de la unidad de área modificable (PDF) . ISBN 0-86094-134-5.
^ ab Chen, Xiang; Sí, Xinyue; Ampliador, Michael J.; Delmelle, Eric; Kwan, Mei-Po; Shannon, Jerry; Racine, Racine F.; Adams, Aarón; Liang, Lu; Peng, Jia (27 de diciembre de 2022). "Una revisión sistemática del problema de la unidad de área modificable (MAUP) en la investigación ambiental alimentaria comunitaria". Informática Urbana . 1 . doi : 10.1007/s44212-022-00021-1 . S2CID 255206315.
^ "MAUP | Definición - Diccionario SIG de soporte de Esri". soporte.esri.com . Consultado el 9 de marzo de 2017 .
^ Geografía, Oficina del Censo de Estados Unidos. "Notas sobre cambios de límites geográficos". www.census.gov . Consultado el 24 de febrero de 2017 .
^ Gehlke y Biehl 1934
^ ab Openshaw 1984, pág. 3
^ Goodchild, Michael F. (2022). "El efecto Openshaw". Revista Internacional de Ciencia de la Información Geográfica . 36 : 1697–1698. doi : 10.1080/13658816.2022.2102637 . Consultado el 24 de enero de 2024 .
^ Fotheringham, AS; Rogerson, PA (2008). "El problema de la unidad de área modificable (MAUP)". El manual SAGE de análisis espacial . Sabio. págs. 105-124. ISBN 978-1-4129-1082-8.
^ Holt D, Steel D, Tranmer M, Wrigley N. (1996). "Agregación y efectos ecológicos en datos de base geográfica". “Análisis geográfico” 28:244{261
^ ab Swift, A., Liu, L. y Uber, J. (2008) "Reducción del sesgo MAUP de las estadísticas de correlación entre la calidad del agua y las enfermedades gastrointestinales". Computadoras, medio ambiente y sistemas urbanos 32, 134–148
^ Larsen, J. (2000). "El problema de la unidad de área modificable: ¿un problema o una fuente de información espacial?" Tesis doctoral, Universidad Estatal de Ohio.
^ Reynolds, H. (1998). "El problema de la unidad de área modificable: análisis empírico mediante simulación estadística". Tesis doctoral, Departamento de Geografía de la Universidad de Toronto, http://www.badpets.net/Thesis
^ Rápido, A. (2017). "Simulación de datos de mapeo de delitos", https://app.box.com/s/a84w16x7hffljjvkhtlr72eisj4qiene
^ abc Viegas, José Manuel; Martínez, L. Miguel; Silva, Elisabete A. (enero de 2009). "Efectos del problema de la unidad de área modificable en la delimitación de zonas de análisis de tráfico". Medio Ambiente y Planificación B: Planificación y Diseño . 36 (4): 625–643. doi :10.1068/b34033. S2CID 54840846.

Fuentes

Arbia, Giuseppe (1988). Configuración de datos espaciales en el análisis estadístico de problemas económicos regionales y afines . Dordrecht: Editores académicos de Kluwer.
Este artículo contiene citas del problema de la unidad de área modificable en GIS Wiki, que está disponible bajo la licencia Creative Commons Attribution 3.0 Unported (CC BY 3.0).
Gehlke, CE; Biehl, Katherine (marzo de 1934). "Ciertos efectos de la agrupación sobre el tamaño del coeficiente de correlación en el material del sector censal". Revista de la Asociación Estadounidense de Estadística . 29 (185A): 169-170. doi :10.2307/2277827. JSTOR 2277827.
Openshaw, Stan (1984). El problema de la unidad de área modificable . Norwick: Geolibros. ISBN 0860941345. OCLC 12052482.
Unwin, DJ (1996). "SIG, análisis espacial y estadística espacial". Progresos en geografía humana. 20 : 540–551.
Cressie, N. (1996). “Cambio de soporte y el problema de la unidad de área modificable”. "Sistemas geográficos", 3:159–180.
Viegas, J., EA Silva, L. Martínez (2009a). “Efectos del problema de la unidad de área modificable en la delimitación de zonas de análisis de tráfico” “Medio ambiente y planificación B – Planificación y diseño”, 36(4): 625–643.
Viegas, J., EA Silva, L. Martínez (2009a). “Definición de una zona de análisis de tráfico: una nueva metodología y algoritmo” “Transporte”. 36 (5): 6“, 36 (5): 6 .

Otras lecturas

Cressie, Noel A (1996). "Cambio de soporte y el problema de la unidad de área modificable". Sistemas Geográficos . 3 (2–3): 159–180.
Holt, David; Acero, David; Tranmer, Mark; Wrigley, Neil (julio de 1996). "Agregación y efectos ecológicos en datos de base geográfica". Análisis Geográfico . 28 (3): 244–261. doi : 10.1111/j.1538-4632.1996.tb00933.x .
Horner, Mark W.; Murray, Alan T. (enero de 2002). "El exceso de desplazamientos y el problema de las unidades de área modificables" (PDF) . Estudios Urbanos . 39 (1): 131-139. doi : 10.1080/00420980220099113. S2CID 56418131. Archivado desde el original (PDF) el 22 de abril de 2017 . Consultado el 5 de julio de 2015 .
Kwan, Mei-Po (2012). "El problema del contexto geográfico incierto" (PDF) . Anales de la Asociación de Geógrafos Americanos . 102 (5): 958–968. doi :10.1080/00045608.2012.687349. S2CID 52024592.
Menon, Carlo (marzo de 2012). «El lado bueno del MAUP: definiendo nuevas medidas de aglomeración industrial» (PDF) . Artículos sobre ciencia regional . 91 (1): 3–28. doi :10.1111/j.1435-5957.2011.00350.x.
Unwin, David J (diciembre de 1996). "SIG, análisis espacial y estadística espacial". Progresos en Geografía Humana . 20 (4): 540–551. doi :10.1177/030913259602000408. S2CID 129487607.
Wong, David (2009). "El problema de la unidad de área modificable (MAUP)". En Fotheringham, A Stewart; Rogerson, Peter (eds.). El manual SAGE de análisis espacial . Los Ángeles: sabio. págs. 105-124. ISBN 9781412910828. OCLC 85898184.
Wrigley, Neil (1995). "Revisando el problema de la unidad de área modificable y la falacia ecológica". En Cliff, Andrew D (ed.). Geografía en difusión: ensayos para Peter Haggett . Serie de publicaciones especiales del Instituto de Geógrafos Británicos . vol. 31. Oxford; Cambridge, Massachusetts: Blackwell. págs. 123–181. ISBN 0631195343. OCLC 30895028.
Zhang, Ming; Kukadia, Nishant (enero de 2005). "Métricas de forma urbana y el problema de la unidad de área modificable". Registro de investigación del transporte: Revista de la Junta de Investigación del Transporte . 1902 : 71–79. doi :10.3141/1902-09.