stringtranslate.com

Problema de unidad de área modificable

Ejemplo de distorsión MAUP
Un ejemplo del problema de la unidad de área modificable y la distorsión de los cálculos de tarifas

El problema de la unidad de área modificable ( MAUP ) es una fuente de sesgo estadístico que puede afectar significativamente los resultados de las pruebas de hipótesis estadísticas . MAUP afecta los resultados cuando las medidas puntuales de fenómenos espaciales se agregan en particiones espaciales o unidades de área (como regiones o distritos ) como, por ejemplo, en la densidad de población o las tasas de enfermedad . [1] [2] Los valores resumidos resultantes (por ejemplo, totales, tasas, proporciones, densidades) están influenciados tanto por la forma como por la escala de la unidad de agregación. [3]

Por ejemplo, los datos del censo pueden agregarse en distritos de condado, sectores censales, áreas de códigos postales, distritos policiales o cualquier otra partición espacial arbitraria. Por lo tanto, los resultados de la agregación de datos dependen de la elección del cartógrafo de qué "unidad de área modificable" utilizar en su análisis. Un mapa de coropletas del censo que calcula la densidad de población utilizando los límites estatales producirá resultados radicalmente diferentes a los de un mapa que calcula la densidad basándose en los límites del condado. Además, los límites de los distritos censales también están sujetos a cambios con el tiempo, [4] lo que significa que se debe considerar el MAUP al comparar datos pasados ​​con datos actuales.

Fondo

La cuestión fue reconocida por primera vez por Gehlke y Biehl en 1934 [5] y posteriormente descrita en detalle en una entrada de la serie Conceptos y técnicas en geografía moderna (CATMOG) de Stan Openshaw (1984) y en el libro de Giuseppe Arbia (1988). . En particular, Openshaw (1984) observó que "las unidades de área (objetos zonales) utilizadas en muchos estudios geográficos son arbitrarias, modificables y sujetas a los caprichos y fantasías de quien esté haciendo o haya hecho la agregación". [6] El problema es especialmente evidente cuando los datos agregados se utilizan para análisis de conglomerados para epidemiología espacial , estadísticas espaciales o mapeo de coropletas , en los que fácilmente se pueden hacer malas interpretaciones sin darnos cuenta. Muchos campos de la ciencia, especialmente la geografía humana, tienden a ignorar el MAUP al sacar inferencias de estadísticas basadas en datos agregados. [2] MAUP está estrechamente relacionado con el tema de la falacia ecológica y el sesgo ecológico (Arbia, 1988). El trabajo de Stan Openshaw sobre este tema ha llevado a Michael F. Goodchild a sugerir que se lo denomine "efecto Openshaw". [7]

El sesgo ecológico causado por MAUP se ha documentado como dos efectos separados que generalmente ocurren simultáneamente durante el análisis de datos agregados. Primero, el efecto de escala provoca variación en los resultados estadísticos entre diferentes niveles de agregación (distancia radial). Por lo tanto, la asociación entre variables depende del tamaño de las unidades de área para las cuales se reportan los datos. Generalmente, la correlación aumenta a medida que aumenta el tamaño de la unidad de área. El efecto de zonificación describe la variación en las estadísticas de correlación causada por la reagrupación de datos en diferentes configuraciones en la misma escala (forma de área). [8]

Desde la década de 1930, las investigaciones han encontrado una variación adicional en los resultados estadísticos gracias al MAUP. Los métodos estándar para calcular la varianza dentro del grupo y entre grupos no tienen en cuenta la varianza adicional observada en los estudios MAUP a medida que cambian las agrupaciones. MAUP se puede utilizar como metodología para calcular los límites superior e inferior, así como los parámetros de regresión promedio para múltiples conjuntos de agrupaciones espaciales. El MAUP es una fuente crítica de error en estudios espaciales, ya sean observacionales o experimentales. Como tal, la coherencia de las unidades, particularmente en un contexto transversal de series temporales (TSCS), es esencial. Además, se deben realizar periódicamente comprobaciones de solidez de la sensibilidad de las unidades a la agregación espacial alternativa para mitigar los sesgos asociados en las estimaciones estadísticas resultantes.

Un mapa de mano con diferentes patrones espaciales. Nota: p es la probabilidad de q -estadístico; * denota significancia estadística en el nivel 0.05, ** para 0.001, *** para menores de 10 −3 ;(D) los subíndices 1, 2, 3 de q y p denotan los estratos Z1+Z2 con Z3,Z1 con Z2+Z3 , y Z1 y Z2 y Z3 individualmente, respectivamente; (E) los subíndices 1 y 2 de q y p denotan los estratos Z1+Z2 con Z3+Z4 y Z1+Z3 con Z2+Z4, respectivamente.

Las soluciones sugeridas

Se han hecho varias sugerencias en la literatura para reducir el sesgo de agregación durante el análisis de regresión . Un investigador podría corregir la matriz de varianza-covarianza utilizando muestras de datos a nivel individual. [9] Alternativamente, uno podría centrarse en la regresión espacial local en lugar de la regresión global. Un investigador también podría intentar diseñar unidades de área para maximizar un resultado estadístico particular. [6] Otros han argumentado que puede ser difícil construir un único conjunto de unidades de agregación óptimas para múltiples variables, cada una de las cuales puede exhibir no estacionariedad y autocorrelación espacial en el espacio de diferentes maneras. Otros han sugerido desarrollar estadísticas que cambien entre escalas de manera predecible, tal vez utilizando la dimensión fractal como una medida de relaciones espaciales independiente de la escala. Otros han sugerido modelos jerárquicos bayesianos como una metodología general para combinar datos agregados e individuales para la inferencia ecológica.

Los estudios del MAUP basados ​​en datos empíricos sólo pueden proporcionar información limitada debido a la incapacidad de controlar las relaciones entre múltiples variables espaciales. La simulación de datos es necesaria para tener control sobre diversas propiedades de los datos a nivel individual. Los estudios de simulación han demostrado que el apoyo espacial de las variables puede afectar la magnitud del sesgo ecológico causado por la agregación de datos espaciales. [10]

Análisis de sensibilidad MAUP

Utilizando simulaciones para datos univariados, Larsen abogó por el uso de un índice de varianza para investigar el efecto de la configuración espacial, la asociación espacial y la agregación de datos. [11] Reynolds presenta una descripción detallada de la variación de las estadísticas debido a MAUP, quien demuestra la importancia de la disposición espacial y la autocorrelación espacial de los valores de los datos. [12] Los experimentos de simulación de Reynold fueron ampliados por Swift, quien en una serie de nueve ejercicios comenzó con análisis de regresión simulados y tendencia espacial, luego se centró en el tema de MAUP en el contexto de la epidemiología espacial. Se presenta un método de análisis de sensibilidad de MAUP que demuestra que MAUP no es del todo un problema. [10] MAUP se puede utilizar como herramienta analítica para ayudar a comprender la heterogeneidad espacial y la autocorrelación espacial .

Este tema es de particular importancia porque en algunos casos la agregación de datos puede oscurecer una fuerte correlación entre variables, haciendo que la relación parezca débil o incluso negativa. Por el contrario, MAUP puede hacer que las variables aleatorias parezcan tener una asociación significativa donde no la hay. Los parámetros de regresión multivariada son más sensibles a MAUP que los coeficientes de correlación. Hasta que se descubra una solución más analítica para MAUP, se recomienda el análisis de sensibilidad espacial utilizando una variedad de unidades de área como metodología para estimar la incertidumbre de los coeficientes de correlación y regresión debido al sesgo ecológico. Está disponible un ejemplo de simulación y reagregación de datos utilizando la biblioteca ArcPy. [13] [14]

En la planificación del transporte, MAUP está asociado a la Zonificación de Análisis de Tráfico (TAZ). Un punto de partida importante para comprender los problemas del análisis del transporte es el reconocimiento de que el análisis espacial tiene algunas limitaciones asociadas con la discretización del espacio. Entre ellos, las unidades de área modificables y los problemas de límites están directa o indirectamente relacionados con la planificación y el análisis del transporte a través del diseño de zonas de análisis de tráfico ; la mayoría de los estudios de transporte requieren directa o indirectamente la definición de TAZ. Se debe prestar especial atención a las cuestiones de límites modificables y de escala durante la especificación de una TAZ debido a los efectos que estos factores ejercen sobre las propiedades estadísticas y matemáticas de los patrones espaciales (es decir, el problema de la unidad de área modificable, MAUP). En los estudios de Viegas, Martínez y Silva (2009, 2009b) [14] los autores proponen un método donde los resultados obtenidos del estudio de datos espaciales no son independientes de la escala, y los efectos de agregación están implícitos en la elección de la escala zonal. límites. La delimitación de los límites zonales de las TAZ tiene un impacto directo en la realidad y precisión de los resultados obtenidos de los modelos de pronóstico del transporte. En este artículo se miden y analizan los efectos de MAUP en la definición de TAZ y los modelos de demanda de transporte utilizando diferentes grillas (en tamaño y en ubicación de origen). Este análisis se desarrolló mediante la construcción de una aplicación integrada en un software SIG comercial y utilizando un estudio de caso (Área Metropolitana de Lisboa) para probar su implementabilidad y rendimiento. Los resultados revelan el conflicto entre la precisión estadística y geográfica, y su relación con la pérdida de información en la etapa de asignación de tráfico de los modelos de planificación del transporte. [14]

Ver también

Aplicaciones

Referencias

  1. ^ Openshaw, Stan (1983). El problema de la unidad de área modificable (PDF) . ISBN 0-86094-134-5.
  2. ^ ab Chen, Xiang; Sí, Xinyue; Ampliador, Michael J.; Delmelle, Eric; Kwan, Mei-Po; Shannon, Jerry; Racine, Racine F.; Adams, Aarón; Liang, Lu; Peng, Jia (27 de diciembre de 2022). "Una revisión sistemática del problema de la unidad de área modificable (MAUP) en la investigación ambiental alimentaria comunitaria". Informática Urbana . 1 . doi : 10.1007/s44212-022-00021-1 . S2CID  255206315.
  3. ^ "MAUP | Definición - Diccionario SIG de soporte de Esri". soporte.esri.com . Consultado el 9 de marzo de 2017 .
  4. ^ Geografía, Oficina del Censo de Estados Unidos. "Notas sobre cambios de límites geográficos". www.census.gov . Consultado el 24 de febrero de 2017 .
  5. ^ Gehlke y Biehl 1934
  6. ^ ab Openshaw 1984, pág. 3
  7. ^ Goodchild, Michael F. (2022). "El efecto Openshaw". Revista Internacional de Ciencia de la Información Geográfica . 36 : 1697–1698. doi : 10.1080/13658816.2022.2102637 . Consultado el 24 de enero de 2024 .
  8. ^ Fotheringham, AS; Rogerson, PA (2008). "El problema de la unidad de área modificable (MAUP)". El manual SAGE de análisis espacial . Sabio. págs. 105-124. ISBN 978-1-4129-1082-8.
  9. ^ Holt D, Steel D, Tranmer M, Wrigley N. (1996). "Agregación y efectos ecológicos en datos de base geográfica". “Análisis geográfico” 28:244{261
  10. ^ ab Swift, A., Liu, L. y Uber, J. (2008) "Reducción del sesgo MAUP de las estadísticas de correlación entre la calidad del agua y las enfermedades gastrointestinales". Computadoras, medio ambiente y sistemas urbanos 32, 134–148
  11. ^ Larsen, J. (2000). "El problema de la unidad de área modificable: ¿un problema o una fuente de información espacial?" Tesis doctoral, Universidad Estatal de Ohio.
  12. ^ Reynolds, H. (1998). "El problema de la unidad de área modificable: análisis empírico mediante simulación estadística". Tesis doctoral, Departamento de Geografía de la Universidad de Toronto, http://www.badpets.net/Thesis
  13. ^ Rápido, A. (2017). "Simulación de datos de mapeo de delitos", https://app.box.com/s/a84w16x7hffljjvkhtlr72eisj4qiene
  14. ^ abc Viegas, José Manuel; Martínez, L. Miguel; Silva, Elisabete A. (enero de 2009). "Efectos del problema de la unidad de área modificable en la delimitación de zonas de análisis de tráfico". Medio Ambiente y Planificación B: Planificación y Diseño . 36 (4): 625–643. doi :10.1068/b34033. S2CID  54840846.

Fuentes

Otras lecturas