stringtranslate.com

Optimización de las pausas naturales de Jenks

El método de optimización de Jenks , también llamado método de clasificación de rupturas naturales de Jenks , es un método de agrupación de datos diseñado para determinar la mejor disposición de valores en diferentes clases. Esto se hace buscando minimizar la desviación promedio de cada clase con respecto a la media de la clase, mientras se maximiza la desviación de cada clase con respecto a las medias de las otras clases. En otras palabras, el método busca reducir la varianza dentro de las clases y maximizar la varianza entre clases. [1] [2]

El método de optimización de Jenks está directamente relacionado con el Método de Otsu y el Análisis Discriminante de Fisher .

Historia

George Federico Jenks

George Frederick Jenks fue un cartógrafo estadounidense del siglo XX . Graduándose con su Ph.D. Licenciado en geografía agrícola por la Universidad de Syracuse en 1947, Jenks comenzó su carrera bajo la tutela de Richard Harrison , cartógrafo de la revista Time and Fortune . [3] Se unió a la facultad de la Universidad de Kansas en 1949 y comenzó a desarrollar el programa de cartografía. Durante sus 37 años en KU, Jenks desarrolló el programa de Cartografía en uno de los tres programas reconocidos por su educación de posgrado en el campo; las otras son la Universidad de Wisconsin y la Universidad de Washington . Gran parte de su tiempo lo dedicó a desarrollar y promover técnicas y programas mejorados de capacitación cartográfica. También dedicó mucho tiempo a investigar mapas tridimensionales, investigación del movimiento ocular, comunicación de mapas temáticos y geoestadística . [2] [3] [4]

Antecedentes y desarrollo

Jenks era cartógrafo de profesión. Su trabajo con estadísticas surgió del deseo de hacer que los mapas de coropletas fueran más precisos visualmente para el espectador. En su artículo, The Data Model Concept in Statistical Mapping , afirma que al visualizar datos en un modelo tridimensional, los cartógrafos podrían idear un “método sistemático y racional para preparar mapas coropléticos”. [1] Jenks utilizó la analogía de un “manto de error” para describir la necesidad de utilizar elementos distintos del medio para generalizar datos. Los modelos tridimensionales se crearon para ayudar a Jenks a visualizar la diferencia entre clases de datos. Su objetivo era generalizar los datos utilizando el menor número de planos posible y mantener un “manto de error” constante.

Descripción del método

El método requiere un proceso iterativo. Es decir, los cálculos deben repetirse utilizando diferentes divisiones en el conjunto de datos para determinar qué conjunto de divisiones tiene la variación en clase más pequeña . El proceso se inicia dividiendo los datos ordenados en clases de alguna manera que puede ser arbitraria. Hay dos pasos que deben repetirse:

  1. Calcule la suma de las desviaciones al cuadrado de las medias de clase (SDCM).
  2. Elija una nueva forma de dividir los datos en clases, tal vez moviendo uno o más puntos de datos de una clase a otra diferente.

Luego se calculan nuevas desviaciones de clase y el proceso se repite hasta que la suma de las desviaciones dentro de la clase alcanza un valor mínimo. [ 15]

Alternativamente, se pueden examinar todas las combinaciones de ruptura, calcular el SDCM para cada combinación y seleccionar la combinación con el SDCM más bajo. Dado que se examinan todas las combinaciones de ruptura, esto garantiza que se encuentre la que tenga el SDCM más bajo.

Finalmente, se puede calcular la suma de las desviaciones al cuadrado de la media del conjunto de datos completo (SDAM) y la bondad del ajuste de la varianza (GVF). GVF se define como (SDAM - SDCM)/SDAM. GVF varía de 0 (peor ajuste) a 1 (ajuste perfecto).

Uso en cartografía

Mapa de coropletas que muestra el porcentaje estimado de la población por debajo del 150% de pobreza en los Estados Unidos contiguos por condado, 2020 que utiliza la clasificación de rupturas naturales de Jenks

El objetivo de Jenks al desarrollar este método era crear un mapa que fuera absolutamente preciso en términos de representación de los atributos espaciales de los datos. Siguiendo este proceso, afirma Jenks, el “manto de error” se puede distribuir uniformemente a lo largo de la superficie mapeada. Desarrolló esto con la intención de utilizar relativamente pocas clases de datos, menos de siete, porque ese era el límite al usar sombreado monocromático en un mapa coroplético. [1]

El método de clasificación de Jenks se utiliza comúnmente en mapas temáticos, especialmente en mapas coropletas, como uno de varios métodos de clasificación disponibles. Al hacer mapas de coropletas, el método de clasificación de Jenks puede resultar ventajoso porque si hay grupos en los valores de datos, los identificará. De hecho, en las versiones actuales del software ArcGIS de Esri, Jenks es el método de clasificación predeterminado. Sin embargo, la clasificación de Jenks no se recomienda para datos que tienen una varianza baja. Las rupturas naturales de Jenks en los datos se utilizan para proporcionar una visualización más significativa de los datos del mapa basada en las "rupturas naturales" en los datos identificados por el proceso iterativo.

Metodos alternativos

Otros métodos de clasificación de datos incluyen rupturas de cabeza/cola , rupturas naturales (sin optimización de Jenks), intervalo igual, cuantil y desviación estándar.

Otras lecturas

Ver también

Referencias

  1. ^ abcd Jenks, George F. 1967. "El concepto de modelo de datos en la cartografía estadística", Anuario internacional de cartografía 7: 186-190.
  2. ^ ab McMaster, Robert, "In Memoriam: George F. Jenks (1916-1996)". Cartografía y Ciencias de la Información Geográfica. 24(1) págs.56-59.
  3. ^ ab McMaster, Robert y McMaster, Susanna. 2002. “Una historia de la cartografía académica estadounidense del siglo XX”, Cartografía y ciencia de la información geográfica. 29(3) págs.312-315.
  4. ^ Grupo de especialidad en cartografía de CSUN, boletín de invierno de 1997 Archivado el 7 de junio de 2010 en Wayback Machine.
  5. ^ Preguntas frecuentes de ESRI, ¿Qué es el método de optimización de Jenks? Archivado el 16 de noviembre de 2007 en Wayback Machine .
  6. ^ "Capítulo 9". Archivado desde el original el 21 de agosto de 2004.

enlaces externos