stringtranslate.com

Distribución rango-tamaño

La distribución por rango y tamaño de la población de los países sigue una distribución exponencial extendida [1] excepto en los casos de los dos " Reyes ": China e India .

La distribución rango-tamaño es la distribución del tamaño por rango, en orden decreciente de tamaño. Por ejemplo, si un conjunto de datos consta de elementos de tamaños 5, 100, 5 y 8, la distribución de rango-tamaño es 100, 8, 5, 5 (rangos 1 a 4). Esto también se conoce como distribución de rango-frecuencia , cuando los datos de origen provienen de una distribución de frecuencia . Estos son particularmente interesantes cuando los datos varían significativamente en escalas, como el tamaño de la ciudad o la frecuencia de palabras. Estas distribuciones siguen frecuentemente una distribución de ley de potencia , o otras menos conocidas, como una función exponencial extendida o una distribución fractal parabólica , al menos aproximadamente para ciertos rangos de rangos; vea abajo.

Una distribución de rango-tamaño no es una distribución de probabilidad ni una función de distribución acumulativa . Más bien, es una forma discreta de una función cuantil (distribución acumulativa inversa) en orden inverso, que da el tamaño del elemento en un rango determinado.

Distribuciones simples de rango-tamaño

En el caso de las poblaciones urbanas, la distribución resultante en un país, una región o el mundo se caracterizará por su ciudad más grande, mientras que otras ciudades disminuirán de tamaño con respecto a ella, inicialmente a un ritmo rápido y luego más lentamente. Esto da como resultado unas pocas ciudades grandes y un número mucho mayor de ciudades de órdenes de magnitud más pequeñas. Por ejemplo, una ciudad de rango 3 tendría un tercio de la población de la ciudad más grande de un país, una ciudad de rango 4 tendría un cuarto de la población de la ciudad más grande, y así sucesivamente. [2]

Segmentación

Gráfico de frecuencia de palabras de Wikipedia, que muestra tres segmentos con comportamiento distinto.

Una distribución de rango-tamaño (o rango-frecuencia) a menudo se segmenta en rangos. Con frecuencia, esto se hace de manera un tanto arbitraria o debido a factores externos, particularmente para la segmentación del mercado , pero también puede deberse a un comportamiento distinto a medida que varía la clasificación.

Lo más simple y común es que una distribución se pueda dividir en dos partes, denominadas cabeza y cola . Si una distribución se divide en tres partes, la tercera parte (la del medio) tiene varios términos, genéricamente medio , [3] también vientre , [4] torso , [5] y cuerpo . [6] Estos frecuentemente tienen algunos adjetivos agregados, más significativamente cola larga , también vientre gordo , [4] medio grueso , etc. En términos más tradicionales, estos pueden denominarse de nivel superior , nivel medio y nivel inferior .

Los tamaños y pesos relativos de estos segmentos (cuántos rangos en cada segmento y qué proporción de la población total está en un segmento determinado) caracterizan cualitativamente una distribución, de manera análoga a la asimetría o curtosis de una distribución de probabilidad. Es decir: ¿está dominado por unos pocos miembros importantes (con mucha cabeza, como las ganancias en la industria de la música grabada), o está dominado por muchos miembros pequeños (con mucha cola, como consultas de búsqueda en Internet), o está distribuido de alguna otra manera? En la práctica, esto determina la estrategia: ¿dónde se debe centrar la atención?

Estas distinciones pueden hacerse por varias razones. Por ejemplo, pueden surgir de diferentes propiedades de la población, como en el principio 90–9–1 , que postula que en una comunidad de Internet, el 90% de los participantes de una comunidad solo ven contenido, el 9% de los participantes editan contenido. , y el 1% de los participantes crean activamente contenido nuevo. Como otro ejemplo, en marketing, uno puede considerar pragmáticamente al jefe como todos los miembros que reciben atención personalizada, como llamadas telefónicas personales; mientras que la cola es todo lo demás, que no recibe atención personalizada, por ejemplo recibir cartas modelo ; y la línea simplemente se fija en un punto que los recursos lo permitan, o donde tenga sentido comercial detenerse.

Desde un punto de vista puramente cuantitativo, una forma convencional de dividir una distribución en cabeza y cola es considerar que la cabeza es la primera porción p de los rangos, que representa la población general, como en el principio de Pareto 80:20 , donde el 20% superior (cabeza) comprende el 80% de la población total. El límite exacto depende de la distribución (cada distribución tiene un único punto de corte) y, para la potencia, las leyes se pueden calcular a partir del índice de Pareto .

Los segmentos pueden surgir naturalmente debido a cambios reales en el comportamiento de la distribución a medida que varía el rango. El más común es el efecto rey , donde el comportamiento del grupo superior de elementos no se ajusta al patrón del resto, como se ilustra en la parte superior para las poblaciones de los países y arriba para las palabras más comunes en la Wikipedia en inglés. Para los rangos superiores, el comportamiento puede cambiar en algún momento y estar bien modelado por diferentes relaciones en diferentes regiones; en su conjunto por una función por partes . Por ejemplo, si dos leyes de potencia diferentes encajan mejor en diferentes regiones, se puede utilizar una ley de potencia quebrada para la relación general; la palabra frecuencia en Wikipedia en inglés (arriba) también lo demuestra.

La distribución Yule-Simon que resulta del apego preferencial (intuitivamente, "los ricos se hacen más ricos" y "el éxito genera éxito") simula una ley de potencia infringida y se ha demostrado que "capta muy bien" la frecuencia de las palabras frente a las distribuciones de rango. [7] Se originó al tratar de explicar la población versus el rango en diferentes especies. También se ha demostrado que se ajusta mejor a la población de la ciudad que a la clasificación. [8]

Regla de rango-tamaño

La regla (o ley ) de rango-tamaño describe la notable regularidad en muchos fenómenos, incluida la distribución del tamaño de las ciudades, el tamaño de las empresas, el tamaño de las partículas (como la arena), la longitud de los ríos, las frecuencias del uso de palabras, y riqueza entre los individuos.

Todas son observaciones del mundo real que siguen leyes potenciales , como la ley de Zipf , la distribución de Yule o la distribución de Pareto . Si uno clasifica el tamaño de la población de las ciudades en un país determinado o en todo el mundo y calcula el logaritmo natural del rango y de la población de la ciudad, el gráfico resultante mostrará un patrón lineal. Esta es la distribución de tamaño de rango. [9]

Excepciones conocidas a las distribuciones simples de rango-tamaño

Si bien la ley de Zipf funciona bien en muchos casos, tiende a no aplicarse a las ciudades más grandes de muchos países; Un tipo de desviación se conoce como efecto King . Un estudio de 2002 encontró que la ley de Zipf fue rechazada en 53 de 73 países, mucho más de lo que se esperaría basándose en el azar. [10] El estudio también encontró que las variaciones del exponente de Pareto se explican mejor por variables políticas que por variables de geografía económica como sustitutos de economías de escala o costos de transporte. [11] Un estudio de 2004 demostró que la ley de Zipf no funcionó bien para las cinco ciudades más grandes de seis países. [12] En los países más ricos, la distribución fue más plana de lo previsto. Por ejemplo, en los Estados Unidos , aunque su ciudad más grande, Nueva York , tiene más del doble de población que Los Ángeles , que ocupa el segundo lugar , las áreas metropolitanas de las dos ciudades (también las dos más grandes del país) están mucho más cerca en población. . En población del área metropolitana, la ciudad de Nueva York es sólo 1,3 veces más grande que Los Ángeles. En otros países, la ciudad más grande dominaría mucho más de lo esperado. Por ejemplo, en la República Democrática del Congo , la capital, Kinshasa , es más de ocho veces más grande que la segunda ciudad más grande, Lubumbashi . Cuando se considera toda la distribución de ciudades, incluidas las más pequeñas, la regla del rango de tamaño no se cumple. En cambio, la distribución es log-normal . Esto se desprende de la ley de crecimiento proporcional de Gibrat .

Como es tan fácil encontrar excepciones, la función de la regla para analizar las ciudades hoy en día es comparar los sistemas urbanos de diferentes países. La regla del rango y tamaño es un estándar común mediante el cual se establece la primacía urbana. Una distribución como la de Estados Unidos o China no muestra un patrón de primacía, pero los países con una " ciudad primada " dominante claramente difieren de la regla de rango-tamaño en el sentido opuesto. Por lo tanto, la regla ayuda a clasificar los sistemas urbanos nacionales (o regionales) según el grado de predominio exhibido por la ciudad más grande. Los países con una ciudad principal, por ejemplo, típicamente han tenido una historia colonial que explica ese patrón de ciudad. Si se espera que un patrón de distribución normal de una ciudad siga la regla de rango-tamaño (es decir, si el principio de rango-tamaño se correlaciona con la teoría del lugar central), entonces sugiere que aquellos países o regiones con distribuciones que no siguen la regla han experimentado algunas condiciones. que han alterado el patrón de distribución normal. Por ejemplo, la presencia de múltiples regiones dentro de naciones grandes como China y Estados Unidos tiende a favorecer un patrón en el que aparecen más ciudades grandes de las que predeciría la regla. Por el contrario, los países pequeños que habían estado conectados (por ejemplo, colonial y económicamente) con áreas mucho más grandes exhibirán una distribución en la que la ciudad más grande es mucho más grande de lo que se ajustaría a la regla, en comparación con las otras ciudades: el tamaño excesivo de la ciudad en teoría surge de su conexión con un sistema más amplio y no de la jerarquía natural que la teoría del lugar central predeciría dentro de ese país o región únicamente.

Ver también

Referencias

  1. ^ "Distribuciones exponenciales extendidas en la naturaleza y la economía:" colas gordas "con escalas características", J. Laherrère y D. Sornette
  2. ^ "Las 200 ciudades más grandes de los Estados Unidos por población 2021". worldpopulationreview.com . Consultado el 28 de marzo de 2021 .
  3. ^ Ilustrando la cola larga, Rand Fishkin, 24 de noviembre de 2009
  4. ^ ab ¡ Digg that Fat Belly!, Robert Young, 4 de septiembre de 2006
  5. ^ La guía de optimización de palabras clave de cola larga: cómo sacar provecho de las palabras clave de cola larga, 3 de agosto de 2009, Tom Demers
  6. ^ La cabeza pequeña, el cuerpo mediano y la cola larga... entonces, ¿dónde está Microsoft? Archivado el 17 de noviembre de 2015 en Wayback Machine , el 12 de marzo de 2005, Informe desde el interior de Lawrence Liu
  7. ^ Lin, Ruokuang; Ma, Qianli DY; Bian, Chunhua (2014). "Leyes de escala en el habla humana, aparición decreciente de nuevas palabras y un modelo generalizado". arXiv : 1412.4846 .
  8. ^ Dacey, MF (1 de abril de 1979). "Un proceso de crecimiento para las leyes sobre el tamaño de las ciudades de Zipf y Yule". Medio Ambiente y Planificación A . 11 (4): 361–372. doi :10.1068/a110361. S2CID  122325866.
  9. ^ Ley de Zipf o distribución rango-tamaño Archivado el 13 de febrero de 2007 en la Wayback Machine Steven Brakman, Harry Garretsen y Charles van Marrewijk
  10. ^ "Kwok Tong Soo (2002)" (PDF) .
  11. ^ Ley de Zipf o distribución rango-tamaño Archivado el 2 de marzo de 2007 en la Wayback Machine.
  12. ^ Cuberes, David, El ascenso y la decadencia de las ciudades, Universidad de Chicago, 29 de septiembre de 2004.

Otras lecturas

enlaces externos