stringtranslate.com

momento L

En estadística , los momentos L son una secuencia de estadísticas utilizadas para resumir la forma de una distribución de probabilidad . [1] [2] [3] [4] Son combinaciones lineales de estadísticas de orden ( estadísticas L ) análogas a los momentos convencionales , y pueden usarse para calcular cantidades análogas a la desviación estándar , la asimetría y la curtosis , denominada escala L. , L-asimetría y L-kurtosis respectivamente (la media L es idéntica a la media convencional ). Los momentos L estandarizados se denominan relaciones de momentos L y son análogos a los momentos estandarizados . Al igual que para los momentos convencionales, una distribución teórica tiene un conjunto de momentos L de población. Los momentos L de muestra se pueden definir para una muestra de la población y se pueden utilizar como estimadores de los momentos L de la población.

Momentos L de población

Para una variable aleatoria X , el momento L de la población r es [1]

donde X k:n denota el estadístico de r ésimo orden ( r ésimo valor más pequeño) en una muestra independiente de tamaño n de la distribución de X y denota el operador del valor esperado . En particular, los primeros cuatro momentos L de población son

Tenga en cuenta que los coeficientes del r ésimo momento L son los mismos que en el r ésimo término de la transformada binomial , como se usa en la diferencia finita de orden r (análogo finito a la derivada).

Los dos primeros de estos momentos L tienen nombres convencionales:

es la "media", "L-media" o "L-ubicación",
es la "escala L".

La escala L es igual a la mitad de la diferencia absoluta media . [5]

Momentos L de muestra

Los momentos L de la muestra se pueden calcular como los momentos L de la población de la muestra, sumando subconjuntos de elementos r de la muestra y, por lo tanto, promediando dividiendo por el coeficiente binomial :

Agruparlos por estadística de orden cuenta el número de formas en que un elemento de una muestra de n  elementos puede ser el jésimo elemento de un subconjunto de r  elementos y produce fórmulas del siguiente formato. Los estimadores directos para los primeros cuatro L-momentos en una muestra finita de n  observaciones son: [6]

donde x ( i ) es el estadístico de iésimo orden y es un coeficiente binomial . Los momentos L de muestra también se pueden definir indirectamente en términos de momentos ponderados de probabilidad, [1] [7] [8] , lo que conduce a un algoritmo más eficiente para su cálculo. [6] [9]

Relaciones de momento L

Un conjunto de relaciones de momentos L , o momentos L escalados, se define por

Los más útiles se denominan asimetría L y curtosis L.

Las relaciones de momentos L se encuentran dentro del intervalo ( −1, 1 ) . Se pueden encontrar límites más estrictos para algunas relaciones de momento L específicas; en particular, la L-kurtosis se encuentra en [ + 1 /4, 1 ) , y

[1]

También se puede definir una cantidad análoga al coeficiente de variación , pero basada en momentos L: que se denomina "coeficiente de variación L", o "L-CV". Para una variable aleatoria no negativa, ésta se encuentra en el intervalo (0, 1) [1] y es idéntica al coeficiente de Gini . [10]

Cantidades relacionadas

Los momentos L son cantidades estadísticas que se derivan de momentos ponderados de probabilidad [11] (PWM) que se definieron anteriormente (1979). [7] Los PWM se utilizan para estimar eficientemente los parámetros de distribuciones expresables en forma inversa, como las distribuciones Gumbel , [8] Tukey lambda y Wakeby .

Uso

Hay dos formas comunes de utilizar los momentos L, en ambos casos de forma análoga a los momentos convencionales:

  1. Como resumen estadístico de los datos.
  2. Derivar estimadores para los parámetros de distribuciones de probabilidad , aplicando el método de momentos a los L-momentos en lugar de los momentos convencionales.

Además de hacerlos con momentos estándar, este último (estimación) se realiza más comúnmente utilizando métodos de máxima verosimilitud ; sin embargo, el uso de momentos L ofrece una serie de ventajas. Específicamente, los momentos L son más robustos que los momentos convencionales, y la existencia de momentos L más altos solo requiere que la variable aleatoria tenga una media finita. Una desventaja de las relaciones de momento L para la estimación es su sensibilidad típicamente más pequeña. Por ejemplo, la distribución de Laplace tiene una curtosis de 6 y colas exponenciales débiles, pero una relación del cuarto momento L mayor que, por ejemplo, la distribución t de Student con df=3, que tiene una curtosis infinita y colas mucho más pesadas.

Como ejemplo, considere un conjunto de datos con algunos puntos de datos y un valor de datos periférico. Si se toma la desviación estándar ordinaria de este conjunto de datos, estará muy influenciada por este punto; sin embargo, si se toma la escala L, será mucho menos sensible a este valor de datos. En consecuencia, los momentos L son mucho más significativos cuando se trata de datos atípicos que los momentos convencionales. Sin embargo, también existen otros métodos más adecuados para lograr una robustez aún mayor que simplemente reemplazar los momentos por momentos L. Un ejemplo de esto es el uso de momentos L como estadísticas resumidas en la teoría de valores extremos  (EVT). Esta aplicación muestra la solidez limitada de los momentos L, es decir, las estadísticas L no son estadísticas resistentes , ya que un solo valor extremo puede desviarlas, pero debido a que son solo lineales (no estadísticas de orden superior ), se ven menos afectadas por los momentos L. valores que los momentos convencionales.

Otra ventaja que tienen los momentos L sobre los momentos convencionales es que su existencia sólo requiere que la variable aleatoria tenga una media finita, por lo que los momentos L existen incluso si los momentos convencionales más altos no existen (por ejemplo, para la distribución t de Student con bajos grados de libertad ). Además, se requiere una varianza finita para que los errores estándar de las estimaciones de los momentos L sean finitos. [1]

Algunas apariciones de momentos L en la literatura estadística incluyen el libro de David y Nagaraja (2003, Sección 9.9) [12] y varios artículos. [10] [13] [14] [15] [16] [17] Se han informado varias comparaciones favorables de momentos L con momentos ordinarios. [18] [19]

Valores para algunas distribuciones comunes.

La siguiente tabla proporciona expresiones para los dos primeros momentos L y valores numéricos de las dos primeras relaciones de momentos L de algunas distribuciones de probabilidad continua comunes con relaciones de momentos L constantes. [1] [5] Se han derivado expresiones más complejas para algunas distribuciones adicionales para las cuales las relaciones del momento L varían con uno o más de los parámetros distribucionales, incluidos log -normal , gamma , Pareto generalizado , valor extremo generalizado y generalizado. distribuciones logísticas . [1]

La notación de los parámetros de cada distribución es la misma que la utilizada en el artículo vinculado. En la expresión de la media de la distribución de Gumbel , γe es la constante de Euler-Mascheroni 0,5772 1566 4901 ....

Extensiones

Los momentos L recortados son generalizaciones de momentos L que dan peso cero a las observaciones extremas. Por lo tanto, son más resistentes a la presencia de valores atípicos y, a diferencia de los momentos L, pueden estar bien definidos para distribuciones para las que no existe la media, como la distribución de Cauchy . [20]

Ver también

Referencias

  1. ^ abcdefgh Hosking, JRM (1990). "Momentos L: análisis y estimación de distribuciones mediante combinaciones lineales de estadísticas de orden". Revista de la Royal Statistical Society, Serie B. 52 (1): 105-124. JSTOR  2345653.
  2. ^ Hosking, JRM (1992). "¿Momentos o momentos L? Un ejemplo que compara dos medidas de forma distributiva". El estadístico estadounidense . 46 (3): 186–189. doi :10.2307/2685210. JSTOR  2685210.
  3. ^ Hosking, JRM (2006). "Sobre la caracterización de distribuciones por sus momentos L". Revista de planificación e inferencia estadística . 136 : 193-198. doi :10.1016/j.jspi.2004.06.004.
  4. ^ Asquith, WH (2011) Análisis distribucional con estadísticas de momento L utilizando el entorno R para computación estadística , Create Space Independent Publishing Platform, [impresión bajo demanda], ISBN 1-463-50841-7 
  5. ^ ab Jones, MC (2002). "Distribución más sencilla para estudiantes". Revista de la Royal Statistical Society, Serie D. 51 (1): 41–49. doi :10.1111/1467-9884.00297. JSTOR  3650389.
  6. ^ ab Wang, QJ (1996). "Estimadores de muestra directa de momentos L". Investigación de recursos hídricos . 32 (12): 3617–3619. doi :10.1029/96WR02675.
  7. ^ ab Greenwood, JA; Landwehr, JM; Matalas, Carolina del Norte; Wallis, JR (1979). "Momentos ponderados de probabilidad: Definición y relación con parámetros de varias distribuciones expresados ​​en forma inversa" (PDF) . Investigación de recursos hídricos . 15 (5): 1049–1054. doi :10.1029/WR015i005p01049. S2CID  121955257. Archivado desde el original (PDF) el 10 de febrero de 2020.
  8. ^ ab Landwehr, JM; Matalas, Carolina del Norte; Wallis, JR (1979). "Momentos ponderados de probabilidad comparados con algunas técnicas tradicionales en la estimación de parámetros y cuantiles de Gumbel". Investigación de recursos hídricos . 15 (5): 1055–1064. doi :10.1029/WR015i005p01055.
  9. ^ "L momentos". Trama de datos del NIST. itl.nist.gov (documentación). Instituto Nacional de Estándares y Tecnología . 6 de enero de 2006 . Consultado el 19 de enero de 2013 .
  10. ^ ab Valbuena, R.; Maltamo, M.; Mehtätalo, L.; Packalen, P. (2017). "Las características estructurales clave de los bosques boreales se pueden detectar directamente utilizando momentos L a partir de datos LIDAR aéreos". Teledetección del Medio Ambiente . 194 : 437–446. doi :10.1016/j.rse.2016.10.024.
  11. ^ Hosking, JRM; Wallis, JR (2005). Análisis de frecuencia regional: un enfoque basado en momentos L. Prensa de la Universidad de Cambridge. pag. 3.ISBN _ 978-0521019408. Consultado el 22 de enero de 2013 .
  12. ^ David, HA; Nagaraja, HN (2003). Estadísticas de pedidos (3ª ed.). Wiley. ISBN 978-0-471-38926-2.
  13. ^ Serfling, R.; Xiao, P. (2007). "Una contribución a los momentos L multivariados: matrices de comomentos L". Revista de análisis multivariado . 98 (9): 1765-1781. CiteSeerX 10.1.1.62.4288 . doi :10.1016/j.jmva.2007.01.008. 
  14. ^ Delicado, P.; Goria, Minnesota (2008). "Una pequeña comparación de muestras de métodos de máxima verosimilitud, momentos y momentos L para la distribución de potencia exponencial asimétrica". Estadística computacional y análisis de datos . 52 (3): 1661-1673. doi :10.1016/j.csda.2007.05.021.
  15. ^ Alkasasbeh, señor; Raqab, MZ (2009). "Estimación de los parámetros de distribución logística generalizada: estudio comparativo". Metodología estadística . 6 (3): 262–279. doi :10.1016/j.stamet.2008.10.001.
  16. ^ Jones, MC (2004). "Sobre algunas expresiones de varianza, covarianza, asimetría y momentos L". Revista de planificación e inferencia estadística . 126 (1): 97-106. doi :10.1016/j.jspi.2003.09.001.
  17. ^ Jones, MC (2009). "Distribución de Kumaraswamy: una distribución de tipo beta con algunas ventajas de manejabilidad". Metodología estadística . 6 (1): 70–81. doi :10.1016/j.stamet.2008.04.001.
  18. ^ Royston, P. (1992). "¿Qué medidas de asimetría y curtosis son mejores?". Estadística en Medicina . 11 (3): 333–343. doi :10.1002/sim.4780110306. PMID  1609174.
  19. ^ Ulrych, TJ; Velis, DR; Woodbury, AD; Sacchi, MD (2000). "Momentos L y momentos C". Investigación estocástica ambiental y evaluación de riesgos . 14 (1): 50–68. doi :10.1007/s004770050004. S2CID  120542594.
  20. ^ Elamir, Elsayed AH; Seheult, Allan H. (2003). "Momentos L recortados". Estadística computacional y análisis de datos . 43 (3): 299–314. doi :10.1016/S0167-9473(02)00250-5.

enlaces externos