Secuencia estadística que caracteriza las distribuciones de probabilidad
En estadística , los momentos L son una secuencia de estadísticas utilizadas para resumir la forma de una distribución de probabilidad . [1] [2] [3] [4] Son combinaciones lineales de estadísticas de orden ( estadísticas L ) análogas a los momentos convencionales , y se pueden utilizar para calcular cantidades análogas a la desviación estándar , la asimetría y la curtosis , denominadas escala L, asimetría L y curtosis L respectivamente (la media L es idéntica a la media convencional ). Los momentos L estandarizados se denominan razones de momentos L y son análogos a los momentos estandarizados . Al igual que para los momentos convencionales, una distribución teórica tiene un conjunto de momentos L de población. Los momentos L de muestra se pueden definir para una muestra de la población y se pueden utilizar como estimadores de los momentos L de población.
Momentos L de población
Para una variable aleatoria X , el momento L de la población r es [1]
donde X k:n denota el estadístico de orden k ( el k valor más pequeño) en una muestra independiente de tamaño n de la distribución de X y denota el operador de valor esperado . En particular, los primeros cuatro momentos L de la población son
Nótese que los coeficientes del momento L r son los mismos que en el término r de la transformada binomial , tal como se utiliza en la diferencia finita de orden r (análogo finito a la derivada).
Los dos primeros de estos momentos L tienen nombres convencionales:
- es la "media", "L-media" o "L-ubicación",
- es la "escala L".
La escala L es igual a la mitad de la diferencia absoluta media . [5]
Ejemplos de momentos L
Los momentos L de la muestra se pueden calcular como los momentos L de la población de la muestra, sumando los subconjuntos de r elementos de la muestra y, por lo tanto, promediando dividiendo por el coeficiente binomial :
Al agruparlos por orden estadístico, se cuenta la cantidad de formas en que un elemento de una muestra de n elementos puede ser el elemento j de un subconjunto de r elementos, y se obtienen fórmulas con la siguiente forma. Los estimadores directos para los primeros cuatro momentos L en una muestra finita de n observaciones son: [6]
donde x ( i ) es la estadística de orden i y es un coeficiente binomial . Los momentos L de muestra también se pueden definir indirectamente en términos de momentos ponderados por probabilidad, [1] [7] [8] lo que conduce a un algoritmo
más eficiente para su cálculo. [6] [9]
Relaciones de momentos L
Un conjunto de relaciones de momentos L , o momentos L escalados, se define mediante
Las más útiles de estas se denominan L-asimetría y L -curtosis .
Las razones de momentos L se encuentran dentro del intervalo ( −1, 1 ) . Se pueden encontrar límites más estrictos para algunas razones de momentos L específicas; en particular, la L-curtosis se encuentra en [ − + 1 /4 , 1 ) ,y
- [1]
También se puede definir una cantidad análoga al coeficiente de variación , pero basada en momentos L,
que se denomina "coeficiente de variación L" o "CV-L". Para una variable aleatoria no negativa, este se encuentra en el intervalo (0, 1) [1] y es idéntico al coeficiente de Gini . [10]
Cantidades relacionadas
Los momentos L son cantidades estadísticas que se derivan de los momentos ponderados por probabilidad [11] (PWM) que se definieron anteriormente (1979). [7] Los PWM se utilizan para estimar de manera eficiente los parámetros de distribuciones expresables en forma inversa, como las distribuciones de Gumbel , [8] lambda de Tukey y Wakeby .
Uso
Hay dos formas comunes en que se utilizan los momentos L, en ambos casos de forma análoga a los momentos convencionales:
- Como estadísticas de resumen de datos.
- Para derivar estimadores para los parámetros de distribuciones de probabilidad , aplicando el método de momentos a los momentos L en lugar de a los momentos convencionales.
Además de hacer esto con momentos estándar, lo último (estimación) se hace más comúnmente usando métodos de máxima verosimilitud ; sin embargo, el uso de momentos L proporciona una serie de ventajas. Específicamente, los momentos L son más robustos que los momentos convencionales, y la existencia de momentos L más altos solo requiere que la variable aleatoria tenga una media finita. Una desventaja de las razones de los momentos L para la estimación es su sensibilidad típicamente menor. Por ejemplo, la distribución de Laplace tiene una curtosis de 6 y colas exponenciales débiles, pero una cuarta razón de momentos L más grande que, por ejemplo, la distribución t de Student con gl=3, que tiene una curtosis infinita y colas mucho más pesadas.
Como ejemplo, considere un conjunto de datos con algunos puntos de datos y un valor de datos atípico. Si se toma la desviación estándar ordinaria de este conjunto de datos, estará altamente influenciada por este punto: sin embargo, si se toma la escala L, será mucho menos sensible a este valor de datos. En consecuencia, los momentos L son mucho más significativos cuando se trata de valores atípicos en los datos que los momentos convencionales. Sin embargo, también hay otros métodos más adecuados para lograr una robustez incluso mayor que simplemente reemplazar momentos por momentos L. Un ejemplo de esto es usar momentos L como estadísticas de resumen en la teoría de valores extremos (EVT). Esta aplicación muestra la robustez limitada de los momentos L, es decir, las estadísticas L no son estadísticas resistentes , ya que un solo valor extremo puede alterarlas, pero debido a que son solo lineales (no estadísticas de orden superior ), se ven menos afectadas por los valores extremos que los momentos convencionales.
Otra ventaja que tienen los momentos L sobre los momentos convencionales es que su existencia solo requiere que la variable aleatoria tenga una media finita, por lo que los momentos L existen incluso si los momentos convencionales más altos no existen (por ejemplo, para la distribución t de Student con bajos grados de libertad ). Además, se requiere una varianza finita para que los errores estándar de las estimaciones de los momentos L sean finitos. [1]
Algunas apariciones de momentos L en la literatura estadística incluyen el libro de David y Nagaraja (2003, Sección 9.9) [12] y una serie de artículos. [10] [13] [14] [15] [16] [17] Se han informado varias comparaciones favorables de momentos L con momentos ordinarios. [18] [19]
Valores para algunas distribuciones comunes
La siguiente tabla proporciona expresiones para los dos primeros momentos L y valores numéricos de las dos primeras razones de momentos L de algunas distribuciones de probabilidad continuas comunes con razones de momentos L constantes. [1] [5]
Se han derivado expresiones más complejas para algunas distribuciones adicionales para las que las razones de momentos L varían con uno o más de los parámetros de distribución, incluidas las distribuciones log-normal , Gamma , Pareto generalizada , valor extremo generalizado y logística generalizada . [1]
La notación para los parámetros de cada distribución es la misma que la utilizada en el artículo vinculado. En la expresión para la media de la distribución de Gumbel , γ e es la constante de Euler-Mascheroni 0,5772 1566 4901 ... .
Extensiones
Los momentos L recortados son generalizaciones de los momentos L que otorgan un peso cero a las observaciones extremas. Por lo tanto, son más robustos a la presencia de valores atípicos y, a diferencia de los momentos L, pueden estar bien definidos para distribuciones para las que no existe la media, como la distribución de Cauchy . [20]
Véase también
Referencias
- ^ abcdefgh Hosking, JRM (1990). "L-momentos: análisis y estimación de distribuciones utilizando combinaciones lineales de estadísticas de orden". Revista de la Royal Statistical Society, Serie B . 52 (1): 105–124. JSTOR 2345653.
- ^ Hosking, JRM (1992). "¿Momentos o momentos L? Un ejemplo que compara dos medidas de forma distributiva". The American Statistician . 46 (3): 186–189. doi :10.2307/2685210. JSTOR 2685210.
- ^ Hosking, JRM (2006). "Sobre la caracterización de distribuciones por sus momentos L". Revista de planificación e inferencia estadística . 136 : 193–198. doi :10.1016/j.jspi.2004.06.004.
- ^ Asquith, WH (2011) Análisis distribucional con estadísticas de momento L utilizando el entorno R para computación estadística , Create Space Independent Publishing Platform, [impresión bajo demanda], ISBN 1-463-50841-7
- ^ ab Jones, MC (2002). "Distribución más simple de Student". Revista de la Royal Statistical Society, Serie D . 51 (1): 41–49. doi :10.1111/1467-9884.00297. JSTOR 3650389.
- ^ ab Wang, QJ (1996). "Estimadores de muestra directa de momentos L". Investigación de recursos hídricos . 32 (12): 3617–3619. doi :10.1029/96WR02675.
- ^ ab Greenwood, JA; Landwehr, JM; Matalas, NC; Wallis, JR (1979). "Momentos ponderados por probabilidad: Definición y relación con los parámetros de varias distribuciones expresadas en forma inversa" (PDF) . Water Resources Research . 15 (5): 1049–1054. doi :10.1029/WR015i005p01049. S2CID 121955257. Archivado desde el original (PDF) el 2020-02-10.
- ^ ab Landwehr, JM; Matalas, NC; Wallis, JR (1979). "Momentos ponderados por probabilidad comparados con algunas técnicas tradicionales para estimar parámetros y cuantiles de Gumbel". Investigación de recursos hídricos . 15 (5): 1055–1064. doi :10.1029/WR015i005p01055.
- ^ "Momentos L". NIST Dataplot. itl.nist.gov (documentación). Instituto Nacional de Estándares y Tecnología . 6 de enero de 2006. Consultado el 19 de enero de 2013 .
- ^ ab Valbuena, R.; Maltamo, M.; Mehtätalo, L.; Packalen, P. (2017). "Las características estructurales clave de los bosques boreales pueden detectarse directamente utilizando momentos L a partir de datos lidar aerotransportados". Teledetección del medio ambiente . 194 : 437–446. doi :10.1016/j.rse.2016.10.024.
- ^ Hosking, JRM; Wallis, JR (2005). Análisis de frecuencias regionales: un enfoque basado en momentos L. Cambridge University Press. pág. 3. ISBN 978-0521019408. Recuperado el 22 de enero de 2013 .
- ^ David, HA; Nagaraja, HN (2003). Estadísticas de pedidos (3ª ed.). Wiley. ISBN 978-0-471-38926-2.
- ^ Serfling, R.; Xiao, P. (2007). "Una contribución a los momentos L multivariados: matrices de comomentos L". Revista de análisis multivariado . 98 (9): 1765-1781. CiteSeerX 10.1.1.62.4288 . doi :10.1016/j.jmva.2007.01.008.
- ^ Delicado, P.; Goria, MN (2008). "Una pequeña muestra de comparación de métodos de máxima verosimilitud, momentos y momentos L para la distribución de potencia exponencial asimétrica". Computational Statistics & Data Analysis . 52 (3): 1661–1673. doi :10.1016/j.csda.2007.05.021.
- ^ Alkasasbeh, MR; Raqab, MZ (2009). "Estimación de los parámetros de distribución logística generalizada: estudio comparativo". Metodología estadística . 6 (3): 262–279. doi :10.1016/j.stamet.2008.10.001.
- ^ Jones, MC (2004). "Sobre algunas expresiones para varianza, covarianza, asimetría y momentos L". Revista de planificación e inferencia estadística . 126 (1): 97–106. doi :10.1016/j.jspi.2003.09.001.
- ^ Jones, MC (2009). "Distribución de Kumaraswamy: una distribución de tipo beta con algunas ventajas de manejabilidad". Metodología estadística . 6 (1): 70–81. doi :10.1016/j.stamet.2008.04.001.
- ^ Royston, P. (1992). "¿Cuáles son las mejores medidas de asimetría y curtosis?". Estadísticas en Medicina . 11 (3): 333–343. doi :10.1002/sim.4780110306. PMID 1609174.
- ^ Ulrych, TJ; Velis, DR; Woodbury, AD; Sacchi, MD (2000). "Momentos L y momentos C". Investigación ambiental estocástica y evaluación de riesgos . 14 (1): 50–68. doi :10.1007/s004770050004. S2CID 120542594.
- ^ Elamir, Elsayed AH; Seheult, Allan H. (2003). "Momentos L recortados". Estadística computacional y análisis de datos . 43 (3): 299–314. doi :10.1016/S0167-9473(02)00250-5.
Enlaces externos
- La página de los momentos L Jonathan RM Hosking, IBM Research
- Momentos L. Manual de referencia de Dataplot , vol. 1, capítulo auxiliar. Instituto Nacional de Normas y Tecnología , 2006. Consultado el 25 de mayo de 2010.
- Lmo lightweight Python incluye funciones para el cálculo rápido de momentos L, momentos L recortados y comomentos L multivariados.