Distribución generalizada de Pareto

En estadística , la distribución generalizada de Pareto (GPD) es una familia de distribuciones de probabilidad continuas . A menudo se utiliza para modelar las colas de otra distribución. Se especifica mediante tres parámetros: ubicación , escala y forma . ^[2]^[3] A veces se especifica solo por la escala y la forma ^[4] y, a veces, solo por su parámetro de forma. Algunas referencias dan el parámetro de forma como . ^[5] $\mu$ $\sigma$ $\xi$ $\kappa =-\xi \,$

Definición

La función de distribución acumulativa estándar (cdf) del GPD está definida por ^[6]

F_{\xi }(z)={\begin{cases}1-\left(1+\xi z\right)^{-1/\xi }&{\text{for }}\xi \neq 0,\\1-e^{-z}&{\text{for }}\xi =0.\end{cases}}

donde el apoyo es para y para . La función de densidad de probabilidad (pdf) correspondiente es $z\geq 0$ $\xi \geq 0$ $0\leq z\leq -1/\xi$ $\xi <0$

f_{\xi }(z)={\begin{cases}(1+\xi z)^{-{\frac {\xi +1}{\xi }}}&{\text{for }}\xi \neq 0,\\e^{-z}&{\text{for }}\xi =0.\end{cases}}

Caracterización

La familia de distribuciones de escala de ubicación relacionada se obtiene reemplazando el argumento z por y ajustando el soporte en consecuencia. ${\frac {x-\mu }{\sigma }}$

La función de distribución acumulativa de ( , , y ) es $X\sim GPD(\mu ,\sigma ,\xi )$ $\mu \in \mathbb {R}$ $\sigma >0$ $\xi \in \mathbb {R}$

F_{(\mu ,\sigma ,\xi )}(x)={\begin{cases}1-\left(1+{\frac {\xi (x-\mu )}{\sigma }}\right)^{-1/\xi }&{\text{for }}\xi \neq 0,\\1-\exp \left(-{\frac {x-\mu }{\sigma }}\right)&{\text{for }}\xi =0,\end{cases}}

donde el apoyo de es cuando , y cuando . $X$ $x\geqslant \mu$ $\xi \geqslant 0\,$ $\mu \leqslant x\leqslant \mu -\sigma /\xi$ $\xi <0$

La función de densidad de probabilidad (pdf) de es $X\sim GPD(\mu ,\sigma ,\xi )$

f_{(\mu ,\sigma ,\xi )}(x)={\frac {1}{\sigma }}\left(1+{\frac {\xi (x-\mu )}{\sigma }}\right)^{\left(-{\frac {1}{\xi }}-1\right)}

de nuevo, para cuando , y cuando . $x\geqslant \mu$ $\xi \geqslant 0$ $\mu \leqslant x\leqslant \mu -\sigma /\xi$ $\xi <0$

El pdf es una solución de la siguiente ecuación diferencial : ^{[ cita requerida ]}

\left\{{\begin{array}{l}f'(x)(-\mu \xi +\sigma +\xi x)+(\xi +1)f(x)=0,\\f(0)={\frac {\left(1-{\frac {\mu \xi }{\sigma }}\right)^{-{\frac {1}{\xi }}-1}}{\sigma }}\end{array}}\right\}

Casos especiales

Si la forma y la ubicación son ambas cero, el GPD es equivalente a la distribución exponencial . $\xi$ $\mu$
Con forma , la GPD es equivalente a la distribución uniforme continua . ^[7] $\xi =-1$ $U(0,\sigma )$
Con forma y ubicación , la distribución GPD es equivalente a la distribución de Pareto con escala y forma . $\xi >0$ $\mu =\sigma$ $x_{m}=\sigma /\xi$ $\alpha =1/\xi$
Si , , , entonces [1]. (exGPD representa la distribución de Pareto generalizada exponencial). $X$ $\sim$ $GPD$ $($ $\mu =0$ $\sigma$ $\xi$ $)$ $Y=\log(X)\sim exGPD(\sigma ,\xi )$
GPD es similar a la distribución de Burr .

Generación de variables aleatorias generalizadas de Pareto

Generación de variables aleatorias GPD

Si U se distribuye uniformemente en (0, 1], entonces

X=\mu +{\frac {\sigma (U^{-\xi }-1)}{\xi }}\sim GPD(\mu ,\sigma ,\xi \neq 0)

X=\mu -\sigma \ln(U)\sim GPD(\mu ,\sigma ,\xi =0).

Ambas fórmulas se obtienen por inversión de la CDF.

En Matlab Statistics Toolbox, puede utilizar fácilmente el comando "gprnd" para generar números aleatorios de Pareto generalizados.

GPD como mezcla gamma exponencial

Una variable aleatoria GPD también se puede expresar como una variable aleatoria exponencial, con un parámetro de tasa distribuida Gamma.

X|\Lambda \sim \operatorname {Exp} (\Lambda )

\Lambda \sim \operatorname {Gamma} (\alpha ,\beta )

entonces

X\sim \operatorname {GPD} (\xi =1/\alpha ,\ \sigma =\beta /\alpha )

Observe, sin embargo, que como los parámetros para la distribución Gamma deben ser mayores que cero, obtenemos las restricciones adicionales de que: deben ser positivos. $\xi$

Además de esta expresión mixta (o compuesta), la distribución de Pareto generalizada también se puede expresar como una simple razón. Concretamente, para y , tenemos . Esto es una consecuencia de la mezcla después de fijar y tener en cuenta que los parámetros de velocidad de la distribución exponencial y gamma son simplemente constantes multiplicativas inversas. $Y\sim {\text{Exponential}}(1)$ $Z\sim {\text{Gamma}}(1/\xi ,1)$ $\mu +\sigma {\frac {Y}{\xi Z}}\sim {\text{GPD}}(\mu ,\sigma ,\xi )$ $\beta =\alpha$

Distribución Pareto generalizada exponencial

La distribución Pareto generalizada exponencial (exGPD)

La pdf de la (distribución de Pareto generalizada exponencial) para diferentes valores y . $exGPD(\sigma ,\xi )$ $\sigma$ $\xi$

Si , , , entonces se distribuye de acuerdo con la distribución de Pareto generalizada exponencial, denotada por , . $X\sim GPD$ $($ $\mu =0$ $\sigma$ $\xi$ $)$ $Y=\log(X)$ $Y$ $\sim$ $exGPD$ $($ $\sigma$ $\xi$ $)$

La función de densidad de probabilidad (pdf) de , es $Y$ $\sim$ $exGPD$ $($ $\sigma$ $\xi$ $)\,\,(\sigma >0)$

g_{(\sigma ,\xi )}(y)={\begin{cases}{\frac {e^{y}}{\sigma }}{\bigg (}1+{\frac {\xi e^{y}}{\sigma }}{\bigg )}^{-1/\xi -1}\,\,\,\,{\text{for }}\xi \neq 0,\\{\frac {1}{\sigma }}e^{y-e^{y}/\sigma }\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,{\text{for }}\xi =0,\end{cases}}

donde el apoyo es para , y para . $-\infty <y<\infty$ $\xi \geq 0$ $-\infty <y\leq \log(-\sigma /\xi )$ $\xi <0$

Para todos , se convierte en el parámetro de ubicación. Consulte el panel derecho para ver el PDF cuando la forma es positiva. $\xi$ $\log \sigma$ $\xi$

El exGPD tiene momentos finitos de todos los órdenes para todos y . $\sigma >0$ $-\infty <\xi <\infty$

La función generadora de momentos de es $Y\sim exGPD(\sigma ,\xi )$

M_{Y}(s)=E[e^{sY}]={\begin{cases}-{\frac {1}{\xi }}{\bigg (}-{\frac {\sigma }{\xi }}{\bigg )}^{s}B(s+1,-1/\xi )\,\,\,\,\,\,\,\,\,\,\,\,{\text{for }}s\in (-1,\infty ),\xi <0,\\{\frac {1}{\xi }}{\bigg (}{\frac {\sigma }{\xi }}{\bigg )}^{s}B(s+1,1/\xi -s)\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,{\text{for }}s\in (-1,1/\xi ),\xi >0,\\\sigma ^{s}\Gamma (1+s)\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,{\text{for }}s\in (-1,\infty ),\xi =0,\end{cases}}

donde y denotan la función beta y la función gamma , respectivamente. $B(a,b)$ $\Gamma (a)$

El valor esperado de , depende de los parámetros de escala y forma , mientras que participa a través de la función digamma : $Y$ $\sim$ $exGPD$ $($ $\sigma$ $\xi$ $)$ $\sigma$ $\xi$ $\xi$

E[Y]={\begin{cases}\log \ {\bigg (}-{\frac {\sigma }{\xi }}{\bigg )}+\psi (1)-\psi (-1/\xi +1)\,\,\,\,\,\,\,\,\,\,\,\,\,\,{\text{for }}\xi <0,\\\log \ {\bigg (}{\frac {\sigma }{\xi }}{\bigg )}+\psi (1)-\psi (1/\xi )\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,{\text{for }}\xi >0,\\\log \sigma +\psi (1)\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,{\text{for }}\xi =0.\end{cases}}

Nótese que para un valor fijo para , el juega como el parámetro de ubicación bajo la distribución de Pareto generalizada exponencial. $\xi \in (-\infty ,\infty )$ $\log \ \sigma$

La varianza de , depende del parámetro de forma únicamente a través de la función poligamma de orden 1 (también llamada función trigamma ): $Y$ $\sim$ $exGPD$ $($ $\sigma$ $\xi$ $)$ $\xi$

Var[Y]={\begin{cases}\psi '(1)-\psi '(-1/\xi +1)\,\,\,\,\,\,\,\,\,\,\,\,\,{\text{for }}\xi <0,\\\psi '(1)+\psi '(1/\xi )\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,{\text{for }}\xi >0,\\\psi '(1)\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,{\text{for }}\xi =0.\end{cases}}

Consulte el panel derecho para ver la varianza en función de . Tenga en cuenta que . $\xi$ $\psi '(1)=\pi ^{2}/6\approx 1.644934$

Obsérvese que los roles del parámetro de escala y del parámetro de forma se pueden interpretar de forma separada, lo que puede llevar a una estimación robusta y eficiente para el que se utiliza [2]. Los roles de los dos parámetros están asociados entre sí (al menos hasta el segundo momento central); consulte la fórmula de varianza en la que participan ambos parámetros. $\sigma$ $\xi$ $Y\sim exGPD(\sigma ,\xi )$ $\xi$ $X\sim GPD(\sigma ,\xi )$ $X\sim GPD(\mu =0,\sigma ,\xi )$ $Var(X)$

El estimador de Hill

Supongamos que son observaciones (no necesariamente iid) de una distribución de cola pesada desconocida , de modo que su distribución de cola varía regularmente con el índice de cola (por lo tanto, el parámetro de forma correspondiente es ). Para ser más específicos, la distribución de cola se describe como $X_{1:n}=(X_{1},\cdots ,X_{n})$ $n$ $F$ $1/\xi$ $\xi$

{\bar {F}}(x)=1-F(x)=L(x)\cdot x^{-1/\xi },\,\,\,\,\,{\text{for some }}\xi >0,\,\,{\text{where }}L{\text{ is a slowly varying function.}}

Es de particular interés en la teoría de valores extremos estimar el parámetro de forma , especialmente cuando es positivo (la llamada distribución de cola pesada). $\xi$ $\xi$

Sea su función de distribución de exceso condicional. El teorema de Pickands–Balkema–de Haan (Pickands, 1975; Balkema y de Haan, 1974) establece que para una clase grande de funciones de distribución subyacentes , y grande , se aproxima bien mediante la distribución generalizada de Pareto (GPD), que motivó los métodos de pico sobre umbral (POT) para estimar : la GPD juega el papel clave en el enfoque POT. $F_{u}$ $F$ $u$ $F_{u}$ $\xi$

Un estimador reconocido que utiliza la metodología POT es el estimador de Hill . La formulación técnica del estimador de Hill es la siguiente. Para , escriba para el -ésimo valor más grande de . Luego, con esta notación, el estimador de Hill (consulte la página 190 de la Referencia 5 de Embrechts et al [3]) basado en las estadísticas de orden superior se define como $1\leq i\leq n$ $X_{(i)}$ $i$ $X_{1},\cdots ,X_{n}$ $k$

{\widehat {\xi }}_{k}^{\text{Hill}}={\widehat {\xi }}_{k}^{\text{Hill}}(X_{1:n})={\frac {1}{k-1}}\sum _{j=1}^{k-1}\log {\bigg (}{\frac {X_{(j)}}{X_{(k)}}}{\bigg )},\,\,\,\,\,\,\,\,{\text{for }}2\leq k\leq n.

En la práctica, el estimador de Hill se utiliza de la siguiente manera. Primero, se calcula el estimador en cada entero , y luego se trazan los pares ordenados . Luego, se selecciona del conjunto de estimadores de Hill que sean aproximadamente constantes con respecto a : estos valores estables se consideran estimaciones razonables para el parámetro de forma . Si son iid, entonces el estimador de Hill es un estimador consistente para el parámetro de forma [4]. ${\widehat {\xi }}_{k}^{\text{Hill}}$ $k\in \{2,\cdots ,n\}$ $\{(k,{\widehat {\xi }}_{k}^{\text{Hill}})\}_{k=2}^{n}$ $\{{\widehat {\xi }}_{k}^{\text{Hill}}\}_{k=2}^{n}$ $k$ $\xi$ $X_{1},\cdots ,X_{n}$ $\xi$

Obsérvese que el estimador de Hill utiliza la transformación logarítmica para las observaciones . (El estimador de Pickand también empleó la transformación logarítmica, pero de una manera ligeramente diferente [5]). ${\widehat {\xi }}_{k}^{\text{Hill}}$ $X_{1:n}=(X_{1},\cdots ,X_{n})$ ${\widehat {\xi }}_{k}^{\text{Pickand}}$

Véase también

Distribución de rebabas
Distribución de Pareto
Distribución generalizada de valores extremos
Distribución Pareto generalizada exponencial
Teorema de Pickands-Balkema-de Haan

Referencias

^ ab Norton, Matthew; Khokhlov, Valentyn; Uryasev, Stan (2019). "Cálculo de CVaR y bPOE para distribuciones de probabilidad comunes con aplicación a la optimización de carteras y estimación de densidad" (PDF) . Anales de investigación de operaciones . 299 (1–2). Springer: 1281–1315. arXiv : 1811.11301 . doi :10.1007/s10479-019-03373-1. S2CID 254231768. Archivado desde el original (PDF) el 2023-03-31 . Consultado el 2023-02-27 .
^ Coles, Stuart (12 de diciembre de 2001). Introducción al modelado estadístico de valores extremos. Springer. pág. 75. ISBN 9781852334598.
^ Dargahi-Noubary, GR (1989). "Sobre la estimación de la cola: un método mejorado". Geología matemática . 21 (8): 829–842. Código Bibliográfico :1989MatGe..21..829D. doi :10.1007/BF00894450. S2CID 122710961.
^ Hosking, JRM; Wallis, JR (1987). "Estimación de parámetros y cuantiles para la distribución generalizada de Pareto". Technometrics . 29 (3): 339–349. doi :10.2307/1269343. JSTOR 1269343.
^ Davison, AC (30 de septiembre de 1984). "Modelado de excesos por encima de umbrales altos, con una aplicación". En de Oliveira, J. Tiago (ed.). Extremos estadísticos y aplicaciones . Kluwer. pág. 462. ISBN 9789027718044.
^ Embrechts, Paul; Klüppelberg, Claudia ; Mikosch, Thomas (1 de enero de 1997). Modelado de eventos extremos para seguros y finanzas. Springer. p. 162. ISBN 9783540609315.
^ Castillo, Enrique y Ali S. Hadi. "Ajuste de la distribución generalizada de Pareto a los datos". Journal of the American Statistical Association 92.440 (1997): 1609-1620.

Lectura adicional

Pickands, James (1975). "Inferencia estadística utilizando estadísticas de orden extremo" (PDF) . Anales de Estadística . 3 s : 119–131. doi : 10.1214/aos/1176343003 .
Balkema, A.; De Haan, Laurens (1974). "Tiempo de vida residual a una edad avanzada". Anales de probabilidad . 2 (5): 792–804. doi : 10.1214/aop/1176996548 .
Lee, Seyoon; Kim, JHK (2018). "Distribución Pareto generalizada exponencial: propiedades y aplicaciones hacia la teoría del valor extremo". Comunicaciones en Estadística - Teoría y Métodos . 48 (8): 1–25. arXiv : 1708.01686 . doi :10.1080/03610926.2018.1441418. S2CID 88514574.
NL Johnson; S. Kotz; N. Balakrishnan (1994). Distribuciones univariadas continuas, volumen 1, segunda edición . Nueva York: Wiley. ISBN 978-0-471-58495-7.Capítulo 20, Sección 12: Distribuciones de Pareto generalizadas.
Barry C. Arnold (2011). "Capítulo 7: Distribuciones de Pareto y Pareto generalizadas". En Duangkamon Chotikapanich (ed.). Modelado de distribuciones y curvas de Lorenz . Nueva York: Springer. ISBN 9780387727967.
Arnold, BC; Laguna, L. (1977). Sobre distribuciones generalizadas de Pareto con aplicaciones a datos de ingresos . Ames, Iowa: Iowa State University, Departamento de Economía.

Enlaces externos

Mathworks: distribución generalizada de Pareto