Distribución parametrizada por cuantiles

Una distribución parametrizada por cuantiles (QPD) es una distribución de probabilidad que está parametrizada directamente por los datos. Fueron creadas para satisfacer la necesidad de distribuciones de probabilidad continuas fáciles de usar y lo suficientemente flexibles como para representar una amplia gama de incertidumbres, como las que se encuentran comúnmente en los negocios, la economía, la ingeniería y la ciencia. Debido a que las QPD están parametrizadas directamente por los datos, tienen la ventaja práctica de evitar el paso intermedio de la estimación de parámetros , un proceso que consume mucho tiempo y que generalmente requiere métodos iterativos no lineales para estimar los parámetros de la distribución de probabilidad a partir de los datos. Algunas QPD tienen una flexibilidad de forma prácticamente ilimitada y también momentos de forma cerrada.

Historia

El desarrollo de distribuciones parametrizadas por cuantiles se inspiró en la necesidad práctica de distribuciones de probabilidad continuas flexibles que sean fáciles de ajustar a los datos. Históricamente, las familias de distribuciones de Pearson ^[1] y Johnson ^[2]^[3] se han utilizado cuando se necesita flexibilidad en la forma. Esto se debe a que ambas familias pueden coincidir con los primeros cuatro momentos (media, varianza, asimetría y curtosis) de cualquier conjunto de datos. Sin embargo, en muchos casos, estas distribuciones son difíciles de ajustar a los datos o no son lo suficientemente flexibles como para ajustarse a los datos de manera apropiada.

Por ejemplo, la distribución beta es una distribución de Pearson flexible que se utiliza con frecuencia para modelar porcentajes de una población. Sin embargo, si las características de esta población son tales que la función de distribución acumulativa (CDF) deseada debe pasar por ciertos puntos específicos de la CDF, puede que no exista ninguna distribución beta que satisfaga esta necesidad. Debido a que la distribución beta solo tiene dos parámetros de forma, en general no puede coincidir ni siquiera con tres puntos específicos de la CDF. Además, los parámetros beta que mejor se ajustan a dichos datos solo se pueden encontrar mediante métodos iterativos no lineales.

Los profesionales del análisis de decisiones , que necesitan distribuciones fácilmente parametrizadas por tres o más puntos CDF (por ejemplo, porque dichos puntos se especificaron como resultado de un proceso de obtención de expertos ), inventaron originalmente distribuciones parametrizadas por cuantiles para este propósito. Keelin y Powley (2011) ^[4] proporcionaron la definición original. Posteriormente, Keelin (2016) ^[5] desarrolló las distribuciones metalog , una familia de distribuciones parametrizadas por cuantiles que tiene una flexibilidad de forma prácticamente ilimitada, ecuaciones simples y momentos de forma cerrada.

Definición

Keelin y Powley ^[4] definen una distribución parametrizada por cuantiles como aquella cuya función cuantil (CDF inversa) se puede escribir en la forma

F^{-1}(y)=\left\{{\begin{array}{cl}L_{0}&{\text{para }}y=0\\\sum _{i=1}^{n}a_{i}g_{i}(y)&{\text{para }}0<y<1\\L_{1}&{\mbox{para }}y=1\end{array}}\right.

dónde

{\begin{array}{rcl}L_{0}&=&\lim _{y\rightarrow 0^{+}}F^{-1}(y)\\L_{1}&=& \lim _{y\rightarrow 1^{-}}F^{-1}(y)\end{array}}

y las funciones son funciones base linealmente independientes y continuamente diferenciables. Aquí, esencialmente, y son los límites inferior y superior (si existen) de una variable aleatoria con función cuantil . Estas distribuciones se denominan parametrizadas por cuantiles porque para un conjunto dado de pares de cuantiles , donde , y un conjunto de funciones base , los coeficientes se pueden determinar resolviendo un conjunto de ecuaciones lineales. ^[4] Si uno desea utilizar más pares de cuantiles que funciones base, entonces los coeficientes se pueden elegir para minimizar la suma de errores al cuadrado entre los cuantiles establecidos y . Keelin y Powley ^[4] ilustran este concepto para una elección específica de funciones base que es una generalización de la función cuantil de la distribución normal , , para la cual la media y la desviación estándar son funciones lineales de probabilidad acumulada : $Estilo de visualización g_{i}(y)}$ $Estilo de visualización L_{0}$ $Estilo de visualización L_{1}$ $Estilo de visualización F-1(y)$ $\{(x_{i},y_{i})\mid i=1,\ldots ,n\}$ $x_{i}=F^{-1}(y_{i})$ ${\estilo de visualización n}$ $Estilo de visualización g_{i}(y)}$ $Estilo de visualización ai$ $Estilo de visualización ai$ $Estilo de visualización x_{i}}$ $Estilo de visualización F-1(y_{i})$ $x=\mu +\sigma \Phi ^{-1}(y)$ ${\estilo de visualización \mu}$ ${\estilo de visualización \sigma}$ ${\estilo de visualización y}$

\mu (y)=a_{1}+a_{4}y

\sigma (y)=a_{2}+a_{3}y

El resultado es una distribución de cuatro parámetros que se puede ajustar a un conjunto de cuatro pares de cuantiles/probabilidades de forma exacta, o a cualquier número de dichos pares mediante mínimos cuadrados lineales . Keelin y Powley ^[4] denominan a esta distribución distribución Q-normal simple. En las figuras siguientes se muestran algunas PDF Q-normales simples sesgadas y simétricas.

Propiedades

Los QPD que cumplen con la definición de Keelin y Powley tienen las siguientes propiedades.

Función de densidad de probabilidad

Diferenciando con respecto a los rendimientos . El recíproco de esta cantidad, , es la función de densidad de probabilidad (PDF) $x=F^{-1}(y)=\sum _{i=1}^{n}a_{i}g_{i}(y)$ ${\estilo de visualización y}$ $dx/dy$ ${\estilo de visualización dy/dx}$

f(y)=\left(\sum _{i=1}^{n}a_{i}{{dg_{i}(y)} \sobre {dy}}\right)^{-1}

donde . Nótese que esta PDF se expresa como una función de probabilidad acumulada en lugar de . Para representarla gráficamente, como se muestra en las figuras, varíe paramétricamente. Grafique en el eje horizontal y en el eje vertical. $0<y<1$ ${\estilo de visualización y}$ ${\estilo de visualización x}$ $y\in (0,1)$ $x=F^{-1}(y)$ $f(y)$

Factibilidad

Una función de la forma de es una distribución de probabilidad factible si y solo si para todos . ^[4] Esto implica una restricción de viabilidad en el conjunto de coeficientes : $Estilo de visualización F-1(y)$ $f(y)>0$ $y\in (0,1)$ ${\boldsymbol {a}}=(a_{1},\ldots ,a_{n})\in \mathbb {R} ^{n}$

\sum _{i=1}^{n}a_{i}{{dg_{i}(y)} \sobre {dy}}>0

a pesar de

y\in (0,1)

En aplicaciones prácticas, generalmente es necesario comprobar la viabilidad en lugar de suponerla.

Convexidad

El conjunto de coeficientes factibles de una QPD para todos es convexo . Debido a que la optimización convexa requiere conjuntos factibles convexos, esta propiedad simplifica las aplicaciones de optimización que involucran QPD. $S_{\boldsymbol {a}}=\{{\boldsymbol {a}}\in \mathbb {R} ^{n}\mid \sum _{i=1}^{n}a_{i}dg_{i}(y)/dy>0$ $y\en (0,1)\}$

Ajuste a los datos

Los coeficientes se pueden determinar a partir de los datos mediante mínimos cuadrados lineales . Dados los puntos de datos que se pretende caracterizar la CDF de un QPD, y una matriz cuyos elementos consisten en , entonces, siempre que sea invertible, el vector columna de los coeficientes se puede determinar como , donde y el vector columna . Si , esta ecuación se reduce a , donde la CDF resultante recorre todos los puntos de datos exactamente. Un método alternativo, implementado como un programa lineal, determina los coeficientes minimizando la suma de las distancias absolutas entre la CDF y los datos sujetos a restricciones de viabilidad. ^[6] ${\boldsymbol {a}}$ ${\estilo de visualización m}$ $(x_{i},y_{i})$ $m\veces n$ ${\boldsymbol {Y}}$ $Estilo de visualización g_j(y_i)$ ${\boldsymbol {Y}}^{T}{\boldsymbol {Y}}$ ${\boldsymbol {a}}$ ${\boldsymbol {a}}=({\boldsymbol {Y}}^{T}{\boldsymbol {Y}})^{-1}{\boldsymbol {Y}}^{T}{\boldsymbol {incógnita}}$ $m\geq n$ ${\boldsymbol {x}}=(x_{1},\ldots ,x_{m})$ ${\estilo de visualización m=n}$ ${\boldsymbol {a}}={\boldsymbol {Y}}^{-1}{\boldsymbol {x}}$

Flexibilidad de forma

Una distribución cuantitativa de probabilidad con términos, donde , tiene parámetros de forma. Por lo tanto, las distribuciones cuantitativas de probabilidad pueden ser mucho más flexibles que las distribuciones de Pearson , que tienen como máximo dos parámetros de forma. Por ejemplo, se ha demostrado que las distribuciones metalog de diez términos parametrizadas por 105 puntos CDF de 30 distribuciones de fuentes tradicionales (incluidas la normal, la t de Student, la lognormal, la gamma, la beta y la de valor extremo) se aproximan a cada una de esas distribuciones de fuentes dentro de una distancia K–S de 0,001 o menos. ^[7] ${\estilo de visualización n}$ $n\geq 2$ ${\estilo de visualización n-2}$

Transformaciones

Las transformaciones QPD se rigen por una propiedad general de las funciones cuantiles: para cualquier función cuantil y función creciente es una función cuantil . ^[8] Por ejemplo, la función cuantil de la distribución normal , , es una QPD según la definición de Keelin y Powley. El logaritmo natural, , es una función creciente, al igual que la función cuantil de la distribución lognormal con límite inferior . Es importante destacar que esta transformación convierte una QPD ilimitada en una QPD semi-limitada. De manera similar, al aplicar esta transformación logarítmica a la distribución metalog ilimitada ^[9] se obtiene la distribución metalog semi-limitada (log) ; ^[10] de la misma manera, al aplicar la transformación logit, , se obtiene la distribución metalog acotada (logit) ^[10] con límites inferior y superior y , respectivamente. Además, al considerar que se distribuye, donde es cualquier QPD que cumple con la definición de Keelin y Powley, la variable transformada mantiene las propiedades anteriores de viabilidad, convexidad y ajuste a los datos. Tales QPD transformadas tienen mayor flexibilidad de forma que la subyacente , que tiene parámetros de forma; la transformación logarítmica tiene parámetros de forma y la transformación logit tiene parámetros de forma. Además, tales QPD transformadas comparten el mismo conjunto de coeficientes factibles que la QPD subyacente no transformada. ^[11] $x=Q(y)$ $t(x),x=t^{-1}(Q(y))$ $x=\mu +\sigma \Phi ^{-1}(y)$ $t(x)=\ln(x-b_{l})$ $x=b_{l}+e^{\mu +\sigma \Phi ^{-1}(y)}$ $Estilo de visualización b_ {l}}$ $t(x)=\ln((x-b_{l})/(b_{u}-x))$ $Estilo de visualización b_ {l}}$ $Estilo de visualización b_{u}}$ ${\estilo de visualización t(x)}$ $Estilo de visualización F-1(y)$ $Estilo de visualización F-1(y)$ $Estilo de visualización F-1(y)$ ${\estilo de visualización n-2}$ ${\estilo de visualización n-1}$ ${\estilo de visualización n}$

Momentos

El momento de una QPD es: ^[4] $k^{th}$

E[x^{k}]=\int _{0}^{1}\left(\sum _{i=1}^{n}a_{i}g_{i}(y)\right)^{k}dy

La existencia de dichos momentos en forma cerrada depende de la elección de las funciones base de QPD . La distribución metalog ilimitada y las QPD polinómicas son ejemplos de QPD para las que existen momentos en forma cerrada como funciones de los coeficientes . $g_{i}(y)$ $a_{i}$

Simulación

Dado que la función cuantil se expresa en forma cerrada, las QPD de Keelin y Powley facilitan la simulación de Monte Carlo . La sustitución de muestras aleatorias uniformemente distribuidas de produce muestras aleatorias de en forma cerrada, eliminando así la necesidad de invertir una CDF expresada como . $x=F^{-1}(y)$ $y$ $x$ $y=F(x)$

Distribuciones relacionadas

Las siguientes distribuciones de probabilidad son QPD según la definición de Keelin y Powley:

La función cuantil de la distribución normal , . $x=\mu +\sigma \Phi ^{-1}(y)$
La función cuantil de la distribución de Gumbel , . $x=\mu -\beta \ln(-\ln(y))$
La función cuantil de la distribución de Cauchy , . $x=x_{0}+\gamma \tan[\pi (y-0.5)]$
La función cuantil de la distribución logística , . $x=\mu +s\ln(y/(1-y))$
La distribución metalog ilimitada , que es una expansión en serie de potencias de los parámetros y de la función cuantil logística. $\mu$ $s$
Las distribuciones metalog semiacotadas y acotadas , que son las transformadas logarítmicas y logit, respectivamente, de la distribución metalog no acotada.
Las distribuciones metalog ilimitadas, semilimitadas y acotadas SPT (triplete percentil simétrico) , que están parametrizadas por tres puntos CDF y límites superiores e inferiores opcionales.
La distribución Q-Normal Simple ^[12]
Las metadistribuciones, incluida la metanormal ^[13]
Funciones cuantiles expresadas como funciones polinomiales de probabilidad acumulada , incluidas las funciones polinomiales de Chebyshev . $y$

Al igual que las distribuciones metalográficas de SPT, las distribuciones parametrizadas por cuantiles de Johnson ^[14]^[15] (JQPD) están parametrizadas por tres cuantiles. Las JQPD no cumplen con la definición de QPD de Keelin y Powley, sino que tienen sus propias propiedades. Las JQPD son factibles para todos los conjuntos de parámetros de SPT que sean consistentes con las reglas de probabilidad .

Aplicaciones

Las aplicaciones originales de las QPD fueron realizadas por analistas de decisiones que deseaban convertir de manera conveniente los cuantiles evaluados por expertos (por ejemplo, los cuantiles 10, 50 y 90) en distribuciones de probabilidad continuas suaves. Las QPD también se han utilizado para ajustar los datos de salida de las simulaciones con el fin de representar esas salidas (tanto CDF como PDF) como distribuciones continuas de forma cerrada. ^[16] Utilizadas de esta manera, suelen ser más estables y suaves que los histogramas. De manera similar, dado que las QPD pueden imponer menos restricciones de forma que las distribuciones tradicionales, se han utilizado para ajustar una amplia gama de datos empíricos con el fin de representar esos conjuntos de datos como distribuciones continuas (por ejemplo, reflejando la bimodalidad que puede existir en los datos de una manera sencilla ^[17] ). La parametrización de cuantiles permite una representación QPD de forma cerrada de distribuciones conocidas cuyas CDF de otro modo no tienen expresión de forma cerrada. Keelin et al. (2019) ^[18] aplican esto a la suma de distribuciones lognormales independientes distribuidas de manera idéntica, donde los cuantiles de la suma se pueden determinar mediante una gran cantidad de simulaciones. Nueve de estos cuantiles se utilizan para parametrizar una distribución metalog semilimitada que recorre cada uno de estos nueve cuantiles exactamente. Las QPD también se han aplicado para evaluar los riesgos de impacto de asteroides, ^[19] ciberseguridad, ^[6]^[20] sesgos en las proyecciones de producción de yacimientos petrolíferos en comparación con la producción observada después del hecho, ^[21] y proyecciones futuras de la población canadiense basadas en la combinación de las opiniones probabilísticas de múltiples expertos. ^[22] Consulte distribuciones metalog y Keelin (2016) ^[5] para aplicaciones adicionales de la distribución metalog.

Enlaces externos

Las distribuciones de Metalog, www.metalogs.org

Referencias

^ Johnson NL, Kotz S, Balakrishnan N. Distribuciones univariadas continuas, vol. 1, segunda edición, John Wiley & Sons, Ltd, 1994, págs. 15-25.
^ Johnson, NL (1949). "Sistemas de curvas de frecuencia generadas por métodos de traducción". Biometrika . 36 (1/2): 149–176. doi :10.2307/2332539. JSTOR 2332539. PMID 18132090.
^ Tadikamalla, Pandu R.; Johnson, Norman L. (1982). "Sistemas de curvas de frecuencia generadas por transformaciones de variables logísticas". Biometrika . 69 (2): 461–465. doi :10.1093/biomet/69.2.461. JSTOR 2335422.
^ abcdefg Keelin, Thomas W.; Powley, Bradford W. (2011). "Distribuciones parametrizadas por cuantiles". Análisis de decisiones . 8 (3): 206–219. doi :10.1287/deca.1110.0213.
^ ab Keelin, Thomas W. (2016). "Las distribuciones Metalog". Análisis de decisiones . 13 (4): 243–277. doi :10.1287/deca.2016.0338.
^ ab Faber, Isaac Justin; Paté-Cornell, M. Elisabeth; Lin, Herbert; Shachter, Ross D. (2019). Gestión de riesgos cibernéticos: advertencias de amenazas generadas por IA (Tesis). Universidad de Stanford.
^ Keelin, Thomas W. (2016). "Las distribuciones Metalog". Análisis de decisiones . 13 (4). Tabla 8. doi :10.1287/deca.2016.0338.
^ Gilchrist, W., 2000. Modelado estadístico con funciones cuantiles. CRC Press.
^ Keelin, Thomas W. (2016). "Las distribuciones Metalog". Análisis de decisiones . 13 (4). Sección 3, págs. 249–257. doi :10.1287/deca.2016.0338.
^ ab Keelin, Thomas W. (2016). "Las distribuciones Metalog". Análisis de decisiones . 13 (4). Sección 4. doi :10.1287/deca.2016.0338.
^ Powley, BW (2013). “Métodos de función cuantil para el análisis de decisiones”. Corolario 12, pág. 30. Tesis doctoral, Universidad de Stanford
^ Keelin, Thomas W.; Powley, Bradford W. (2011). "Distribuciones parametrizadas por cuantiles". Análisis de decisiones . 8 (3). págs. 208–210. doi :10.1287/deca.1110.0213.
^ Keelin, Thomas W. (2016). "Las distribuciones Metalog". Análisis de decisiones . 13 (4): 253. doi :10.1287/deca.2016.0338.
^ Hadlock, Christopher C.; Bickel, J. Eric (2017). "Distribuciones parametrizadas por cuantiles de Johnson". Análisis de decisiones . 14 : 35–64. doi :10.1287/deca.2016.0343.
^ Hadlock, Christopher C.; Bickel, J. Eric (2019). "El sistema de distribución parametrizado por cuantiles de Johnson generalizado". Análisis de decisiones . 16 : 67–85. doi :10.1287/deca.2018.0376. S2CID 159339224.
^ Keelin, TW (2016), Sección 6.2.2, págs. 271–274.
^ Keelin, TW (2016), Sección 6.1.1, Figura 10, págs. 266-267.
^ Mustafee, N. (18 de mayo de 2020). Distribuciones metalog y sumas extremadamente precisas de lognormales en forma cerrada. Instituto de Ingenieros Eléctricos y Electrónicos (IEEE). pp. 3074–3085. ISBN 9781728132839.
^ Reinhardt, Jason C.; Chen, Xi; Liu, Wenhao; Manchev, Petar; Paté-Cornell, M. Elisabeth (2016). "Evaluación del riesgo de asteroides: un enfoque probabilístico". Análisis de riesgo . 36 (2): 244–261. Bibcode :2016RiskA..36..244R. doi :10.1111/risa.12453. PMID 26215051. S2CID 23308354.
^ Wang, Jiali; Neil, Martin; Fenton, Norman (2020). "Un enfoque de red bayesiana para la evaluación de riesgos de ciberseguridad implementando y extendiendo el modelo FAIR". Computers & Security . 89 : 101659. doi :10.1016/j.cose.2019.101659. S2CID 209099797.
^ Bratvold, Reidar B.; Mohus, Erlend; Petutschnig, David; Bickel, Eric (2020). "Pronóstico de producción: optimista y demasiado confiado, una y otra vez". Spe Reservoir Evaluation & Engineering . 23 (3): 0799–0810. doi :10.2118/195914-PA. S2CID 219661316.
^ Avances en la previsión demográfica (PDF) . La serie Springer sobre métodos demográficos y análisis de población. Vol. 49. 2020. págs. 43–62. doi :10.1007/978-3-030-42472-5. hdl :20.500.12657/42565. ISBN 978-3-030-42471-8. Número de identificación del sujeto 226615299.