Función cuantil

En probabilidad y estadística , la función cuantil genera el valor de una variable aleatoria de modo que su probabilidad sea menor o igual que un valor de probabilidad de entrada. De manera intuitiva, la función cuantil asocia con un rango igual o inferior a una entrada de probabilidad la probabilidad de que una variable aleatoria se realice en ese rango para alguna distribución de probabilidad. También se denomina función percentil (por percentil ), función de punto porcentual , función de distribución acumulativa inversa (por función de distribución acumulativa o cdf) o función de distribución inversa .

Definición

Función de distribución estrictamente monótona

Con referencia a una función de distribución acumulativa (cdf) continua y estrictamente monótona de una variable aleatoria X , la función cuantil asigna su entrada p a un valor umbral x de modo que la probabilidad de que X sea menor o igual que x es p . En términos de la función de distribución F , la función cuantil Q devuelve el valor x tal que $F_{X}\colon \mathbb {R} \to [0,1]$ $Q\colon [0,1]\to \mathbb {R}$

F_{X}(x):=\Pr(X\leq x)=p,

que puede escribirse como inversa de la CDF

Q(p)=F_{X}^{-1}(p).

Función de distribución general

En el caso general de funciones de distribución que no son estrictamente monótonas y por lo tanto no permiten una función de distribución acumulativa inversa , el cuantil es una función de valor fijo (potencialmente) de una función de distribución $F$ , dada por el intervalo ^[1]

Q(p)={\big [}\sup\{x\colon F(x)<p\},\sup\{x\colon F(x)\leq p\}{\big ]}.

A menudo es estándar elegir el valor más bajo, que puede escribirse de manera equivalente como (usando la continuidad derecha de $F$ )

Q(p)=\inf\{x\in \mathbb {R} :p\leq F(x)\}.

Aquí capturamos el hecho de que la función cuantil devuelve el valor mínimo de $x$ entre todos aquellos valores cuyo valor de cdf excede $p$ , lo que es equivalente a la afirmación de probabilidad anterior en el caso especial de que la distribución sea continua. Nótese que la función ínfima puede ser reemplazada por la función mínima, ya que la función de distribución es continua por la derecha y débilmente monótona creciente.

El cuantil es la única función que satisface las desigualdades de Galois.

Q(p)\leq x

Si y sólo si

p\leq F(x).

Si la función $F$ es continua y estrictamente monótonamente creciente, entonces las desigualdades pueden reemplazarse por igualdades, y tenemos

Q=F^{-1}.

En general, aunque la función de distribución $F$ puede no tener una inversa izquierda o derecha , la función cuantil $Q$ se comporta como una "inversa izquierda casi segura" para la función de distribución, en el sentido de que

Q{\bigl (}F(X){\bigr )}=X

Casi seguro.

Ejemplo sencillo

Por ejemplo, la función de distribución acumulativa de exponencial ( λ ) (es decir, intensidad λ y valor esperado ( media ) 1/ λ ) es

F(x;\lambda )={\begin{cases}1-e^{-\lambda x}&x\geq 0,\\0&x<0.\end{cases}}

La función cuantil para exponencial ( λ ) se deriva encontrando el valor de Q para el cual : $1-e^{-\lambda Q}=p$

Q(p;\lambda )={\frac {-\ln(1-p)}{\lambda }},

para 0 ≤ p < 1. Los cuartiles son por tanto:

primer cuartil ( p = 1/4): $-\ln(3/4)/\lambda,$
mediana ( p = 2/4): $-\ln(1/2)/\lambda,$
tercer cuartil ( p = 3/4): $-\ln(1/4)/\lambda .$

Aplicaciones

Las funciones cuantiles se utilizan tanto en aplicaciones estadísticas como en métodos de Monte Carlo .

La función cuantil es una forma de prescribir una distribución de probabilidad, y es una alternativa a la función de densidad de probabilidad (pdf) o función de masa de probabilidad , la función de distribución acumulativa (cdf) y la función característica . La función cuantil, Q , de una distribución de probabilidad es la inversa de su función de distribución acumulativa F. La derivada de la función cuantil, es decir, la función de densidad cuantil , es otra forma de prescribir una distribución de probabilidad. Es el recíproco de la pdf compuesta con la función cuantil.

Consideremos una aplicación estadística en la que un usuario necesita conocer los puntos porcentuales clave de una distribución dada. Por ejemplo, requieren la mediana y los cuartiles del 25% y del 75% como en el ejemplo anterior o los niveles del 5%, 95%, 2,5%, 97,5% para otras aplicaciones, como evaluar la significancia estadística de una observación cuya distribución es conocida; véase la entrada sobre cuantiles . Antes de la popularización de las computadoras, no era raro que los libros tuvieran apéndices con tablas estadísticas que muestreaban la función cuantil. ^[2] Gilchrist analiza extensamente las aplicaciones estadísticas de las funciones cuantiles. ^[3]

Las simulaciones de Montecarlo emplean funciones cuantiles para producir números aleatorios o pseudoaleatorios no uniformes para su uso en diversos tipos de cálculos de simulación. En principio, se puede obtener una muestra de una distribución dada aplicando su función cuantil a una muestra de una distribución uniforme. Las demandas de métodos de simulación, por ejemplo en las finanzas computacionales modernas , están centrando cada vez más la atención en los métodos basados en funciones cuantiles, ya que funcionan bien con técnicas multivariadas basadas en métodos cópula o cuasi-Montecarlo ^[4] y métodos de Montecarlo en finanzas .

Cálculo

La evaluación de funciones cuantiles a menudo implica métodos numéricos , como la distribución exponencial anterior, que es una de las pocas distribuciones en las que se puede encontrar una expresión de forma cerrada (otras incluyen la distribución uniforme , la distribución Weibull , la distribución lambda de Tukey (que incluye la logística ) y la distribución log-logística ). Cuando la propia función de distribución acumulativa tiene una expresión de forma cerrada, siempre se puede utilizar un algoritmo numérico de búsqueda de raíces , como el método de bisección, para invertir la función de distribución acumulativa. Otros métodos se basan en una aproximación de la inversa mediante técnicas de interpolación. ^[5]^{[6] En la serie de libros}Recetas numéricas se ofrecen algoritmos adicionales para evaluar funciones cuantiles . Los algoritmos para distribuciones comunes están integrados en muchos paquetes de software estadístico . Se pueden encontrar métodos generales para calcular numéricamente las funciones cuantiles para clases generales de distribuciones en las siguientes bibliotecas:

Biblioteca C UNU.RAN ^[7]
Biblioteca R Runuran ^[8]
Muestreo de subpaquetes de Python en scipy.stats ^[9]^[10]

Las funciones cuantiles también pueden caracterizarse como soluciones de ecuaciones diferenciales ordinarias y parciales no lineales . Se han dado y resuelto las ecuaciones diferenciales ordinarias para los casos de las distribuciones normal , de Student , beta y gamma . ^[11]

Distribución normal

La distribución normal es quizás el caso más importante. Debido a que la distribución normal es una familia de escala de ubicación , su función cuantil para parámetros arbitrarios se puede derivar de una transformación simple de la función cuantil de la distribución normal estándar, conocida como función probit . Desafortunadamente, esta función no tiene una representación en forma cerrada utilizando funciones algebraicas básicas; como resultado, se utilizan generalmente representaciones aproximadas. Wichura ^[12] y Acklam ^[13] han proporcionado aproximaciones racionales y polinómicas compuestas exhaustivas. Shaw ha desarrollado aproximaciones racionales no compuestas. ^[14]

Ecuación diferencial ordinaria para el cuantil normal

Se puede dar una ecuación diferencial ordinaria no lineal para el cuartil normal, w ( p ). Es

{\frac {d^{2}w}{dp^{2}}}=w\left({\frac {dw}{dp}}\right)^{2}

con las condiciones centrales (iniciales)

w\left(1/2\right)=0,\,

w'(1/2\right)={\sqrt {2\pi }}.\,

Esta ecuación se puede resolver mediante varios métodos, incluido el método clásico de series de potencias . A partir de este método se pueden desarrollar soluciones con un grado de precisión arbitrario (véase Steinbrecher y Shaw, 2008).

Estudiantesa-distribución

Históricamente, este ha sido uno de los casos más difíciles de resolver, ya que la presencia de un parámetro, ν, los grados de libertad, hace que el uso de aproximaciones racionales y de otro tipo sea complicado. Existen fórmulas simples cuando ν = 1, 2, 4 y el problema puede reducirse a la solución de un polinomio cuando ν es par. En otros casos, las funciones cuantiles pueden desarrollarse como series de potencias. ^[15] Los casos simples son los siguientes:

ν = 1 (distribución de Cauchy)

Q(p)=\tan(\pi (p-1/2))\!

ν = 2: $Q(p)=2(p-1/2){\sqrt {\frac {2}{\alpha }}}\!$

ν = 4: $Q(p)=\operatorname {signo} (p-1/2)\,2\,{\sqrt {q-1}}\!$

dónde

q={\frac {\cos \left({\frac {1}{3}}\arccos \left({\sqrt {\alpha }}\,\right)\right)}{\sqrt {\alpha }}}\!

\alpha =4p(1-p).\!

En el ejemplo anterior, la función "signo" es +1 para argumentos positivos, -1 para argumentos negativos y cero en cero. No debe confundirse con la función seno trigonométrica.

Mezclas de cuantiles

De manera análoga a las mezclas de densidades , las distribuciones pueden definirse como mezclas cuantiles.

Q(p)=\sum _{i=1}^{m}a_{i}Q_{i}(p)

donde , son funciones cuantiles y , son los parámetros del modelo. Los parámetros deben seleccionarse de modo que sea una función cuantil. Karvanen presenta dos mezclas cuantiles de cuatro parámetros, la mezcla cuantil normal-polinomial y la mezcla cuantil Cauchy-polinomial. ^[16] $Estilo de visualización Q_{i}(p)}$ $i=1,\lpuntos ,m$ $Estilo de visualización ai$ $i=1,\lpuntos ,m$ $Estilo de visualización ai$ ${\estilo de visualización Q(p)}$

Ecuaciones diferenciales no lineales para funciones cuantiles

La ecuación diferencial ordinaria no lineal dada para la distribución normal es un caso especial de la disponible para cualquier función cuantil cuya segunda derivada exista. En general, se puede dar la ecuación para un cuantil, Q ( p ). Es

{\frac {d^{2}Q}{dp^{2}}}=H(Q)\left({\frac {dQ}{dp}}\right)^{2}

aumentada mediante condiciones de contorno adecuadas, donde

H(x)=-{\frac {f'(x)}{f(x)}}=-{\frac {d}{dx}}\ln f(x)

y ƒ ( x ) es la función de densidad de probabilidad. Las formas de esta ecuación, y su análisis clásico por series y soluciones asintóticas, para los casos de las distribuciones normal, de Student, gamma y beta han sido dilucidadas por Steinbrecher y Shaw (2008). Tales soluciones proporcionan puntos de referencia precisos y, en el caso de la distribución de Student, series adecuadas para el uso en vivo de Monte Carlo.

Véase también

Referencias

^ Ehm, W.; Gneiting, T.; Jordan, A.; Krüger, F. (2016). "De cuantiles y expectiles: funciones de puntuación consistentes, representaciones de Choquet y clasificaciones de pronósticos". JR Stat. Soc. B . 78 (3): 505–562. arXiv : 1503.08195 . doi : 10.1111/rssb.12154 .
^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 24 de marzo de 2012. Consultado el 25 de marzo de 2012 .{{cite web}}: CS1 maint: copia archivada como título ( enlace )
^ Gilchrist, W. (2000). Modelado estadístico con funciones cuantiles . Taylor & Francis. ISBN 1-58488-174-7.
^ Jaeckel, P. (2002). Métodos de Monte Carlo en finanzas .
^ Hörmann, Wolfgang; Leydold, Josef (2003). "Generación de variables aleatorias continuas mediante inversión numérica rápida". ACM Transactions on Modeling and Computer Simulation . 13 (4): 347–362. doi :10.1145/945511.945517 . Consultado el 17 de junio de 2024 – vía WU Vienna.
^ Derflinger, Gerhard; Hörmann, Wolfgang; Leydold, Josef (2010). "Generación de variables aleatorias mediante inversión numérica cuando solo se conoce la densidad". ACM Transactions on Modeling and Computer Simulation . 20 (4): 1–25. doi :10.1145/1842722.1842723. N.º de artículo 18.
^ "UNU.RAN - Generadores de números aleatorios universales no uniformes".
^ "Runuran: Interfaz R para los generadores de variables aleatorias 'UNU.RAN'". 17 de enero de 2023.
^ "Generadores de números aleatorios (Scipy.stats.sampling) — Manual de SciPy v1.13.0".
^ Baumgarten, Christoph; Patel, Tirth (2022). "Generación automática de variables aleatorias en Python". Actas de la 21.ª Conferencia sobre Python en la Ciencia . págs. 46–51. doi : 10.25080/majora-212e5952-007 .
^ Steinbrecher, G.; Shaw, WT (2008). "Mecánica cuantil". Revista Europea de Matemáticas Aplicadas . 19 (2): 87–112. doi :10.1017/S0956792508007341. S2CID 6899308.
^ Wichura, MJ (1988). "Algoritmo AS241: Los puntos porcentuales de la distribución normal". Estadística Aplicada . 37 (3). Blackwell Publishing: 477–484. doi :10.2307/2347330. JSTOR 2347330.
^ Un algoritmo para calcular la función de distribución acumulativa normal inversa Archivado el 5 de mayo de 2007 en Wayback Machine .
^ Finanzas computacionales: ecuaciones diferenciales para el reciclaje de Monte Carlo
^ Shaw, WT (2006). "Muestreo de la distribución T de Student: uso de la función de distribución acumulativa inversa". Journal of Computational Finance . 9 (4): 37–73. doi :10.21314/JCF.2006.150.
^ Karvanen, J. (2006). "Estimación de mezclas de cuantiles mediante momentos L y momentos L recortados". Estadística computacional y análisis de datos . 51 (2): 947–956. doi :10.1016/j.csda.2005.09.014.

Lectura adicional

Abernathy, Roger W. y Smith, Robert P. (1993) *"Aplicación de la expansión de series a la distribución beta inversa para hallar percentiles de la distribución F", ACM Trans. Math. Softw. , 9 (4), 478–480 doi :10.1145/168173.168387
Refinamiento del cuantil normal
Nuevos métodos para gestionar la distribución T de Student
Algoritmo ACM 396: t-cuantiles de Student