Distribución exponencial

En teoría de probabilidad y estadística , la distribución exponencial o distribución exponencial negativa es la distribución de probabilidad de la distancia entre eventos en un proceso puntual de Poisson , es decir, un proceso en el que los eventos ocurren de manera continua e independiente a una tasa promedio constante; el parámetro de distancia podría ser cualquier medida unidimensional significativa del proceso, como el tiempo entre errores de producción o la longitud a lo largo de un rollo de tela en el proceso de fabricación de tejidos. ^[1] Es un caso particular de la distribución gamma . Es el análogo continuo de la distribución geométrica y tiene la propiedad clave de no tener memoria . ^[2] Además de usarse para el análisis de procesos puntuales de Poisson, se encuentra en varios otros contextos. ^[3]

La distribución exponencial no es lo mismo que la clase de familias exponenciales de distribuciones. Se trata de una gran clase de distribuciones de probabilidad que incluye la distribución exponencial como uno de sus miembros, pero también incluye muchas otras distribuciones, como la distribución normal , la binomial , la gamma y la de Poisson . ^[3]

Definiciones

Función de densidad de probabilidad

La función de densidad de probabilidad (pdf) de una distribución exponencial es

f(x;\lambda )={\begin{cases}\lambda e^{-\lambda x}&x\geq 0,\\0&x<0.\end{cases}}

Aquí λ > 0 es el parámetro de la distribución, a menudo llamado parámetro de tasa . La distribución se sustenta en el intervalo $[0, \infty)$ . Si una variable aleatoria X tiene esta distribución, escribimos $X ~ Exp(λ)$ .

La distribución exponencial exhibe divisibilidad infinita .

Función de distribución acumulativa

La función de distribución acumulativa está dada por

F(x;\lambda )={\begin{cases}1-e^{-\lambda x}&x\geq 0,\\0&x<0.\end{cases}}

Parametrización alternativa

La distribución exponencial a veces se parametriza en términos del parámetro de escala $β = 1/ λ$ , que también es la media: $f(x;\beta )={\begin{cases}{\frac {1}{\beta }}e^{-x/\beta }&x\geq 0,\\0&x<0.\end{cases}}\qquad \qquad F(x;\beta )={\begin{cases}1-e^{-x/\beta }&x\geq 0,\\0&x<0.\end{cases}}$

Propiedades

Media, varianza, momentos y mediana

El valor medio o esperado de una variable aleatoria X distribuida exponencialmente con parámetro de tasa λ viene dado por $\operatorname {E} [X]={\frac {1}{\lambda }}.$

A la luz de los ejemplos que se dan a continuación, esto tiene sentido: una persona que recibe un promedio de dos llamadas telefónicas por hora puede esperar que el tiempo entre llamadas consecutivas sea de 0,5 horas o 30 minutos.

La varianza de X está dada por lo que la desviación estándar es igual a la media. $\operatorname {Var} [X]={\frac {1}{\lambda ^{2}}},$

Los momentos de X , para están dados por $n\in \mathbb {N}$ $\operatorname {E} \left[X^{n}\right]={\frac {n!}{\lambda ^{n}}}.$

Los momentos centrales de X , para están dados por donde ! n es el subfactorial de n $n\in \mathbb {N}$ $\mu _{n}={\frac {!n}{\lambda ^{n}}}={\frac {n!}{\lambda ^{n}}}\sum _{k=0}^{n}{\frac {(-1)^{k}}{k!}}.$

La mediana de X está dada por donde $ln$ se refiere al logaritmo natural . Por lo tanto, la diferencia absoluta entre la media y la mediana es $\operatorname {m} [X]={\frac {\ln(2)}{\lambda }}<\operatorname {E} [X],$ $\left|\nombre del operador {E} \left[X\right]-\nombre del operador {m} \left[X\right]\right|={\frac {1-\ln(2)}{\lambda }}<{\frac {1}{\lambda }}=\nombre del operador {\sigma } [X],$

de acuerdo con la desigualdad mediana-media .

Propiedad de falta de memoria de la variable aleatoria exponencial

Una variable aleatoria T distribuida exponencialmente obedece la relación $\Pr \left(T>s+t\mid T>s\right)=\Pr(T>t),\qquad \forall s,t\geq 0.$

Esto se puede ver considerando la función de distribución acumulativa complementaria : ${\begin{aligned}\Pr \left(T>s+t\mid T>s\right)&={\frac {\Pr \left(T>s+t\cap T>s\right)}{\Pr \left(T>s\right)}}\\[4pt]&={\frac {\Pr \left(T>s+t\right)}{\Pr \left(T>s\right)}}\\[4pt]&={\frac {e^{-\lambda (s+t)}}{e^{-\lambda s}}}\\[4pt]&=e^{-\lambda t}\\[4pt]&=\Pr(T>t).\end{aligned}}$

Cuando T se interpreta como el tiempo de espera para que ocurra un evento en relación con un tiempo inicial, esta relación implica que, si T está condicionada a la falta de observación del evento durante un período de tiempo inicial s , la distribución del tiempo de espera restante es la misma que la distribución incondicional original. Por ejemplo, si un evento no ha ocurrido después de 30 segundos, la probabilidad condicional de que ocurra tardará al menos 10 segundos más es igual a la probabilidad incondicional de observar el evento más de 10 segundos después del tiempo inicial.

La distribución exponencial y la distribución geométrica son las únicas distribuciones de probabilidad sin memoria .

La distribución exponencial es, por tanto, necesariamente también la única distribución de probabilidad continua que tiene una tasa de fallo constante .

Cuantiles

La función cuantil (función de distribución acumulativa inversa) para Exp( λ ) es $F^{-1}(p;\lambda )={\frac {-\ln(1-p)}{\lambda }},\qquad 0\leq p<1$

Los cuartiles son por tanto:

primer cuartil: ln(4/3)/ λ
mediana : ln(2)/ λ
tercer cuartil: ln(4)/ λ

Y como consecuencia el rango intercuartil es ln(3)/ λ .

Valor condicional en riesgo (déficit esperado)

El valor condicional en riesgo (CVaR), también conocido como déficit esperado o supercuantil para Exp( λ ), se deriva de la siguiente manera: ^[4]

${\begin{aligned}{\bar {q}}_{\alpha }(X)&={\frac {1}{1-\alpha }}\int _{\alpha }^{1}q_{p}(X)dp\\&={\frac {1}{(1-\alpha )}}\int _{\alpha }^{1}{\frac {-\ln(1-p)}{\lambda }}dp\\&={\frac {-1}{\lambda (1-\alpha )}}\int _{1-\alpha }^{0}-\ln(y)dy\\&={\frac {-1}{\lambda (1-\alpha )}}\int _{0}^{1-\alpha }\ln(y)dy\\&={\frac {-1}{\lambda (1-\alpha )}}[(1-\alpha )\ln(1-\alpha )-(1-\alpha )]\\&={\frac {-\ln(1-\alpha )+1}{\lambda }}\\\end{aligned}}$

Probabilidad de excedencia amortiguada (bPOE)

La probabilidad amortiguada de excedencia es igual a uno menos el nivel de probabilidad en el que el CVaR es igual al umbral . Se obtiene de la siguiente manera: ^[4] $x$

${\begin{aligned}{\bar {p}}_{x}(X)&=\{1-\alpha |{\bar {q}}_{\alpha }(X)=x\}\\&=\{1-\alpha |{\frac {-\ln(1-\alpha )+1}{\lambda }}=x\}\\&=\{1-\alpha |\ln(1-\alpha )=1-\lambda x\}\\&=\{1-\alpha |e^{\ln(1-\alpha )}=e^{1-\lambda x}\}=\{1-\alpha |1-\alpha =e^{1-\lambda x}\}=e^{1-\lambda x}\end{aligned}}$

Divergencia de Kullback-Leibler

La divergencia dirigida de Kullback-Leibler en nats de (distribución "aproximada") de (distribución "verdadera") está dada por $e^{\lambda }$ $e^{\lambda _{0}}$ ${\begin{aligned}\Delta (\lambda _{0}\parallel \lambda )&=\mathbb {E} _{\lambda _{0}}\left(\log {\frac {p_{\lambda _{0}}(x)}{p_{\lambda }(x)}}\right)\\&=\mathbb {E} _{\lambda _{0}}\left(\log {\frac {\lambda _{0}e^{\lambda _{0}x}}{\lambda e^{\lambda x}}}\right)\\&=\log(\lambda _{0})-\log(\lambda )-(\lambda _{0}-\lambda )E_{\lambda _{0}}(x)\\&=\log(\lambda _{0})-\log(\lambda )+{\frac {\lambda }{\lambda _{0}}}-1.\end{aligned}}$

Distribución de máxima entropía

Entre todas las distribuciones de probabilidad continuas con soporte $[0, \infty)$ y media μ , la distribución exponencial con λ = 1/ μ tiene la entropía diferencial más grande . En otras palabras, es la distribución de probabilidad de entropía máxima para una variable aleatoria X que es mayor o igual a cero y para la cual E[ X ] es fija. ^[5]

Distribución del mínimo de variables aleatorias exponenciales

Sean X ₁ , ..., X _n variables aleatorias independientes distribuidas exponencialmente con parámetros de velocidad λ ₁ , ..., λ _n . Entonces también se distribuye exponencialmente, con parámetro $\min \left\{X_{1},\dotsc ,X_{n}\right\}$ $\lambda =\lambda _{1}+\dotsb +\lambda _{n}.$

Esto se puede ver considerando la función de distribución acumulativa complementaria : ${\begin{aligned}&\Pr \left(\min\{X_{1},\dotsc ,X_{n}\}>x\right)\\={}&\Pr \left(X_{1}>x,\dotsc ,X_{n}>x\right)\\={}&\prod _{i=1}^{n}\Pr \left(X_{i}>x\right)\\={}&\prod _{i=1}^{n}\exp \left(-x\lambda _{i}\right)=\exp \left(-x\sum _{i=1}^{n}\lambda _{i}\right).\end{aligned}}$

El índice de la variable que alcanza el mínimo se distribuye según la distribución categórica $\Pr \left(X_{k}=\min\{X_{1},\dotsc ,X_{n}\}\right)={\frac {\lambda _{k}}{\lambda _{1}+\dotsb +\lambda _{n}}}.$

Se puede ver una prueba haciendo . Entonces, $I=\operatorname {argmin} _{i\in \{1,\dotsb ,n\}}\{X_{1},\dotsc ,X_{n}\}$ ${\begin{aligned}\Pr(I=k)&=\int _{0}^{\infty }\Pr(X_{k}=x)\Pr(\forall _{i\neq k}X_{i}>x)\,dx\\&=\int _{0}^{\infty }\lambda _{k}e^{-\lambda _{k}x}\left(\prod _{i=1,i\neq k}^{n}e^{-\lambda _{i}x}\right)dx\\&=\lambda _{k}\int _{0}^{\infty }e^{-\left(\lambda _{1}+\dotsb +\lambda _{n}\right)x}dx\\&={\frac {\lambda _{k}}{\lambda _{1}+\dotsb +\lambda _{n}}}.\end{aligned}}$

Nótese que no se distribuye exponencialmente, si X ₁ , ..., X _n no tienen todos parámetro 0. ^[6] $\max\{X_{1},\dotsc ,X_{n}\}$

Momentos conjuntos de estadísticas de orden exponencial iid

Sean variables aleatorias exponenciales independientes e idénticamente distribuidas con parámetro de velocidad λ . Denotemos las estadísticas de orden correspondientes . Para , el momento conjunto de las estadísticas de orden y está dado por $X_{1},\dotsc ,X_{n}$ $n$ $X_{(1)},\dotsc ,X_{(n)}$ $i<j$ $\operatorname {E} \left[X_{(i)}X_{(j)}\right]$ $X_{(i)}$ $X_{(j)}$ ${\begin{aligned}\operatorname {E} \left[X_{(i)}X_{(j)}\right]&=\sum _{k=0}^{j-1}{\frac {1}{(n-k)\lambda }}\operatorname {E} \left[X_{(i)}\right]+\operatorname {E} \left[X_{(i)}^{2}\right]\\&=\sum _{k=0}^{j-1}{\frac {1}{(n-k)\lambda }}\sum _{k=0}^{i-1}{\frac {1}{(n-k)\lambda }}+\sum _{k=0}^{i-1}{\frac {1}{((n-k)\lambda )^{2}}}+\left(\sum _{k=0}^{i-1}{\frac {1}{(n-k)\lambda }}\right)^{2}.\end{aligned}}$

Esto se puede comprobar invocando la ley de la expectativa total y la propiedad de la falta de memoria: ${\begin{aligned}\operatorname {E} \left[X_{(i)}X_{(j)}\right]&=\int _{0}^{\infty }\operatorname {E} \left[X_{(i)}X_{(j)}\mid X_{(i)}=x\right]f_{X_{(i)}}(x)\,dx\\&=\int _{x=0}^{\infty }x\operatorname {E} \left[X_{(j)}\mid X_{(j)}\geq x\right]f_{X_{(i)}}(x)\,dx&&\left({\textrm {since}}~X_{(i)}=x\implies X_{(j)}\geq x\right)\\&=\int _{x=0}^{\infty }x\left[\operatorname {E} \left[X_{(j)}\right]+x\right]f_{X_{(i)}}(x)\,dx&&\left({\text{by the memoryless property}}\right)\\&=\sum _{k=0}^{j-1}{\frac {1}{(n-k)\lambda }}\operatorname {E} \left[X_{(i)}\right]+\operatorname {E} \left[X_{(i)}^{2}\right].\end{aligned}}$

La primera ecuación se desprende de la ley de la expectativa total . La segunda ecuación aprovecha el hecho de que una vez que condicionamos a , debe seguir que . La tercera ecuación se basa en la propiedad sin memoria de reemplazar por . $X_{(i)}=x$ $X_{(j)}\geq x$ $\operatorname {E} \left[X_{(j)}\mid X_{(j)}\geq x\right]$ $\operatorname {E} \left[X_{(j)}\right]+x$

Suma de dos variables aleatorias exponenciales independientes

La función de distribución de probabilidad (PDF) de una suma de dos variables aleatorias independientes es la convolución de sus PDF individuales . Si y son variables aleatorias exponenciales independientes con respectivos parámetros de tasa y entonces la densidad de probabilidad de está dada por La entropía de esta distribución está disponible en forma cerrada: suponiendo (sin pérdida de generalidad), entonces donde es la constante de Euler-Mascheroni , y es la función digamma . ^[7] $X_{1}$ $X_{2}$ $\lambda _{1}$ $\lambda _{2},$ $Z=X_{1}+X_{2}$ ${\begin{aligned}f_{Z}(z)&=\int _{-\infty }^{\infty }f_{X_{1}}(x_{1})f_{X_{2}}(z-x_{1})\,dx_{1}\\&=\int _{0}^{z}\lambda _{1}e^{-\lambda _{1}x_{1}}\lambda _{2}e^{-\lambda _{2}(z-x_{1})}\,dx_{1}\\&=\lambda _{1}\lambda _{2}e^{-\lambda _{2}z}\int _{0}^{z}e^{(\lambda _{2}-\lambda _{1})x_{1}}\,dx_{1}\\&={\begin{cases}{\dfrac {\lambda _{1}\lambda _{2}}{\lambda _{2}-\lambda _{1}}}\left(e^{-\lambda _{1}z}-e^{-\lambda _{2}z}\right)&{\text{ if }}\lambda _{1}\neq \lambda _{2}\\[4pt]\lambda ^{2}ze^{-\lambda z}&{\text{ if }}\lambda _{1}=\lambda _{2}=\lambda .\end{cases}}\end{aligned}}$ $\lambda _{1}>\lambda _{2}$ ${\begin{aligned}H(Z)&=1+\gamma +\ln \left({\frac {\lambda _{1}-\lambda _{2}}{\lambda _{1}\lambda _{2}}}\right)+\psi \left({\frac {\lambda _{1}}{\lambda _{1}-\lambda _{2}}}\right),\end{aligned}}$ $\gamma$ $\psi (\cdot )$

En el caso de parámetros de velocidad iguales, el resultado es una distribución Erlang con forma 2 y parámetro que a su vez es un caso especial de distribución gamma . $\lambda ,$

La suma de n variables aleatorias exponenciales independientes Exp( λ) tiene una distribución Gamma(n, λ) .

Distribuciones relacionadas

Si X ~ Laplace(μ, β ⁻¹ ) , entonces | X − µ| ~ Exp(β).
Si X ~ Pareto(1, λ) , entonces log( X ) ~ Exp(λ).
Si X ~ SkewLogistic(θ) , entonces . $\log \left(1+e^{-X}\right)\sim \operatorname {Exp} (\theta )$
Si X _i ~ U (0, 1) entonces $\lim _{n\to \infty }n\min \left(X_{1},\ldots ,X_{n}\right)\sim \operatorname {Exp} (1)$
La distribución exponencial es un límite de una distribución beta escalada : $\lim _{n\to \infty }n\operatorname {Beta} (1,n)=\operatorname {Exp} (1).$
La distribución exponencial es un caso especial de distribución de Pearson tipo 3 .
La distribución exponencial es el caso especial de una distribución Gamma con parámetro de forma 1.
Si X ~ Exp(λ) y X _i ~ Exp(λ _i ) entonces:
- $kX\sim \operatorname {Exp} \left({\frac {\lambda }{k}}\right)$ , cierre bajo escalamiento por un factor positivo.
- 1 + X ~ BenktanderWeibull (λ, 1), que se reduce a una distribución exponencial truncada.
- ke ^X ~ Pareto ( k , λ).
- e ^−X ~ Beta (λ, 1).
- ⁠1/a⁠ e ^X ~ Ley de potencia ( k , λ)
- ${\sqrt {X}}\sim \operatorname {Rayleigh} \left({\frac {1}{\sqrt {2\lambda }}}\right)$ , la distribución de Rayleigh
- $X\sim \operatorname {Weibull} \left({\frac {1}{\lambda }},1\right)$ , la distribución de Weibull
- $X^{2}\sim \operatorname {Weibull} \left({\frac {1}{\lambda ^{2}}},{\frac {1}{2}}\right)$
- μ − β log(λ X ) ∼ Gumbel (μ, β) .
- $\lfloor X\rfloor \sim \operatorname {Geometric} \left(1-e^{-\lambda }\right)$ , una distribución geométrica en 0,1,2,3,...
- $\lceil X\rceil \sim \operatorname {Geometric} \left(1-e^{-\lambda }\right)$ , una distribución geométrica en 1,2,3,4,...
- Si además Y ~ Erlang( n , λ) o entonces $Y\sim \Gamma \left(n,{\frac {1}{\lambda }}\right)$ ${\frac {X}{Y}}+1\sim \operatorname {Pareto} (1,n)$
- Si también λ ~ Gamma ( k , θ) (forma, parametrización de escala), entonces la distribución marginal de X es Lomax ( k , 1/θ), la mezcla gamma
- λ ₁X ₁ − λ ₂Y ₂ ~ Laplace(0, 1) .
- mín{ X ₁ , ..., X _n } ~ Exp(λ ₁ + ... + λ _n ).
- Si además λ _i = λ entonces:
  - $X_{1}+\cdots +X_{k}=\sum _{i}X_{i}\sim$ Erlang ( k , λ) = Gamma ( k , λ ⁻¹ ) = Gamma( k , λ) (en parametrización ( k , θ) y (α, β) respectivamente) con un parámetro de forma entero k. ^[8]
  - Si , entonces . $T=(X_{1}+\cdots +X_{n})=\sum _{i=1}^{n}X_{i}$ $2\lambda T\sim \chi _{2n}^{2}$
  - X _i − X _j ~ Laplace(0, λ ⁻¹ ).
- Si además X _i son independientes, entonces:
  - ${\frac {X_{i}}{X_{i}+X_{j}}}$ ~ Tu (0, 1)
  - $Z={\frac {\lambda _{i}X_{i}}{\lambda _{j}X_{j}}}$ tiene una función de densidad de probabilidad . Esto se puede utilizar para obtener un intervalo de confianza para . $f_{Z}(z)={\frac {1}{(z+1)^{2}}}$ ${\frac {\lambda _{i}}{\lambda _{j}}}$
- Si además λ = 1:
  - $\mu -\beta \log \left({\frac {e^{-X}}{1-e^{-X}}}\right)\sim \operatorname {Logistic} (\mu ,\beta )$ , la distribución logística
  - $\mu -\beta \log \left({\frac {X_{i}}{X_{j}}}\right)\sim \operatorname {Logistic} (\mu ,\beta )$
  - μ − σ log( X ) ~ GEV(μ, σ, 0) .
  - Además, si entonces ( distribución K ) $Y\sim \Gamma \left(\alpha ,{\frac {\beta }{\alpha }}\right)$ ${\sqrt {XY}}\sim \operatorname {K} (\alpha ,\beta )$
- Si además λ = 1/2 entonces X ∼ χ²
  ₂; es decir, X tiene una distribución de chi-cuadrado con 2 grados de libertad . Por lo tanto: $\operatorname {Exp} (\lambda )={\frac {1}{2\lambda }}\operatorname {Exp} \left({\frac {1}{2}}\right)\sim {\frac {1}{2\lambda }}\chi _{2}^{2}\Rightarrow \sum _{i=1}^{n}\operatorname {Exp} (\lambda )\sim {\frac {1}{2\lambda }}\chi _{2n}^{2}$
Si y ~ Poisson( X ) entonces ( distribución geométrica ) $X\sim \operatorname {Exp} \left({\frac {1}{\lambda }}\right)$ $Y\mid X$ $Y\sim \operatorname {Geometric} \left({\frac {1}{1+\lambda }}\right)$
La distribución de Hoyt se puede obtener a partir de la distribución exponencial y la distribución de arcoseno.
La distribución exponencial es un límite de la distribución exponencial κ en el caso. $\kappa =0$
La distribución exponencial es un límite de la distribución κ-Gamma generalizada en los casos y : $\alpha =1$ $\nu =1$
$\lim _{(\alpha ,\nu )\to (0,1)}p_{\kappa }(x)=(1+\kappa \nu )(2\kappa )^{\nu }{\frac {\Gamma {\Big (}{\frac {1}{2\kappa }}+{\frac {\nu }{2}}{\Big )}}{\Gamma {\Big (}{\frac {1}{2\kappa }}-{\frac {\nu }{2}}{\Big )}}}{\frac {\alpha \lambda ^{\nu }}{\Gamma (\nu )}}x^{\alpha \nu -1}\exp _{\kappa }(-\lambda x^{\alpha })=\lambda e^{-\lambda x}$

Otras distribuciones relacionadas:

Distribución hiperexponencial : distribución cuya densidad es una suma ponderada de densidades exponenciales.
Distribución hipoexponencial : la distribución de una suma general de variables aleatorias exponenciales.
Distribución exgaussiana : la suma de una distribución exponencial y una distribución normal .

Inferencia estadística

A continuación, supongamos que la variable aleatoria X se distribuye exponencialmente con el parámetro de tasa λ, y son n muestras independientes de X , con media muestral . $x_{1},\dotsc ,x_{n}$ ${\bar {x}}$

Estimación de parámetros

El estimador de máxima verosimilitud para λ se construye de la siguiente manera.

La función de verosimilitud para λ, dada una muestra independiente e idénticamente distribuida x = ( x ₁ , ..., x _n ) extraída de la variable, es: $L(\lambda )=\prod _{i=1}^{n}\lambda \exp(-\lambda x_{i})=\lambda ^{n}\exp \left(-\lambda \sum _{i=1}^{n}x_{i}\right)=\lambda ^{n}\exp \left(-\lambda n{\overline {x}}\right),$

donde: es la media de la muestra. ${\overline {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}$

La derivada del logaritmo de la función de verosimilitud es: ${\frac {d}{d\lambda }}\ln L(\lambda )={\frac {d}{d\lambda }}\left(n\ln \lambda -\lambda n{\overline {x}}\right)={\frac {n}{\lambda }}-n{\overline {x}}\ {\begin{cases}>0,&0<\lambda <{\frac {1}{\overline {x}}},\\[8pt]=0,&\lambda ={\frac {1}{\overline {x}}},\\[8pt]<0,&\lambda >{\frac {1}{\overline {x}}}.\end{cases}}$

En consecuencia, la estimación de máxima verosimilitud para el parámetro de tasa es: ${\widehat {\lambda }}_{\text{mle}}={\frac {1}{\overline {x}}}={\frac {n}{\sum _{i}x_{i}}}$

Este no es un estimador imparcial de aunque es un estimador imparcial ^[9] MLE ^[10] de y la media de distribución. $\lambda ,$ ${\overline {x}}$ $1/\lambda$

El sesgo de es igual a lo que produce el estimador de máxima verosimilitud corregido por sesgo ${\widehat {\lambda }}_{\text{mle}}$ $B\equiv \operatorname {E} \left[\left({\widehat {\lambda }}_{\text{mle}}-\lambda \right)\right]={\frac {\lambda }{n-1}}$ ${\widehat {\lambda }}_{\text{mle}}^{*}={\widehat {\lambda }}_{\text{mle}}-B.$

Se puede encontrar un minimizador aproximado del error cuadrático medio (ver también: equilibrio entre sesgo y varianza ), asumiendo un tamaño de muestra mayor que dos, con un factor de corrección para el error cuadrático medio: Esto se deriva de la media y la varianza de la distribución gamma inversa , . ^[11] ${\widehat {\lambda }}=\left({\frac {n-2}{n}}\right)\left({\frac {1}{\bar {x}}}\right)={\frac {n-2}{\sum _{i}x_{i}}}$ ${\textstyle {\mbox{Inv-Gamma}}(n,\lambda )}$

Información de Fisher

La información de Fisher , denotada , para un estimador del parámetro de tasa se da como: ${\mathcal {I}}(\lambda )$ $\lambda$ ${\mathcal {I}}(\lambda )=\operatorname {E} \left[\left.\left({\frac {\partial }{\partial \lambda }}\log f(x;\lambda )\right)^{2}\right|\lambda \right]=\int \left({\frac {\partial }{\partial \lambda }}\log f(x;\lambda )\right)^{2}f(x;\lambda )\,dx$

Conectando la distribución y resolviendo obtenemos: ${\mathcal {I}}(\lambda )=\int _{0}^{\infty }\left({\frac {\partial }{\partial \lambda }}\log \lambda e^{-\lambda x}\right)^{2}\lambda e^{-\lambda x}\,dx=\int _{0}^{\infty }\left({\frac {1}{\lambda }}-x\right)^{2}\lambda e^{-\lambda x}\,dx=\lambda ^{-2}.$

Esto determina la cantidad de información que cada muestra independiente de una distribución exponencial lleva sobre el parámetro de tasa desconocido . $\lambda$

Intervalos de confianza

Un intervalo de confianza exacto del 100(1 − α)% para el parámetro de tasa de una distribución exponencial viene dado por: ^[12] que también es igual a donde $χ$ ${\frac {2n}{{\widehat {\lambda }}_{\textrm {mle}}\chi _{{\frac {\alpha }{2}},2n}^{2}}}<{\frac {1}{\lambda }}<{\frac {2n}{{\widehat {\lambda }}_{\textrm {mle}}\chi _{1-{\frac {\alpha }{2}},2n}^{2}}}\,,$ ${\frac {2n{\overline {x}}}{\chi _{{\frac {\alpha }{2}},2n}^{2}}}<{\frac {1}{\lambda }}<{\frac {2n{\overline {x}}}{\chi _{1-{\frac {\alpha }{2}},2n}^{2}}}\,,$ $2 pág., vág.$ es el percentil $100(p)$ de la distribución de chi cuadrado con v grados de libertad , n es el número de observaciones y la barra x es el promedio de la muestra. Se puede derivar una aproximación simple a los puntos finales exactos del intervalo utilizando una aproximación normal a $χ$ $2 pág., vág.$ distribución. Esta aproximación da los siguientes valores para un intervalo de confianza del 95%: ${\begin{aligned}\lambda _{\text{lower}}&={\widehat {\lambda }}\left(1-{\frac {1.96}{\sqrt {n}}}\right)\\\lambda _{\text{upper}}&={\widehat {\lambda }}\left(1+{\frac {1.96}{\sqrt {n}}}\right)\end{aligned}}$

Esta aproximación puede ser aceptable para muestras que contengan al menos entre 15 y 20 elementos. ^[13]

Inferencia bayesiana

La distribución conjugada anterior de la distribución exponencial es la distribución gamma (de la cual la distribución exponencial es un caso especial). La siguiente parametrización de la función de densidad de probabilidad gamma resulta útil:

$\operatorname {Gamma} (\lambda ;\alpha ,\beta )={\frac {\beta ^{\alpha }}{\Gamma (\alpha )}}\lambda ^{\alpha -1}\exp(-\lambda \beta ).$

La distribución posterior p puede entonces expresarse en términos de la función de verosimilitud definida anteriormente y una distribución gamma previa:

${\begin{aligned}p(\lambda )&\propto L(\lambda )\Gamma (\lambda ;\alpha ,\beta )\\&=\lambda ^{n}\exp \left(-\lambda n{\overline {x}}\right){\frac {\beta ^{\alpha }}{\Gamma (\alpha )}}\lambda ^{\alpha -1}\exp(-\lambda \beta )\\&\propto \lambda ^{(\alpha +n)-1}\exp(-\lambda \left(\beta +n{\overline {x}}\right)).\end{aligned}}$

Ahora se ha especificado la densidad posterior p hasta una constante normalizadora faltante. Dado que tiene la forma de una función de densidad de probabilidad gamma, esto se puede completar fácilmente y se obtiene:

$p(\lambda )=\operatorname {Gamma} (\lambda ;\alpha +n,\beta +n{\overline {x}}).$

Aquí el hiperparámetro α puede interpretarse como el número de observaciones previas y β como la suma de las observaciones previas. La media posterior aquí es: ${\frac {\alpha +n}{\beta +n{\overline {x}}}}.$

Ocurrencia y aplicaciones

Ocurrencia de eventos

La distribución exponencial ocurre naturalmente cuando se describen las longitudes de los tiempos entre llegadas en un proceso de Poisson homogéneo .

La distribución exponencial puede considerarse como una contraparte continua de la distribución geométrica , que describe el número de ensayos de Bernoulli necesarios para que un proceso discreto cambie de estado. Por el contrario, la distribución exponencial describe el tiempo que tarda un proceso continuo en cambiar de estado.

En situaciones del mundo real, el supuesto de una tasa constante (o probabilidad por unidad de tiempo) rara vez se cumple. Por ejemplo, la tasa de llamadas entrantes varía según la hora del día. Pero si nos centramos en un intervalo de tiempo durante el cual la tasa es aproximadamente constante, como de 14 a 16 horas durante los días laborables, la distribución exponencial se puede utilizar como un buen modelo aproximado para el tiempo hasta que llega la siguiente llamada telefónica. Se aplican advertencias similares a los siguientes ejemplos que arrojan variables distribuidas de manera aproximadamente exponencial:

El tiempo que transcurre hasta que una partícula radiactiva se desintegra , o el tiempo entre los clics de un contador Geiger
El tiempo entre recibir una llamada telefónica y la siguiente
El tiempo hasta el impago (en el pago a los tenedores de deuda de la empresa) en el modelo de riesgo crediticio de forma reducida

Las variables exponenciales también se pueden utilizar para modelar situaciones en las que ciertos eventos ocurren con una probabilidad constante por unidad de longitud, como la distancia entre mutaciones en una cadena de ADN o entre animales atropellados en una carretera determinada.

En la teoría de colas , los tiempos de servicio de los agentes en un sistema (por ejemplo, cuánto tarda un cajero de banco, etc., en atender a un cliente) suelen modelarse como variables distribuidas exponencialmente. (La llegada de clientes, por ejemplo, también se modela mediante la distribución de Poisson si las llegadas son independientes y se distribuyen de forma idéntica). La duración de un proceso que puede considerarse como una secuencia de varias tareas independientes sigue la distribución de Erlang (que es la distribución de la suma de varias variables independientes distribuidas exponencialmente). La teoría de la fiabilidad y la ingeniería de la fiabilidad también hacen un uso extensivo de la distribución exponencial. Debido a la propiedad de falta de memoria de esta distribución, es muy adecuada para modelar la parte de tasa de riesgo constante de la curva de la bañera utilizada en la teoría de la fiabilidad. También es muy conveniente porque es muy fácil añadir tasas de fallos en un modelo de fiabilidad. Sin embargo, la distribución exponencial no es adecuada para modelar la vida útil total de organismos o dispositivos técnicos, porque las "tasas de fallos" aquí no son constantes: se producen más fallos en sistemas muy jóvenes y muy antiguos.

Distribución exponencial acumulativa ajustada a las precipitaciones máximas diarias anuales utilizando CumFreq ^[14]

En física , si se observa un gas a una temperatura y presión fijas en un campo gravitatorio uniforme , las alturas de las distintas moléculas también siguen una distribución exponencial aproximada, conocida como fórmula barométrica . Esto es una consecuencia de la propiedad de la entropía que se menciona a continuación.

En hidrología , la distribución exponencial se utiliza para analizar valores extremos de variables como los valores máximos mensuales y anuales de las precipitaciones diarias y los volúmenes de descarga de los ríos. ^[15]

La imagen azul ilustra un ejemplo de ajuste de la distribución exponencial a las precipitaciones máximas diarias anuales clasificadas, mostrando también el rango de confianza del 90 % basado en la distribución binomial . Los datos de precipitaciones se representan mediante el trazado de posiciones como parte del análisis de frecuencia acumulada .

En la gestión de quirófanos, distribución de la duración de las cirugías para una categoría de cirugías sin un contenido de trabajo típico (como en una sala de urgencias, que abarca todo tipo de cirugías).

Predicción

Tras observar una muestra de n puntos de datos de una distribución exponencial desconocida, una tarea habitual consiste en utilizar estas muestras para hacer predicciones sobre datos futuros de la misma fuente. Una distribución predictiva habitual sobre muestras futuras es la denominada distribución de complemento, que se forma introduciendo una estimación adecuada para el parámetro de tasa λ en la función de densidad exponencial. Una opción habitual de estimación es la proporcionada por el principio de máxima verosimilitud, y su utilización da como resultado la densidad predictiva sobre una muestra futura x _{n +1} , condicionada a las muestras observadas x = ( x ₁ , ..., x _n ) dada por $p_{\rm {ML}}(x_{n+1}\mid x_{1},\ldots ,x_{n})=\left({\frac {1}{\overline {x}}}\right)\exp \left(-{\frac {x_{n+1}}{\overline {x}}}\right).$

El enfoque bayesiano proporciona una distribución predictiva que tiene en cuenta la incertidumbre del parámetro estimado, aunque esto puede depender fundamentalmente de la elección del valor anterior.

Una distribución predictiva libre de los problemas de elección de valores anteriores que surgen bajo el enfoque bayesiano subjetivo es

$p_{\rm {CNML}}(x_{n+1}\mid x_{1},\ldots ,x_{n})={\frac {n^{n+1}\left({\overline {x}}\right)^{n}}{\left(n{\overline {x}}+x_{n+1}\right)^{n+1}}},$

que puede considerarse como

una distribución de confianza frecuentista , obtenida a partir de la distribución de la cantidad fundamental ; ^[16] ${x_{n+1}}/{\overline {x}}$
una probabilidad predictiva de perfil, obtenida eliminando el parámetro λ de la probabilidad conjunta de x _{n +1} y λ por maximización; ^[17]
una distribución posterior predictiva bayesiana objetiva, obtenida utilizando la distribución previa de Jeffreys no informativa 1/ λ ;
la distribución predictiva de máxima verosimilitud normalizada condicional (CNML), a partir de consideraciones de teoría de la información. ^[18]

La precisión de una distribución predictiva se puede medir utilizando la distancia o divergencia entre la distribución exponencial verdadera con parámetro de velocidad, λ ₀ , y la distribución predictiva basada en la muestra x . La divergencia de Kullback-Leibler es una medida de uso común, libre de parametrización, de la diferencia entre dos distribuciones. Si Δ( λ ₀ || p ) denota la divergencia de Kullback-Leibler entre una distribución exponencial con parámetro de velocidad λ ₀ y una distribución predictiva p , se puede demostrar que

${\begin{aligned}\operatorname {E} _{\lambda _{0}}\left[\Delta (\lambda _{0}\parallel p_{\rm {ML}})\right]&=\psi (n)+{\frac {1}{n-1}}-\log(n)\\\operatorname {E} _{\lambda _{0}}\left[\Delta (\lambda _{0}\parallel p_{\rm {CNML}})\right]&=\psi (n)+{\frac {1}{n}}-\log(n)\end{aligned}}$

donde la expectativa se toma con respecto a la distribución exponencial con parámetro de tasa λ ₀ ∈ (0, ∞) , y ψ( · ) es la función digamma. Está claro que la distribución predictiva CNML es estrictamente superior a la distribución de complemento de máxima verosimilitud en términos de divergencia promedio de Kullback–Leibler para todos los tamaños de muestra n > 0 .

Generación de variables aleatorias

Un método conceptualmente muy simple para generar variables exponenciales se basa en el muestreo por transformada inversa : dada una variable aleatoria U extraída de la distribución uniforme en el intervalo unitario $(0, 1)$ , la variable

$T=F^{-1}(U)$

tiene una distribución exponencial, donde F ⁻¹ es la función cuantil , definida por

$F^{-1}(p)={\frac {-\ln(1-p)}{\lambda }}.$

Además, si U es uniforme en (0, 1), entonces también lo es 1 − U . Esto significa que se pueden generar variables exponenciales de la siguiente manera:

$T={\frac {-\ln(U)}{\lambda }}.$

^{Knuth [19] y Devroye}^[20] analizan otros métodos para generar variables exponenciales .

También está disponible un método rápido para generar un conjunto de variables exponenciales listas para ordenar sin utilizar una rutina de clasificación. ^[20]

Véase también

Tiempo muerto : una aplicación de la distribución exponencial al análisis de detectores de partículas.
Distribución de Laplace , o "distribución exponencial doble".
Relaciones entre distribuciones de probabilidad
Distribución exponencial de Marshall-Olkin

Referencias

^ "7.2: Distribución exponencial". Statistics LibreTexts . 2021-07-15 . Consultado el 2024-10-11 .
^ "Distribución exponencial | Matemáticas | Britannica". www.britannica.com . Consultado el 11 de octubre de 2024 .
^ de Weisstein, Eric W. "Distribución exponencial". mathworld.wolfram.com . Consultado el 11 de octubre de 2024 .
^ ab Norton, Matthew; Khokhlov, Valentyn; Uryasev, Stan (2019). "Cálculo de CVaR y bPOE para distribuciones de probabilidad comunes con aplicación a la optimización de carteras y estimación de densidad" (PDF) . Anales de investigación de operaciones . 299 (1–2). Springer: 1281–1315. doi :10.1007/s10479-019-03373-1. Archivado desde el original (PDF) el 2023-03-31 . Consultado el 2023-02-27 .
^ Park, Sung Y.; Bera, Anil K. (2009). "Modelo de heterocedasticidad condicional autorregresiva de máxima entropía" (PDF) . Journal of Econometrics . 150 (2). Elsevier: 219–230. doi :10.1016/j.jeconom.2008.12.014. Archivado desde el original (PDF) el 2016-03-07 . Consultado el 2011-06-02 .
^ Michael, Lugo. «La esperanza del máximo de las exponenciales» (PDF) . Archivado desde el original (PDF) el 20 de diciembre de 2016. Consultado el 13 de diciembre de 2016 .
^ Eckford, Andrew W.; Thomas, Peter J. (2016). "Entropía de la suma de dos variables aleatorias exponenciales independientes y no idénticamente distribuidas". arXiv : 1609.02911 [cs.IT].
^ Ibe, Oliver C. (2014). Fundamentos de probabilidad aplicada y procesos aleatorios (2.ª ed.). Academic Press. pág. 128. ISBN 9780128010358.
^ Richard Arnold Johnson; Dean W. Wichern (2007). Análisis estadístico multivariante aplicado. Pearson Prentice Hall. ISBN 978-0-13-187715-3. Recuperado el 10 de agosto de 2012 .
^ Manual electrónico de métodos estadísticos del NIST/SEMATECH
^ Elfessi, Abdulaziz; Reineke, David M. (2001). "Una mirada bayesiana a la estimación clásica: la distribución exponencial". Revista de Educación en Estadística . 9 (1). doi : 10.1080/10691898.2001.11910648 .
^ Ross, Sheldon M. (2009). Introducción a la probabilidad y la estadística para ingenieros y científicos (4.ª ed.). Associated Press. pág. 267. ISBN 978-0-12-370483-2.
^ Guerriero, V. (2012). "Distribución de la ley de potencia: método de estadística inferencial multiescala". Journal of Modern Mathematics Frontier . 1 : 21–28.
^ "Cumfreq, un programa informático gratuito para el análisis de frecuencia acumulativa".
^ Ritzema, HP, ed. (1994). Análisis de frecuencia y regresión. Capítulo 6 en: Principios y aplicaciones del drenaje, Publicación 16, Instituto Internacional para la Recuperación y Mejora de Tierras (ILRI), Wageningen, Países Bajos. pp. 175–224. ISBN 90-70754-33-9.
^ Lawless, JF; Fredette, M. (2005). "Intervalos de predicción frecuentistas y distribuciones predictivas". Biometrika . 92 (3): 529–542. doi :10.1093/biomet/92.3.529.
^ Bjornstad, JF (1990). "Probabilidad predictiva: una revisión". Statist. Sci . 5 (2): 242–254. doi : 10.1214/ss/1177012175 .
^ DF Schmidt y E. Makalic, "Modelos universales para la distribución exponencial", IEEE Transactions on Information Theory , volumen 55, número 7, págs. 3087-3090, 2009 doi :10.1109/TIT.2009.2018331
^ Donald E. Knuth (1998). The Art of Computer Programming , volumen 2: Seminumerical Algorithms , 3.ª ed. Boston: Addison–Wesley. ISBN 0-201-89684-2 . Véase la sección 3.4.1, pág. 133.
^ de Luc Devroye (1986). Generación de variables aleatorias no uniformes . Nueva York: Springer-Verlag. ISBN 0-387-96305-7 . Véase el capítulo IX, sección 2, págs. 392-401.

Enlaces externos

"Distribución exponencial", Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
Calculadora en línea de distribución exponencial