La distribución lambda de Tukey , formalizada por John Tukey , es una distribución de probabilidad continua y simétrica definida en términos de su función cuantil . Se utiliza normalmente para identificar una distribución adecuada (ver los comentarios a continuación) y no se utiliza directamente en modelos estadísticos .
La distribución lambda de Tukey tiene un único parámetro de forma , λ , y, al igual que con otras distribuciones de probabilidad, se puede transformar con un parámetro de ubicación , μ , y un parámetro de escala , σ . Dado que la forma general de la distribución de probabilidad se puede expresar en términos de la distribución estándar, las fórmulas posteriores se dan para la forma estándar de la función.
Para la forma estándar de la distribución lambda de Tukey, la función cuantil (es decir, la función inversa a la función de distribución acumulativa ) y la función de densidad cuantil son
Para la mayoría de los valores del parámetro de forma, λ , la función de densidad de probabilidad (PDF) y la función de distribución acumulativa (CDF) deben calcularse numéricamente. La distribución lambda de Tukey tiene una forma simple y cerrada para la CDF y/o PDF solo para unos pocos valores excepcionales del parámetro de forma, por ejemplo: λ ∈ { 2, 1, 1 /2 , 0 } (ver distribución uniforme [ casos λ = 1 y λ = 2 ] y distribución logística [ caso λ = 0 ].
Sin embargo, para cualquier valor de λ tanto la CDF como la PDF se pueden tabular para cualquier número de probabilidades acumuladas, p , utilizando la función cuantil Q para calcular el valor x , para cada probabilidad acumulada p , con la densidad de probabilidad dada por 1/q , el recíproco de la función de densidad de cuantiles. Como es el caso habitual con las distribuciones estadísticas, la distribución lambda de Tukey se puede utilizar fácilmente buscando valores en una tabla preparada.
La distribución lambda de Tukey es simétrica alrededor del cero, por lo tanto, el valor esperado de esta distribución, si existe, es igual a cero. La varianza existe para λ > − 1 /2 ,y excepto cuando λ = 0,viene dada por la fórmula
De manera más general, el momento de orden n es finito cuando λ > -1 /norte y se expresa (excepto cuando λ = 0 )en términos de lafunción beta Β ( x , y ) :
Debido a la simetría de la función de densidad, todos los momentos de órdenes impares, si existen, son iguales a cero.
A diferencia de los momentos centrales, los momentos L se pueden expresar en forma cerrada. Para el momento L n, se expresa mediante [3]
Los primeros seis momentos L se pueden presentar de la siguiente manera: [3]
La distribución lambda de Tukey es en realidad una familia de distribuciones que pueden aproximarse a varias distribuciones comunes. Por ejemplo,
El uso más común de esta distribución es generar un gráfico PPCC de Tukey lambda de un conjunto de datos . Según el valor de λ con mejor correlación, como se muestra en el gráfico PPCC , se sugiere un modelo apropiado para los datos. Por ejemplo, si el mejor ajuste de la curva a los datos ocurre para un valor de λ en o cerca de 0,14 , entonces empíricamente los datos podrían modelarse bien con una distribución normal. Los valores de λ menores de 0,14 sugieren una distribución de cola más pesada.
Un hito en λ = 0 ( logístico ) indicaría colas bastante gruesas, con el límite extremo en λ = −1 , aproximando Cauchy y versiones de muestra pequeña de la t de Student . Es decir, como el valor de mejor ajuste de λ varía desde colas delgadas en 0,14 hacia colas gruesas −1 , se sugiere una PDF en forma de campana con colas cada vez más gruesas. De manera similar, un valor de ajuste de curva óptimo de λ mayor que 0,14 sugiere una distribución con colas excepcionalmente delgadas (basado en el punto de vista de que la distribución normal en sí misma es de colas delgadas para empezar; la distribución exponencial se elige a menudo como el ejemplo de colas intermedias entre gruesas y delgadas).
A excepción de los valores de λ que se aproximan a 0 y aquellos inferiores, todas las funciones PDF analizadas tienen soporte finito , entre -1 /| la | y +1 /| la | .
Dado que la distribución lambda de Tukey es una distribución simétrica , el uso del gráfico PPCC de lambda de Tukey para determinar una distribución razonable para modelar los datos solo se aplica a distribuciones simétricas. Un histograma de los datos debería proporcionar evidencia de si los datos se pueden modelar razonablemente con una distribución simétrica. [4]
Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.