Distribución de Dirichlet

En teoría de la probabilidad y estadística, la distribución de Dirichlet (en honor a Peter Gustav Lejeune Dirichlet), generalmente denotada

, es una familia de distribuciones de probabilidad continuas multivariada, parametrizadas por un vector alfa perteneciente al conjunto de los números reales positivos.

Las distribuciones de Dirichlet frecuentemente se utilizan como distribuciones a priori en estadística Bayesiana, y de hecho la distribución de Dirichlet es el conjugado a priori de la distribución categórica y la distribución multinomial.

tiene una función de densidad con respecto a la Medida de Lebesgue en el espacio euclidiano

simplex abierto o en otras palabras: La constante de normalización es la función beta multinomial, que puede expresarse en términos de la función gamma: donde

Estas pueden verse como las probabilidades de un evento categórico K. Otra manera de expresar esto, es que el dominio de la distribución de Dirichlet es en sí un conjunto de distribuciones de probabilidad, específicamente el conjunto de distribuciones discretas de dimensiones K. Cabe recalcar que el término técnico para el conjunto de puntos que soportan una distribución de Dirichlet de dimensiones K es el simplex (K−1) estándar abierto,[1] que es una generalización de un triángulo, embebido en la siguiente dimensión más alta.

Por ejemplo, con K=3, el soporte es un triángulo equilátero embebido en un espacio tridimensional, con vértices en (1,0,0), (0,1,0) y (0,0,1), es decir, tocando cada uno de los ejes de coordenadas en un punto alejado en una unidad del origen.