En teoría de la probabilidad y estadística, la distribución de Dirichlet (en honor a Peter Gustav Lejeune Dirichlet), generalmente denotada
, es una familia de distribuciones de probabilidad continuas multivariada, parametrizadas por un vector alfa perteneciente al conjunto de los números reales positivos.
Es la generalización multivariada de la distribución beta.
Las distribuciones de Dirichlet frecuentemente se utilizan como distribuciones a priori en estadística Bayesiana, y de hecho la distribución de Dirichlet es el conjugado a priori de la distribución categórica y la distribución multinomial.
eventos rivales son
dado que cada evento haya sido observado
tiene una función de densidad con respecto a la Medida de Lebesgue en el espacio euclidiano
simplex abierto o en otras palabras: La constante de normalización es la función beta multinomial, que puede expresarse en términos de la función gamma: donde
cuyas entradas son números reales en el intervalo (0,1); además
, es decir, la suma de las coordenadas es 1.
Estas pueden verse como las probabilidades de un evento categórico K. Otra manera de expresar esto, es que el dominio de la distribución de Dirichlet es en sí un conjunto de distribuciones de probabilidad, específicamente el conjunto de distribuciones discretas de dimensiones K. Cabe recalcar que el término técnico para el conjunto de puntos que soportan una distribución de Dirichlet de dimensiones K es el simplex (K−1) estándar abierto,[1] que es una generalización de un triángulo, embebido en la siguiente dimensión más alta.
Por ejemplo, con K=3, el soporte es un triángulo equilátero embebido en un espacio tridimensional, con vértices en (1,0,0), (0,1,0) y (0,0,1), es decir, tocando cada uno de los ejes de coordenadas en un punto alejado en una unidad del origen.