La distribución apareció por primera vez en el artículo Aplicaciones de las matemáticas a los problemas médicos , [2] de Anderson Gray McKendrick en 1926. En este trabajo, el autor explica varios métodos matemáticos que se pueden aplicar a la investigación médica. En uno de estos métodos, consideró la distribución de Poisson bivariada y demostró que la distribución de la suma de dos variables de Poisson correlacionadas sigue una distribución que más tarde se conocería como distribución de Hermite.
Como aplicación práctica, McKendrick consideró la distribución de recuentos de bacterias en leucocitos . Utilizando el método de momentos, ajustó los datos a la distribución de Hermite y encontró que el modelo era más satisfactorio que ajustarlo a una distribución de Poisson .
La distribución fue introducida y publicada formalmente por CD Kemp y Adrienne W. Kemp en 1965 en su trabajo Algunas propiedades de la distribución "Hermite" . El trabajo se centra en las propiedades de esta distribución, por ejemplo, una condición necesaria en los parámetros y sus estimadores de máxima verosimilitud (MLE), el análisis de la función generadora de probabilidad (PGF) y cómo se puede expresar en términos de los coeficientes de los polinomios de Hermite (modificados) . Un ejemplo que han utilizado en esta publicación es la distribución de recuentos de bacterias en leucocitos que utilizó McKendrick, pero Kemp y Kemp estiman el modelo utilizando el método de máxima verosimilitud .
Los mismos autores publicaron en 1966 el artículo An alternative Derivation of the Hermite Distribution . [5] En este trabajo establecieron que la distribución de Hermite puede obtenerse formalmente combinando una distribución de Poisson con una distribución normal .
En 1971, YC Patel [6] realizó un estudio comparativo de varios procedimientos de estimación para la distribución de Hermite en su tesis doctoral. Incluía estimadores de máxima verosimilitud, estimadores de momento, estimadores de frecuencia media y cero y el método de puntos pares.
En 1974, Gupta y Jain [7] realizaron una investigación sobre una forma generalizada de distribución de Hermite.
Cuando una variable aleatoria Y = X 1 + 2 X 2 se distribuye según una distribución de Hermite, donde X 1 y X 2 son dos variables de Poisson independientes con parámetros a 1 y a 2 , escribimos
Propiedades
Funciones generadoras de momentos y cumulantes
La función generadora de momentos de una variable aleatoria X se define como el valor esperado de e t , en función del parámetro real t . Para una distribución de Hermite con parámetros X 1 y X 2 , la función generadora de momentos existe y es igual a
La asimetría es el tercer momento centrado alrededor de la media dividido por la potencia 3/2 de la desviación estándar , y para la distribución de Hermite es, [4]
Siempre , por lo que la masa de la distribución se concentra en la izquierda.
Curtosis
La curtosis es el cuarto momento centrado alrededor de la media, dividido por el cuadrado de la varianza , y para la distribución de Hermite es, [4]
El exceso de curtosis es simplemente una corrección para hacer que la curtosis de la distribución normal sea igual a cero, y es la siguiente:
Siempre , o la distribución tiene un pico agudo alto alrededor de la media y colas más gordas.
Función característica
En una distribución discreta, la función característica de cualquier variable aleatoria de valor real se define como el valor esperado de , donde i es la unidad imaginaria y t ∈ R
Esta función está relacionada con la función generadora de momentos mediante . Por lo tanto, para esta distribución la función característica es, [1]
Esta distribución puede tener cualquier número de modas . Como ejemplo, la distribución ajustada para los datos de McKendrick [2] tiene parámetros estimados de , . Por lo tanto, las primeras cinco probabilidades estimadas son 0,899, 0,012, 0,084, 0,001, 0,004.
Esta distribución es cerrada bajo adición o cerrada bajo convoluciones. [9] Al igual que la distribución de Poisson , la distribución de Hermite tiene esta propiedad. Dadas dos variables aleatorias distribuidas según Hermite y , entonces Y = X 1 + X 2 sigue una distribución de Hermite, .
Esta distribución permite una sobredispersión moderada , por lo que puede utilizarse cuando los datos tienen esta propiedad. [9] Una variable aleatoria tiene sobredispersión, o está sobredispersada con respecto a la distribución de Poisson, cuando su varianza es mayor que su valor esperado. La distribución de Hermite permite una sobredispersión moderada porque el coeficiente de dispersión siempre está entre 1 y 2,
Estimación de parámetros
Método de momentos
La media y la varianza de la distribución de Hermite son y , respectivamente. Por lo tanto, tenemos estas dos ecuaciones,
Resolviendo estas dos ecuaciones obtenemos los estimadores de momento y de a 1 y a 2 . [6]
Dado que tanto un 1 como un 2 son positivos, el estimador y son admisibles (≥ 0) sólo si, .
Máxima verosimilitud
Dada una muestra X 1 , ..., X m son variables aleatorias independientes, cada una con una distribución de Hermite, deseamos estimar el valor de los parámetros y . Sabemos que la media y la varianza de la distribución son y , respectivamente. Usando estas dos ecuaciones,
Podemos parametrizar la función de probabilidad mediante μ y d
Se puede demostrar que la función de verosimilitud logarítmica es estrictamente cóncava en el dominio de los parámetros. En consecuencia, la MLE es única.
La ecuación de probabilidad no siempre tiene solución como lo muestra la siguiente proposición,
Proposición: [9] Sea X 1 , ..., X m proveniente de una distribución Hermite generalizada con n fijo . Entonces los MLE de los parámetros son y si solo si , donde indica el momento factorial empírico de orden 2.
Observación 1: La condición es equivalente a donde es el índice de dispersión empírica
Observación 2: Si la condición no se cumple, entonces los MLE de los parámetros son y , es decir, los datos se ajustan utilizando la distribución de Poisson.
Estimadores de frecuencia cero y media
Una opción habitual para distribuciones discretas es la frecuencia relativa cero del conjunto de datos, que se equipara a la probabilidad de cero en la distribución supuesta. Observando que y . Siguiendo el ejemplo de YC Patel (1976), el sistema de ecuaciones resultante,
Se puede observar que para distribuciones con una alta probabilidad en 0, la eficiencia es alta.
Para valores admisibles de y , debemos tener
Prueba del supuesto de Poisson
Cuando se utiliza la distribución de Hermite para modelar una muestra de datos, es importante verificar si la distribución de Poisson es suficiente para ajustar los datos. Siguiendo la función de masa de probabilidad parametrizada utilizada para calcular el estimador de máxima verosimilitud, es importante corroborar la siguiente hipótesis:
Donde es la función de verosimilitud logarítmica. Como d = 1 pertenece al límite del dominio de parámetros, bajo la hipótesis nula, W no tiene una distribución asintótica como se esperaba. Se puede establecer que la distribución asintótica de W es una mezcla 50:50 de la constante 0 y la . Los puntos porcentuales de cola superior de α para esta mezcla son los mismos que los puntos porcentuales de cola superior de 2α para a ; por ejemplo, para α = 0,01, 0,05 y 0,10 son 5,41189, 2,70554 y 1,64237.
La prueba del "puntaje" o multiplicador de Lagrange
La estadística de puntuación es [9]
donde m es el número de observaciones.
La distribución asintótica del estadístico de la prueba de puntuación bajo la hipótesis nula es una distribución. Puede ser conveniente utilizar una versión con signo de la prueba de puntuación, es decir, , que sigue asintóticamente una normal estándar.
^ abc Kemp, CD; Kemp, AW (1965). "Algunas propiedades de la distribución "Hermite"". Biometrika . 52 (3–4): 381–394. doi :10.1093/biomet/52.3-4.381.
^ ab McKendrick, AG (1926). "Aplicaciones de las matemáticas a los problemas médicos". Actas de la Sociedad Matemática de Edimburgo . 44 : 98–130. doi : 10.1017/s0013091500034428 .
^ Huiming, Zhang; Yunxiao Liu; Bo Li (2014). "Notas sobre el modelo de Poisson compuesto discreto con aplicaciones a la teoría del riesgo". Seguros: Matemáticas y Economía . 59 : 325–336. doi :10.1016/j.insmatheco.2014.09.012.
^ abcd Johnson, NL, Kemp, AW y Kotz, S. (2005) Distribuciones discretas univariadas, tercera edición, Wiley, ISBN 978-0-471-27246-5 .
^ Kemp, ADRIENNE W.; Kemp CD (1966). "Una derivación alternativa de la distribución de Hermite". Biometrika . 53 (3–4): 627–628. doi :10.1093/biomet/53.3-4.627.
^ abc Patel, YC (1976). "Estimación de puntos pares y estimación de momentos en la distribución de Hermite". Biometrics . 32 (4): 865–873. doi :10.2307/2529270. JSTOR 2529270.
^ Gupta, RP; Jain, GC (1974). "Una distribución Hermite generalizada y sus propiedades". Revista SIAM de Matemáticas Aplicadas . 27 (2): 359–363. doi :10.1137/0127027. JSTOR 2100572.
^ ab Kotz, Samuel (1982–1989). Enciclopedia de ciencias estadísticas . John Wiley. ISBN978-0471055525.
^ abcdefgh Puig, P. (2003). "Caracterización de modelos discretos cerrados aditivamente mediante una propiedad de sus estimadores de máxima verosimilitud, con una aplicación a distribuciones Hermite generalizadas". Journal of the American Statistical Association . 98 (463): 687–692. doi :10.1198/016214503000000594. JSTOR 30045296. S2CID 120484966.