La distribución apareció por primera vez en el artículo Aplicaciones de las matemáticas a los problemas médicos , [2] de Anderson Gray McKendrick en 1926. En este trabajo el autor explica varios métodos matemáticos que se pueden aplicar a la investigación médica. En uno de estos métodos consideró la distribución de Poisson bivariada y demostró que la distribución de la suma de dos variables de Poisson correlacionadas sigue una distribución que luego se conocería como distribución de Hermite.
Como aplicación práctica, McKendrick consideró la distribución de recuentos de bacterias en los leucocitos . Utilizando el método de momentos ajustó los datos con la distribución de Hermite y encontró el modelo más satisfactorio que ajustarlo con una distribución de Poisson .
La distribución fue introducida y publicada formalmente por CD Kemp y Adrienne W. Kemp en 1965 en su obra Algunas propiedades de la distribución 'Hermite' . El trabajo se centra en las propiedades de esta distribución, por ejemplo, una condición necesaria sobre los parámetros y sus estimadores de máxima verosimilitud (MLE), el análisis de la función generadora de probabilidad (PGF) y cómo se puede expresar en términos de los coeficientes de ( modificado) Polinomios de Hermite . Un ejemplo que han utilizado en esta publicación es la distribución de recuentos de bacterias en leucocitos que utilizó McKendrick pero Kemp y Kemp estimaron el modelo utilizando el método de máxima verosimilitud .
Los mismos autores publicaron en 1966 el artículo Una derivación alternativa de la distribución de Hermite . [5] En este trabajo se estableció que la distribución de Hermite se puede obtener formalmente combinando una distribución de Poisson con una distribución normal .
En 1971, YC Patel [6] realizó un estudio comparativo de varios procedimientos de estimación para la distribución de Hermite en su tesis doctoral. Incluyó estimadores de máxima verosimilitud, momento, estimadores de frecuencia media y cero y el método de puntos pares.
En 1974, Gupta y Jain [7] investigaron una forma generalizada de distribución de Hermite.
Cuando una variable aleatoria Y = X 1 + 2 X 2 se distribuye mediante una distribución de Hermite, donde X 1 y X 2 son dos variables de Poisson independientes con parámetros a 1 y a 2 , escribimos
Propiedades
Funciones generadoras de momentos y acumuladores.
La función generadora de momentos de una variable aleatoria X se define como el valor esperado de e t , en función del parámetro real t . Para una distribución de Hermite con parámetros X 1 y X 2 , la función generadora de momento existe y es igual a
Si consideramos el coeficiente de ( it ) r r ! en la expansión de K ( t ) obtenemos el r -acumulante
Por lo tanto, la media y los tres momentos siguientes son
Oblicuidad
La asimetría es el tercer momento centrado alrededor de la media dividida por la potencia 3/2 de la desviación estándar , y para la distribución de Hermite es, [4]
Siempre , por lo que la masa de la distribución se concentra hacia la izquierda.
Curtosis
La curtosis es el cuarto momento centrado alrededor de la media, dividido por el cuadrado de la varianza , y para la distribución de Hermite es, [4]
El exceso de curtosis es solo una corrección para hacer que la curtosis de la distribución normal sea igual a cero, y es la siguiente:
Siempre , o la distribución tiene un pico alto y agudo alrededor de las colas medias y más gordas.
Función característica
En una distribución discreta, la función característica de cualquier variable aleatoria de valor real se define como el valor esperado de , donde i es la unidad imaginaria y t ∈ R
Esta función está relacionada con la función generadora de momentos a través de . Por lo tanto, para esta distribución la función característica es, [1]
Esta distribución puede tener cualquier número de modos . Como ejemplo, la distribución ajustada para los datos de McKendrick [2] tiene parámetros estimados de , . Por tanto, las primeras cinco probabilidades estimadas son 0,899, 0,012, 0,084, 0,001, 0,004.
Ejemplo de datos multimodales, distribución de Hermite (0,1,1,5).
Esta distribución está cerrada bajo suma o cerrada bajo convolución. [9] Al igual que la distribución de Poisson , la distribución de Hermite tiene esta propiedad. Dadas dos variables aleatorias distribuidas por Hermite y , entonces Y = X 1 + X 2 sigue una distribución de Hermite, .
Esta distribución permite una sobredispersión moderada , por lo que se puede utilizar cuando los datos tienen esta propiedad. [9] Una variable aleatoria tiene sobredispersión, o está sobredispersada con respecto a la distribución de Poisson, cuando su varianza es mayor que su valor esperado. La distribución de Hermite permite una sobredispersión moderada porque el coeficiente de dispersión está siempre entre 1 y 2,
Estimación de parámetros
Método de momentos
La media y la varianza de la distribución de Hermite son y , respectivamente. Entonces tenemos estas dos ecuaciones,
Resolviendo estas dos ecuaciones obtenemos los estimadores de momento y de a 1 y a 2 . [6]
Dado que a 1 y a 2 son positivos, el estimador y son admisibles (≥ 0) sólo si, .
Máxima verosimilitud
Dada una muestra X 1 , ..., X m son variables aleatorias independientes, cada una con una distribución de Hermite, deseamos estimar el valor de los parámetros y . Sabemos que la media y la varianza de la distribución son y , respectivamente. Usando estas dos ecuaciones,
Podemos parametrizar la función de probabilidad mediante μ y d.
Se puede demostrar que la función log-verosimilitud es estrictamente cóncava en el dominio de los parámetros. En consecuencia, el MLE es único.
La ecuación de probabilidad no siempre tiene una solución como muestra la siguiente proposición,
Proposición: [9] Sea X 1 , ..., X m provenir de una distribución de Hermite generalizada con n fijo . Entonces los MLE de los parámetros son y si solo si , donde indica el momento factorial empírico de orden 2.
Observación 1: La condición es equivalente a dónde está el índice de dispersión empírico
Observación 2: Si no se cumple la condición, entonces los MLE de los parámetros son y , es decir, los datos se ajustan utilizando la distribución de Poisson.
Frecuencia cero y estimadores de media.
Una elección habitual para distribuciones discretas es la frecuencia relativa cero del conjunto de datos, que se equipara a la probabilidad de cero bajo la distribución supuesta. Observando eso y . Siguiendo el ejemplo de YC Patel (1976), el sistema de ecuaciones resultante,
Se puede ver que para distribuciones con alta probabilidad de 0, la eficiencia es alta.
Para valores admisibles de y , debemos tener
Probando el supuesto de Poisson
Cuando se utiliza la distribución de Hermite para modelar una muestra de datos, es importante comprobar si la distribución de Poisson es suficiente para ajustar los datos. Siguiendo la función de masa de probabilidad parametrizada utilizada para calcular el estimador de máxima verosimilitud, es importante corroborar la siguiente hipótesis,
¿Dónde está la función de probabilidad logarítmica? Como d = 1 pertenece al límite del dominio de parámetros, bajo la hipótesis nula, W no tiene una distribución asintótica como se esperaba. Se puede establecer que la distribución asintótica de W es una mezcla 50:50 de la constante 0 y . Los puntos porcentuales α de la cola superior para esta mezcla son los mismos que los 2 puntos porcentuales de la cola superior para a ; por ejemplo, para α = 0,01, 0,05 y 0,10 son 5,41189, 2,70554 y 1,64237.
La "score" o prueba del multiplicador de Lagrange
La estadística de puntuación es, [9]
donde m es el número de observaciones.
La distribución asintótica del estadístico de la prueba de puntuación bajo la hipótesis nula es una distribución. Puede ser conveniente utilizar una versión firmada de la prueba de puntuación, es decir, siguiendo asintóticamente una normal estándar.
^ abc Kemp, CD; Kemp, AW (1965). "Algunas propiedades de la distribución" Hermite "". Biometrika . 52 (3–4): 381–394. doi :10.1093/biomet/52.3-4.381.
^ ab McKendrick, AG (1926). "Aplicaciones de las matemáticas a problemas médicos". Actas de la Sociedad Matemática de Edimburgo . 44 : 98-130. doi : 10.1017/s0013091500034428 .
^ Huiming, Zhang; Yunxiao Liu; Bo Li (2014). "Notas sobre el modelo de Poisson compuesto discreto con aplicaciones a la teoría del riesgo". Seguros: Matemáticas y Economía . 59 : 325–336. doi :10.1016/j.insmatheco.2014.09.012.
^ abcd Johnson, NL, Kemp, AW y Kotz, S. (2005) Distribuciones discretas univariadas, tercera edición, Wiley, ISBN 978-0-471-27246-5 .
^ Kemp, ADRIENNE W.; CD de Kemp (1966). "Una derivación alternativa de la distribución de Hermite". Biometrika . 53 (3–4): 627–628. doi :10.1093/biomet/53.3-4.627.
^ abc Patel, YC (1976). "Estimación de puntos pares y estimación de momentos en distribución de Hermite". Biometría . 32 (4): 865–873. doi :10.2307/2529270. JSTOR 2529270.
^ Gupta, RP; Jainista, GC (1974). "Una distribución generalizada de Hermite y sus propiedades". Revista SIAM de Matemática Aplicada . 27 (2): 359–363. doi :10.1137/0127027. JSTOR 2100572.
^ ab Kotz, Samuel (1982-1989). Enciclopedia de ciencias estadísticas . Juan Wiley. ISBN978-0471055525.
^ abcdefgh Puig, P. (2003). "Caracterización de modelos discretos aditivamente cerrados mediante una propiedad de sus estimadores de máxima verosimilitud, con una aplicación a distribuciones generalizadas de Hermite". Revista de la Asociación Estadounidense de Estadística . 98 (463): 687–692. doi :10.1198/016214503000000594. JSTOR 30045296. S2CID 120484966.