stringtranslate.com

Estimación de espaciado máximo

El método de espaciado máximo intenta encontrar una función de distribución tal que los espaciados, D ( i ) , sean todos aproximadamente de la misma longitud. Esto se hace maximizando su media geométrica .

En estadística , la estimación de espaciamiento máximo ( MSE o MSP ), o producto máximo de estimación de espaciamiento (MPS) , es un método para estimar los parámetros de un modelo estadístico univariado . [1] El método requiere la maximización de la media geométrica de los espacios en los datos, que son las diferencias entre los valores de la función de distribución acumulativa en puntos de datos vecinos.

El concepto subyacente al método se basa en la transformación integral de probabilidad , en la que un conjunto de muestras aleatorias independientes derivadas de cualquier variable aleatoria debe, en promedio, distribuirse uniformemente con respecto a la función de distribución acumulativa de la variable aleatoria. El método MPS elige los valores de los parámetros que hacen que los datos observados sean lo más uniformes posible, de acuerdo con una medida cuantitativa específica de uniformidad.

Uno de los métodos más comunes para estimar los parámetros de una distribución a partir de datos, el método de máxima verosimilitud (MLE), puede fallar en varios casos, como cuando se involucran ciertas mezclas de distribuciones continuas. [2] En estos casos, el método de estimación de espaciamiento máximo puede tener éxito.

Además de su uso en matemáticas puras y estadística, las aplicaciones de prueba del método se han informado utilizando datos de campos como la hidrología , [3] econometría , [4] imágenes por resonancia magnética , [5] y otros. [6]

Historia y uso

El método MSE fue desarrollado de forma independiente por Russel Cheng y Nik Amin del Instituto de Ciencia y Tecnología de la Universidad de Gales , y Bo Ranneby de la Universidad Sueca de Ciencias Agrícolas . [2] Los autores explicaron que debido a la transformación integral de probabilidad en el parámetro verdadero, el "espaciado" entre cada observación debe distribuirse uniformemente. Esto implicaría que la diferencia entre los valores de la función de distribución acumulativa en observaciones consecutivas debería ser igual. Este es el caso que maximiza la media geométrica de tales espaciamientos, por lo que al resolver los parámetros que maximizan la media geométrica se lograría el “mejor” ajuste definido de esta manera. Ranneby (1984) justificó el método demostrando que es un estimador de la divergencia de Kullback-Leibler , similar a la estimación de máxima verosimilitud , pero con propiedades más robustas para algunas clases de problemas.

Hay ciertas distribuciones, especialmente aquellas con tres o más parámetros, cuyas probabilidades pueden volverse infinitas a lo largo de ciertos caminos en el espacio de parámetros . El uso de la máxima verosimilitud para estimar estos parámetros a menudo falla, ya que un parámetro tiende al valor específico que hace que la probabilidad sea infinita, lo que hace que los demás parámetros sean inconsistentes. Sin embargo, el método de espaciado máximo, al depender de la diferencia entre puntos de la función de distribución acumulativa y no de puntos de probabilidad individuales, no tiene este problema y arrojará resultados válidos en una gama mucho más amplia de distribuciones. [1]

Las distribuciones que tienden a tener problemas de probabilidad suelen ser las que se utilizan para modelar fenómenos físicos. Salón y otros. (2004) buscan analizar métodos de mitigación de inundaciones, lo que requiere modelos precisos de los efectos de las inundaciones de los ríos. Las distribuciones que modelan mejor estos efectos son todos los modelos de tres parámetros, que sufren del problema de probabilidad infinita descrito anteriormente, lo que llevó a Hall a la investigación del procedimiento de espaciado máximo. Wong y Li (2006), al comparar el método con la máxima verosimilitud, utilizan varios conjuntos de datos que van desde un conjunto sobre las edades más avanzadas en el momento de la muerte en Suecia entre 1905 y 1958 hasta un conjunto que contiene las velocidades máximas anuales del viento.

Definición

Dada una muestra aleatoria iid { x 1 , ..., x n } de tamaño n de una distribución univariada con función de distribución acumulativa continua F ( x ; θ 0 ), donde θ 0 ∈ Θ es un parámetro desconocido a estimar , sea { x (1) , ..., x ( n ) } sea la muestra ordenada correspondiente , que es el resultado de ordenar todas las observaciones de menor a mayor. Por conveniencia, denotemos también x (0) = −∞ y x ( n +1) = +∞.

Defina los espacios como los “espacios” entre los valores de la función de distribución en puntos ordenados adyacentes: [7]

Entonces el estimador de espaciamiento máximo de θ 0 se define como un valor que maximiza el logaritmo de la media geométrica de los espaciamientos muestrales:

Por la desigualdad de las medias aritméticas y geométricas , la función S n ( θ ) está limitada desde arriba por −ln ( n +1) y, por lo tanto, el máximo tiene que existir al menos en el sentido supremo .

Tenga en cuenta que algunos autores definen la función S n ( θ ) de manera algo diferente. En particular, Ranneby (1984) multiplica cada Di por un factor de ( n +1), mientras que Cheng y Stephens (1989) omiten el factor 1n +1 delante de la suma y añaden el signo “-” en orden. convertir la maximización en minimización. Al ser constantes respecto de θ , las modificaciones no alteran la ubicación del máximo de la función S n .

Ejemplos

Esta sección presenta dos ejemplos de cálculo del estimador de espaciado máximo.

Ejemplo 1

Un cuadro que contiene la gráfica de dos funciones cóncavas desplazadas con diferentes picos, líneas verticales que dividen los picos y flechas etiquetadas que apuntan al lugar donde las líneas verticales se cruzan con la parte inferior del cuadro.
Gráficas del valor logarítmico de λ para el ejemplo simplista tanto bajo estimación de probabilidad como de espaciamiento. Se identifican los valores para los cuales se maximizan tanto la probabilidad como el espaciamiento, las estimaciones de máxima verosimilitud y máximo espaciamiento.

Supongamos que se tomaron muestras de dos valores x (1) = 2, x (2) = 4 de la distribución exponencial F ( x ; λ ) = 1 − e , x ≥ 0 con parámetro desconocido λ > 0. Para construir el MSE primero tenemos que encontrar los espacios:

El proceso continúa encontrando el λ que maximiza la media geométrica de la columna de “diferencia”. Usando la convención que ignora tomar la raíz ( n +1), esto se convierte en la maximización del siguiente producto: (1 − e −2 λ ) · (e −2 λ − e −4 λ ) · (e −4 λ ). Sea μ = e −2 λ , el problema es encontrar el máximo de μ 5 −2 μ 4 + μ 3 . Al derivar, μ tiene que satisfacer 5 μ 4 −8 μ 3 +3 μ 2 = 0. Esta ecuación tiene raíces 0, 0,6 y 1. Como μ es en realidad e −2 λ , tiene que ser mayor que cero pero menor de una. Por lo tanto, la única solución aceptable es

1λλ MLE

Ejemplo 2

Supongamos que { x (1) , ..., x ( n ) } es la muestra ordenada de una distribución uniforme U ( a , b ) con puntos finales desconocidos a y b . La función de distribución acumulativa es F ( x ; a , b ) = ( xa )/( ba ) cuando x ∈[ a , b ]. Por lo tanto, los espaciamientos individuales están dados por

Calculando la media geométrica y luego tomando el logaritmo, el estadístico S n será igual a

ab

Se sabe que estos son los estimadores insesgados de varianza mínima uniforme (UMVU) para la distribución uniforme continua. [1] En comparación, las estimaciones de máxima verosimilitud para este problema están sesgadas y tienen un error cuadrático medio más alto .

Propiedades

Consistencia y eficiencia

Gráfica de una función de densidad en “forma de J” y su distribución correspondiente. Un Weibull desplazado con un parámetro de escala de 15, un parámetro de forma de 0,5 y un parámetro de ubicación de 10. La densidad asintóticamente se acerca al infinito cuando x se acerca a 10, lo que hace que las estimaciones de los otros parámetros sean inconsistentes. Tenga en cuenta que no hay ningún punto de inflexión en la gráfica de la distribución.

El estimador de espaciado máximo es un estimador consistente en el sentido de que converge en probabilidad al valor verdadero del parámetro, θ 0 , a medida que el tamaño de la muestra aumenta hasta el infinito. [2] La consistencia de la estimación del espaciamiento máximo se mantiene en condiciones mucho más generales que para los estimadores de máxima verosimilitud . En particular, en los casos en que la distribución subyacente tiene forma de J, la probabilidad máxima fracasará cuando MSE tenga éxito. [1] Un ejemplo de una densidad en forma de J es la distribución de Weibull , específicamente una Weibull desplazada , con un parámetro de forma menor que 1. La densidad tenderá al infinito a medida que x se acerca al parámetro de ubicación , lo que hace que las estimaciones de los otros parámetros sean inconsistentes.

Los estimadores de espaciado máximo también son al menos tan asintóticamente eficientes como los estimadores de máxima verosimilitud, cuando estos últimos existen. Sin embargo, pueden existir MyPEs en los casos en que las MLEs no existan. [1]

Sensibilidad

Los estimadores de espaciamiento máximo son sensibles a observaciones muy espaciadas, y especialmente a vínculos. [8] Dado

Cuando los empates se deben a múltiples observaciones, los espaciamientos repetidos (aquellos que de otro modo serían cero) deben reemplazarse por la verosimilitud correspondiente. [1] Es decir, se debe sustituir , como

Cuando los empates se deben a un error de redondeo, Cheng y Stephens (1989) sugieren otro método para eliminar los efectos. [nota 1] Dadas r observaciones empatadas de x i a x i + r −1 , sea δ el error de redondeo . Entonces todos los valores verdaderos deberían estar dentro del rango . Los puntos correspondientes en la distribución ahora deberían estar entre y . Cheng y Stephens sugieren suponer que los valores redondeados están espaciados uniformemente en este intervalo, definiendo

El método MSE también es sensible al agrupamiento secundario. [8] Un ejemplo de este fenómeno es cuando se cree que un conjunto de observaciones provienen de una única distribución normal , pero en realidad proviene de una mezcla de normales con diferentes medias. Un segundo ejemplo es cuando se cree que los datos provienen de una distribución exponencial , pero en realidad provienen de una distribución gamma . En este último caso pueden aparecer espaciamientos más pequeños en la cola inferior. Un valor alto de M ( θ ) indicaría este efecto de agrupamiento secundario, y sugiere que se requiere una mirada más cercana a los datos. [8]

prueba de moran

El estadístico S n ( θ ) también es una forma del estadístico de Moran o Moran-Darling, M ( θ ), que se puede utilizar para probar la bondad del ajuste . [nota 2] Se ha demostrado que la estadística, cuando se define como

asintóticamente normal[8]distribución normal
γconstante de Euler-Mascheroni[nota 3]

La distribución también se puede aproximar por la de , donde

distribución chi-cuadradogrados de libertadsignificanciavalor crítico[8]

Cuando θ 0 es estimado por , Cheng y Stephens (1989) demostraron que tiene la misma media asintótica y varianza que en el caso conocido. Sin embargo, el estadístico de prueba que se utilizará requiere la adición de un término de corrección de sesgo y es:

Espaciado máximo generalizado

Medidas y espaciamientos alternativos

Ranneby y Ekström (1997) generalizaron el método MSE para aproximar otras medidas además de la medida de Kullback-Leibler. Ekström (1997) amplió aún más el método para investigar las propiedades de los estimadores que utilizan espaciamientos de orden superior, donde un espaciamiento de orden m se definiría como .

Distribuciones multivariadas

Ranneby y otros. (2005) analizan métodos de espaciado máximo extendidos al caso multivariado . Como no existe un orden natural para , discuten dos enfoques alternativos: un enfoque geométrico basado en celdas de Dirichlet y un enfoque probabilístico basado en una métrica de "bola vecina más cercana".

Ver también

Notas

  1. ^ Parece haber algunos errores tipográficos menores en el artículo. Por ejemplo, en la sección 4.2, ecuación (4.1), el reemplazo por redondeo de , no debe tener el término logarítmico. En la sección 1, la ecuación (1.2) se define como el espaciamiento mismo y es la suma negativa de los registros de . Si se registra en este paso, el resultado siempre es ≤ 0, ya que la diferencia entre dos puntos adyacentes en una distribución acumulativa es siempre ≤ 1 y estrictamente < 1 a menos que solo haya dos puntos en los sujetalibros. Además, en la sección 4.3, en la página 392, el cálculo muestra que es la varianza la que tiene una estimación de MPS de 6,87, no la desviación estándar . - Editor
  2. ^ La literatura se refiere a estadísticas relacionadas como estadísticas de Moran o Moran-Darling. Por ejemplo, Cheng y Stephens (1989) analizan la forma donde se define como anteriormente. Wong y Li (2006) también utilizan la misma forma. Sin embargo, Beirlant & al. (2001) utiliza la forma , con el factor adicional de dentro de la suma registrada. Los factores adicionales marcarán la diferencia en términos de la media esperada y la varianza de la estadística. Para mantener la coherencia, este artículo seguirá utilizando el formulario Cheng & Amin/Wong & Li. -- Editor
  3. ^ Wong y Li (2006) omiten la constante de Euler-Mascheroni en su descripción. -- Editor

Referencias

Citas

  1. ^ abcdef Cheng y Amin (1983)
  2. ^ abc Ranneby (1984)
  3. ^ Salón y otros. (2004)
  4. ^ Anatolyev y Kosenok (2004)
  5. ^ Pieciak (2014)
  6. ^ Wong y Li (2006)
  7. ^ Pyke (1965)
  8. ^ abcde Cheng y Stephens (1989)

Trabajos citados