Tipo de modelo estadístico
En estadística , un modelo semiparamétrico es un modelo estadístico que tiene componentes paramétricos y no paramétricos .
Un modelo estadístico es una familia parametrizada de distribuciones: indexada por un parámetro .
- Un modelo paramétrico es un modelo en el que el parámetro de indexación es un vector en el espacio euclidiano -dimensional , para algún entero no negativo . [1] Por lo tanto, es de dimensión finita, y .
- Con un modelo no paramétrico , el conjunto de valores posibles del parámetro es un subconjunto de algún espacio , que no es necesariamente de dimensión finita. Por ejemplo, podríamos considerar el conjunto de todas las distribuciones con media 0. Dichos espacios son espacios vectoriales con estructura topológica , pero pueden no ser de dimensión finita como espacios vectoriales. Por lo tanto, para algún espacio posiblemente de dimensión infinita .
- En un modelo semiparamétrico, el parámetro tiene un componente de dimensión finita y un componente de dimensión infinita (a menudo una función de valor real definida en la línea real). Por lo tanto, , donde es un espacio de dimensión infinita.
A primera vista, puede parecer que los modelos semiparamétricos incluyen modelos no paramétricos, ya que tienen un componente de dimensión infinita y uno de dimensión finita. Sin embargo, se considera que un modelo semiparamétrico es "más pequeño" que un modelo completamente no paramétrico porque a menudo nos interesa solo el componente de dimensión finita de . Es decir, el componente de dimensión infinita se considera un parámetro molesto . [2] En los modelos no paramétricos, por el contrario, el interés principal está en estimar el parámetro de dimensión infinita. Por lo tanto, la tarea de estimación es estadísticamente más difícil en los modelos no paramétricos.
Estos modelos a menudo utilizan suavizado o kernels .
Ejemplo
Un ejemplo bien conocido de un modelo semiparamétrico es el modelo de riesgos proporcionales de Cox . [3] Si nos interesa estudiar el tiempo hasta que ocurre un evento como la muerte por cáncer o la falla de una bombilla, el modelo de Cox especifica la siguiente función de distribución para :
donde es el vector de covariables, y y son parámetros desconocidos. . Aquí es de dimensión finita y es de interés; es una función no negativa desconocida del tiempo (conocida como la función de riesgo de referencia) y a menudo es un parámetro molesto . El conjunto de posibles candidatos para es de dimensión infinita.
Véase también
Notas
- ^ Bickel, PJ; Klaassen, CAJ; Ritov, Y.; Wellner, JA (2006), "Semiparametrics", en Kotz, S .; et al. (eds.), Enciclopedia de ciencias estadísticas , Wiley.
- ^ Oakes, D. (2006), "Modelos semiparamétricos", en Kotz, S. ; et al. (eds.), Enciclopedia de ciencias estadísticas , Wiley.
- ^ Balakrishnan, N.; Rao, CR (2004). Manual de estadística 23: Avances en el análisis de supervivencia. Elsevier . pág. 126.
Referencias
- Bickel, PJ; Klaassen, CAJ; Ritov, Y.; Wellner, JA (1998), Estimación eficiente y adaptativa para modelos semiparamétricos , Springer
- Härdle, Wolfgang; Müller, Marlene; Sperlich, Stefan; Werwatz, Axel (2004), Modelos no paramétricos y semiparamétricos , Springer
- Kosorok, Michael R. (2008), Introducción a los procesos empíricos y la inferencia semiparamétrica , Springer
- Tsiatis, Anastasios A. (2006), Teoría semiparamétrica y datos faltantes , Springer
- Begun, Janet M.; Hall, WJ; Huang, Wei-Min; Wellner, Jon A. (1983), "Información y eficiencia asintótica en modelos paramétricos y no paramétricos", Annals of Statistics, 11 (1983), n.º 2, 432-452