Tipo de modelo estadístico
En estadística , un modelo semiparamétrico es un modelo estadístico que tiene componentes paramétricos y no paramétricos .
Un modelo estadístico es una familia de distribuciones parametrizada : indexada por un parámetro .
- Un modelo paramétrico es un modelo en el que el parámetro de indexación es un vector en un espacio euclidiano dimensional , para algún número entero no negativo . [1] Por tanto, es de dimensión finita y .
- Con un modelo no paramétrico , el conjunto de valores posibles del parámetro es un subconjunto de algún espacio , que no es necesariamente de dimensión finita. Por ejemplo, podríamos considerar el conjunto de todas las distribuciones con media 0. Dichos espacios son espacios vectoriales con estructura topológica , pero pueden no ser de dimensión finita como los espacios vectoriales. Por lo tanto, para algún espacio posiblemente de dimensión infinita .
- Con un modelo semiparamétrico, el parámetro tiene tanto un componente de dimensión finita como un componente de dimensión infinita (a menudo una función de valor real definida en la recta real). Por tanto , donde es un espacio de dimensión infinita.
Al principio puede parecer que los modelos semiparamétricos incluyen modelos no paramétricos, ya que tienen un componente de dimensión infinita y otro de dimensión finita. Sin embargo, un modelo semiparamétrico se considera "más pequeño" que un modelo completamente no paramétrico porque a menudo sólo nos interesa el componente de dimensión finita de . Es decir, el componente de dimensión infinita se considera un parámetro molesto . [2] En los modelos no paramétricos, por el contrario, el interés principal es estimar el parámetro de dimensión infinita. Por tanto, la tarea de estimación es estadísticamente más difícil en modelos no paramétricos.
Estos modelos suelen utilizar alisados o núcleos .
Ejemplo
Un ejemplo bien conocido de modelo semiparamétrico es el modelo de riesgos proporcionales de Cox . [3] Si estamos interesados en estudiar el tiempo hasta un evento como la muerte por cáncer o la falla de una bombilla, el modelo de Cox especifica la siguiente función de distribución para :
donde está el vector covariable y y son parámetros desconocidos. . Aquí es de dimensión finita y es de interés; es una función desconocida no negativa del tiempo (conocida como función de riesgo de referencia) y, a menudo, es un parámetro molesto . El conjunto de posibles candidatos para es de dimensión infinita.
Ver también
Notas
- ^ Bickel, PJ; Klaassen, CAJ; Ritov, Y.; Wellner, JA (2006), "Semiparametrics", en Kotz, S .; et al. (eds.), Enciclopedia de ciencias estadísticas , Wiley.
- ^ Oakes, D. (2006), "Modelos semiparamétricos", en Kotz, S .; et al. (eds.), Enciclopedia de ciencias estadísticas , Wiley.
- ^ Balakrishnan, N.; Rao, CR (2004). Manual de estadística 23: Avances en el análisis de supervivencia. Elsevier . pag. 126.
Referencias
- Bickel, PJ; Klaassen, CAJ; Ritov, Y.; Wellner, JA (1998), Estimación eficiente y adaptativa para modelos semiparamétricos , Springer
- Härdle, Wolfgang; Müller, Marlene; Sperlich, Stefan; Werwatz, Axel (2004), Modelos no paramétricos y semiparamétricos , Springer
- Kosorok, Michael R. (2008), Introducción a los procesos empíricos y la inferencia semiparamétrica , Springer
- Tsiatis, Anastasios A. (2006), Teoría semiparamétrica y datos faltantes , Springer
- Comenzado, Janet M.; Hall, WJ; Huang, Wei-Min; Wellner, Jon A. (1983), "Información y eficiencia asintótica en modelos paramétricos y no paramétricos", Annals of Statistics, 11 (1983), no. 2, 432--452