Identificabilidad

En estadística , la identificabilidad es una propiedad que debe satisfacer un modelo para que sea posible realizar una inferencia precisa. Un modelo es identificable si es teóricamente posible conocer los valores verdaderos de los parámetros subyacentes de este modelo después de obtener un número infinito de observaciones de él. Matemáticamente, esto equivale a decir que los diferentes valores de los parámetros deben generar diferentes distribuciones de probabilidad de las variables observables. Por lo general, el modelo solo es identificable bajo ciertas restricciones técnicas, en cuyo caso el conjunto de estos requisitos se denomina condiciones de identificación .

Un modelo que no es identificable se dice que es no identificable o no identificable : dos o más parametrizaciones son observacionalmente equivalentes . En algunos casos, aunque un modelo no sea identificable, aún es posible conocer los valores verdaderos de un cierto subconjunto de los parámetros del modelo. En este caso decimos que el modelo es parcialmente identificable . En otros casos puede ser posible conocer la ubicación del parámetro verdadero hasta una cierta región finita del espacio de parámetros, en cuyo caso el modelo se establece como identificable .

Además de la exploración estrictamente teórica de las propiedades del modelo, la identificabilidad puede considerarse en un ámbito más amplio cuando un modelo se prueba con conjuntos de datos experimentales, utilizando el análisis de identificabilidad . ^[1]

Definición

Sea un modelo estadístico con espacio de parámetros . Decimos que es identificable si la aplicación es biunívoca : ^[2] ${\mathcal {P}}=\{P_{\theta }:\theta \en \Theta \}$ ${\estilo de visualización \Theta}$ ${\mathcal {P}}$ $\theta \mapsto P_{\theta }$

P_{\theta _{1}}=P_{\theta _{2}}\quad \Rightarrow \quad \theta _{1}=\theta _{2}\quad \ {\text{para todos }}\theta _{1},\theta _{2}\en \Theta .

Esta definición significa que valores distintos de θ deben corresponder a distribuciones de probabilidad distintas: si θ ₁ ≠ θ ₂ , entonces también P _{θ ₁} ≠ P _{θ ₂} . ^[3] Si las distribuciones se definen en términos de funciones de densidad de probabilidad (pdf), entonces dos pdf deben considerarse distintas solo si difieren en un conjunto de medidas distintas de cero (por ejemplo, dos funciones ƒ ₁ ( x ) = 1 _{0 ≤ x < 1} y ƒ ₂ ( x ) = 1 _{0 ≤ x ≤ 1} difieren solo en un único punto x = 1 —un conjunto de medidas cero— y, por lo tanto, no pueden considerarse como pdf distintas).

La identificabilidad del modelo en el sentido de invertibilidad de la función es equivalente a poder conocer el parámetro verdadero del modelo si el modelo puede ser observado indefinidamente. De hecho, si { X _t } ⊆ S es la secuencia de observaciones del modelo, entonces por la ley fuerte de los grandes números , $\theta \mapsto P_{\theta }$

{\frac {1}{T}}\sum _{t=1}^{T}\mathbf {1} _{\{X_{t}\en A\}}\ {\xrightarrow {\text{as}}}\ \Pr[X_{t}\en A],

para cada conjunto medible A ⊆ S (aquí 1 _{...} es la función indicadora ). Por lo tanto, con un número infinito de observaciones podremos encontrar la distribución de probabilidad verdadera P ₀ en el modelo, y dado que la condición de identificabilidad anterior requiere que el mapa sea invertible, también podremos encontrar el valor verdadero del parámetro que generó la distribución dada P ₀ . $\theta \mapsto P_{\theta }$

Ejemplos

Ejemplo 1

Sea la familia de escala-ubicación normal : ${\mathcal {P}}$

{\mathcal {P}}={\Big \{}\ f_{\theta }(x)={\tfrac {1}{{\sqrt {2\pi }}\sigma }}e^{-{\frac {1}{2\sigma ^{2}}}(x-\mu )^{2}}\ {\Big |}\ \theta =(\mu ,\sigma ):\mu \in \mathbb {R} ,\,\sigma \!>0\ {\Big \}}.

Entonces

{\begin{aligned}&f_{\theta _{1}}(x)=f_{\theta _{2}}(x)\\[6pt]\Longleftrightarrow {}&{\frac {1}{{\sqrt {2\pi }}\sigma _{1}}}\exp \left(-{\frac {1}{2\sigma _{1}^{2}}}(x-\mu _{1})^{2}\right)={\frac {1}{{\sqrt {2\pi }}\sigma _{2}}}\exp \left(-{\frac {1}{2\sigma _{2}^{2}}}(x-\mu _{2})^{2}\right)\\[6pt]\Longleftrightarrow {}&{\frac {1}{\sigma _{1}^{2}}}(x-\mu _{1})^{2}+\ln \sigma _{1}={\frac {1}{\sigma _{2}^{2}}}(x-\mu _{2})^{2}+\ln \sigma _{2}\\[6pt]\Longleftrightarrow {}&x^{2}\left({\frac {1}{\sigma _{1}^{2}}}-{\frac {1}{\sigma _{2}^{2}}}\right)-2x\left({\frac {\mu _{1}}{\sigma _{1}^{2}}}-{\frac {\mu _{2}}{\sigma _{2}^{2}}}\right)+\left({\frac {\mu _{1}^{2}}{\sigma _{1}^{2}}}-{\frac {\mu _{2}^{2}}{\sigma _{2}^{2}}}+\ln \sigma _{1}-\ln \sigma _{2}\right)=0\end{alineado}}

Esta expresión es igual a cero para casi todos los x solo cuando todos sus coeficientes son iguales a cero, lo que solo es posible cuando | σ ₁ | = | σ ₂ | y μ ₁ = μ ₂ . Dado que en la escala el parámetro σ está restringido a ser mayor que cero, concluimos que el modelo es identificable: ƒ _{θ ₁} = ƒ _{θ ₂} ⇔ θ ₁ = θ ₂ .

Ejemplo 2

Sea el modelo de regresión lineal estándar : ${\mathcal {P}}$

y=\beta 'x+\varepsilon ,\quad \mathrm {E} [\,\varepsilon \mid x\,]=0

(donde ′ denota la matriz transpuesta ). Entonces, el parámetro β es identificable si y solo si la matriz es invertible. Por lo tanto, esta es la condición de identificación en el modelo. $\mathrm {E} [xx']$

Ejemplo 3

Supongamos que el modelo lineal clásico de errores en las variables es : ${\mathcal {P}}$

{\begin{cases}y=\beta x^{*}+\varepsilon ,\\x=x^{*}+\eta ,\end{cases}}

donde ( ε , η , x* ) son variables aleatorias independientes normales conjuntas con valor esperado cero y varianzas desconocidas, y solo se observan las variables ( x , y ). Entonces este modelo no es identificable, ^[4] solo lo es el producto βσ² _∗ (donde σ² _∗ es la varianza del regresor latente x* ). Este también es un ejemplo de un modelo identificable por conjuntos : aunque no se puede aprender el valor exacto de β , podemos garantizar que debe estar en algún lugar del intervalo ( β _yx , 1÷ β _xy ), donde β _yx es el coeficiente en la regresión MCO de y sobre x , y β _xy es el coeficiente en la regresión MCO de x sobre y . ^[5]

Si abandonamos el supuesto de normalidad y requerimos que x* no se distribuya normalmente, conservando sólo la condición de independencia ε ⊥ η ⊥ x* , entonces el modelo se vuelve identificable. ^[4]

Véase también

Referencias

Citas

^ Raue, A.; Kreutz, C.; Maiwald, T.; Bachmann, J.; Schilling, M.; Klingmuller, U.; Timmer, J. (1 de agosto de 2009). "Análisis de identificabilidad estructural y práctica de modelos dinámicos parcialmente observados mediante la explotación de la verosimilitud del perfil". Bioinformática . 25 (15): 1923–1929. doi : 10.1093/bioinformatics/btp358 . PMID 19505944.
^ Lehmann y Casella 1998, Cap. 1, Definición 5.2
^ van der Vaart 1998, pág. 62
^ desde Reiersøl 1950
^ Casella y Berger 2002, pág. 583

Fuentes

Casella, George ; Berger, Roger L. (2002), Inferencia estadística (2.ª ed.), ISBN 0-534-24312-6, C.L.C.N. 2001025794
Hsiao, Cheng (1983), Identificación , Manual de econometría, vol. 1, cap. 4, North-Holland Publishing Company
Lehmann, EL ; Casella, G. (1998), Teoría de la estimación puntual (2.ª ed.), Springer, ISBN 0-387-98502-6
Reiersøl, Olav (1950), "Identificabilidad de una relación lineal entre variables sujetas a error", Econometrica , 18 (4): 375–389, doi :10.2307/1907835, JSTOR 1907835
van der Vaart, AW (1998), Estadística asintótica , Cambridge University Press , ISBN 978-0-521-49603-2

Lectura adicional

Walter, É. ; Pronzato, L. (1997), Identificación de modelos paramétricos a partir de datos experimentales , Springer

Econometría

Lewbel, Arthur (1 de diciembre de 2019). "El zoológico de la identificación: significados de la identificación en econometría". Revista de literatura económica . 57 (4). Asociación Económica Estadounidense: 835–903. doi :10.1257/jel.20181361. ISSN 0022-0515. S2CID 125792293.
Matzkin, Rosa L. (2013). "Identificación no paramétrica en modelos económicos estructurales". Revista Anual de Economía . 5 (1): 457–486. doi :10.1146/annurev-economics-082912-110231.
Rothenberg, Thomas J. (1971). "Identificación en modelos paramétricos". Econometrica . 39 (3): 577–591. doi :10.2307/1913267. ISSN 0012-9682. JSTOR 1913267.