Modelo estadístico para regresands censurados
En estadística, un modelo Tobit es cualquiera de una clase de modelos de regresión en los que el rango observado de la variable dependiente está censurado de alguna manera. [1] El término fue acuñado por Arthur Goldberger en referencia a James Tobin , [2] [a] quien desarrolló el modelo en 1958 para mitigar el problema de los datos inflados a cero para las observaciones del gasto de los hogares en bienes duraderos . [3] [b] Debido a que el método de Tobin se puede extender fácilmente para manejar muestras truncadas y otras muestras seleccionadas de forma no aleatoria, [c] algunos autores adoptan una definición más amplia del modelo Tobit que incluye estos casos. [4]
La idea de Tobin era modificar la función de verosimilitud para que reflejara la probabilidad de muestreo desigual para cada observación dependiendo de si la variable dependiente latente caía por encima o por debajo del umbral determinado. [5] Para una muestra que, como en el caso original de Tobin, fue censurada desde abajo en cero, la probabilidad de muestreo para cada observación no límite es simplemente la altura de la función de densidad apropiada . Para cualquier observación límite, es la distribución acumulativa, es decir, la integral por debajo de cero de la función de densidad apropiada. La función de verosimilitud de Tobin es, por tanto, una mezcla de densidades y funciones de distribución acumulativa. [6]
La función de verosimilitud
A continuación se muestran las funciones de verosimilitud y logaritmo de verosimilitud para un Tobit de tipo I. Este es un Tobit censurado desde abajo cuando la variable latente . Para escribir la función de verosimilitud, primero definimos una función indicadora :
A continuación, sea la función de distribución acumulativa normal estándar y sea la función de densidad de probabilidad normal estándar . Para un conjunto de datos con N observaciones, la función de verosimilitud para un Tobit de tipo I es
y la probabilidad logarítmica viene dada por
Reparametrización
La verosimilitud logarítmica, como se indicó anteriormente, no es globalmente cóncava , lo que complica la estimación de máxima verosimilitud . Olsen sugirió la simple reparametrización y , lo que da como resultado una verosimilitud logarítmica transformada,
que es globalmente cóncava en términos de los parámetros transformados. [7]
Para el modelo truncado (tobit II), Orme demostró que si bien la verosimilitud logarítmica no es globalmente cóncava, es cóncava en cualquier punto estacionario bajo la transformación anterior. [8] [9]
Consistencia
Si el parámetro de relación se estima mediante la regresión de lo observado en , el estimador de regresión de mínimos cuadrados ordinarios resultante es inconsistente . Producirá una estimación sesgada hacia abajo del coeficiente de pendiente y una estimación sesgada hacia arriba del intercepto. Takeshi Amemiya (1973) ha demostrado que el estimador de máxima verosimilitud sugerido por Tobin para este modelo es consistente. [10]
Interpretación
El coeficiente no debe interpretarse como el efecto de sobre , como se haría con un modelo de regresión lineal ; este es un error común. En cambio, debe interpretarse como la combinación de (1) el cambio en de aquellos por encima del límite, ponderado por la probabilidad de estar por encima del límite; y (2) el cambio en la probabilidad de estar por encima del límite, ponderado por el valor esperado de si es superior. [11]
Variaciones del modelo de Tobit
Se pueden producir variaciones del modelo Tobit cambiando dónde y cuándo se produce la censura . Amemiya (1985, p. 384) clasifica estas variaciones en cinco categorías (Tobit tipo I – Tobit tipo V), donde Tobit tipo I representa el primer modelo descrito anteriormente. Schnedler (2005) proporciona una fórmula general para obtener estimadores de verosimilitud consistentes para estas y otras variaciones del modelo Tobit. [12]
Tipo I
El modelo Tobit es un caso especial de un modelo de regresión censurada , ya que la variable latente no siempre se puede observar mientras que la variable independiente sí lo es. Una variación común del modelo Tobit es la censura en un valor distinto de cero:
Otro ejemplo es la censura de valores superiores a .
Otro modelo resulta cuando se censura desde arriba y desde abajo al mismo tiempo.
El resto de los modelos se presentarán como acotados desde abajo en 0, aunque esto se puede generalizar como se hizo para el Tipo I.
Tipo II
Los modelos Tobit de tipo II introducen una segunda variable latente. [13]
En el modelo Tobit tipo I, la variable latente absorbe tanto el proceso de participación como el resultado de interés. El modelo Tobit tipo II permite que el proceso de participación (selección) y el resultado de interés sean independientes, condicionados a datos observables.
El modelo de selección de Heckman cae dentro del modelo Tobit Tipo II, [14] que a veces se denomina Heckit en honor a James Heckman . [15]
Tipo III
El tipo III introduce una segunda variable dependiente observada.
El modelo de Heckman cae dentro de este tipo.
Tipo IV
El tipo IV introduce una tercera variable dependiente observada y una tercera variable latente.
Tipo V
Al igual que en el tipo II, en el tipo V sólo se observa el signo de .
Versión no paramétrica
Si la variable latente subyacente no se distribuye normalmente, se deben utilizar cuantiles en lugar de momentos para analizar la variable observable . El estimador CLAD de Powell ofrece una forma posible de lograr esto. [16]
Aplicaciones
Por ejemplo, se han aplicado modelos Tobit para estimar los factores que afectan la recepción de subvenciones, incluidas las transferencias financieras distribuidas a los gobiernos subnacionales que pueden solicitar estas subvenciones. En estos casos, los receptores de subvenciones no pueden recibir cantidades negativas y, por lo tanto, los datos están censurados por la izquierda. Por ejemplo, Dahlberg y Johansson (2002) analizan una muestra de 115 municipios (42 de los cuales recibieron una subvención). [17] Dubois y Fattore (2011) utilizan un modelo Tobit para investigar el papel de varios factores en la recepción de fondos de la Unión Europea aplicando los gobiernos subnacionales polacos. [18] Sin embargo, los datos pueden estar censurados por la izquierda en un punto superior a cero, con el riesgo de una especificación incorrecta. Ambos estudios aplican Probit y otros modelos para comprobar la robustez. Los modelos Tobit también se han aplicado en el análisis de la demanda para dar cabida a observaciones con gastos cero en algunos bienes. En una aplicación relacionada de los modelos Tobit, se ha utilizado un sistema de modelos de regresión Tobit no lineales para estimar conjuntamente un sistema de demanda de marca con variantes homocedásticas, heterocedásticas y heterocedásticas generalizadas. [19]
Véase también
Notas
- ^ Cuando se le preguntó por qué se llamaba modelo "Tobit", en lugar de Tobin, James Tobin explicó que este término fue introducido por Arthur Goldberger , ya sea como un acrónimo de "Tobin's probit ", o como una referencia a la novela The Caine Mutiny , una novela del amigo de Tobin, Herman Wouk , en la que Tobin hace un cameo como "Mr Tobit". Tobin informa haberle preguntado a Goldberger cuál era, y el hombre se negó a decirlo. Véase Shiller, Robert J. (1999). "The ET Interview: Professor James Tobin". Econometric Theory . 15 (6): 867–900. doi :10.1017/S0266466699156056. S2CID 122574727.
- ^ Un modelo casi idéntico fue sugerido independientemente por Anders Hald en 1949, véase Hald, A. (1949). "Estimación de máxima verosimilitud de los parámetros de una distribución normal que se trunca en un punto conocido". Scandinavian Actuarial Journal . 49 (4): 119–134. doi :10.1080/03461238.1949.10419767.
- ^ Una muestra se censura cuando se observa para todas las observaciones , pero el valor verdadero de se conoce solo para un rango restringido de observaciones. Si la muestra se trunca , tanto y solo se observan si se encuentra dentro del rango restringido. Véase Breen, Richard (1996). Modelos de regresión: datos censurados, muestras seleccionadas o truncados. Thousand Oaks: Sage. págs. 2–4. ISBN 0-8039-5710-6.
Referencias
- ^ Hayashi, Fumio (2000). Econometría . Princeton: Princeton University Press. pp. 518–521. ISBN. 0-691-01018-8.
- ^ Goldberger, Arthur S. (1964). Teoría econométrica . Nueva York: J. Wiley. pp. 253–55. ISBN. 9780471311010.
- ^ Tobin, James (1958). "Estimación de relaciones para variables dependientes limitadas" (PDF) . Econometrica . 26 (1): 24–36. doi :10.2307/1907382. JSTOR 1907382.
- ^ Amemiya, Takeshi (1984). "Modelos Tobit: una encuesta". Revista de Econometría . 24 (1–2): 3–61. doi :10.1016/0304-4076(84)90074-5.
- ^ Kennedy, Peter (2003). A Guide to Econometrics (Quinta edición). Cambridge: MIT Press. Págs. 283-284. ISBN. 0-262-61183-X.
- ^ Bierens, Herman J. (2004). Introducción a los fundamentos matemáticos y estadísticos de la econometría . Cambridge University Press. pág. 207.
- ^ Olsen, Randall J. (1978). "Nota sobre la singularidad del estimador de máxima verosimilitud para el modelo Tobit". Econometrica . 46 (5): 1211–1215. doi :10.2307/1911445. JSTOR 1911445.
- ^ Orme, Chris (1989). "Sobre la singularidad del estimador de máxima verosimilitud en modelos de regresión truncados". Econometric Reviews . 8 (2): 217–222. doi :10.1080/07474938908800171.
- ^ Iwata, Shigeru (1993). "Una nota sobre raíces múltiples de la verosimilitud del logaritmo de Tobit". Journal of Econometrics . 56 (3): 441–445. doi :10.1016/0304-4076(93)90129-S.
- ^ Amemiya, Takeshi (1973). "Análisis de regresión cuando la variable dependiente es normal truncada". Econometrica . 41 (6): 997–1016. doi :10.2307/1914031. JSTOR 1914031.
- ^ McDonald, John F.; Moffit, Robert A. (1980). "Los usos del análisis de Tobit". The Review of Economics and Statistics . 62 (2): 318–321. doi :10.2307/1924766. JSTOR 1924766.
- ^ Schnedler, Wendelin (2005). "Estimación de verosimilitud para vectores aleatorios censurados" (PDF) . Econometric Reviews . 24 (2): 195–217. doi :10.1081/ETC-200067925. hdl :10419/127228. S2CID 55747319.
- ^ Amemiya, Takeshi (1985). "Modelos Tobit". Econometría avanzada . Cambridge, Mass.: Harvard University Press. pág. 384. ISBN 0-674-00560-0.OCLC 11728277 .
- ^ Heckman, James J. (1979). "Sesgo de selección de muestra como error de especificación". Econometrica . 47 (1): 153–161. doi :10.2307/1912352. ISSN 0012-9682. JSTOR 1912352.
- ^ Sigelman, Lee; Zeng, Langche (1999). "Análisis de datos censurados y seleccionados por muestra con los modelos Tobit y Heckit". Análisis político . 8 (2): 167–182. doi :10.1093/oxfordjournals.pan.a029811. ISSN 1047-1987. JSTOR 25791605.
- ^ Powell, James L (1 de julio de 1984). "Estimación de desviaciones mínimas absolutas para el modelo de regresión censurada". Journal of Econometrics . 25 (3): 303–325. CiteSeerX 10.1.1.461.4302 . doi :10.1016/0304-4076(84)90004-6.
- ^ Dahlberg, Matz; Johansson, Eva (1 de marzo de 2002). "Sobre el comportamiento de compra de votos de los gobiernos en el poder". American Political Science Review . 96 (1): 27–40. CiteSeerX 10.1.1.198.4112 . doi :10.1017/S0003055402004215. ISSN 1537-5943. S2CID 12718473.
- ^ Dubois, Hans FW; Fattore, Giovanni (1 de julio de 2011). "Asignación de fondos públicos mediante evaluación de proyectos". Estudios regionales y federales . 21 (3): 355–374. doi :10.1080/13597566.2011.578827. ISSN 1359-7566. S2CID 154659642.
- ^ Baltas, George (2001). "Sistemas de demanda de marca consistentes con la utilidad con consumo de categorías endógenas: principios y aplicaciones de marketing". Decision Sciences . 32 (3): 399–422. doi :10.1111/j.1540-5915.2001.tb00965.x. ISSN 0011-7315.
Lectura adicional
- Amemiya, Takeshi (1985). "Modelos Tobit". Econometría avanzada . Oxford: Basil Blackwell. pp. 360–411. ISBN 0-631-13345-3.
- Breen, Richard (1996). "El modelo Tobit para datos censurados". Modelos de regresión: datos censurados, de muestras seleccionadas o truncados . Thousand Oaks: Sage. págs. 12–33. ISBN 0-8039-5710-6.
- Gouriéroux, Christian (2000). "El modelo Tobit". Econometría de variables dependientes cualitativas . Nueva York: Cambridge University Press. pp. 170–207. ISBN 0-521-58985-1.
- King, Gary (1989). "Modelos con selección no aleatoria". Metodología política unificadora: la teoría de la verosimilitud de la inferencia estadística . Cambridge University Press. pp. 208–230. ISBN 0-521-36697-6.
- Maddala, GS (1983). "Modelos de regresión censurados y truncados". Variables cualitativas y dependientes limitadas en econometría . Nueva York: Cambridge University Press. pp. 149–196. ISBN 0-521-24143-X.