logit mixto

Logit mixto es un modelo estadístico completamente general para examinar opciones discretas . Supera tres limitaciones importantes del modelo logit estándar al permitir variaciones aleatorias de gustos entre los electores, patrones de sustitución sin restricciones entre las opciones y correlación de factores no observados a lo largo del tiempo. ^[1] El logit mixto puede elegir cualquier distribución para los coeficientes aleatorios, a diferencia del probit que se limita a la distribución normal. Se llama "logit mixto" porque la probabilidad de elección es una mezcla de logits, con la distribución mixta. ^[2] Se ha demostrado que un modelo logit mixto puede aproximarse con cualquier grado de precisión a cualquier modelo de utilidad aleatorio verdadero de elección discreta, dada la especificación adecuada de las variables y la distribución de coeficientes. ^[3] $f$ $f$

Variación aleatoria del sabor

Los coeficientes de "gusto" del modelo logit estándar, o 's, son fijos, lo que significa que son los mismos para todos. El logit mixto tiene diferentes para cada persona (es decir, cada tomador de decisiones). $\beta$ $\beta$ $\beta$

En el modelo logit estándar, la utilidad de persona como alternativa es: $n$ $i$

U_{ni}=\beta x_{ni}+\varepsilon _{ni}

con

\varepsilon _{ni}

~ iid valor extremo

Para el modelo logit mixto, esta especificación se generaliza permitiendo que sea aleatoria. La utilidad de persona por alternativa en el modelo logit mixto es: $\beta _{n}$ $n$ $i$

U_{ni}=\beta _{n}x_{ni}+\varepsilon _{ni}

con

\varepsilon _{ni}

~ iid valor extremo

\quad \beta _{n}\sim f(\beta |\theta )

donde θ son los parámetros de la distribución de s sobre la población, como la media y la varianza de . $\beta _{n}$ $\beta _{n}$

Condicional a , la probabilidad de que la persona elija una alternativa es la fórmula logit estándar: $\beta _{n}$ $n$ $i$

L_{ni}(\beta _{n})={\frac {e^{\beta _{n}X_{ni}}}{\sum _{j}e^{\beta _{n}X_{nj}}}}

Sin embargo, como es aleatoria y no se conoce, la probabilidad de elección (incondicional) es la integral de esta fórmula logit sobre la densidad de . $\beta _{n}$ $\beta _{n}$

P_{ni}=\int L_{ni}(\beta )f(\beta |\theta )d\beta

Este modelo también se llama modelo logit de coeficiente aleatorio ya que es una variable aleatoria. Permite que las pendientes de la utilidad (es decir, la utilidad marginal ) sean aleatorias, lo cual es una extensión del modelo de efectos aleatorios donde sólo el intercepto era estocástico. $\beta _{n}$

Se puede especificar cualquier función de densidad de probabilidad para la distribución de los coeficientes en la población, es decir, para . La distribución más utilizada es la normal, principalmente por su simplicidad. Para los coeficientes que toman el mismo signo para todas las personas, como un coeficiente de precio que es necesariamente negativo o el coeficiente de un atributo deseable, se utilizan distribuciones con soporte en un solo lado de cero, como la lognormal. ^[4]^[5] Cuando los coeficientes no pueden ser lógicamente grandes o pequeños ilimitadamente, a menudo se utilizan distribuciones acotadas, como las distribuciones triangulares o. $f(\beta |\theta )$ $S_{b}$

Patrones de sustitución sin restricciones

El modelo logit mixto puede representar un patrón de sustitución general porque no exhibe la propiedad restrictiva de independencia de alternativas irrelevantes (IIA) del logit. El cambio porcentual en la probabilidad incondicional de una persona de elegir una alternativa dado un cambio porcentual en el m -ésimo atributo de la alternativa (la elasticidad de con respecto a ) es $n$ $i$ $j$ $P_{ni}$ $x_{nj}^{m}$

{\text{Elasticity}}_{P_{ni},x_{nj}^{m}}=-{\frac {x_{nj}^{m}}{P_{ni}}}\int \beta ^{m}L_{ni}(\beta )L_{nj}(\beta )f(\beta )d\beta =-x_{nj}^{m}\int \beta ^{m}L_{nj}(\beta ){\frac {L_{ni}(\beta )}{P_{ni}}}f(\beta )d\beta

¿Dónde está el elemento m de ? ^[1]^[5] Se puede ver en esta fórmula que una reducción del diez por ciento no necesariamente implica (como ocurre con logit) una reducción del diez por ciento en cada otra alternativa . ^[1] La razón es que los porcentajes relativos dependen de la correlación entre la probabilidad condicional de que la persona elija una alternativa y la probabilidad condicional de que la persona elija una alternativa entre varios sorteos de . $\beta ^{m}$ $\beta$ $P_{ni}$ $P_{nj}$ $n$ $i,L_{ni},$ $n$ $j,L_{nj},$ $\beta$

Correlación de factores no observados a lo largo del tiempo.

El logit estándar no tiene en cuenta ningún factor no observado que persista en el tiempo para un tomador de decisiones determinado. Esto puede ser un problema si utiliza datos de panel, que representan elecciones repetidas a lo largo del tiempo. Al aplicar un modelo logit estándar a datos de panel, se asume que los factores no observados que afectan la elección de una persona son nuevos cada vez que la persona toma la decisión. Ésa es una suposición muy improbable. Para tener en cuenta tanto la variación aleatoria del gusto como la correlación en factores no observados a lo largo del tiempo, la utilidad del encuestado n para la alternativa i en el momento t se especifica de la siguiente manera:

U_{nit}=\beta _{n}X_{nit}+\varepsilon _{nit}

donde el subíndice t es la dimensión temporal. Todavía hacemos la suposición logit, que es el valor extremo de iid. Eso significa que es independiente del tiempo, de las personas y de las alternativas. es esencialmente solo ruido blanco. Sin embargo, la correlación en el tiempo y en las alternativas surge del efecto común de las , que entran en utilidad en cada período de tiempo y en cada alternativa. $\varepsilon$ $\varepsilon$ $\varepsilon$ $\beta$

Para examinar la correlación explícitamente, supongamos que los β están distribuidos normalmente con media y varianza . Entonces la ecuación de utilidad queda: ${\bar {\beta }}$ $\sigma ^{2}$

U_{nit}=({\bar {\beta }}+\sigma \eta _{n})X_{nit}+\varepsilon _{nit}

y η es una extracción de la densidad normal estándar. Reordenando, la ecuación queda:

U_{nit}={\bar {\beta }}X_{nit}+(\sigma \eta _{n}X_{nit}+\varepsilon _{nit})

U_{nit}={\bar {\beta }}X_{nit}+e_{nit}

donde se recogen los factores no observados . De los factores no observados, es independiente en el tiempo y no es independiente en el tiempo ni en alternativas. $e_{nit}=\sigma \eta _{n}X_{nit}+\varepsilon _{nit}$ $\varepsilon _{nit}$ $\sigma \eta _{n}X_{nit}$

Entonces la covarianza entre alternativas y es, $i$ $j$

{\text{Cov}}(e_{nit},e_{njt})=\sigma ^{2}(X_{nit}X_{njt})

y la covarianza entre el tiempo y es $t$ $q$

{\text{Cov}}(e_{nit},e_{niq})=\sigma ^{2}(X_{nit}X_{niq})

Al especificar las X apropiadamente, se puede obtener cualquier patrón de covarianza en el tiempo y alternativas.

Condicional a , la probabilidad de la secuencia de elecciones de una persona es simplemente el producto de la probabilidad logit de cada elección individual de esa persona: $\beta _{n}$

L_{n}(\beta _{n})=\prod _{t}{\frac {e^{\beta _{n}X_{nit}}}{\sum _{j}e^{\beta _{n}X_{njt}}}}

ya que es independiente en el tiempo. Entonces la probabilidad (incondicional) de la secuencia de elecciones es simplemente la integral de este producto de logits sobre la densidad de . $\varepsilon _{nit}$ $\beta$

P_{ni}=\int L_{n}(\beta )f(\beta |\theta )d\beta

Simulación

Lamentablemente, no existe una forma cerrada para la integral que entra en la probabilidad de elección, por lo que el investigador debe simular P _n . Afortunadamente para el investigador, simular P _n puede resultar muy sencillo. Hay cuatro pasos básicos a seguir.

1. Saque una base de la función de densidad de probabilidad que especificó para los coeficientes de "gusto". Es decir, tome un sorteo y etiquételo para representar el primer sorteo. $f(\beta |\theta )$ $\beta ^{r}$ $r=1$

2. Calcular . (La probabilidad condicional.) $L_{n}(\beta ^{r})$

3. Repita muchas veces, durante . $r=2,...,R$

4. Promediar los resultados

Entonces la fórmula para la simulación se parece a la siguiente,

${\tilde {P}}_{ni}={\frac {\sum _{r}L_{ni}(\beta ^{r})}{R}}$

donde R es el número total de sorteos tomados de la distribución y r es un sorteo.

Una vez hecho esto, tendrá un valor para la probabilidad de cada alternativa i para cada encuestado n.

Ver también

elección discreta

Otras lecturas

Cap. 6 de métodos de elección discreta con simulación, por Kenneth Train ( Cambridge University Press )

Referencias

^ abc Train, K. (2003) Métodos de elección discreta con simulación
^ Hensher, David A. y William H. Greene (2003). "El modelo Logit mixto: el estado de la práctica", Transporte , vol. 30, págs. 133-176, en pág. 135.
^ McFadden, D. y Train, K. (2000). “Modelos MNL mixtos para respuesta discreta”, Journal of Applied Econometrics , vol. 15, núm. 5, págs. 447-470.
^ David Revelt y Train, K (1998). "Logit mixto con opciones repetidas: opciones de los hogares en cuanto al nivel de eficiencia de los electrodomésticos", Review of Economics and Statistics, vol. 80, núm. 4, págs. 647-657
^ ab Train, K (1998). "Modelos de demanda de recreación con variación de gusto", Land Economics, vol. 74, núm. 2, págs. 230-239.