stringtranslate.com

Estimador de puntuación máxima

En estadística y econometría , el estimador de puntuación máxima es un estimador no paramétrico para modelos de elección discreta desarrollado por Charles Manski en 1975. A diferencia de los estimadores probit multinomial y logit multinomial , no hace suposiciones sobre la distribución de la parte no observable de la utilidad . Sin embargo, sus propiedades estadísticas (particularmente su distribución asintótica ) son más complicadas que los modelos multinomiales probit y logit, lo que dificulta la inferencia estadística . Para abordar estos problemas, Joel Horowitz propuso una variante, llamada estimador de puntuación máxima suavizado.

Configuración

Al modelar problemas de elección discreta , se supone que la elección está determinada por la comparación de la utilidad latente subyacente. [1] Denotemos la población de agentes como T y la elección común establecida para cada agente como C. Para el agente , indique su elección como , que es igual a 1 si se elige la opción i y 0 en caso contrario. Supongamos que la utilidad latente es lineal en las variables explicativas y hay un error de respuesta aditivo . Entonces para un agente ,

y

donde y son las covariables q -dimensionales observables sobre el agente y la elección, y y son los factores que intervienen en la decisión del agente y que no son observados por el econometrista. La construcción de las covariables observables es muy general. Por ejemplo, si C es un conjunto de diferentes marcas de café, entonces incluye las características tanto del agente t , como edad, género, ingresos y origen étnico, como del café i , como precio, sabor y si es local. o importado. Todos los términos de error se suponen iid y necesitamos estimar cuál caracteriza el efecto de diferentes factores en la elección del agente.

Estimadores paramétricos

Generalmente se impone algún supuesto de distribución específico sobre el término de error, de modo que el parámetro se estima paramétricamente . Por ejemplo, si se supone que la distribución del término de error es normal, entonces el modelo es simplemente un modelo probit multinomial ; [2] si se supone que es una distribución de Gumbel , entonces el modelo se convierte en un modelo logit multinomial . El modelo paramétrico [3] es conveniente para el cálculo, pero puede no ser consistente una vez que se especifica mal la distribución del término de error. [4]

respuesta binaria

Por ejemplo, supongamos que C sólo contiene dos elementos. Esta es la representación de utilidad latente [5] de un modelo de elección binaria . En este modelo, la elección es: , donde son dos vectores de las covariables explicativas y son los errores de respuesta iid,

son la utilidad latente de elegir las opciones 1 y 2. Entonces, la función logarítmica de verosimilitud se puede dar como:

Si se impone algún supuesto distributivo sobre el error de respuesta, entonces la función logarítmica de verosimilitud tendrá una representación de forma cerrada. [2] Por ejemplo, si se supone que el error de respuesta se distribuye como: , entonces la función de probabilidad se puede reescribir como:

¿Dónde está la función de distribución acumulativa (CDF) para la distribución normal estándar ? Aquí, incluso si no tiene una representación de forma cerrada, su derivada sí la tiene. Este es el modelo probit .

Este modelo se basa en un supuesto distributivo sobre el término de error de respuesta. Agregar un supuesto de distribución específico al modelo puede hacer que el modelo sea computacionalmente manejable debido a la existencia de una representación de forma cerrada. Pero si se especifica mal la distribución del término de error, las estimaciones basadas en el supuesto de distribución serán inconsistentes.

La idea básica del modelo sin distribución es reemplazar los dos términos de probabilidad en la función de probabilidad logarítmica con otras ponderaciones. La forma general de la función de probabilidad logarítmica se puede escribir como:

Estimador de puntuación máxima

Para hacer que el estimador sea más robusto al supuesto distribucional, Manski (1975) propuso un modelo no paramétrico para estimar los parámetros. En este modelo, denotamos el número de elementos del conjunto de elección como J , el número total de agentes como N , y es una secuencia de números reales. El Estimador de puntuación máxima [6] se define como:

Aquí está la clasificación de la parte de certeza de la utilidad subyacente de elegir i . La intuición en este modelo es que cuando la clasificación sea más alta, se asignará más peso a la elección.

Bajo ciertas condiciones, el estimador de puntuación máxima puede ser débilmente consistente , pero sus propiedades asintóticas son muy complicadas. [7] Este problema proviene principalmente de la falta de suavidad de la función objetivo.

Ejemplo binario

En el contexto binario, el estimador de puntuación máxima se puede representar como:

dónde

y y son dos constantes en (0,1). La intuición de este esquema de ponderación es que la probabilidad de la elección depende del orden relativo de la parte de certeza de la utilidad.

Estimador de puntuación máxima suavizado

Horowitz (1992) propuso un estimador de puntuación máxima suavizado (SMS) que tiene propiedades asintóticas mucho mejores. [8] La idea básica es reemplazar la función de peso no suavizada por una suavizada. Defina una función kernel suave K que satisfaga las siguientes condiciones:

  1. está acotado sobre los números reales
  2. y

Aquí, la función del núcleo es análoga a una CDF cuya PDF es simétrica alrededor de 0. Entonces, el estimador SMS se define como:

donde es una secuencia de números estrictamente positivos y . Aquí, la intuición es la misma que en la construcción del estimador de puntuación máxima tradicional: es más probable que el agente elija la opción que tenga la mayor parte observada de utilidad latente. Bajo ciertas condiciones, el estimador de puntuación máxima suavizado es consistente y, lo que es más importante, tiene una distribución normal asintótica. Por lo tanto, se pueden implementar todas las pruebas e inferencias estadísticas habituales basadas en la normalidad asintótica. [9]

Referencias

  1. ^ Para obtener más ejemplos, consulte: Smith, Michael D. y Brynjolfsson, Erik, Consumer Decision-Making at an Internet Shopbot (octubre de 2001). Documento de trabajo n.º 4206-01 de la MIT Sloan School of Management.
  2. ^ ab Wooldridge, J. (2002). Análisis econométrico de datos de sección transversal y de panel . Cambridge, Masa: MIT Press. págs. 457–460. ISBN 978-0-262-23219-7.
  3. ^ Para ver un ejemplo concreto, consulte: Tetsuo Yai, Seiji Iwakura, Shigeru Morichi, Probit multinomial con covarianza estructurada para el comportamiento de elección de ruta, Investigación en transporte, Parte B: Metodológica, Volumen 31, Número 3, junio de 1997, páginas 195-207, ISSN 0191-2615
  4. ^ Jin Yan (2012), "Un estimador de puntuación máxima suavizado para modelos de elección discreta multinomial", documento de trabajo.
  5. ^ Caminante, Juana; Ben-Akiva, Moshe (2002). "Modelo de utilidad aleatorio generalizado". Ciencias Sociales Matemáticas . 43 (3): 303–343. doi :10.1016/S0165-4896(02)00023-9.
  6. ^ Manski, Charles F. (1975). "Estimación de la puntuación máxima del modelo de utilidad estocástico de elección". Revista de Econometría . 3 (3): 205–228. CiteSeerX 10.1.1.587.6474 . doi :10.1016/0304-4076(75)90032-9. 
  7. ^ Kim, Jeankyung; Pollard, David (1990). "Asintóticas de raíz cúbica". Anales de Estadística . 18 (1): 191–219. doi : 10.1214/aos/1176347498 . JSTOR  2241541.
  8. ^ Horowitz, Joel L. (1992). "Un estimador de puntuación máxima suavizado para el modelo de respuesta binaria". Econométrica . 60 (3): 505–531. doi :10.2307/2951582. JSTOR  2951582.
  9. ^ Para ver un estudio de encuesta, consulte: Jin Yan (2012), "Un estimador de puntuación máxima suavizado para modelos de elección discreta multinomial", documento de trabajo.

Otras lecturas