stringtranslate.com

Especificación del modelo estadístico

En estadística , la especificación del modelo es parte del proceso de construcción de un modelo estadístico : la especificación consiste en seleccionar una forma funcional apropiada para el modelo y elegir qué variables incluir. Por ejemplo, dados los ingresos personales junto con los años de escolaridad y experiencia laboral , podríamos especificar una relación funcional de la siguiente manera: [1]

donde es el término de error inexplicado que se supone que comprende variables gaussianas independientes e idénticamente distribuidas .

El estadístico Sir David Cox ha dicho: "La forma en que se realiza la traducción del problema en cuestión al modelo estadístico es a menudo la parte más crítica de un análisis". [2]

Error y sesgo de especificación

El error de especificación se produce cuando la forma funcional o la elección de las variables independientes no representan adecuadamente los aspectos relevantes del verdadero proceso de generación de datos. En particular, el sesgo (el valor esperado de la diferencia entre un parámetro estimado y el valor subyacente real) se produce si una variable independiente está correlacionada con los errores inherentes al proceso subyacente. Existen varias causas posibles de error de especificación; algunas de ellas se enumeran a continuación.

Además, los errores de medición pueden afectar a las variables independientes: si bien esto no es un error de especificación, puede crear un sesgo estadístico.

Tenga en cuenta que todos los modelos tendrán algún error de especificación. De hecho, en estadística existe un aforismo común que dice que " todos los modelos son erróneos ". En palabras de Burnham y Anderson,

"El modelado es un arte y una ciencia y tiene como objetivo encontrar un buen modelo de aproximación... como base para la inferencia estadística". [4]

Detección de especificaciones incorrectas

La prueba RESET de Ramsey puede ayudar a detectar errores de especificación en el análisis de regresión .

En el ejemplo anterior, que relaciona el ingreso personal con la educación y la experiencia laboral, si los supuestos del modelo son correctos, las estimaciones de mínimos cuadrados de los parámetros y serán eficientes e imparciales . Por lo tanto, los diagnósticos de especificación generalmente implican la prueba del primer al cuarto momento de los residuos . [5]

Construcción de modelos

La creación de un modelo implica encontrar un conjunto de relaciones que representen el proceso que genera los datos. Para ello es necesario evitar todas las fuentes de especificación errónea mencionadas anteriormente.

Un enfoque consiste en empezar con un modelo en forma general que se base en una comprensión teórica del proceso de generación de datos. Luego, el modelo se puede ajustar a los datos y comprobar las diversas fuentes de especificación incorrecta, en una tarea llamada validación del modelo estadístico . La comprensión teórica puede guiar entonces la modificación del modelo de tal manera que se conserve la validez teórica y se eliminen las fuentes de especificación incorrecta. Pero si resulta imposible encontrar una especificación teóricamente aceptable que se ajuste a los datos, es posible que haya que rechazar el modelo teórico y reemplazarlo por otro.

En este caso, resulta muy apropiada una cita de Karl Popper : "Siempre que una teoría te parezca la única posible, tómatelo como una señal de que no has comprendido ni la teoría ni el problema que se pretendía resolver". [6]

Otro enfoque para la construcción de modelos es especificar varios modelos diferentes como candidatos y luego comparar esos modelos candidatos entre sí. El propósito de la comparación es determinar qué modelo candidato es el más apropiado para la inferencia estadística. Los criterios comunes para comparar modelos incluyen los siguientes: R 2 , el factor de Bayes y la prueba de razón de verosimilitud junto con su generalización de verosimilitud relativa . Para obtener más información sobre este tema, consulte selección de modelos estadísticos .

Véase también

Notas

  1. ^ Este ejemplo en particular se conoce como función de ganancias de Mincer .
  2. ^ Cox, DR (2006), Principios de inferencia estadística , Cambridge University Press , pág. 197.
  3. ^ "Métodos cuantitativos II: Econometría", College of William & Mary .
  4. ^ Burnham, KP; Anderson, DR (2002), Selección de modelos e inferencia multimodelo: un enfoque práctico basado en la teoría de la información (2.ª ed.), Springer-Verlag , §1.1.
  5. ^ Long, J. Scott ; Trivedi, Pravin K. (1993). "Algunas pruebas de especificación para el modelo de regresión lineal". En Bollen, Kenneth A. ; Long, J. Scott (eds.). Pruebas de modelos de ecuaciones estructurales . SAGE Publishing . págs. 66–110.
  6. ^ Popper, Karl (1972), Conocimiento objetivo: un enfoque evolutivo , Oxford University Press.

Lectura adicional