stringtranslate.com

Regresión binaria

En estadística , específicamente en análisis de regresión , una regresión binaria estima una relación entre una o más variables explicativas y una única variable binaria de salida . Generalmente, se modela la probabilidad de las dos alternativas, en lugar de simplemente generar un único valor, como en la regresión lineal .

La regresión binaria suele analizarse como un caso especial de regresión binomial , con un único resultado ( ), y una de las dos alternativas consideradas como "éxito" y codificadas como 1: el valor es el recuento de éxitos en 1 ensayo, ya sea 0 o 1. Los modelos de regresión binaria más comunes son el modelo logit ( regresión logística ) y el modelo probit ( regresión probit ).

Aplicaciones

La regresión binaria se aplica principalmente para la predicción ( clasificación binaria ) o para estimar la asociación entre las variables explicativas y el resultado. En economía, las regresiones binarias se utilizan para modelar la elección binaria .

Interpretaciones

Los modelos de regresión binaria pueden interpretarse como modelos de variable latente , junto con un modelo de medición; o como modelos probabilísticos, modelando directamente la probabilidad.

Modelo de variable latente

La interpretación de la variable latente se ha utilizado tradicionalmente en bioensayos , dando lugar al modelo probit , en el que se supone una varianza normal y un punto de corte. La interpretación de la variable latente también se utiliza en la teoría de respuesta al ítem (TRI).

Formalmente, la interpretación de la variable latente postula que el resultado y está relacionado con un vector de variables explicativas x por

donde y , β es un vector de parámetros y G es una distribución de probabilidad .

Este modelo se puede aplicar en muchos contextos económicos. Por ejemplo, el resultado puede ser la decisión de un gerente de invertir en un programa, es el flujo de efectivo neto descontado esperado y x es un vector de variables que pueden afectar el flujo de efectivo de este programa. Entonces, el gerente invertirá solo cuando espere que el flujo de efectivo neto descontado sea positivo. [1]

A menudo, se supone que el término de error sigue una distribución normal condicionada a las variables explicativas x . Esto genera el modelo probit estándar . [2]

Modelo probabilístico

El modelo probabilístico directo más simple es el modelo logit , que modela las probabilidades logarítmicas como una función lineal de la variable o variables explicativas. El modelo logit es el "más simple" en el sentido de los modelos lineales generalizados (GLIM): las probabilidades logarítmicas son el parámetro natural para la familia exponencial de la distribución de Bernoulli y, por lo tanto, es el más simple de usar para los cálculos.

Otro modelo probabilístico directo es el modelo de probabilidad lineal , que modela la probabilidad misma como una función lineal de las variables explicativas. Un inconveniente del modelo de probabilidad lineal es que, para algunos valores de las variables explicativas, el modelo predecirá probabilidades menores que cero o mayores que uno.

Véase también

Referencias

  1. ^ Para un ejemplo detallado, consulte: Tetsuo Yai, Seiji Iwakura, Shigeru Morichi, Probit multinomial con covarianza estructurada para el comportamiento de elección de ruta, Transportation Research Part B: Methodological, Volumen 31, Número 3, junio de 1997, páginas 195-207, ISSN 0191-2615
  2. ^ Bliss, CI (1934). "El método de probits". Science 79 (2037): 38–39.