stringtranslate.com

Logit

Gráfica de logit( x ) en el dominio de 0 a 1, donde la base del logaritmo es e .

En estadística , la función logit ( / ˈl ɪ t / LOH -jit ) es la función cuantil asociada con la distribución logística estándar . Tiene muchos usos en análisis de datos y aprendizaje automático, especialmente en transformaciones de datos .

Matemáticamente, el logit es la inversa de la función logística estándar , por lo que el logit se define como

Debido a esto, el logit también se llama log-odds ya que es igual al logaritmo de las odds donde p es una probabilidad. Por lo tanto, el logit es un tipo de función que asigna valores de probabilidad a números reales en [1] , similar a la función probit .

Definición

Si p es una probabilidad , entonces p /(1 − p ) son las probabilidades correspondientes ; el logit de la probabilidad es el logaritmo de las probabilidades, es decir:

La base de la función logarítmica utilizada tiene poca importancia en el presente artículo, siempre que sea mayor que 1, pero el logaritmo natural con base e es el más utilizado. La elección de la base corresponde a la elección de la unidad logarítmica del valor: la base 2 corresponde a un shannon , la base  e a un “ nat ”, y la base 10 a un hartley ; Estas unidades se utilizan particularmente en interpretaciones de la teoría de la información. Para cada elección de base, la función logit toma valores entre el infinito negativo y el positivo.

La función “logística” de cualquier número viene dada por el logit inverso :

La diferencia entre los logit s de dos probabilidades es el logaritmo de la razón de probabilidades ( R ), proporcionando así una forma abreviada de escribir la combinación correcta de razones de probabilidad solo sumando y restando :

Historia

Se han explorado varios enfoques para adaptar los métodos de regresión lineal a un dominio donde el resultado es un valor de probabilidad , en lugar de cualquier número real . En muchos casos, dichos esfuerzos se han centrado en modelar este problema mapeando el rango y luego ejecutando la regresión lineal sobre estos valores transformados. [2]

En 1934, Chester Ittner Bliss utilizó la función de distribución normal acumulativa para realizar este mapeo y llamó a su modelo probit , una abreviatura de " unidad de probabilidad ". Sin embargo, esto es computacionalmente más costoso. [2]

En 1944, Joseph Berkson utilizó el registro de probabilidades y llamó a esta función logit , una abreviatura de " unidad logística " , siguiendo la analogía de probit:

"Utilizo este término [logit] para seguir a Bliss, quien llamó 'probit' a la función análoga que es lineal para la curva normal".

—Joseph  Berkson (1944) [3]

Charles Sanders Peirce (finales del siglo XIX) utilizó ampliamente las probabilidades logarítmicas . [4] GA Barnard en 1949 acuñó el término comúnmente utilizado log-odds ; [5] [6] el log-odds de un evento es el logit de la probabilidad del evento. [7] Barnard también acuñó el término lods como una forma abstracta de "log-odds", [8] pero sugirió que "en la práctica, el término 'odds' normalmente debería usarse, ya que es más familiar en la vida cotidiana". [9]

Usos y propiedades

Comparación con probit

Comparación de la función logit con un probit escalado (es decir, la CDF inversa de la distribución normal ), comparando vs. , lo que hace que las pendientes sean las mismas en el origen y .

Estrechamente relacionados con la función logit (y el modelo logit ) están la función probit y el modelo probit . Tanto el logit como el probit son funciones sigmoideas con un dominio entre 0 y 1, lo que las convierte en funciones cuantiles , es decir, inversas de la función de distribución acumulativa (CDF) de una distribución de probabilidad . De hecho, el logit es la función cuantil de la distribución logística , mientras que el probit es la función cuantil de la distribución normal . La función probit se denota , donde es la CDF de la distribución normal estándar, como se acaba de mencionar:

Como se muestra en el gráfico de la derecha, las funciones logit y probit son extremadamente similares cuando se escala la función probit , de modo que su pendiente en y = 0 coincide con la pendiente del logit . Como resultado, a veces se utilizan modelos probit en lugar de modelos logit porque para ciertas aplicaciones (por ejemplo, en la teoría de respuesta al ítem ) la implementación es más fácil. [14]

Ver también

Referencias

  1. ^ "Logit/Probit" (PDF) .
  2. ^ ab Cramer, JS (2003). "Los orígenes y desarrollo del modelo logit" (PDF) . Cambridge UP.
  3. ^ Berkson 1944, pag. 361, nota al pie 2.
  4. ^ Stigler, Stephen M. (1986). La historia de la estadística : la medición de la incertidumbre antes de 1900 . Cambridge, Massachusetts: Belknap Press de Harvard University Press. ISBN 978-0-674-40340-6.
  5. ^ Hilbe, Joseph M. (2009), Modelos de regresión logística, CRC Press, p. 3, ISBN 9781420075779.
  6. ^ Barnard 1949, pag. 120.
  7. ^ Cramer, JS (2003), Modelos logit de economía y otros campos, Cambridge University Press, pág. 13, ISBN 9781139438193.
  8. ^ Barnard 1949, pag. 120.128.
  9. ^ Barnard 1949, pag. 136.
  10. ^ "R: función logit inversa". Archivado desde el original el 6 de julio de 2011 . Consultado el 18 de febrero de 2011 .
  11. ^ Thrun, Sebastián (2003). "Aprendizaje de mapas de cuadrícula de ocupación con modelos de sensores delanteros". Robots Autónomos . 15 (2): 111-127. doi :10.1023/A:1025584807625. ISSN  0929-5593. S2CID  2279013.
  12. ^ Styler, Alex (2012). «Técnicas Estadísticas en Robótica» (PDF) . pag. 2 . Consultado el 26 de enero de 2017 .
  13. ^ Dickmann, J.; Appenrodt, N.; Klappstein, J.; Bloecher, HL; Muntzinger, M.; Marinero, A.; Hahn, M.; Brenk, C. (1 de enero de 2015). "Hacer que Bertha vea aún más: contribución del radar". Acceso IEEE . 3 : 1233-1247. doi : 10.1109/ACCESS.2015.2454533 . ISSN  2169-3536.
  14. ^ Alberto, James H. (2016). "Logit, Probit y otras funciones de respuesta". Manual de teoría de respuesta al ítem . vol. Dos. Chapman y Hall. págs. 3–22. doi :10.1201/b19166-1.

enlaces externos

Otras lecturas