Regresión ponderada por unidad

En estadística , la regresión ponderada por unidad es una versión simplificada y robusta ( Wainer y Thissen, 1976) del análisis de regresión múltiple , en la que solo se estima el término de intersección, es decir, se ajusta a un modelo.

{\hat {y}}={\hat {f}}(\mathbf {x} )={\hat {b}}+\sum _{i}x_{i}

donde cada una de las son variables binarias , quizás multiplicadas por un peso arbitrario. $Estilo de visualización x_{i}}$

Comparemos esto con el modelo de regresión múltiple más común, donde cada predictor tiene su propio coeficiente estimado:

{\hat {y}}={\hat {f}}(\mathbf {x} )={\hat {b}}+\sum _{i}{\hat {w}}_{i}x_{i}

En las ciencias sociales , la regresión ponderada por unidad se utiliza a veces para la clasificación binaria , es decir, para predecir una respuesta de tipo sí-no donde "no" indica "sí". Es más fácil de interpretar que la regresión lineal múltiple (conocida como análisis discriminante lineal en el caso de la clasificación). ${\hat {y}}<0$ ${\hat {y}}\geq 0$

Pesos unitarios

La regresión ponderada por unidad es un método de regresión robusta que se lleva a cabo en tres pasos. En primer lugar, se seleccionan los predictores del resultado de interés; idealmente, debe haber buenas razones empíricas o teóricas para la selección. En segundo lugar, los predictores se convierten a una forma estándar. Por último, los predictores se suman y esta suma se denomina variable, que se utiliza como predictor del resultado.

Método de Burgess

El método Burgess fue presentado por primera vez por el sociólogo Ernest W. Burgess en un estudio de 1928 para determinar el éxito o el fracaso de los reclusos en libertad condicional. Primero, seleccionó 21 variables que se creía que estaban asociadas con el éxito en la libertad condicional. A continuación, convirtió cada predictor a la forma estándar de cero o uno (Burgess, 1928). Cuando los predictores tenían dos valores, el valor asociado con el resultado objetivo se codificó como uno. Burgess seleccionó el éxito en la libertad condicional como el resultado objetivo, por lo que un predictor como un historial de robo se codificó como "sí" = 0 y "no" = 1. Luego, estos valores codificados se agregaron para crear una puntuación predictora, de modo que las puntuaciones más altas predijeran una mejor probabilidad de éxito. Las puntuaciones podrían posiblemente variar de cero (ningún predictor de éxito) a 21 (los 21 predictores puntuaron como predictores de éxito).

Para los predictores con más de dos valores, el método de Burgess selecciona un valor de corte basado en un juicio subjetivo. Como ejemplo, un estudio que utilizó el método de Burgess (Gottfredson y Snyder, 2005) seleccionó como predictor el número de quejas por conducta delictiva. Con el fracaso de la libertad condicional como resultado objetivo, el número de quejas se codificó de la siguiente manera: "cero a dos quejas" = 0, y "tres o más quejas" = 1 (Gottfredson y Snyder, 2005, pág. 18).

El método Kerby

El método Kerby es similar al método Burgess, pero difiere en dos aspectos. En primer lugar, mientras que el método Burgess utiliza un juicio subjetivo para seleccionar un puntaje de corte para un predictor multivalor con un resultado binario, el método Kerby utiliza un análisis de árbol de clasificación y regresión ( CART ). De esta manera, la selección del puntaje de corte no se basa en un juicio subjetivo, sino en un criterio estadístico, como el punto donde el valor de chi-cuadrado es máximo.

La segunda diferencia es que mientras que el método de Burgess se aplica a un resultado binario, el método de Kerby se puede aplicar a un resultado multivaluado, porque el análisis CART puede identificar puntuaciones de corte en tales casos, utilizando un criterio como el punto donde el valor t es máximo. Debido a que el análisis CART no solo es binario, sino también recursivo, el resultado puede ser que una variable predictora se divida nuevamente, lo que produce dos puntuaciones de corte. La forma estándar para cada predictor es que se agrega una puntuación de uno cuando el análisis CART crea una partición.

Un estudio (Kerby, 2003) seleccionó como predictores los cinco rasgos de los cinco grandes rasgos de personalidad , prediciendo una medida multivaluada de ideación suicida . A continuación, las puntuaciones de personalidad se convirtieron a la forma estándar con el análisis CART. Cuando el análisis CART arrojó una partición, el resultado fue como el método de Burgess en el sentido de que el predictor se codificó como cero o uno. Pero para la medida del neuroticismo, el resultado fueron dos puntuaciones de corte. Debido a que las puntuaciones de neuroticismo más altas se correlacionaban con más pensamiento suicida, las dos puntuaciones de corte llevaron a la siguiente codificación: "neuroticismo bajo" = 0, "neuroticismo moderado" = 1, "neuroticismo alto" = 2 (Kerby, 2003).

el-método de puntuación

Otro método puede aplicarse cuando los predictores se miden en una escala continua. En tal caso, cada predictor puede convertirse en una puntuación estándar , o puntuación z , de modo que todos los predictores tengan una media de cero y una desviación estándar de uno. Con este método de regresión ponderada por unidad, la variable es una suma de las puntuaciones z (p. ej., Dawes, 1979; Bobko, Roth y Buster, 2007).

Revisión de literatura

Se considera que el primer estudio empírico que utilizó la regresión ponderada por unidad fue un estudio de 1928 realizado por el sociólogo Ernest W. Burgess . Utilizó 21 variables para predecir el éxito o el fracaso de la libertad condicional, y los resultados sugieren que las ponderaciones unitarias son una herramienta útil para tomar decisiones sobre qué reclusos deben ser puestos en libertad condicional. De los reclusos con las mejores puntuaciones, el 98% de hecho logró la libertad condicional; y de los que obtuvieron las peores puntuaciones, solo el 24% logró hacerlo (Burgess, 1928).

Los problemas matemáticos involucrados en la regresión ponderada por unidad fueron discutidos por primera vez en 1938 por Samuel Stanley Wilks , un estadístico líder que tenía un interés especial en el análisis multivariante . Wilks describió cómo los pesos unitarios podrían usarse en entornos prácticos, cuando no se disponía de datos para estimar los pesos beta. Por ejemplo, una universidad pequeña puede querer seleccionar buenos estudiantes para la admisión. Pero la escuela puede no tener dinero para recopilar datos y realizar un análisis de regresión múltiple estándar. En este caso, la escuela podría usar varios predictores: calificaciones de la escuela secundaria, puntajes del SAT, calificaciones de los maestros. Wilks (1938) demostró matemáticamente por qué los pesos unitarios deberían funcionar bien en la práctica.

Frank Schmidt (1971) realizó un estudio de simulación de pesos unitarios. Sus resultados demostraron que Wilks estaba en lo cierto y que los pesos unitarios tienden a tener un buen desempeño en simulaciones de estudios prácticos.

Robyn Dawes (1979) analizó el uso de ponderaciones unitarias en estudios aplicados, haciendo referencia a la robustez y belleza de los modelos ponderados por unidades. Jacob Cohen también analizó el valor de las ponderaciones unitarias y destacó su utilidad práctica. De hecho, escribió: "En la práctica, la mayoría de las veces es mejor utilizar ponderaciones unitarias" (Cohen, 1990, p. 1306).

Dave Kerby (2003) demostró que los pesos unitarios se comparan bien con la regresión estándar, y lo hizo con un estudio de validación cruzada , es decir, derivó pesos beta en una muestra y los aplicó a una segunda muestra. El resultado de interés fue el pensamiento suicida y las variables predictoras fueron rasgos generales de personalidad. En la muestra de validación cruzada, la correlación entre la personalidad y el pensamiento suicida fue ligeramente más fuerte con la regresión ponderada por unidad ( r = .48) que con la regresión múltiple estándar ( r = .47).

Gottfredson y Snyder (2005) compararon el método de Burgess de regresión ponderada por unidad con otros métodos, con una muestra de construcción de N = 1.924 y una muestra de validación cruzada de N = 7.552. Utilizando el método biserial puntual de Pearson, el tamaño del efecto en la muestra de validación cruzada para el modelo de ponderaciones unitarias fue r = .392, que fue algo mayor que para la regresión logística ( r = .368) y el análisis de atributos predictivos ( r = .387), y menor que la regresión múltiple solo en el tercer decimal ( r = .397).

En una revisión de la literatura sobre pesos unitarios, Bobko, Roth y Buster (2007) observaron que "los pesos unitarios y los pesos de regresión funcionan de manera similar en términos de la magnitud de la correlación múltiple validada cruzada, y los estudios empíricos han confirmado este resultado a lo largo de varias décadas" (p. 693).

Andreas Graefe aplicó un enfoque de ponderación igual a nueve modelos de regresión múltiple establecidos para pronosticar las elecciones presidenciales de Estados Unidos . En las diez elecciones de 1976 a 2012, los predictores con ponderación igual redujeron el error de pronóstico de los modelos de regresión originales en un promedio del cuatro por ciento. Un modelo de ponderación igual que incluye todas las variables proporcionó pronósticos calibrados que redujeron el error del modelo de regresión más preciso en un 29 por ciento. ^[1]

Ejemplo

Un ejemplo puede aclarar cómo los pesos unitarios pueden ser útiles en la práctica.

Brenna Bry y sus colegas (1982) abordaron la cuestión de qué causa el consumo de drogas en los adolescentes. En investigaciones anteriores se había utilizado la regresión múltiple; con este método, es natural buscar el mejor predictor, el que tiene el mayor peso beta. Bry y sus colegas observaron que un estudio anterior había descubierto que el consumo temprano de alcohol era el mejor predictor. Otro estudio había descubierto que el mejor predictor era el aislamiento de los padres. Otro estudio había descubierto que las bajas calificaciones en la escuela eran el mejor predictor. La falta de replicación era claramente un problema, un problema que podría ser causado por el rebote de las betas.

Bry y sus colegas propusieron un enfoque diferente: en lugar de buscar el mejor predictor, analizaron el número de predictores. En otras palabras, dieron un peso unitario a cada predictor. Su estudio tenía seis predictores: 1) bajas calificaciones en la escuela, 2) falta de afiliación a una religión, 3) consumo de alcohol a temprana edad, 4) angustia psicológica, 5) baja autoestima y 6) alienación de los padres. Para convertir los predictores a la forma estándar, cada factor de riesgo se puntuó como ausente (puntuado como cero) o presente (puntuado como uno). Por ejemplo, la codificación para las bajas calificaciones en la escuela fue la siguiente: "C o superior" = 0, "D o F" = 1. Los resultados mostraron que el número de factores de riesgo era un buen predictor del consumo de drogas: los adolescentes con más factores de riesgo tenían más probabilidades de consumir drogas.

El modelo utilizado por Bry y sus colegas fue que los consumidores de drogas no difieren en ningún aspecto especial de los no consumidores de drogas. Más bien, difieren en el número de problemas que deben afrontar. "El número de factores a los que un individuo debe enfrentarse es más importante que cuáles son exactamente esos factores" (p. 277). Dado este modelo, la regresión ponderada por unidad es un método de análisis adecuado.

Pesos beta

En la regresión múltiple estándar, cada predictor se multiplica por un número que se denomina peso beta , peso de regresión o coeficientes de regresión ponderados (denominados β _W o BW). ^[2] La predicción se obtiene sumando estos productos junto con una constante. Cuando los pesos se eligen para dar la mejor predicción según algún criterio, el modelo se denomina modelo lineal adecuado . Por lo tanto, la regresión múltiple es un modelo lineal adecuado. Por el contrario, la regresión ponderada por unidad se denomina modelo lineal impropio.

Especificación del modelo

La regresión múltiple estándar se basa en el supuesto de que todos los predictores relevantes del resultado están incluidos en el modelo de regresión. Este supuesto se denomina especificación del modelo. Se dice que un modelo está especificado cuando todos los predictores relevantes están incluidos en el modelo y todos los predictores irrelevantes se excluyen del modelo. En la práctica, es raro que un estudio pueda determinar todos los predictores relevantes a priori. En este caso, los modelos no se especifican y las estimaciones de los pesos beta sufren un sesgo de variable omitida. Es decir, los pesos beta pueden cambiar de una muestra a la siguiente, una situación a veces llamada el problema de los rebotes beta. Es este problema con los rebotes beta lo que hace que la regresión ponderada por unidad sea un método útil.

Véase también

Referencias

^ Graefe, Andreas (2015). "Mejora de los pronósticos utilizando predictores igualmente ponderados" (PDF) . Journal of Business Research . 68 (8). Elsevier: 1792–1799. doi :10.1016/j.jbusres.2015.03.038.
^ Ziglari, Leily (2017). "Interpretación de resultados de regresión múltiple: pesos β y coeficientes de estructura" (PDF) . Revista General Linear Model Journal . 43 (1). GLMJ: 13–22. doi :10.31523/glmj.043002.002.

Bobko, P., Roth, PL y Buster, MA (2007). "La utilidad de los pesos unitarios en la creación de puntuaciones compuestas: una revisión de la literatura, su aplicación a la validez de contenido y un metanálisis". Métodos de investigación organizacional , volumen 10, páginas 689-709. doi :10.1177/1094428106294734
Bry, BH; McKeon, P.; Pandina, RJ (1982). "Grado de consumo de drogas en función del número de factores de riesgo". Journal of Abnormal Psychology . 91 (4): 273–279. doi :10.1037/0021-843X.91.4.273. PMID 7130523.
Burgess, EW (1928). "Factores que determinan el éxito o el fracaso de la libertad condicional". En AA Bruce (Ed.), The Workings of the Indeterminate Sentence Law and Parole in Illinois (págs. 205-249). Springfield, Illinois: Illinois State Parole Board. Google books
Cohen, Jacob. (1990). "Cosas que he aprendido (hasta ahora)". American Psychologist , volumen 45, páginas 1304-1312. doi :10.1037/0003-066X.45.12.1304
Dawes, Robyn M. (1979). "La robusta belleza de los modelos lineales inadecuados en la toma de decisiones". American Psychologist , volumen 34, páginas 571-582. doi :10.1037/0003-066X.34.7.571. pdf archivado
Gottfredson, DM y Snyder, HN (julio de 2005). Las matemáticas de la clasificación de riesgos: transformación de los datos en instrumentos válidos para los tribunales de menores . Pittsburgh, Penn.: Centro Nacional de Justicia Juvenil. NCJ 209158. Eric.ed.gov pdf
Kerby, Dave S. (2003). "Análisis CART con regresión ponderada por unidad para predecir la ideación suicida a partir de los cinco rasgos principales". Personality and Individual Differences , volumen 35, páginas 249-261. doi :10.1016/S0191-8869(02)00174-5
Schmidt, Frank L. (1971). "La eficiencia relativa de la regresión y los pesos predictores unitarios simples en la psicología diferencial aplicada". Educational and Psychological Measurement , volumen 31, páginas 699-714. doi :10.1177/001316447103100310
Wainer, H. y Thissen, D. (1976). Tres pasos hacia una regresión robusta. Psychometrika , volumen 41(1), páginas 9–34. doi :10.1007/BF02291695
Wilks, SS (1938). "Sistemas de ponderación para funciones lineales de variables correlacionadas cuando no hay variable dependiente". Psychometrika . 3 : 23–40. doi :10.1007/BF02287917.

Lectura adicional

Dana, J., y Dawes, RM (2004). "La superioridad de alternativas simples a la regresión para predicciones en ciencias sociales". Journal of Educational and Behavioral Statistics , volumen 29(3), páginas 317-331. doi :10.3102/10769986029003317
Dawes, RM y Corrigan, B. (1974). Modelos lineales en la toma de decisiones. Psychological Bulletin , volumen 81, páginas 95-106. doi :10.1037/h0037613
Einhorn, HJ y Hogarth, RM (1975). Esquemas de ponderación unitaria para la toma de decisiones. Comportamiento organizacional y desempeño humano , volumen 13(2), páginas 171-192. doi :10.1016/0030-5073(75)90044-6
Hakeem, M. (1948). La validez del método de Burgess para la predicción de la palabra. American Journal of Sociology , volumen 53(5), páginas 376-386. JSTOR
Newman, JR, Seaver, D., Edwards, W. (1976). Esquemas de ponderación unitaria versus diferencial para la toma de decisiones: un método de estudio y algunos resultados preliminares. Los Ángeles, CA: Social Science Research Institute. PDF archivado
Raju, NS, Bilgic, R., Edwards, JE, Fleer, PF (1997). Revisión metodológica: Estimación de la validez poblacional y la validez cruzada, y el uso de pesos iguales en la predicción. Applied Psychological Measurement , volumen 21(4), páginas 291-305. doi :10.1177/01466216970214001
Ree, MJ, Carretta, TR y Earles, JA (1998). "En las decisiones de arriba hacia abajo, la ponderación de las variables no importa: una consecuencia del teorema de Wilk". Métodos de investigación organizacional , volumen 1(4), páginas 407-420. doi :10.1177/109442819814003
Wainer, Howard (1976). "Estimación de coeficientes en modelos lineales: no importa" (PDF) . Psychological Bulletin . 83 (2): 213. doi :10.1037/0033-2909.83.2.213.PDF archivado
Wainer, H. (1978). Sobre la sensibilidad de la regresión y los regresores. Psychological Bulletin , volumen 85(2), páginas 267-273. doi :10.1037/0033-2909.85.2.267

Enlaces externos

Blog de Chis Stucchio: Por qué una lista de pros y contras es un 75 % tan buena como su sofisticado algoritmo de aprendizaje automático