Arrepentimiento (teoría de la decisión)

En la teoría de la decisión , al tomar decisiones en condiciones de incertidumbre (si la información sobre el mejor curso de acción llega después de tomar una decisión fija), a menudo se experimenta la respuesta emocional humana de arrepentimiento , y puede medirse como el valor de la diferencia entre una decisión tomada y la decisión óptima.

La teoría de la aversión al arrepentimiento o arrepentimiento anticipado propone que, cuando se enfrentan a una decisión, las personas pueden anticipar el arrepentimiento y, por lo tanto, incorporar en su elección su deseo de eliminar o reducir esta posibilidad. El arrepentimiento es una emoción negativa con un poderoso componente social y reputacional , y es fundamental para el aprendizaje de los seres humanos a partir de la experiencia y para la psicología humana de la aversión al riesgo . La anticipación consciente del arrepentimiento crea un ciclo de retroalimentación que trasciende el arrepentimiento del ámbito emocional (a menudo modelado como un mero comportamiento humano ) al ámbito del comportamiento de elección racional que se modela en la teoría de la decisión.

Descripción

La teoría del arrepentimiento es un modelo de economía teórica desarrollado simultáneamente en 1982 por Graham Loomes y Robert Sugden , ^[1] David E. Bell, ^[2] y Peter C. Fishburn . ^[3] La teoría del arrepentimiento modela la elección en condiciones de incertidumbre teniendo en cuenta el efecto del arrepentimiento anticipado. Posteriormente, varios otros autores la mejoraron. ^[4]

Incorpora un término de arrepentimiento en la función de utilidad que depende negativamente del resultado obtenido y positivamente del mejor resultado alternativo dada la resolución de la incertidumbre. Este término de arrepentimiento suele ser una función creciente, continua y no negativa que se resta al índice de utilidad tradicional. Este tipo de preferencias siempre viola la transitividad en el sentido tradicional ^[5] , aunque la mayoría satisface una versión más débil. ^[4]

En el caso de loterías independientes y cuando el arrepentimiento se evalúa sobre la diferencia entre utilidades y luego se promedia sobre todas las combinaciones de resultados, el arrepentimiento todavía puede ser transitivo, pero solo para una forma específica de función del arrepentimiento. Se muestra que solo la función seno hiperbólica mantendrá esta propiedad. ^[6] Esta forma de arrepentimiento hereda la mayoría de las características deseadas, como mantener preferencias correctas frente al dominio estocástico de primer orden , aversión al riesgo para utilidades logarítmicas y la capacidad de explicar la paradoja de Allais .

La aversión al arrepentimiento no es sólo un modelo económico teórico, sino un sesgo cognitivo que se produce cuando se ha tomado la decisión de abstenerse de arrepentirse de una decisión alternativa. Para empezar, la aversión al arrepentimiento puede verse como un miedo por acción u omisión; la perspectiva de comprometerse con un fracaso u omitir una oportunidad que buscamos evitar. ^[7] El arrepentimiento, sentir tristeza o decepción por algo que ha sucedido, puede racionalizarse para una determinada decisión, pero puede guiar las preferencias y puede llevar a las personas por mal camino. Esto contribuye a la propagación de la desinformación porque las cosas no se ven como una responsabilidad personal.

Evidencia

Varios experimentos sobre elecciones tanto incentivadas como hipotéticas dan fe de la magnitud de este efecto.

Los experimentos en subastas de primer precio muestran que al manipular la retroalimentación que los participantes esperan recibir, se observan diferencias significativas en las ofertas promedio. ^[8] En particular, el "arrepentimiento del perdedor" puede inducirse revelando la oferta ganadora a todos los participantes en la subasta, y revelando así a los perdedores si habrían podido obtener una ganancia y cuánto podría haber sido (un participante que tiene una valoración de $50, ofrece $30 y descubre que la oferta ganadora fue $35 también aprenderá que podría haber ganado hasta $15 ofertando cualquier valor superior a $35). Esto a su vez permite la posibilidad de arrepentimiento y si los postores anticipan esto correctamente, tenderán a ofertar más alto que en el caso en el que no se proporciona retroalimentación sobre la oferta ganadora para disminuir la posibilidad de arrepentimiento.

En las decisiones sobre loterías, los experimentos también proporcionan evidencia de respaldo de arrepentimiento anticipado. ^[9]^[10]^[11] Como en el caso de las subastas de primer precio, las diferencias en la retroalimentación sobre la resolución de la incertidumbre pueden causar la posibilidad de arrepentimiento y si esto se anticipa, puede inducir diferentes preferencias. Por ejemplo, cuando se enfrenta una elección entre $40 con certeza y un lanzamiento de moneda que paga $100 si el resultado se adivina correctamente y $0 en caso contrario, no solo la alternativa de pago segura minimiza el riesgo sino también la posibilidad de arrepentimiento, ya que típicamente la moneda no se lanzará (y por lo tanto la incertidumbre no se resolverá) mientras que si se elige el lanzamiento de moneda, el resultado que paga $0 inducirá arrepentimiento. Si la moneda se lanza independientemente de la alternativa elegida, entonces el pago alternativo siempre será conocido y entonces no hay ninguna elección que elimine la posibilidad de arrepentimiento.

Arrepentimiento anticipado versus arrepentimiento experimentado

El arrepentimiento anticipado tiende a sobreestimarse tanto en el caso de las elecciones como de las acciones de las que las personas se perciben responsables. ^[12]^[13] Las personas son particularmente propensas a sobrestimar el arrepentimiento que sentirán cuando no alcancen un resultado deseado por un margen estrecho. En un estudio, los pasajeros predijeron que sentirían un mayor arrepentimiento si perdieran un tren por un minuto más que si lo perdieran por cinco minutos, por ejemplo, pero los pasajeros que realmente perdieron su tren por uno o cinco minutos experimentaron cantidades (iguales y) menores de arrepentimiento. Los pasajeros parecían sobreestimar el arrepentimiento que sentirían si perdieran el tren por un margen estrecho, porque tendían a subestimar el grado en que atribuirían la pérdida del tren a causas externas (por ejemplo, perder su billetera o pasar menos tiempo en la ducha). ^[12]

Aplicaciones

Además de la configuración tradicional de las elecciones sobre loterías, se ha propuesto la aversión al arrepentimiento como una explicación para la sobreoferta típicamente observada en las subastas de primer precio, ^[14] y el efecto de disposición , ^[15] entre otros.

Minimax arrepentido

El enfoque del arrepentimiento minimax , que fue presentado originalmente por Leonard Savage en 1951, tiene como objetivo minimizar el arrepentimiento en el peor de los casos. ^[16] El objetivo es lograr un desempeño lo más cercano posible al curso óptimo. Dado que el criterio minimax aplicado aquí se refiere al arrepentimiento (diferencia o proporción de los pagos) en lugar de al pago en sí, no es tan pesimista como el enfoque minimax ordinario. Se han utilizado enfoques similares en diversas áreas, como:

Una ventaja del arrepentimiento minimax (a diferencia del arrepentimiento esperado) es que es independiente de las probabilidades de los distintos resultados: por lo tanto, si el arrepentimiento se puede calcular con precisión, se puede utilizar de manera confiable el arrepentimiento minimax. Sin embargo, las probabilidades de los resultados son difíciles de estimar.

Esto se diferencia del enfoque minimax estándar en que utiliza diferencias o proporciones entre resultados y, por lo tanto, requiere mediciones de intervalo o proporción, así como mediciones ordinales (clasificación), como en el minimax estándar.

Ejemplo

Supongamos que un inversor tiene que elegir entre invertir en acciones, bonos o en el mercado monetario, y que el rendimiento total depende de lo que ocurra con los tipos de interés. La siguiente tabla muestra algunos rendimientos posibles:

La opción máxima basada en la rentabilidad sería invertir en el mercado monetario, lo que garantizaría una rentabilidad de al menos 1. Sin embargo, si los tipos de interés cayeran, el arrepentimiento asociado a esta elección sería grande. Sería 11, que es la diferencia entre los 12 que se podrían haber recibido si se hubiera conocido el resultado de antemano y el 1 recibido. Una cartera mixta de alrededor del 11,1% en acciones y el 88,9% en el mercado monetario habría asegurado una rentabilidad de al menos 2,22; pero, si los tipos de interés cayeran, habría un arrepentimiento de alrededor de 9,78.

La tabla de arrepentimiento para este ejemplo, construida restando los rendimientos reales de los mejores rendimientos, es la siguiente:

Por lo tanto, utilizando una elección minimax basada en el arrepentimiento, el mejor camino sería invertir en bonos, asegurando un arrepentimiento no peor que 5. Una cartera de inversión mixta obtendría un mejor resultado aún: 61,1% invertido en acciones y 38,9% en el mercado monetario produciría un arrepentimiento no peor que aproximadamente 4,28.

Ejemplo: Configuración de estimación lineal

Lo que sigue es una ilustración de cómo el concepto de arrepentimiento puede usarse para diseñar un estimador lineal . En este ejemplo, el problema es construir un estimador lineal de un vector de parámetros de dimensión finita a partir de su medición lineal ruidosa con estructura de covarianza de ruido conocida. La pérdida de reconstrucción de se mide utilizando el error cuadrático medio (MSE). Se sabe que el vector de parámetros desconocido se encuentra en un elipsoide centrado en cero. El arrepentimiento se define como la diferencia entre el MSE del estimador lineal que no conoce el parámetro y el MSE del estimador lineal que conoce . Además, dado que el estimador está restringido a ser lineal, el MSE cero no se puede lograr en el último caso. En este caso, la solución de un problema de optimización convexa da el estimador lineal óptimo, minimax que minimiza el arrepentimiento, que se puede ver mediante el siguiente argumento. ${\estilo de visualización x}$ ${\estilo de visualización x}$ ${\estilo de visualización E}$ ${\estilo de visualización x}$ ${\estilo de visualización x}$

Según los supuestos, el vector observado y el vector de parámetros deterministas desconocidos están vinculados por el modelo lineal. ${\estilo de visualización y}$ ${\estilo de visualización x}$

y=Hx+w

donde es una matriz conocida con rango de columna completo , y es un vector aleatorio de media cero con una matriz de covarianza conocida . ${\estilo de visualización H}$ $n\veces m$ ${\estilo de visualización m}$ ${\estilo de visualización w}$ $Estilo de visualización C_{w}}$

Dejar

{\hat {x}}=Gy

sea una estimación lineal de a partir de , donde es una matriz. El MSE de este estimador está dado por ${\estilo de visualización x}$ ${\estilo de visualización y}$ ${\estilo de visualización G}$ $m\veces n$

MSE=E\left(||{\hat {x}}-x||^{2}\right)=Tr(GC_{w}G^{*})+x^{*}(I-GH)^{*}(I-GH)x.

Dado que el MSE depende explícitamente de , no se puede minimizar directamente. En cambio, se puede utilizar el concepto de arrepentimiento para definir un estimador lineal con un buen rendimiento de MSE. Para definir el arrepentimiento aquí, considere un estimador lineal que conoce el valor del parámetro , es decir, la matriz puede depender explícitamente de : ${\estilo de visualización x}$ ${\estilo de visualización x}$ ${\estilo de visualización G}$ ${\estilo de visualización x}$

{\hat {x}}^{o}=G(x)y.

El MSE de es ${\hat {x}}^{o}$

MSE^{o}=E\left(||{\hat {x}}^{o}-x||^{2}\right)=Tr(G(x)C_{w}G(x)^{*})+x^{*}(IG(x)H)^{*}(IG(x)H)x.

Para encontrar el óptimo , se diferencia con respecto a y la derivada se iguala a 0 obteniendo ${\estilo de visualización G(x)}$ $MSE^{o}$ ${\estilo de visualización G}$

G(x)=xx^{*}H^{*}(C_{w}+Hxx^{*}H^{*})^{-1}.

Luego, utilizando el lema de inversión de matrices

G(x)={\frac {1}{1+x^{*}H^{*}C_{w}^{-1}Hx}}xx^{*}H^{*}C_{w}^{-1}.

Sustituyendo esto nuevamente en , se obtiene $G(x)$ $MSE^{o}$

MSE^{o}={\frac {x^{*}x}{1+x^{*}H^{*}C_{w}^{-1}Hx}}.

Este es el MSE más pequeño que se puede lograr con una estimación lineal que conoce . En la práctica, este MSE no se puede lograr, pero sirve como límite para el MSE óptimo. El arrepentimiento de usar el estimador lineal especificado por es igual a $x$ $G$

R(x,G)=MSE-MSE^{o}=Tr(GC_{w}G^{*})+x^{*}(I-GH)^{*}(I-GH)x-{\frac {x^{*}x}{1+x^{*}H^{*}C_{w}^{-1}Hx}}.

El enfoque de arrepentimiento minimax aquí es minimizar el arrepentimiento del peor caso, es decir, Esto permitirá un rendimiento lo más cercano posible al mejor rendimiento alcanzable en el peor caso del parámetro . Aunque este problema parece difícil, es un ejemplo de optimización convexa y, en particular, se puede calcular de manera eficiente una solución numérica. ^[17] Se pueden usar ideas similares cuando es aleatorio con incertidumbre en la matriz de covarianza . ^[18]^[19] $\sup _{x\in E}R(x,G).$ $x$ $x$

El arrepentimiento en los problemas entre principal y agente

Camara, Hartline y Johnsen ^[20] estudian los problemas de principal-agente . Se trata de juegos de información incompleta entre dos jugadores llamados Principal y Agente , cuyos pagos dependen de un estado de naturaleza conocido solo por el Agente. El Principal se compromete con una política, luego el agente responde y luego se revela el estado de naturaleza. Suponen que el principal y el agente interactúan repetidamente y pueden aprender con el tiempo del historial de estados, utilizando el aprendizaje de refuerzo . Suponen que el agente está impulsado por la aversión al arrepentimiento. En particular, el agente minimiza su arrepentimiento interno contrafactual . Basándose en este supuesto, desarrollan mecanismos que minimizan el arrepentimiento del principal.

Collina, Roth y Shao ^[21] mejoran su mecanismo tanto en el tiempo de ejecución como en los límites del arrepentimiento (en función del número de estados de naturaleza distintos).

Véase también

Referencias

^ Loomes, G.; Sugden, R. (1982). "Teoría del arrepentimiento: una teoría alternativa de la elección racional en condiciones de incertidumbre". Revista Económica . 92 (4): 805–824. doi :10.2307/2232669. JSTOR 2232669.
^ Bell, DE (1982). "Arrepentimiento en la toma de decisiones bajo incertidumbre". Investigación de operaciones . 30 (5): 961–981. doi :10.1287/opre.30.5.961.
^ Fishburn, PC (1982). Los fundamentos de la utilidad esperada . Biblioteca de teoría y decisión. ISBN 90-277-1420-7.
^ ab Diecidue, E.; Somasundaram, J. (2017). "Teoría del arrepentimiento: una nueva base". Revista de teoría económica . 172 : 88–119. doi :10.1016/j.jet.2017.08.006. S2CID 36505167.
^ Bikhchandani, S.; Segal, U. (2011). "Arrepentimiento transitivo". Economía teórica . 6 (1): 95–108. doi : 10.3982/TE738 . hdl : 10419/150148 .
^ Bardakhchyan, V.; Allahverdyan, A. (2023). "Teoría del arrepentimiento, paradoja de Allais y tortilla de Savage". Revista de Psicología Matemática . 117 . arXiv : 2301.02447 . doi :10.1016/j.jmp.2023.102807.
^ "¿Por qué anticipamos el arrepentimiento antes de tomar una decisión?". The Decision Lab .
^ Filiz-Ozbay, E.; Ozbay, EY (2007). "Subastas con arrepentimiento anticipado: teoría y experimento". American Economic Review . 97 (4): 1407–1418. doi :10.1257/aer.97.4.1407. S2CID 51815774.
^ Zeelenberg, M.; Beattie, J.; Van der Pligt, J.; de Vries, NK (1996). "Consecuencias de la aversión al arrepentimiento: efectos de la retroalimentación esperada en la toma de decisiones riesgosas". Comportamiento organizacional y procesos de decisión humana . 65 (2): 148–158. doi :10.1006/obhd.1996.0013.
^ Zeelenberg, M.; Beattie, J. (1997). "Consecuencias de la aversión al arrepentimiento 2: evidencia adicional de los efectos de la retroalimentación en la toma de decisiones". Comportamiento organizacional y procesos de decisión humana . 72 (1): 63–78. doi :10.1006/obhd.1997.2730.
^ Somasundaram, J.; Diecidue, E. (2016). "Teoría del arrepentimiento y actitudes ante el riesgo". Revista de riesgo e incertidumbre . 55 (2–3): 1–29. doi :10.1007/s11166-017-9268-9. S2CID 254978441.
^ ab Gilbert, Daniel T.; Morewedge, Carey K.; Risen, Jane L.; Wilson, Timothy D. (1 de mayo de 2004). "Mirando hacia adelante para mirar hacia atrás: la predicción errónea del arrepentimiento". Psychological Science . 15 (5): 346–350. CiteSeerX 10.1.1.492.9980 . doi :10.1111/j.0956-7976.2004.00681.x. ISSN 0956-7976. PMID 15102146. S2CID 748553.
^ Sevdalis, Nick; Harvey, Nigel (1 de agosto de 2007). "Previsión sesgada del afecto posdecisional". Psychological Science . 18 (8): 678–681. doi :10.1111/j.1467-9280.2007.01958.x. ISSN 0956-7976. PMID 17680936. S2CID 7524552.
^ Engelbrecht-Wiggans, R. (1989). "El efecto del arrepentimiento en la puja óptima en subastas". Management Science . 35 (6): 685–692. doi :10.1287/mnsc.35.6.685. hdl : 2142/28707 .
^ Fogel, SOC; Berry, T. (2006). "El efecto de disposición y las decisiones de los inversores individuales: el papel del arrepentimiento y las alternativas contrafácticas". Journal of Behavioral Finance . 7 (2): 107–116. doi :10.1207/s15427579jpfm0702_5. S2CID 153522835.
^ Savage, LJ (1951). "La teoría de la decisión estadística". Revista de la Asociación Estadounidense de Estadística . 46 (253): 55–67. doi :10.1080/01621459.1951.10500768.
^ Eldar, YC; Ben-Tal, A.; Nemirovski, A. (2004). "Estimación de arrepentimiento lineal minimáx de parámetros deterministas con incertidumbres de datos acotadas". IEEE Trans. Signal Process . 52 (8): 2177–2188. Bibcode :2004ITSP...52.2177E. doi :10.1109/TSP.2004.831144. S2CID 16417895.
^ Eldar, YC; Merhav, Neri (2004). "Un enfoque minimax competitivo para la estimación robusta de parámetros aleatorios". IEEE Trans. Signal Process . 52 (7): 1931–1946. Bibcode :2004ITSP...52.1931E. doi :10.1109/TSP.2004.828931. S2CID 15596014.
^ Eldar, YC; Merhav, Neri (2005). "Estimación de la relación MSE minimáx con incertidumbres de covarianza de la señal". IEEE Trans. Signal Process . 53 (4): 1335–1347. Bibcode :2005ITSP...53.1335E. doi :10.1109/TSP.2005.843701. S2CID 16732469.
^ Camara, Modibo K.; Hartline, Jason D.; Johnsen, Aleck (1 de noviembre de 2020). "Mecanismos para un agente sin arrepentimiento: más allá del prior común". 2020 IEEE 61st Annual Symposium on Foundations of Computer Science (FOCS) . IEEE. págs. 259–270. arXiv : 2009.05518 . doi :10.1109/focs46700.2020.00033. ISBN 978-1-7281-9621-3.S2CID221640554 .
^ Collina, Natalie; Roth, Aaron; Shao, Han (2023). "Mecanismos eficientes sin prioridad para agentes sin arrepentimiento". arXiv : 2311.07754 [cs.GT].

Enlaces externos

"TUTORIAL G05: Teoría de la decisión". Archivado desde el original el 3 de julio de 2015.