En la teoría de la decisión , al tomar decisiones en condiciones de incertidumbre (en caso de que llegue información sobre el mejor curso de acción después de tomar una decisión fija), la respuesta emocional humana de arrepentimiento a menudo se experimenta y puede medirse como el valor de la diferencia entre una decisión tomada y la otra. decisión óptima.
La teoría de la aversión al arrepentimiento o arrepentimiento anticipado propone que al enfrentar una decisión, los individuos podrían anticipar el arrepentimiento y así incorporar en su elección su deseo de eliminar o reducir esa posibilidad. El arrepentimiento es una emoción negativa con un poderoso componente social y de reputación , y es fundamental para la forma en que los humanos aprenden de la experiencia y para la psicología humana de la aversión al riesgo . La anticipación consciente del arrepentimiento crea un circuito de retroalimentación que trasciende el arrepentimiento del ámbito emocional (a menudo modelado como mero comportamiento humano ) al ámbito del comportamiento de elección racional que se modela en la teoría de la decisión.
La teoría del arrepentimiento es un modelo de economía teórica desarrollado simultáneamente en 1982 por Graham Loomes y Robert Sugden , [1] David E. Bell, [2] y Peter C. Fishburn . [3] La teoría del arrepentimiento modela la elección bajo incertidumbre teniendo en cuenta el efecto del arrepentimiento anticipado. Posteriormente, varios otros autores lo mejoraron. [4]
Incorpora un término de arrepentimiento en la función de utilidad que depende negativamente del resultado obtenido y positivamente del mejor resultado alternativo dada la resolución de la incertidumbre. Este término de arrepentimiento suele ser una función creciente, continua y no negativa que se resta al índice de utilidad tradicional. Este tipo de preferencias siempre violan la transitividad en el sentido tradicional, [5] aunque la mayoría satisface una versión más débil. [4]
Para loterías independientes y cuando el arrepentimiento se evalúa sobre la diferencia entre utilidades y luego se promedia sobre todas las combinaciones de resultados, el arrepentimiento aún puede ser transitivo, pero solo para una forma específica de arrepentimiento funcional. Se muestra que sólo la función seno hiperbólica mantendrá esta propiedad. [6] Esta forma de arrepentimiento hereda la mayoría de las características deseadas, como mantener preferencias correctas frente al dominio estocástico de primer orden , aversión al riesgo para las utilidades logarítmicas y la capacidad de explicar la paradoja de Allais .
La aversión al arrepentimiento no es sólo un modelo económico teórico, sino un sesgo cognitivo que se produce cuando se ha tomado la decisión de abstenerse de arrepentirse de una decisión alternativa. Para decirlo mejor, la aversión al arrepentimiento puede verse a través del miedo, ya sea por acción u omisión; la perspectiva de comprometernos con un fracaso u omitir una oportunidad que buscamos evitar. [7] El arrepentimiento, el sentimiento de tristeza o decepción por algo que ha sucedido, puede racionalizarse para una determinada decisión, pero puede guiar las preferencias y llevar a las personas por mal camino. Esto contribuye a la difusión de desinformación porque no se considera que las cosas sean responsabilidad personal de cada uno.
Varios experimentos sobre opciones tanto hipotéticas como incentivadas dan fe de la magnitud de este efecto.
Los experimentos en subastas de primer precio muestran que al manipular la retroalimentación que los participantes esperan recibir, se observan diferencias significativas en las ofertas promedio. [8] En particular, se puede inducir el "arrepentimiento del perdedor" revelando la oferta ganadora a todos los participantes en la subasta, y revelando así a los perdedores si habrían podido obtener una ganancia y cuánto podría haber sido (un participante que tiene una valoración de $50, ofrece $30 y descubre que la oferta ganadora fue $35 también aprenderá que podría haber ganado hasta $15 al ofertar algo superior a $35.) Esto a su vez permite la posibilidad de arrepentirse y si Si los postores anticipan esto correctamente, tenderían a ofertar más alto que en el caso en que no se proporciona información sobre la oferta ganadora para disminuir la posibilidad de arrepentimiento.
En las decisiones sobre loterías, los experimentos también proporcionan evidencia que respalda el arrepentimiento anticipado. [9] [10] [11] Como en el caso de las subastas de primer precio, las diferencias en la retroalimentación sobre la resolución de la incertidumbre pueden causar la posibilidad de arrepentimiento y, si esto se anticipa, puede inducir preferencias diferentes. Por ejemplo, cuando se tiene que elegir entre $40 con certeza y un lanzamiento de moneda que paga $100 si el resultado se adivina correctamente y $0 en caso contrario, la alternativa de pago seguro no sólo minimiza el riesgo sino también la posibilidad de arrepentimiento, ya que normalmente la moneda no se lanzará (y por lo tanto la incertidumbre no se resolverá), mientras que si se elige el lanzamiento de la moneda, el resultado que paga $0 inducirá arrepentimiento. Si se lanza la moneda independientemente de la alternativa elegida, entonces siempre se conocerá el beneficio alternativo y entonces no habrá elección que elimine la posibilidad de arrepentimiento.
El arrepentimiento anticipado tiende a sobreestimarse tanto en las elecciones como en las acciones de las que las personas se consideran responsables. [12] [13] Es particularmente probable que las personas sobreestimen el arrepentimiento que sentirán cuando pierdan un resultado deseado por un margen estrecho. En un estudio, los viajeros predijeron que se arrepentirían más si perdían un tren por 1 minuto más que si perdían un tren por 5 minutos, por ejemplo, pero los viajeros que realmente perdieron su tren por 1 o 5 minutos experimentaron cantidades (iguales y) menores. de arrepentimiento. Los viajeros parecían sobreestimar por un estrecho margen el arrepentimiento que sentirían al perder el tren, porque tendían a subestimar el grado en que atribuirían la pérdida del tren a causas externas (por ejemplo, perder su billetera o pasar menos tiempo en la ducha). . [12]
Además de la configuración tradicional de las elecciones en las loterías, se ha propuesto la aversión al arrepentimiento como explicación de la sobrepuja típicamente observada en las subastas de primer precio, [14] y el efecto de disposición , [15] entre otros.
El enfoque de arrepentimiento minimax es minimizar el arrepentimiento en el peor de los casos, presentado originalmente por Leonard Savage en 1951. [16] El objetivo de esto es actuar lo más cerca posible del curso óptimo. Dado que el criterio minimax aplicado aquí se refiere al arrepentimiento (diferencia o proporción de los beneficios) más que al beneficio en sí, no es tan pesimista como el enfoque minimax ordinario. Se han utilizado enfoques similares en una variedad de áreas tales como:
Un beneficio del minimax (a diferencia del arrepentimiento esperado) es que es independiente de las probabilidades de los diversos resultados: por lo tanto, si el arrepentimiento se puede calcular con precisión, se puede utilizar de manera confiable el arrepentimiento minimax. Sin embargo, las probabilidades de los resultados son difíciles de estimar.
Esto difiere del enfoque minimax estándar en que utiliza diferencias o proporciones entre resultados y, por lo tanto, requiere mediciones de intervalo o proporción, así como mediciones ordinales (clasificación), como en el minimax estándar.
Supongamos que un inversor tiene que elegir entre invertir en acciones, bonos o el mercado monetario, y el rendimiento total depende de lo que suceda con las tasas de interés. La siguiente tabla muestra algunos posibles retornos:
La elección máxima burda basada en los rendimientos sería invertir en el mercado monetario, asegurando un rendimiento de al menos 1. Sin embargo, si las tasas de interés cayeran, el arrepentimiento asociado con esta elección sería grande. Este sería 11, que es la diferencia entre los 12 que se podrían haber recibido si se hubiera conocido el resultado de antemano y el 1 recibido. Una cartera mixta de aproximadamente el 11,1% en acciones y el 88,9% en el mercado monetario habría asegurado un rendimiento de al menos 2,22; pero, si los tipos de interés bajaran, habría un arrepentimiento de alrededor del 9,78.
La tabla de arrepentimiento para este ejemplo, construida restando los rendimientos reales de los mejores rendimientos, es la siguiente:
Por lo tanto, utilizando una opción minimax basada en el arrepentimiento, lo mejor sería invertir en bonos, asegurando un arrepentimiento no peor que 5. Una cartera de inversión mixta funcionaría aún mejor: el 61,1% invertido en acciones y el 38,9% en dinero. El mercado produciría un arrepentimiento no peor que aproximadamente 4,28.
Lo que sigue es una ilustración de cómo se puede utilizar el concepto de arrepentimiento para diseñar un estimador lineal . En este ejemplo, el problema es construir un estimador lineal de un vector de parámetros de dimensión finita a partir de su medición lineal ruidosa con una estructura de covarianza de ruido conocida. La pérdida de reconstrucción se mide utilizando el error cuadrático medio (MSE). Se sabe que el vector de parámetros desconocidos se encuentra en un elipsoide centrado en cero. El arrepentimiento se define como la diferencia entre el MSE del estimador lineal que no conoce el parámetro y el MSE del estimador lineal que sí lo conoce . Además, dado que el estimador está restringido a ser lineal, en este último caso no se puede alcanzar el MSE cero. En este caso, la solución de un problema de optimización convexa proporciona el estimador lineal óptimo minimax que minimiza el arrepentimiento, que puede verse mediante el siguiente argumento.
Según los supuestos, el vector observado y el vector de parámetros deterministas desconocidos están vinculados por el modelo lineal.
donde es una matriz conocida con rango de columna completo y es un vector aleatorio de media cero con una matriz de covarianza conocida .
Dejar
Sea una estimación lineal de desde , donde hay alguna matriz. El MSE de este estimador está dado por
Dado que el MSE depende explícitamente de él, no se puede minimizar directamente. En cambio, el concepto de arrepentimiento se puede utilizar para definir un estimador lineal con buen desempeño de MSE. Para definir el arrepentimiento aquí, considere un estimador lineal que conoce el valor del parámetro , es decir, la matriz puede depender explícitamente de :
El MSE de es
Para encontrar el óptimo , se deriva con respecto a y la derivada se iguala a 0 obteniendo
Luego, usando el lema de inversión de matrices
Sustituyendo esto nuevamente en , se obtiene
Este es el MSE más pequeño que se puede lograr con una estimación lineal que se conozca . En la práctica, este MSE no se puede lograr, pero sirve como límite para el MSE óptimo. El arrepentimiento de utilizar el estimador lineal especificado por es igual a
El enfoque de arrepentimiento minimax aquí es minimizar el arrepentimiento en el peor de los casos, es decir, esto permitirá un desempeño lo más cercano posible al mejor desempeño alcanzable en el peor caso del parámetro . Aunque este problema parece difícil, es un ejemplo de optimización convexa y, en particular, se puede calcular eficientemente una solución numérica. [17] Se pueden utilizar ideas similares cuando es aleatorio con incertidumbre en la matriz de covarianza . [18] [19]
Camara, Hartline y Johnsen [20] estudian problemas principal-agente . Se trata de juegos de información incompleta entre dos jugadores llamados Principal y Agente , cuyos pagos dependen de un estado de naturaleza conocido sólo por el Agente. El Principal se compromete con una política, luego el agente responde y luego se revela el estado de naturaleza. Suponen que el director y el agente interactúan repetidamente y pueden aprender con el tiempo de la historia del estado, utilizando el aprendizaje por refuerzo . Suponen que el agente está impulsado por la aversión al arrepentimiento. En particular, el agente minimiza su arrepentimiento interno contrafáctico . Con base en este supuesto, desarrollan mecanismos que minimizan el arrepentimiento del director.
Collina, Roth y Shao [21] mejoran su mecanismo tanto en el tiempo de ejecución como en los límites del arrepentimiento (en función del número de estados de naturaleza distintos).