La teoría de la decisión o teoría de la elección racional es una rama de la probabilidad , la economía y la filosofía analítica que utiliza las herramientas de la utilidad esperada y la probabilidad para modelar cómo los individuos deberían comportarse racionalmente en condiciones de incertidumbre . [1] [2] Se diferencia de las ciencias cognitivas y del comportamiento en que es prescriptiva y se ocupa de identificar decisiones óptimas para un agente racional , en lugar de describir cómo las personas realmente toman decisiones. A pesar de esto, el campo es extremadamente importante para el estudio del comportamiento humano real por parte de los científicos sociales , ya que sienta las bases para los modelos de agente racional utilizados para modelar y analizar matemáticamente a los individuos en campos como la sociología , la economía , la criminología , la ciencia cognitiva y la ciencia política .
La teoría normativa de la decisión se ocupa de la identificación de decisiones óptimas, donde la optimalidad a menudo se determina considerando un tomador de decisiones ideal que es capaz de calcular con perfecta precisión y es en cierto sentido completamente racional . La aplicación práctica de este enfoque prescriptivo (cómo las personas deberían tomar decisiones) se llama análisis de decisiones y tiene como objetivo encontrar herramientas, metodologías y software ( sistemas de apoyo a la toma de decisiones ) para ayudar a las personas a tomar mejores decisiones. [3] [4]
Por el contrario, la teoría descriptiva de la decisión se ocupa de describir los comportamientos observados, a menudo bajo el supuesto de que quienes toman las decisiones se comportan de acuerdo con ciertas reglas consistentes. Estas reglas pueden, por ejemplo, tener un marco procedimental (por ejemplo, el modelo de eliminación por aspectos de Amos Tversky ) o un marco axiomático (por ejemplo, los axiomas de transitividad estocástica ), reconciliando los axiomas de Von Neumann-Morgenstern con las violaciones conductuales de la hipótesis de utilidad esperada , o pueden dar explícitamente una forma funcional para las funciones de utilidad inconsistentes en el tiempo (por ejemplo, el descuento cuasi-hiperbólico de Laibson ). [3] [4]
La teoría de la decisión prescriptiva se ocupa de las predicciones sobre el comportamiento que produce la teoría de la decisión positiva para permitir más pruebas del tipo de toma de decisiones que ocurre en la práctica. En las últimas décadas, también ha habido un creciente interés en la "teoría de la decisión conductual", que contribuye a una reevaluación de lo que requiere una toma de decisiones útil. [5] [6]
El área de elección bajo incertidumbre representa el corazón de la teoría de la decisión. Conocida desde el siglo XVII ( Blaise Pascal la invocó en su famosa apuesta , que está contenida en sus Pensées , publicada en 1670), la idea del valor esperado es que, cuando se enfrenta a una serie de acciones, cada una de las cuales podría dar lugar a más de un resultado posible con diferentes probabilidades, el procedimiento racional es identificar todos los resultados posibles, determinar sus valores (positivos o negativos) y las probabilidades que resultarán de cada curso de acción, y multiplicar los dos para dar un "valor esperado", o la expectativa promedio para un resultado; la acción a elegir debe ser la que dé lugar al valor esperado total más alto. En 1738, Daniel Bernoulli publicó un influyente artículo titulado Exposición de una nueva teoría sobre la medición del riesgo , en el que utiliza la paradoja de San Petersburgo para mostrar que la teoría del valor esperado debe ser normativamente errónea. Pone un ejemplo en el que un comerciante holandés intenta decidir si debe asegurar un cargamento que se envía desde Ámsterdam a San Petersburgo en invierno. En su solución, define una función de utilidad y calcula la utilidad esperada en lugar del valor financiero esperado. [7]
En el siglo XX, el interés se reavivó con el artículo de 1939 de Abraham Wald , que señalaba que los dos procedimientos centrales de la teoría estadística basada en la distribución de muestreo , a saber, la prueba de hipótesis y la estimación de parámetros , son casos especiales del problema general de decisión. [8] El artículo de Wald renovó y sintetizó muchos conceptos de la teoría estadística, incluidas las funciones de pérdida , las funciones de riesgo , las reglas de decisión admisibles , las distribuciones antecedentes , los procedimientos bayesianos y los procedimientos minimax . La frase "teoría de la decisión" en sí fue utilizada en 1950 por EL Lehmann . [9]
El resurgimiento de la teoría de la probabilidad subjetiva , a partir de los trabajos de Frank Ramsey , Bruno de Finetti , Leonard Savage y otros, amplió el alcance de la teoría de la utilidad esperada a situaciones en las que se pueden utilizar probabilidades subjetivas. En ese momento, la teoría de la utilidad esperada de von Neumann y Morgenstern [10] demostró que la maximización de la utilidad esperada se deducía de postulados básicos sobre el comportamiento racional.
El trabajo de Maurice Allais y Daniel Ellsberg mostró que el comportamiento humano tiene desviaciones sistemáticas y a veces importantes de la maximización de la utilidad esperada ( paradoja de Allais y paradoja de Ellsberg ). [11] La teoría prospectiva de Daniel Kahneman y Amos Tversky renovó el estudio empírico del comportamiento económico con menos énfasis en los presupuestos de racionalidad. Describe una forma en que las personas toman decisiones cuando todos los resultados conllevan un riesgo. [12] Kahneman y Tversky encontraron tres regularidades: en la toma de decisiones humana real, "las pérdidas parecen mayores que las ganancias"; las personas se centran más en los cambios en sus estados de utilidad que en las utilidades absolutas; y la estimación de las probabilidades subjetivas está severamente sesgada por el anclaje .
La elección intertemporal se ocupa del tipo de elección en la que diferentes acciones conducen a resultados que se realizan en diferentes etapas a lo largo del tiempo. [13] También se describe como toma de decisiones de costo-beneficio , ya que implica la elección entre recompensas que varían según la magnitud y el momento de llegada. [14] Si alguien recibiera una ganancia inesperada de varios miles de dólares, podría gastarlos en unas vacaciones caras, lo que le daría un placer inmediato, o podría invertirlos en un plan de pensiones, lo que le daría un ingreso en algún momento en el futuro. ¿Qué es lo óptimo que se puede hacer? La respuesta depende en parte de factores como las tasas de interés y la inflación esperadas, la esperanza de vida de la persona y su confianza en la industria de las pensiones. Sin embargo, incluso teniendo en cuenta todos esos factores, el comportamiento humano nuevamente se desvía en gran medida de las predicciones de la teoría de la decisión prescriptiva, lo que lleva a modelos alternativos en los que, por ejemplo, las tasas de interés objetivas se reemplazan por tasas de descuento subjetivas .
Algunas decisiones son difíciles porque es necesario tener en cuenta cómo responderán otras personas en la situación a la decisión que se toma. El análisis de estas decisiones sociales suele abordarse desde la teoría de la decisión, aunque implica métodos matemáticos. En el campo emergente de la ingeniería sociocognitiva , la investigación se centra especialmente en los diferentes tipos de toma de decisiones distribuida en las organizaciones humanas, en situaciones normales y anormales/de emergencia/crisis. [15]
Otras áreas de la teoría de la decisión se ocupan de decisiones que son difíciles simplemente por su complejidad, o por la complejidad de la organización que tiene que tomarlas. Los individuos que toman decisiones tienen recursos limitados (es decir, tiempo e inteligencia) y, por lo tanto, son racionalmente limitados ; la cuestión, por lo tanto, es, más que la desviación entre el comportamiento real y el óptimo, la dificultad de determinar el comportamiento óptimo en primer lugar. Las decisiones también se ven afectadas por el hecho de que las opciones se formulen juntas o por separado; esto se conoce como el sesgo de distinción .
Las heurísticas son procedimientos para tomar una decisión sin calcular las consecuencias de cada opción. Las heurísticas reducen la cantidad de pensamiento evaluativo necesario para tomar decisiones, ya que se centran en algunos aspectos de la decisión e ignoran otros. [16] Si bien es más rápido que el procesamiento paso a paso, el pensamiento heurístico también es más propenso a incluir falacias o imprecisiones. [17]
Un ejemplo de un proceso de pensamiento común y erróneo que surge a través del pensamiento heurístico es la falacia del jugador , que consiste en creer que un evento aleatorio aislado se ve afectado por eventos aleatorios aislados anteriores. Por ejemplo, si al lanzar una moneda al aire repetidamente sale cruz, la moneda sigue teniendo la misma probabilidad (es decir, 0,5) de que salga cruz en los próximos lanzamientos, aunque intuitivamente parezca que es más probable que salga cara. [18] A largo plazo, cara y cruz deberían ocurrir con la misma frecuencia; las personas cometen la falacia del jugador cuando utilizan esta heurística para predecir que el resultado de cara es "debería" ocurrir después de una serie de cruces. [19] Otro ejemplo es que los tomadores de decisiones pueden estar sesgados a preferir alternativas moderadas a las extremas. El efecto de compromiso opera bajo una mentalidad de que la opción más moderada es la que conlleva el mayor beneficio. En un escenario de información incompleta, como en la mayoría de las decisiones diarias, la opción moderada parecerá más atractiva que cualquiera de los extremos, independientemente del contexto, basándose únicamente en el hecho de que tiene características que se pueden encontrar en ambos extremos. [20]
Una cuestión muy controvertida es si se puede sustituir el uso de la probabilidad en la teoría de la decisión por otra cosa.
Los defensores del uso de la teoría de la probabilidad señalan:
Los defensores de la lógica difusa , la teoría de la posibilidad , la teoría de Dempster-Shafer y la teoría de la decisión basada en la brecha de información sostienen que la probabilidad es solo una de muchas alternativas y señalan muchos ejemplos en los que se han implementado alternativas no estándar con aparente éxito. En particular, la teoría de la decisión probabilística a veces puede ser sensible a los supuestos sobre las probabilidades de varios eventos, mientras que las reglas no probabilísticas, como minimax , son sólidas en el sentido de que no hacen tales supuestos.
Una crítica general a la teoría de la decisión basada en un universo fijo de posibilidades es que considera las "incógnitas conocidas", no las " incógnitas desconocidas ": [21] se centra en las variaciones esperadas, no en los eventos imprevistos, que algunos sostienen que tienen un impacto descomunal y deben considerarse: los eventos significativos pueden estar "fuera del modelo". Esta línea de argumentación, llamada la falacia lúdica , es que existen imperfecciones inevitables en el modelado del mundo real mediante modelos particulares, y que la confianza ciega en los modelos nos ciega a sus límites.