En psicología , la heurística de tomar la mejor [1] es una heurística (una estrategia simple para la toma de decisiones ) que decide entre dos alternativas eligiendo en función de la primera señal que las discrimina, donde las señales se ordenan por validez de señal (de mayor a menor). En la formulación original, se suponía que las señales tenían valores binarios (sí o no) o tenían un valor desconocido. La lógica de la heurística es que basa su elección solo en la mejor señal (razón) e ignora el resto.
Los psicólogos Gerd Gigerenzer y Daniel Goldstein descubrieron que la heurística funcionaba sorprendentemente bien a la hora de hacer inferencias precisas en entornos del mundo real, como inferir cuál de dos ciudades es más grande. Desde entonces, la heurística se ha modificado y aplicado a ámbitos como la medicina , la inteligencia artificial y la previsión política . [2] [3] La heurística se ha utilizado para modelar con precisión cómo los expertos, como los agentes de aduanas de los aeropuertos [4] y los ladrones profesionales, toman decisiones; [5] el modelo a menudo hace mejores predicciones del comportamiento humano que los modelos más complejos que suponen que los expertos integran todas las señales disponibles. [6] [7]
Las teorías de la toma de decisiones suelen suponer que se buscan todas las razones relevantes (características o indicios) y se integran en una decisión final. Sin embargo, en condiciones de incertidumbre (a diferencia del riesgo), normalmente no se conocen todos los indicios relevantes, ni tampoco sus pesos precisos y las correlaciones entre ellos. En estas situaciones, confiar únicamente en el mejor indicio disponible puede ser una alternativa razonable que permita tomar decisiones rápidas, frugales y precisas. Esta es la lógica de una clase de heurística conocida como "toma de decisiones basada en una razón", que incluye la de "tomar lo mejor". [8] Consideremos indicios con valores binarios (0, 1), donde 1 indica el valor del indicio que está asociado con un valor de criterio más alto. La tarea consiste en inferir cuál de las dos alternativas tiene el valor de criterio más alto. Un ejemplo es cuál de los dos equipos de la NBA ganará el partido, basándose en indicios como el partido en casa y quién ganó el último partido. La heurística de "tomar lo mejor" implica tres pasos para hacer tal inferencia: [9]
Regla de búsqueda : Mira las pistas en el orden de su validez.
Regla de detención : detener la búsqueda cuando se encuentre la primera pista en la que los valores de las dos alternativas difieran.
Regla de decisión : predecir que la alternativa con el valor de referencia más alto tendrá el valor más alto en la variable de resultado.
La validez v de una señal viene dada por v = C/(C+W), donde C es el número de inferencias correctas cuando una señal discrimina, y W es el número de inferencias erróneas, todas estimadas a partir de muestras.
Consideremos la tarea de inferir qué objeto, A o B, tiene un valor más alto en un criterio numérico. Como ejemplo, imaginemos que alguien tiene que juzgar si la ciudad alemana de Colonia tiene una población mayor que la otra ciudad alemana, Stuttgart. Este juicio o inferencia tiene que basarse en información proporcionada por pistas binarias, como "¿Es la ciudad la capital de un estado?". Desde un punto de vista formal, la tarea es una categorización: un par (A, B) debe categorizarse como X A > X B o X B > X A (donde X denota el criterio), en función de la información de la pista.
Las claves son binarias, es decir, asumen dos valores y pueden modelarse, por ejemplo, como si tuvieran los valores 0 y 1 (para "sí" y "no"). Se clasifican según su validez de clave , definida como la proporción de comparaciones correctas entre los pares A y B, para los que tiene valores diferentes, es decir, para los que discrimina entre A y B. El método Take-the-best analiza cada clave, una después de la otra, según la clasificación por validez y se detiene la primera vez que una clave discrimina entre los elementos y concluye que el elemento con el valor más alto también tiene un valor más alto en el criterio.
La matriz de todos los objetos de la clase de referencia, de la que se han tomado A y B, y de los valores de referencia que describen estos objetos constituye un denominado entorno. Gigerenzer y Goldstein, que introdujeron el método "toma lo mejor" (véase Gerd Gigerenzer y Daniel Goldstein , DG (1996) [10] ), consideraron, como ejemplo de recorrido, precisamente pares de ciudades alemanas, pero solo aquellas con más de 100.000 habitantes. La tarea de comparación para un par dado (A, B) de ciudades alemanas en la clase de referencia, consistió en establecer cuál tiene una población mayor, basándose en nueve señales. Las señales tenían valores binarios, como si la ciudad es la capital de un estado o si tiene un equipo de fútbol en la liga nacional.
Los valores de las señales podrían modelarse mediante 1 (para "sí") y 0 (para "no") de modo que cada ciudad pudiera identificarse con su "perfil de señal", es decir, un vector de 1 y 0, ordenados según la clasificación de las señales.
La pregunta era: ¿Cómo se puede inferir cuál de dos objetos, por ejemplo, la ciudad A con perfil de señal (100101010) y la ciudad B con perfil de señal (100010101) , tiene una puntuación más alta en el criterio establecido, es decir, el tamaño de la población? La heurística de tomar el mejor simplemente compara los perfiles lexicográficamente, tal como se comparan los números escritos en base dos: el primer valor de señal es 1 para ambos, lo que significa que el primer valor de señal no discrimina entre A y B. El segundo valor de señal es 0 para ambos, nuevamente sin discriminación. Lo mismo sucede con el tercer valor de señal, mientras que el cuarto valor de señal es 1 para A y 0 para B, lo que implica que A se juzga como que tiene un valor más alto en el criterio. En otras palabras, X A > X B si y solo si (100101010) > (100010101) .
Matemáticamente, esto significa que las claves encontradas para la comparación permiten un isomorfismo de cuasi orden entre los objetos comparados según el criterio, en este caso ciudades con sus poblaciones, y sus vectores binarios correspondientes. Aquí, "cuasi" significa que el isomorfismo, en general, no es perfecto, porque el conjunto de claves no es perfecto.
Lo sorprendente es que esta sencilla heurística tiene un gran rendimiento en comparación con otras estrategias. Una medida obvia para establecer el rendimiento de un mecanismo de inferencia está determinada por el porcentaje de juicios correctos. Además, lo que más importa no es sólo el rendimiento de la heurística al ajustar datos conocidos, sino también al generalizar a partir de un conjunto de entrenamiento conocido a nuevos elementos.
Czerlinski, Goldstein y Gigerenzer compararon varias estrategias con la estrategia de tomar lo mejor: un modelo de recuento simple o de peso unitario (también llamado "regla de Dawes" en esa literatura), un modelo lineal ponderado sobre las señales ponderadas por sus validez (también llamado "regla de Franklin" en esa literatura), regresión lineal y minimalista. Sus resultados muestran la solidez de la estrategia de tomar lo mejor en la generalización.
Por ejemplo, considere la tarea de seleccionar la ciudad más grande de dos ciudades cuando
El porcentaje de aciertos fue de aproximadamente el 74 % para la regresión lineal con ponderación unitaria y con el mejor puntaje. Más específicamente, los puntajes fueron 74,3 %, 74,2 % y 74,1 %, por lo que la regresión ganó por un pequeño margen.
Sin embargo, el artículo también consideró la generalización (también conocida como predicción fuera de la muestra).
En este caso, cuando se utilizaron 10.000 divisiones aleatorias diferentes, la regresión tuvo un promedio de 71,9 % de aciertos, la heurística "tomar lo mejor" tuvo un 72,2 % de aciertos y la heurística unitaria con lineal tuvo un 71,4 % de aciertos. La heurística "tomar lo mejor" fue más precisa que la regresión en este caso. [13]