El árbol rápido y frugal o heurística de emparejamiento [1] (en el estudio de la toma de decisiones ) es una estructura gráfica simple que clasifica los objetos al hacer una pregunta a la vez. Estos árboles de decisión se utilizan en una variedad de campos: psicología , inteligencia artificial y ciencia de la gestión . A diferencia de otros árboles de decisión o clasificación , como el CART de Leo Breiman , [2] los árboles rápidos y frugales son intencionalmente simples, tanto en su construcción como en su ejecución, y operan rápidamente con poca información. Por esta razón, los árboles rápidos y frugales son potencialmente atractivos al diseñar tareas con recursos limitados. [3]
Laura Martignon , Vitouch, Takezawa y Forster introdujeron por primera vez el concepto y el término en 2003; [4] se habían utilizado heurísticas similares para otras tareas antes, basándose en los modelos formales creados por Gerd Gigerenzer y Herbert A. Simon .
En tareas de categorización con dos opciones y m pistas (también conocidas como características o atributos) disponibles para tomar tal decisión, una FFT se define de la siguiente manera:
Un árbol rápido y frugal es una clasificación o un árbol de decisión que tiene m+1 salidas, con una salida para cada una de las primeras m −1 señales y dos salidas para la última señal.
Matemáticamente, los árboles rápidos y frugales pueden considerarse como heurísticas lexicográficas o como modelos de clasificación lineal con pesos no compensatorios y un umbral. [MKW] Sus propiedades formales y construcción también han sido analizadas utilizando la teoría de detección de señales por Luan, Schooler y Gigerenzer en 2011. [5] [LSG]
Los elementos básicos son las señales. Las señales están ordenadas por orden de importancia, con una señal en cada nivel del árbol y un nodo de salida en cada nivel (excepto los dos nodos de salida de la última señal en el último nivel del árbol). Siempre que se utiliza una señal, se formula una pregunta sobre el valor de la señal. Las respuestas a las preguntas pueden conducir inmediatamente a una salida, o pueden conducir a otra pregunta (y eventualmente a una salida). Una propiedad característica de los árboles rápidos y frugales es que, para cada pregunta, hay al menos una respuesta posible que conduce a una salida.
En la literatura sobre árboles rápidos y frugales, se han propuesto muchos algoritmos diferentes [4] [MKW] [LSG] [6] para (1) ordenar señales y (2) decidir qué respuesta posible a una pregunta sobre una señal conduce inmediatamente a una salida. Un árbol rápido y frugal está completamente definido si se cumplen las dos condiciones siguientes. A menudo, para mantener la construcción simple e intuitiva, los algoritmos utilizan (1) medidas simples de la "bondad" de la señal (por ejemplo, correlación entre señal y categoría, considerando cada señal independientemente de las otras señales) y (2) toman decisiones simples sobre las salidas (por ejemplo, decidir sobre cada salida independientemente de las otras salidas), pero también se han propuesto algoritmos más complejos.
Para utilizar un árbol rápido y frugal, comience por la raíz y verifique una pista a la vez. En cada paso, uno de los resultados posibles es un nodo de salida que permite tomar una decisión (o acción): si se llega a una salida, detenerse; de lo contrario, continuar hasta llegar a una salida. Tome una salida, detenerse; de lo contrario, continúe y haga más preguntas hasta llegar a una salida.
La figura 1 ilustra un árbol rápido y frugal para clasificar a un paciente como de "alto riesgo" de sufrir un infarto y, por lo tanto, tener que ser enviado a la "unidad de cuidados coronarios" o como de "bajo riesgo" y, por lo tanto, tener que ser enviado a una "cama de enfermería regular" (Green y Mehr, 1997). [GM]
Consideremos tres pacientes, John, Mary y Jack:
En los estudios de Laskey y Martignon (2014), se ha demostrado que la precisión y la solidez de los árboles rápidos y frugales son comparables a las de los puntos de referencia bayesianos. [LM] También se han llevado a cabo estudios exhaustivos que comparan el rendimiento de los árboles rápidos y frugales con el de los algoritmos de clasificación utilizados en estadística y aprendizaje automático, como Bayes ingenuo, CART, bosques aleatorios y regresión logística, utilizando docenas de conjuntos de datos del mundo real. [WHM] [MKW] [6]
Los árboles rápidos y frugales se utilizan para realizar clasificaciones binarias o tomar decisiones. En psicología, medicina y otros campos, la teoría de detección de señales (o teoría de detección ) ha sido la teoría clásica bajo la cual se analizan dichas tareas.
La teoría supone que hay dos categorías de eventos o personas (por ejemplo, personas con y sin problemas cardíacos), de las cuales la categoría más relevante para nosotros se denomina "señal" mientras que la otra se denomina "ruido". Las dos difieren en su distribución en una escala de observación que podemos llamar "evidencia", y la distribución de la señal tiene una media más alta. Se pueden hacer dos clasificaciones posibles, a saber, "señal" o "ruido", al reunir la evidencia. Esto lleva a cuatro resultados posibles: acierto (clasificar como "señal" cuando en realidad es una señal), rechazo correcto (clasificar como "ruido" cuando en realidad es un ruido), error (clasificar como "ruido" cuando en realidad es una señal) y falsa alarma (clasificar como "señal" cuando en realidad es un ruido). Para maximizar la precisión general o el valor esperado de una clasificación, la teoría postula que debemos seleccionar cuidadosamente el criterio de clasificación en la escala de evidencia, por encima del cual tomamos una decisión de "señal" y por debajo del cual "ruido". En particular, cuando el costo de un error es muy alto (por ejemplo, clasificar a un paciente con problemas cardíacos como normal), se debe seleccionar un criterio más bajo y "liberal" (es decir, hacia la izquierda en la escala de evidencia), mientras que cuando el costo de una falsa alarma es muy alto (por ejemplo, clasificar a una persona inocente como culpable de un asesinato), será mejor un criterio más alto y "conservador". Esto implica que un buen tomador de decisiones debe estar adecuadamente sesgado en la mayoría de las situaciones del mundo real; esta es la idea más crítica y relevante de la teoría de detección de señales sobre la clasificación y la toma de decisiones.
En 2011, Luan, Schooler y Gigerenzer analizaron las características de los árboles rápidos y frugales desde la perspectiva de la teoría de detección de señales. Este análisis arroja varias conclusiones clave. En primer lugar, la elección de la estructura de salida de un árbol rápido y frugal corresponde a la configuración del criterio de decisión en la detección de señales. En pocas palabras, cuanto antes aparezca una "salida de señal" en un árbol rápido y frugal, más liberalmente sesgado será el árbol. Los sesgos relativos de dos árboles rápidos y frugales están determinados por la primera salida en la que difieren, siendo siempre más liberal el que tiene la "salida de señal" (indicada por "s") que el que tiene la "salida de ruido" (indicada por "n") (Figura 2). Por ejemplo, una FFTsnnn (aquí nuevamente s = "Salida de señal", n = "salida de ruido") tiene un sesgo más liberal que una FFTnsss. Este principio se conoce como el "sesgo de decisión lexicográfica" de los árboles rápidos y frugales.
En segundo lugar, una serie de simulaciones muestra que los árboles rápidos y frugales con diferentes estructuras de salida darán lugar a valores esperados de decisiones diferentes (a veces drásticamente diferentes) cuando las consecuencias de un error y una falsa alarma difieren. Por lo tanto, al construir y aplicar un árbol rápido y frugal, es necesario elegir una estructura de salida que coincida bien con la estructura de resultados de la decisión de una tarea.
En tercer lugar, la sensibilidad general de un árbol rápido y frugal (es decir, la capacidad del árbol para discriminar una señal de un ruido, que se puede medir con d' o A' según la teoría de detección de señales ) se ve afectada por las propiedades de las señales que componen el árbol, como la media y la varianza de las sensibilidades de las señales y las correlaciones entre las señales, pero no tanto por la estructura de salida del árbol. Y, por último, el rendimiento de los árboles rápidos y frugales es robusto y comparable a algoritmos de decisión mucho más sofisticados desarrollados en la teoría de detección de señales, incluido el modelo de análisis del observador ideal y el modelo de muestreo secuencial óptimo. En el contexto de las predicciones fuera de la muestra, los árboles rápidos y frugales tienen el mejor rendimiento en relación con otros modelos cuando el tamaño de la muestra de aprendizaje es relativamente pequeño (por ejemplo, menos de 80 ensayos).
En 2017, Phillips, Neth, Woike y Gaissmaier [PNWG] presentaron el paquete R FFTrees, [7] alojado en CRAN (con una aplicación complementaria [8] ), que construye, representa gráficamente y evalúa cuantitativamente árboles rápidos y frugales de maneras fáciles de usar.
Los árboles rápidos y frugales se han utilizado en muchas ocasiones para prescribir cómo se debe tomar una decisión y para describir cómo la gente realmente toma decisiones. Más allá del ámbito médico, un ejemplo de sus aplicaciones prescriptivas es la instrucción a los soldados estacionados en Afganistán sobre cómo distinguir si un coche que se acerca a un puesto de control es conducido por civiles o por potenciales terroristas suicidas; [9] [KK] el árbol se ilustra en la Figura 3. En la Figura 4 se muestran dos ejemplos de usos descriptivos de los árboles rápidos y frugales. Los árboles de la izquierda y la derecha describen, respectivamente, cómo una persona decide si perdona a otra persona por una ofensa que esta última cometió durante las interacciones sociales [TLK] y cómo los jueces británicos toman una decisión sobre la libertad bajo fianza o la cárcel. [D] En general, los árboles rápidos y frugales se pueden aplicar para ayudar o modelar cualquier proceso binario de toma de decisiones que implique múltiples señales.
[Un] árbol rápido y frugal ('heurística de emparejamiento')[.]