stringtranslate.com

Árboles rápidos y frugales

El árbol rápido y frugal o heurística de emparejamiento [1] (en el estudio de la toma de decisiones ) es una estructura gráfica simple que clasifica los objetos haciendo una pregunta a la vez. Estos árboles de decisión se utilizan en una variedad de campos: psicología , inteligencia artificial y ciencia de la gestión . A diferencia de otros árboles de decisión o clasificación , como el CART de Leo Breiman , [2] los árboles rápidos y frugales son intencionalmente simples, tanto en su construcción como en su ejecución, y operan rápidamente con poca información. Por esta razón, los árboles rápidos y frugales son potencialmente atractivos al diseñar tareas con recursos limitados. [3]

Laura Martignon , Vitouch, Takezawa y Forster introdujeron por primera vez el concepto y el término en 2003; [4] se habían utilizado heurísticas similares para otras tareas antes, basándose en los modelos formales creados por Gerd Gigerenzer y Herbert A. Simon .

En tareas de categorización con dos opciones y m pistas (también conocidas como características o atributos) disponibles para tomar tal decisión, una FFT se define de la siguiente manera:

Un árbol rápido y frugal es una clasificación o un árbol de decisión que tiene m+1 salidas, con una salida para cada una de las primeras m −1 señales y dos salidas para la última señal.

Matemáticamente, los árboles rápidos y frugales pueden considerarse como heurísticas lexicográficas o como modelos de clasificación lineal con pesos no compensatorios y un umbral. [MKW] Sus propiedades formales y su construcción también han sido analizadas utilizando la teoría de detección de señales por Luan, Schooler y Gigerenzer en 2011. [5] [LSG]

Organización básica

Construcción

Los elementos básicos son las señales. Las señales están ordenadas por orden de importancia, con una señal en cada nivel del árbol y un nodo de salida en cada nivel (excepto dos nodos de salida para la última señal en el último nivel del árbol). Siempre que se utiliza una señal, se formula una pregunta sobre el valor de la señal. Las respuestas a las preguntas pueden conducir inmediatamente a una salida, o pueden conducir a otra pregunta (y eventualmente a una salida). Una propiedad característica de los árboles rápidos y frugales es que, para cada pregunta, hay al menos una respuesta posible que conduce a una salida.

En la literatura sobre árboles rápidos y frugales, se han propuesto muchos algoritmos diferentes [4] [MKW] [LSG] [6] para (1) ordenar señales y (2) decidir qué respuesta posible a una pregunta sobre una señal conduce inmediatamente a una salida. Un árbol rápido y frugal está completamente definido si se cumplen las dos condiciones siguientes. A menudo, para mantener la construcción simple e intuitiva, los algoritmos utilizan (1) medidas simples de la "bondad" de la señal (por ejemplo, correlación entre señal y categoría, considerando cada señal independientemente de las otras señales) y (2) toman decisiones simples sobre las salidas (por ejemplo, decidir sobre cada salida independientemente de las otras salidas), pero también se han propuesto algoritmos más complejos.

Ejecución

Para utilizar un árbol rápido y frugal, comience por la raíz y verifique una señal a la vez. En cada paso, uno de los resultados posibles es un nodo de salida que permite tomar una decisión (o acción): si se llega a una salida, detenerse; de ​​lo contrario, continuar hasta llegar a una salida. Tome una salida, detenerse; de ​​lo contrario, continúe y haga más preguntas hasta llegar a una salida.

Ejemplo de árbol frugal y rápido
Figura 1. Un árbol rápido y frugal que ayuda a los médicos de urgencias a decidir si enviar a un paciente a una cama de enfermería normal o a la unidad de cuidados coronarios (Green y Mehr, 1997). [GM]

La figura 1 ilustra un árbol rápido y frugal para clasificar a un paciente como de "alto riesgo" de sufrir un infarto y, por lo tanto, tener que ser enviado a la "unidad de cuidados coronarios" o como de "bajo riesgo" y, por lo tanto, tener que ser enviado a una "cama de enfermería regular" (Green y Mehr, 1997). [GM]

Consideremos a tres pacientes, John, Mary y Jack:

Actuación

En los estudios de Laskey y Martignon (2014), se ha demostrado que la precisión y la solidez de los árboles rápidos y frugales son comparables a las de los puntos de referencia bayesianos. [LM] También se han llevado a cabo estudios exhaustivos que comparan el rendimiento de los árboles rápidos y frugales con el de los algoritmos de clasificación utilizados en estadística y aprendizaje automático, como Bayes ingenuo, CART, bosques aleatorios y regresión logística, utilizando docenas de conjuntos de datos del mundo real. [WHM] [MKW] [6]

Análisis de detección de señales

Los árboles rápidos y frugales se utilizan para realizar clasificaciones binarias o tomar decisiones. En psicología, medicina y otros campos, la teoría de detección de señales (o teoría de detección ) ha sido la teoría clásica bajo la cual se analizan dichas tareas.

La teoría supone que hay dos categorías de eventos o personas (por ejemplo, personas con y sin problemas cardíacos), de las cuales la categoría más relevante para nosotros se denomina "señal" mientras que la otra se denomina "ruido". Las dos difieren en su distribución en una escala de observación que podemos llamar "evidencia", donde la distribución de la señal tiene una media más alta. Se pueden hacer dos clasificaciones posibles, a saber, "señal" o "ruido", al reunir la evidencia. Esto lleva a cuatro resultados posibles: acierto (clasificar como "señal" cuando en realidad es una señal), rechazo correcto (clasificar como "ruido" cuando en realidad es un ruido), error (clasificar como "ruido" cuando en realidad es una señal) y falsa alarma (clasificar como "señal" cuando en realidad es un ruido). Para maximizar la precisión general o el valor esperado de una clasificación, la teoría postula que debemos seleccionar cuidadosamente el criterio de clasificación en la escala de evidencia, por encima del cual tomamos una decisión de "señal" y por debajo del cual "ruido". En particular, cuando el costo de un error es muy alto (por ejemplo, clasificar a un paciente con problemas cardíacos como normal), se debe seleccionar un criterio más bajo y "liberal" (es decir, hacia la izquierda en la escala de evidencia), mientras que cuando el costo de una falsa alarma es muy alto (por ejemplo, clasificar a una persona inocente como culpable de un asesinato), será mejor un criterio más alto y "conservador". Esto implica que un buen tomador de decisiones debe estar adecuadamente sesgado en la mayoría de las situaciones del mundo real; esta es la idea más crítica y relevante de la teoría de detección de señales sobre la clasificación y la toma de decisiones.

Ejemplo 2 de árbol rápido y frugal
Figura 2. La sección superior de la figura ilustra los supuestos de la teoría de detección de señales en una tarea de decisión binaria. Las tres líneas verticales representan tres criterios de decisión que pueden adoptar el agente y el decisor. La sección inferior ilustra las cuatro posibles FFT que se pueden construir cuando se consultan tres características en un orden fijo. Con base en las clasificaciones indicadas por las dos primeras salidas, los árboles se nombran de izquierda a derecha FFTss, FFTsn, FFTns y FFTnn. Las flechas que conectan las partes de la figura indican aproximadamente las ubicaciones de los criterios de decisión de las cuatro FFT cuando se utilizan para realizar una clasificación o decisión binaria de relación señal/ruido (para señal y ruido, respectivamente). Entre las cuatro, FFTss tiene el criterio de decisión más liberal y FFTnn el más conservador. Los criterios de decisión de FFTsn y FFTns son menos extremos que los otros dos, siendo FFTsn más liberal que FFTns.

En 2011, Luan, Schooler y Gigerenzer analizaron las características de los árboles rápidos y frugales desde la perspectiva de la teoría de detección de señales. Este análisis arroja varias conclusiones clave. En primer lugar, la elección de la estructura de salida de un árbol rápido y frugal corresponde a la configuración del criterio de decisión en la detección de señales. En pocas palabras, cuanto antes aparezca una "salida de señal" en un árbol rápido y frugal, más liberalmente sesgado será el árbol. Los sesgos relativos de dos árboles rápidos y frugales están determinados por la primera salida en la que difieren, siendo el que tiene la "salida de señal" -indicada por "s"- siempre más liberal que el que tiene la "salida de ruido" -indicada por "n" (Figura 2). Por ejemplo, una FFTsnnn (aquí nuevamente s = "Salida de señal", n = "salida de ruido") tiene un sesgo más liberal que una FFTnsss. Este principio se conoce como el "sesgo de decisión lexicográfica" de los árboles rápidos y frugales.

En segundo lugar, una serie de simulaciones muestra que los árboles rápidos y frugales con diferentes estructuras de salida darán lugar a valores esperados de decisiones diferentes (a veces drásticamente diferentes) cuando las consecuencias de un error y una falsa alarma difieren. Por lo tanto, al construir y aplicar un árbol rápido y frugal, es necesario elegir una estructura de salida que coincida bien con la estructura de resultados de la decisión de una tarea.

En tercer lugar, la sensibilidad general de un árbol rápido y frugal (es decir, la capacidad del árbol para discriminar una señal de un ruido, que se puede medir con d' o A' según la teoría de detección de señales ) se ve afectada por las propiedades de las señales que componen el árbol, como la media y la varianza de las sensibilidades de las señales y las correlaciones entre señales, pero no tanto por la estructura de salida del árbol. Y, por último, el rendimiento de los árboles rápidos y frugales es robusto y comparable a algoritmos de decisión mucho más sofisticados desarrollados en la teoría de detección de señales, incluido el modelo de análisis del observador ideal y el modelo de muestreo secuencial óptimo. En el contexto de las predicciones fuera de la muestra, los árboles rápidos y frugales tienen el mejor rendimiento en relación con otros modelos cuando el tamaño de la muestra de aprendizaje es relativamente pequeño (por ejemplo, menos de 80 ensayos).

Ejemplo 3 de árbol rápido y frugal
Figura 3. Un árbol rápido y frugal que puede ayudar a los soldados estacionados en Afganistán a distinguir si un automóvil que se acerca a un puesto de control es conducido por civiles o por posibles terroristas suicidas (Keller y Katsikopoulos, 2016). [KK]
Ejemplo 4 de árbol rápido y frugal
Figura 4. Árboles de ayuno y frugalidad que describen cómo una persona decide si perdona a otra persona por una ofensa que esta última cometió durante interacciones sociales (izquierda; Tan, Luan y Katsikopoulos, 2017) [TLK] y cómo los jueces británicos deciden si tomar una decisión punitiva sobre la libertad bajo fianza (derecha; Dhami, 2003). [D]

Soporte informático

En 2017, Phillips, Neth, Woike y Gaissmaier [PNWG] presentaron el paquete R FFTrees, [7] alojado en CRAN (con una aplicación complementaria [8] ), que construye, representa gráficamente y evalúa cuantitativamente árboles rápidos y frugales de maneras fáciles de usar.

Más ejemplos

Los árboles rápidos y frugales se han utilizado en muchas ocasiones para prescribir cómo se debe tomar una decisión y para describir cómo la gente realmente toma decisiones. Más allá del ámbito médico, un ejemplo de sus aplicaciones prescriptivas es la instrucción a los soldados estacionados en Afganistán sobre cómo distinguir si un coche que se acerca a un puesto de control es conducido por civiles o por potenciales terroristas suicidas; [9] [KK] el árbol se ilustra en la Figura 3. En la Figura 4 se muestran dos ejemplos de usos descriptivos de los árboles rápidos y frugales. Los árboles de la izquierda y la derecha describen, respectivamente, cómo una persona decide si perdona a otra persona por una ofensa que esta última cometió durante las interacciones sociales [TLK] y cómo los jueces británicos toman una decisión sobre la libertad bajo fianza o la cárcel. [D] En general, los árboles rápidos y frugales se pueden aplicar para ayudar o modelar cualquier proceso binario de toma de decisiones que implique múltiples señales.

Artículos relacionados y otras fuentes

Referencias

  1. ^ Gigerenzer, G.; Gaissmaier, W. (2011). "Toma de decisiones heurística". Revisión anual de psicología . 62 : 451–482. doi :10.1146/annurev-psych-120709-145346. hdl : 11858/00-001M-0000-0024-F16D-5 . PMID  21126183 . Consultado el 6 de mayo de 2024 . [Un] árbol rápido y frugal ('heurística de emparejamiento')[.]
  2. ^ Leo Breiman (2017). Árboles de clasificación y regresión. Routledge. doi :10.1201/9781315139470. ISBN 9781315139470. S2CID  129307201 . Consultado el 30 de agosto de 2019 .
  3. ^ Martignon, Laura F.; Katsikopoulos, Konstantinos V.; Woike, Jan K. (2012), "Árboles ingenuos, rápidos y frugales para la clasificación", Ecological Rationality , Oxford University Press, doi :10.1093/acprof:oso/9780195315448.001.0001, ISBN 978-0-19-531544-8, consultado el 28 de febrero de 2022
  4. ^ ab Martignon, Laura; Vitouch, Oliver; Takezawa, Masanori; Forster, Malcolm. "Ingenuos y, sin embargo, iluminados: de frecuencias naturales a árboles de decisión rápidos y frugales", publicado en Pensamiento: perspectivas psicológicas sobre razonamiento, juicio y toma de decisiones (David Hardman y Laura Macchi; editores), Chichester: John Wiley & Sons, 2003.
  5. ^ Luan, Schooler y Gigerenzer, 2011 Un análisis de detección de señales de árboles rápidos y frugales.
  6. ^ ab Şimşek, Özgür; Buckmann, Marcus (2015), Cortes, C.; Lawrence, ND; Lee, DD; Sugiyama, M. (eds.), "Aprendizaje a partir de muestras pequeñas: un análisis de heurísticas de decisión simples" (PDF) , Advances in Neural Information Processing Systems 28 , Curran Associates, Inc., pp. 3159–3167 , consultado el 1 de septiembre de 2019
  7. ^ "FFTrees: generar, visualizar y evaluar árboles de decisión rápidos y económicos". 5 de junio de 2023.
  8. ^ https://econpsychbasel.shinyapps.io/shinyfftrees/ [ URL básica ]
  9. ^ Keller, N., & Katsikopoulos, KV (2016) – Sobre el papel de la heurística psicológica en la investigación operativa; y una demostración en operaciones de estabilidad militar. Revista Europea de Investigación Operativa, 249, 1063–1073.