La teoría de decisión de brecha de información busca optimizar la robustez ante fallas bajo incertidumbre severa , [1] [2] en particular aplicando análisis de sensibilidad del tipo radio de estabilidad [3] a perturbaciones en el valor de una estimación dada del parámetro de interés. Tiene algunas conexiones con el modelo maximin de Wald ; algunos autores los distinguen, otros los consideran instancias del mismo principio.
Ha sido desarrollado por Yakov Ben-Haim, [4] y ha encontrado muchas aplicaciones y se describe como una teoría para la toma de decisiones en condiciones de " incertidumbre severa ". Ha sido criticado por no ser adecuado para este propósito y se han propuesto alternativas, incluidos enfoques clásicos como la optimización robusta .
La brecha de información es una teoría: ayuda a tomar decisiones en condiciones de incertidumbre. Para ello, utiliza modelos, cada uno construido sobre el anterior. Se comienza con un modelo para la situación en la que se desconoce algún parámetro o parámetros. Luego se toma una estimación del parámetro y se analiza qué tan sensibles son los resultados del modelo al error en esta estimación.
La teoría de la brecha de información modela la incertidumbre como subconjuntos en torno a una estimación puntual : la estimación es precisa y la incertidumbre aumenta, en general, sin límites. La incertidumbre mide la "distancia" entre una estimación y una verosimilitud, proporcionando una medida intermedia entre un punto (la estimación puntual ) y todas las verosimilitudes, y dando una medida de sensibilidad: ¿cuál es el margen de error ?
El análisis de la brecha de información brinda respuestas a preguntas como:
Puede usarse para satisfacer , como alternativa a la optimización en presencia de incertidumbre o racionalidad limitada ; vea una optimización sólida para un enfoque alternativo.
A diferencia de la teoría de la decisión probabilística , el análisis de brechas de información no utiliza distribuciones de probabilidad: mide la desviación de los errores (diferencias entre el parámetro y la estimación), pero no la probabilidad de los resultados; en particular, la estimación no es en ningún sentido más o menos probable que otros puntos, ya que la brecha de información no utiliza la probabilidad. La brecha de información, al no utilizar distribuciones de probabilidad, es sólida porque no es sensible a los supuestos sobre las probabilidades de los resultados. Sin embargo, el modelo de incertidumbre incluye una noción de resultados "más cercanos" y "más distantes" y, por lo tanto, incluye algunos supuestos, y no es tan sólido como simplemente considerar todos los resultados posibles, como en el minimax. Además, considera un universo fijo, por lo que no es robusto ante eventos inesperados (no modelados).
La conexión con el análisis minimax ha ocasionado cierta controversia: (Ben-Haim 1999, pp. 271-2) sostiene que el análisis de robustez de info-gap, aunque similar en algunos aspectos, no es un análisis minimax del peor de los casos, ya que no evalúa decisiones. sobre todos los resultados posibles, mientras que (Sniedovich, 2007) sostiene que el análisis de robustez puede verse como un ejemplo de maximin (no minimax). Esto se analiza en la crítica a continuación y se elabora desde la perspectiva de la teoría de la decisión clásica.
Como ejemplo sencillo, consideremos un trabajador. Esperan ganar 20 dólares por semana, mientras que si ganan menos de 15 dólares no podrán trabajar y dormirán en la calle; de lo contrario, podrán permitirse el lujo de pasar una noche de entretenimiento.
Usando el modelo de error absoluto:
donde se puede decir que la solidez es $15, y la oportunidad es $20: si ganan $20, no dormirán en la calle ni se darán un festín, y si ganan dentro de $20 de $200. Pero, si se equivocaron por $20, pueden dormir en la calle, mientras que por más de $30, pueden encontrarse cenando en la opulencia.
Como se indicó, este ejemplo es sólo descriptivo y no permite tomar ninguna decisión; en las aplicaciones, se consideran reglas de decisión alternativas y, a menudo, situaciones con incertidumbre más compleja.
El trabajador está pensando en mudarse a otro lugar donde el alojamiento sea más barato. Ganarán $26 por semana, pero los albergues cuestan $20, mientras que el entretenimiento todavía cuesta $170. En ese caso, la solidez será de 24 dólares y la oportunidad será de 43 dólares. El segundo caso tiene menos solidez y menos oportunidad.
Pero, al medir la incertidumbre por el error relativo ,
la robustez es del 20% y la oportunidad del 23%, mientras que en el otro la robustez es del 38% y la oportunidad del 60%, por lo que moverse es menos oportuno.
Info-gap se puede aplicar a espacios de funciones; en ese caso el parámetro incierto es una función con estimación y los subconjuntos anidados son conjuntos de funciones. Una forma de describir dicho conjunto de funciones es exigir que los valores de u sean cercanos a los valores de para todo x, utilizando una familia de modelos de brecha de información sobre los valores.
Por ejemplo, el modelo de error fraccionario anterior para valores se convierte en el modelo de error fraccionario para funciones agregando un parámetro x a la definición:
De manera más general, si se trata de una familia de modelos de valores con brecha de información, entonces se obtiene un modelo de funciones con brecha de información de la misma manera:
Es común tomar decisiones bajo incertidumbre. [nota 1] ¿Qué se puede hacer para tomar buenas decisiones (o al menos las mejores posibles) en condiciones de incertidumbre? El análisis de robustez de la brecha de información evalúa cada decisión factible preguntando: ¿cuánta desviación de una estimación de un valor, función o conjunto de parámetros se permite y, sin embargo, "garantiza" un rendimiento aceptable? En términos cotidianos, la "robustez" de una decisión está determinada por el tamaño de la desviación de una estimación que aún conduce a un desempeño dentro de los requisitos al utilizar esa decisión. A veces es difícil juzgar cuánta solidez es necesaria o suficiente. Sin embargo, según la teoría de la brecha de información, la clasificación de decisiones factibles en términos de su grado de solidez es independiente de tales juicios.
La teoría de la brecha de información también propone una función de oportunidad que evalúa el potencial de resultados inesperados resultantes de una incertidumbre favorable.
Suponga que es un director de proyecto y supervisa dos equipos: naranja y blanco. Se obtendrán algunos ingresos a finales de año. Tiene una escala de tiempo limitada y su objetivo es decidir cómo espaciar estos recursos entre el naranja y el blanco, de modo que los ingresos totales sean grandes.
Los ingresos reales pueden ser diferentes. Para el nivel de incertidumbre podemos definir una envolvente. Una menor incertidumbre correspondería a una envolvente más pequeña.
Estos sobres se denominan modelos de incertidumbre de brecha de información , ya que describen la comprensión que uno tiene de la incertidumbre que rodea a las funciones de ingresos.
Podemos encontrar un modelo para los ingresos totales. La Figura 5 muestra el modelo de brecha de información de los ingresos totales.
Los ingresos elevados normalmente le harían ganar al director de proyecto el respeto de la alta dirección, pero si los ingresos totales están por debajo de un cierto umbral, le costará el trabajo a dicho director de proyecto. Definiremos dicho umbral como ingreso crítico , ya que los ingresos totales por debajo del ingreso crítico se considerarán un fracaso.
Esto se muestra en la Figura 6. Si la incertidumbre aumenta, la envolvente de incertidumbre se volverá más inclusiva, para incluir instancias de la función de ingreso total que, para la asignación específica, produce un ingreso menor que el ingreso crítico.
La robustez mide la inmunidad de una decisión al fracaso. Un satisfactor robusto es un tomador de decisiones que prefiere opciones con mayor solidez.
Si, para alguna asignación , se ilustra la correlación entre el ingreso crítico y la robustez, el resultado es un gráfico algo similar al de la Figura 7. Este gráfico, llamado curva de robustez de la asignación , tiene dos características importantes, que son comunes a ( la mayoría) curvas de robustez:
La decisión depende del valor del fracaso.
Además de la amenaza de perder el trabajo, la alta dirección le ofrece una zanahoria: si los ingresos son superiores a algunos ingresos, será recompensado.
Si la incertidumbre disminuye, la envolvente de incertidumbre se volverá menos inclusiva, para excluir todos los casos de la función de ingresos totales que, para la asignación específica, produce un ingreso mayor que el ingreso extraordinario.
Si, para alguna asignación , ilustramos la correlación entre los ingresos extraordinarios y la solidez, tendremos un gráfico algo similar a la Figura 10. Este gráfico, llamado curva de oportunidad de asignación , tiene dos características importantes, que son comunes a (la mayoría ) curvas de oportunidad:
Tenga en cuenta que, además de los resultados generados por la estimación, también se muestran dos valores verdaderos "posibles" de los ingresos a cierta distancia de la estimación.
Como lo indica la imagen, dado que el modelo de robustez de la brecha de información aplica su análisis Maximin en una vecindad inmediata de la estimación, no hay seguridad de que el análisis se realice de hecho en la vecindad del valor real de los ingresos. De hecho, en condiciones de gran incertidumbre, esto es muy poco probable desde el punto de vista metodológico.
Esto plantea la pregunta: ¿qué tan válidos/útiles/significativos son los resultados? ¿No estamos barriendo bajo la alfombra la gravedad de la incertidumbre?
Por ejemplo, supongamos que una determinada asignación resulta muy frágil en las proximidades de la estimación. ¿Significa esto que esta asignación también es frágil en otras partes de la región de incertidumbre? Por el contrario, ¿qué garantía hay de que una asignación que es sólida en la vecindad de la estimación también lo sea en otros lugares de la región de incertidumbre, de hecho en la vecindad del valor real de los ingresos?
Lo que es más fundamental, dado que los resultados generados por la brecha de información se basan en un análisis local de ingresos/asignación cercano a una estimación que probablemente sea sustancialmente errónea, no nos queda otra opción (metodológicamente hablando) que asumir que los resultados Las conclusiones generadas por este análisis tienen igualmente probabilidades de ser sustancialmente erróneas. En otras palabras, de acuerdo con el axioma universal de basura que entra y sale , tenemos que asumir que la calidad de los resultados generados por el análisis de info-gap es tan buena como la calidad de la estimación en la que se basan los resultados.
La imagen habla por sí sola.
Lo que surge entonces es que la teoría de la brecha de información aún debe explicar de qué manera, si es que la hay, intenta realmente abordar la gravedad de la incertidumbre bajo consideración. Las secciones siguientes de este artículo abordarán esta cuestión de gravedad y sus implicaciones metodológicas y prácticas.
En Sniedovich (2007) se puede encontrar un análisis más detallado de un problema de inversión numérico ilustrativo de este tipo.
Las brechas de información se cuantifican mediante modelos de incertidumbre de brechas de información. Un modelo de brecha de información es una familia ilimitada de conjuntos anidados. Por ejemplo, un ejemplo que se encuentra con frecuencia es una familia de elipsoides anidados que tienen todos la misma forma. La estructura de los conjuntos en un modelo de brecha de información se deriva de la información sobre la incertidumbre. En términos generales, la estructura de un modelo de incertidumbre con brecha de información se elige para definir la familia de conjuntos más pequeña o estricta cuyos elementos son consistentes con la información previa. Dado que, por lo general, no se conoce el peor de los casos, la familia de conjuntos puede ser ilimitada.
Un ejemplo común de modelo de brecha de información es el modelo de error fraccionario. La mejor estimación de una función incierta es , pero se desconoce el error fraccionario de esta estimación. La siguiente familia ilimitada de conjuntos anidados de funciones es un modelo de brecha de información de error fraccionario:
En cualquier horizonte de incertidumbre , el conjunto contiene todas las funciones cuya desviación fraccionaria no es mayor que . Sin embargo, se desconoce el horizonte de incertidumbre, por lo que el modelo de brecha de información es una familia ilimitada de conjuntos y no existe el peor de los casos ni la mayor desviación.
Hay muchos otros tipos de modelos de incertidumbre con brechas de información. Todos los modelos de brecha de información obedecen a dos axiomas básicos :
El axioma de anidamiento impone la propiedad de "agrupación", que es característica de la incertidumbre de la brecha de información. Además, el axioma de anidación implica que los conjuntos de incertidumbre se vuelven más inclusivos a medida que crecen, dotándolo así de su significado como horizonte de incertidumbre. El axioma de la contracción implica que, en el horizonte de incertidumbre cero, la estimación es correcta.
Recuerde que el elemento incierto puede ser un parámetro, vector, función o conjunto. El modelo de brecha de información es entonces una familia ilimitada de conjuntos anidados de parámetros, vectores, funciones o conjuntos.
Para una estimación de punto fijo, un modelo de brecha de información suele ser equivalente a una función definida como:
que significa "la incertidumbre de un punto u es la incertidumbre mínima tal que u está en el conjunto con esa incertidumbre". En este caso, la familia de conjuntos se puede recuperar como conjuntos de subnivel de :
es decir: "el subconjunto anidado con horizonte de incertidumbre consta de todos los puntos con incertidumbre menor o igual a ".
Por el contrario, dada una función que satisface el axioma (equivalentemente, si y sólo si ), define un modelo de brecha de información a través de los conjuntos de subniveles.
Por ejemplo, si la región de incertidumbre es un espacio métrico , entonces la función de incertidumbre puede ser simplemente la distancia, por lo que los subconjuntos anidados son simplemente
Esto siempre define un modelo de brecha de información, ya que las distancias siempre son no negativas (axioma de no negatividad) y satisface (axioma de contracción de la brecha de información) porque la distancia entre dos puntos es cero si y solo si son iguales ( la identidad de los indiscernibles); El anidamiento sigue mediante la construcción de un conjunto de subniveles.
No todos los modelos de brecha de información surgen como conjuntos de subniveles: por ejemplo, si es para todos pero no para (tiene incertidumbre "un poco más" que 1), entonces el mínimo anterior no está definido; se puede reemplazar por un ínfimum , pero entonces los conjuntos de subniveles resultantes no concordarán con el modelo infogap: pero el efecto de esta distinción es muy menor, sin embargo, ya que modifica los conjuntos en menos que cambiar el horizonte de incertidumbre en cualquier número positivo. sin embargo pequeño.
La incertidumbre puede ser perniciosa o propicia. Es decir, las variaciones inciertas pueden ser adversas o favorables. La adversidad implica la posibilidad de fracaso, mientras que la favorabilidad es la oportunidad de un éxito arrollador. La teoría de la decisión de la brecha de información se basa en cuantificar estos dos aspectos de la incertidumbre y elegir una acción que aborde uno, el otro o ambos simultáneamente. Los aspectos perniciosos y propicios de la incertidumbre se cuantifican mediante dos "funciones de inmunidad": la función de robustez expresa la inmunidad al fracaso, mientras que la función de oportunidad expresa la inmunidad a las ganancias inesperadas.
La función de robustez expresa el mayor nivel de incertidumbre en el que no puede ocurrir la falla; la función de oportunidad es el menor nivel de incertidumbre que conlleva la posibilidad de un éxito arrollador. Las funciones de robustez y oportunidad abordan, respectivamente, las facetas perniciosa y propicia de la incertidumbre.
Sea un vector de decisión de parámetros como variables de diseño, tiempo de inicio, parámetros del modelo u opciones operativas. Podemos expresar verbalmente las funciones de robustez y oportunidad como el máximo o mínimo de un conjunto de valores del parámetro de incertidumbre de un modelo de brecha de información:
Formalmente,
Podemos "leer" la ecuación. (1) de la siguiente manera. La robustez del vector de decisión es el mayor valor del horizonte de incertidumbre para el cual siempre se satisfacen los requisitos mínimos especificados . expresa robustez (el grado de resistencia a la incertidumbre y la inmunidad contra el fracaso), por lo que es deseable un valor grande de. La robustez se define como el peor de los casos hasta el horizonte de incertidumbre: ¿qué tan grande puede ser el horizonte de incertidumbre y aun así, incluso en el peor de los casos, alcanzar el nivel crítico de resultado?
Ec. (2) establece que la oportunidad es el menor nivel de incertidumbre que debe tolerarse para permitir la posibilidad de un éxito arrollador como resultado de las decisiones . es la inmunidad contra recompensas inesperadas, por lo que es deseable un valor pequeño de. Un valor pequeño de refleja la situación oportuna de que es posible una gran recompensa incluso en presencia de poca incertidumbre ambiental. La oportunidad se define como el mejor de los casos hasta el horizonte de incertidumbre: ¿qué tan pequeño puede ser el horizonte de incertidumbre y aun así, en el mejor de los casos, lograr la recompensa inesperada?
Las funciones de inmunidad son complementarias y se definen en un sentido antisimétrico. Por lo tanto, "cuanto más grande es mejor", mientras que "lo grande es malo" para . Las funciones de inmunidad (robustez y oportunidad) son las funciones de decisión básicas en la teoría de la decisión de la brecha de información.
La función de robustez implica una maximización, pero no del desempeño o resultado de la decisión: en general el resultado podría ser arbitrariamente malo. Más bien, maximiza el nivel de incertidumbre que se requeriría para que el resultado fracase.
La mayor incertidumbre tolerable se encuentra en el momento en que la decisión satisface el desempeño en un nivel crítico de supervivencia. Uno puede establecer sus preferencias entre las acciones disponibles de acuerdo con su robustez , donde una mayor robustez engendra una mayor preferencia. De esta manera, la función de robustez subyace a un algoritmo de decisión satisfactorio que maximiza la inmunidad a la incertidumbre perniciosa.
La función de oportunidad en la ec. (2) implica una minimización, aunque no como cabría esperar, del daño que puede derivarse de acontecimientos adversos desconocidos. Se busca el horizonte de menor incertidumbre en el que la decisión permita (pero no necesariamente garantice) grandes ganancias inesperadas. A diferencia de la función de robustez, la función de oportunidad no satisface, sino que genera "ganancias inesperadas". Las preferencias inesperadas son aquellas que prefieren acciones para las cuales la función de oportunidad toma un valor pequeño. Cuando se acostumbra elegir una acción , se está “ganando el cielo” al optimizar la oportunidad a partir de la incertidumbre propicia en un intento de posibilitar metas o recompensas muy ambiciosas.
Dada una función de recompensa escalar , dependiendo del vector de decisión y de la función de brecha de información incierta , el requisito mínimo en la ecuación. (1) es que la recompensa no sea inferior a un valor crítico . Asimismo, el éxito arrollador en la ec. (2) es el logro de un nivel de recompensa del "sueño más loco" que es mucho mayor que . Por lo general, ninguno de estos valores umbral y , se elige irrevocablemente antes de realizar el análisis de decisión. Más bien, estos parámetros permiten a quien toma las decisiones explorar una gama de opciones. En cualquier caso, la recompensa inesperada es mayor, generalmente mucho mayor, que la recompensa crítica :
Las funciones de robustez y oportunidad de las ecs. (1) y (2) ahora se pueden expresar más explícitamente:
es el mayor nivel de incertidumbre consistente con una recompensa garantizada no menor que la recompensa crítica , mientras que es el menor nivel de incertidumbre que debe aceptarse para facilitar (pero no garantizar) ganancias inesperadas tan grandes como . La estructura complementaria o antisimétrica de las funciones de inmunidad es evidente a partir de las ecs. (3) y (4).
Estas definiciones se pueden modificar para manejar funciones de recompensa de criterios múltiples. Asimismo, se aplican definiciones análogas cuando se trata de una pérdida en lugar de una recompensa.
Con base en estas funciones, se puede decidir un curso de acción optimizando la incertidumbre: elegir la decisión que sea más sólida (puede soportar la mayor incertidumbre; "satisfactoria"), o elegir la decisión que requiera la menor incertidumbre para lograr un ganancia inesperada.
Formalmente, optimizar por robustez u optimizar por oportunidad produce una relación de preferencia en el conjunto de decisiones, y la regla de decisión es "optimizar con respecto a esta preferencia".
A continuación, sea el conjunto de todos los vectores de decisión disponibles o factibles .
La función de robustez genera preferencias robustas y satisfactorias sobre las opciones: las decisiones se clasifican en orden creciente de robustez, para una recompensa crítica determinada, es decir, por valor, es decir , si
Una decisión robusta y satisfactoria es aquella que maximiza la robustez y satisface el desempeño en el nivel crítico .
Denotemos la robustez máxima por (formalmente, la robustez máxima para una recompensa crítica determinada) y la decisión (o decisiones) correspondiente (formalmente, la acción de optimización crítica para un nivel dado de recompensa crítica):
Por lo general, aunque no invariablemente, la acción robusta y satisfactoria depende de la recompensa crítica .
A la inversa, se puede optimizar la oportunidad: la función de oportunidad genera preferencias oportunas e inesperadas sobre las opciones: las decisiones se clasifican en orden decreciente de oportunidad, para una determinada recompensa inesperada, es decir, por valor, es decir , si
La decisión oportuna e inesperada , minimiza la función de oportunidad en el conjunto de decisiones disponibles.
Denota la oportunidad mínima por (formalmente, la oportunidad mínima para una recompensa inesperada determinada) y la decisión (o decisiones) correspondiente (formalmente, la acción de optimización de la ganancia inesperada para un nivel determinado de recompensa inesperada):
Los dos rankings de preferencia, así como las correspondientes decisiones óptimas y , pueden ser diferentes y pueden variar dependiendo de los valores de y
La teoría de la brecha de información ha generado mucha literatura. La teoría de la brecha de información se ha estudiado o aplicado en una variedad de aplicaciones que incluyen ingeniería, [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] conservación biológica, [19] [20] [21] [22] [23] [24] [ 25] [26] [27] [28 ] [29 ] [30] biología teórica , [31] seguridad nacional, [32] economía, [33] [34] [35] gestión de proyectos [36] [37] [38] y estadísticas. [39] También se han estudiado cuestiones fundamentales relacionadas con la teoría de la brecha de información. [40] [41] [42] [43] [44] [45]
El resto de esta sección describe con un poco más de detalle el tipo de incertidumbres que aborda la teoría de la brecha de información. Aunque a continuación se mencionan muchos trabajos publicados, aquí no se intenta presentar ideas de estos artículos. El énfasis no está en dilucidar los conceptos de la teoría de la brecha de información, sino en el contexto donde se utiliza y los objetivos.
Una aplicación típica de ingeniería es el análisis de vibraciones de una viga agrietada, donde la ubicación, el tamaño, la forma y la orientación de la grieta se desconocen e influyen en gran medida en la dinámica de la vibración. [9] Generalmente se sabe muy poco sobre estas incertidumbres espaciales y geométricas. El análisis de brechas de información permite modelar estas incertidumbres y determinar el grado de robustez (ante estas incertidumbres) de propiedades como la amplitud de la vibración, las frecuencias naturales y los modos naturales de vibración. Otro ejemplo es el diseño estructural de un edificio sujeto a cargas inciertas, como las del viento o los terremotos. [8] [10] La respuesta de la estructura depende en gran medida de la distribución espacial y temporal de las cargas. Sin embargo, las tormentas y los terremotos son eventos altamente idiosincrásicos, y la interacción entre el evento y la estructura involucra propiedades mecánicas muy específicas del sitio que rara vez se conocen. El análisis de brechas de información permite que el diseño de la estructura mejore la inmunidad estructural contra desviaciones inciertas de la base de diseño o de las cargas estimadas en el peor de los casos. [ cita necesaria ] Otra aplicación de ingeniería implica el diseño de una red neuronal para detectar fallas en un sistema mecánico, basada en mediciones en tiempo real. Una dificultad importante es que las fallas son altamente idiosincrásicas, por lo que los datos de entrenamiento para la red neuronal tenderán a diferir sustancialmente de los datos obtenidos de fallas en tiempo real después de que la red haya sido entrenada. La estrategia de robustez de la brecha de información permite diseñar la red neuronal para que sea robusta ante la disparidad entre los datos de entrenamiento y los eventos reales futuros. [11] [13]
El biólogo conservacionista se enfrenta a lagunas de información en el uso de modelos biológicos. Utilizan curvas de robustez de la brecha de información para seleccionar entre opciones de manejo para las poblaciones de gusanos de las yemas del abeto en el este de Canadá. Burgman [46] utiliza el hecho de que las curvas de robustez de diferentes alternativas pueden cruzarse.
La gestión de proyectos es otra área donde la incertidumbre sobre la falta de información es común. El director del proyecto a menudo tiene información muy limitada sobre la duración y el costo de algunas de las tareas del proyecto, y la solidez de la brecha de información puede ayudar en la planificación e integración del proyecto. [37] La economía financiera es otra área donde el futuro está plagado de sorpresas, que pueden ser perniciosas o propicias. Los análisis de solidez y oportunidad de las brechas de información pueden ayudar en el diseño de carteras, el racionamiento del crédito y otras aplicaciones. [33]
Al aplicar la teoría de la brecha de información, uno debe ser consciente de ciertas limitaciones.
En primer lugar, el modelo de brecha de información hace suposiciones, es decir, sobre el universo en cuestión y el grado de incertidumbre; el modelo de brecha de información es un modelo de grados de incertidumbre o similitud de varias suposiciones, dentro de un universo determinado. Info-gap no hace suposiciones de probabilidad dentro de este universo (no es probabilístico), pero cuantifica una noción de "distancia desde la estimación". En resumen, la brecha de información hace menos suposiciones que un método probabilístico, pero hace algunas suposiciones.
Por ejemplo, un modelo simple de rendimientos diarios del mercado de valores –que por definición caen dentro del rango– puede incluir movimientos extremos como el Lunes Negro (1987), pero podría no modelar las crisis del mercado después de los ataques del 11 de septiembre : considera las "incógnitas conocidas". ", no las " incógnitas desconocidas ". Esta es una crítica general a gran parte de la teoría de la decisión y de ninguna manera es específica de la brecha de información, pero la brecha de información no es inmune a ella.
En segundo lugar, no existe una escala natural: ¿la incertidumbre es pequeña o grande? Diferentes modelos de incertidumbre dan diferentes escalas y requieren juicio y comprensión del dominio y del modelo de incertidumbre. De manera similar, medir las diferencias entre resultados requiere juicio y comprensión del dominio.
En tercer lugar, si el universo bajo consideración es mayor que un horizonte significativo de incertidumbre, y los resultados para estos puntos distantes son significativamente diferentes de los puntos cercanos a la estimación, entonces las conclusiones de los análisis de robustez u oportunidad serán generalmente: "uno debe tener mucha confianza en su supuestos, de lo contrario se puede esperar que los resultados varíen significativamente de las proyecciones", una conclusión cautelar.
Las funciones de robustez y oportunidad pueden informar la decisión. Por ejemplo, un cambio en la decisión que aumenta la solidez puede aumentar o disminuir la oportunidad. Desde una postura subjetiva, la solidez y la oportunidad se compensan con la aspiración de obtener resultados: la solidez y la oportunidad se deterioran a medida que aumentan las aspiraciones de quien toma las decisiones. La robustez es cero para los mejores resultados anticipados del modelo. Las curvas de robustez para decisiones alternativas pueden cruzarse en función de la aspiración, lo que implica una inversión de preferencia.
Varios teoremas identifican condiciones en las que una mayor robustez de la brecha de información implica una mayor probabilidad de éxito, independientemente de la distribución de probabilidad subyacente. Sin embargo, estas condiciones son técnicas y no se traducen en recomendaciones verbales de sentido común, lo que limita las aplicaciones de la teoría de la brecha de información por parte de no expertos.
Una crítica general a las reglas de decisión no probabilísticas, discutida en detalle en Teoría de la decisión: alternativas a la teoría de la probabilidad , es que las reglas de decisión óptimas (formalmente, reglas de decisión admisibles ) siempre pueden derivarse mediante métodos probabilísticos, con una función de utilidad adecuada y una distribución previa. (ésta es la declaración de los teoremas de clase completos) y, por lo tanto, los métodos no probabilísticos como el info-gap son innecesarios y no producen reglas de decisión nuevas o mejores.
Una crítica más general a la toma de decisiones en condiciones de incertidumbre es el impacto de eventos inesperados de gran tamaño, que no son capturados por el modelo. Esto se analiza particularmente en la teoría del cisne negro , y la brecha de información, utilizada de forma aislada, es vulnerable a esto, como lo son a fortiori todas las teorías de decisión que utilizan un universo fijo de posibilidades, en particular las probabilísticas.
Sniedovich [47] plantea dos puntos a la teoría de la decisión de la brecha de información, uno sustantivo, otro académico:
Sniedovich ha cuestionado la validez de la teoría de la brecha de información para tomar decisiones en condiciones de gran incertidumbre. Sniedovich señala que la función de robustez de la brecha de información es "local" en la región circundante , donde es probable que haya errores sustanciales.
Simbólicamente, max supone un resultado mínimo (peor de los casos), o maximin.
En otras palabras, si bien no es un análisis maximin del resultado sobre el universo de incertidumbre, sí es un análisis maximin sobre un espacio de decisión adecuadamente construido.
Ben-Haim sostiene que el modelo de robustez de info-gap no es un análisis mínimo-máximo/maximín porque no es un análisis de resultados en el peor de los casos; es un modelo satisfactorio , no un modelo de optimización: un análisis maximin (sencillo) consideraría los peores resultados en todo el espacio, lo que, dado que la incertidumbre a menudo es potencialmente ilimitada, produciría un peor caso ilimitado.
Sniedovich [3] ha demostrado que el modelo de robustez de Info-gap es un modelo de radio de estabilidad simple , es decir, un modelo de estabilidad local de forma genérica.
donde denota una bola de radio centrado en y denota el conjunto de valores de que satisfacen condiciones de estabilidad predeterminadas.
En otras palabras, el modelo de robustez de Info-gap es un modelo de radio de estabilidad caracterizado por un requisito de estabilidad de la forma . Dado que los modelos de radio de estabilidad están diseñados para el análisis de pequeñas perturbaciones en un valor nominal dado de un parámetro, Sniedovich [3] sostiene que el modelo de robustez de info-gap no es adecuado para el tratamiento de una incertidumbre severa caracterizada por una estimación deficiente y un amplio espacio de incertidumbre. .
Es cierto que la función de robustez de la brecha de información es local y tiene un valor cuantitativo restringido en algunos casos. Sin embargo, uno de los principales objetivos del análisis de decisiones es centrar los juicios subjetivos. Es decir, independientemente del análisis formal, se proporciona un marco para la discusión. Sin entrar en ningún marco en particular, ni en las características de los marcos en general, a continuación se debaten las propuestas para tales marcos.
Simon [48] introdujo la idea de racionalidad limitada . Las limitaciones en el conocimiento, la comprensión y la capacidad computacional limitan la capacidad de los tomadores de decisiones para identificar opciones óptimas. Simon abogó por satisfacer en lugar de optimizar: buscar resultados adecuados (en lugar de óptimos) teniendo en cuenta los recursos disponibles. Schwartz, [49] Conlisk [50] y otros analizan una amplia evidencia del fenómeno de la racionalidad limitada entre los tomadores de decisiones humanos, así como de las ventajas de satisfacer cuando el conocimiento y la comprensión son deficientes. La función de robustez de la brecha de información proporciona un medio para implementar una estrategia satisfactoria bajo una racionalidad limitada. Por ejemplo, al discutir la racionalidad limitada y la satisfacción en la conservación y la gestión ambiental, Burgman señala que "la teoría de la brecha de información... puede funcionar sensatamente cuando hay lagunas de conocimiento 'graves'". Las funciones de robustez y oportunidad de la brecha de información proporcionan "un marco formal para explorar los tipos de especulaciones que ocurren intuitivamente al examinar las opciones de decisión". [51] Burgman luego procede a desarrollar una estrategia sólida y satisfactoria de brecha de información para proteger al loro de vientre naranja en peligro de extinción. De manera similar, Vinot, Cogan y Cipolla [52] discuten el diseño de ingeniería y señalan que "la desventaja de un análisis basado en modelos radica en el conocimiento de que el comportamiento del modelo es sólo una aproximación al comportamiento real del sistema. De ahí la pregunta del diseñador honesto". : ¿Qué tan sensible es mi medida del éxito del diseño a las incertidumbres en la representación de mi sistema?... Es evidente que si el análisis basado en modelos se va a utilizar con algún nivel de confianza entonces... [uno debe] intentar satisfacer un nivel aceptable nivel subóptimo de rendimiento sin dejar de ser lo más robusto posible ante las incertidumbres del sistema". [52] Proceden a desarrollar un procedimiento de diseño robusto y satisfactorio con brecha de información para una aplicación aeroespacial.
Por supuesto, tomar decisiones ante la incertidumbre no es nada nuevo y los intentos de abordarlas tienen una larga historia. Varios autores han notado y discutido similitudes y diferencias entre la robustez de la brecha de información y los métodos minimax o del peor de los casos [7] [16] [35] [37] [53] . [54] Sniedovich [47] ha demostrado formalmente que la función de robustez de la brecha de información se puede representar como una optimización maximin y, por lo tanto, está relacionada con la teoría minimax de Wald. Sniedovich [47] ha afirmado que el análisis de robustez de info-gap se realiza en la vecindad de una estimación que probablemente sea sustancialmente incorrecta, concluyendo que la función de robustez resultante tiene la misma probabilidad de ser sustancialmente incorrecta.
Por otro lado, la estimación es la mejor que se tiene, por lo que es útil saber si puede equivocarse mucho y aun así arrojar un resultado aceptable. Esta pregunta crítica plantea claramente la cuestión de si la robustez (como la define la teoría de la brecha de información) está calificada para juzgar si la confianza está justificada, [5] [55] [56] y cómo se compara con los métodos utilizados para informar decisiones en condiciones de incertidumbre utilizando consideraciones que no se limitan a la vecindad de una mala suposición inicial. Las respuestas a estas preguntas varían según el problema particular en cuestión. A continuación se presentan algunos comentarios generales.
El análisis de sensibilidad (qué tan sensibles son las conclusiones a los supuestos de entrada) se puede realizar independientemente de un modelo de incertidumbre: de manera más simple, se pueden tomar dos valores diferentes supuestos para una entrada y comparar las conclusiones. Desde esta perspectiva, la brecha de información puede verse como una técnica de análisis de sensibilidad, aunque de ninguna manera la única.
La literatura sobre optimización robusta [57] [58] [59] [60] [61] [62] proporciona métodos y técnicas que adoptan un enfoque global para el análisis de robustez. Estos métodos abordan directamente la toma de decisiones en situaciones de gran incertidumbre y se han utilizado con este fin durante más de treinta años. El modelo Maximin de Wald es el principal instrumento utilizado por estos métodos.
La principal diferencia entre el modelo Maximin empleado por info-gap y los diversos modelos Maximin empleados por métodos de optimización robustos está en la manera en que la región total de incertidumbre se incorpora en el modelo de robustez. Info-gap adopta un enfoque local que se concentra en la vecindad inmediata de la estimación. En marcado contraste, los métodos de optimización robustos se proponen incorporar en el análisis toda la región de incertidumbre, o al menos una representación adecuada de la misma. De hecho, algunos de estos métodos ni siquiera utilizan una estimación.
La teoría de la decisión clásica, [63] [64] ofrece dos enfoques para la toma de decisiones bajo incertidumbre severa, a saber, maximin y el principio de razón insuficiente de Laplaces (suponer que todos los resultados son igualmente probables); Estas pueden considerarse soluciones alternativas a las soluciones del problema de la brecha de información.
Además, como se analiza en Teoría de la decisión: alternativas a la teoría de la probabilidad , los probabilistas , particularmente los probabilistas bayesianos, argumentan que las reglas de decisión óptimas (formalmente, reglas de decisión admisibles ) siempre pueden derivarse mediante métodos probabilísticos (esta es la declaración de los teoremas de clase completos ), y, por lo tanto, los métodos no probabilísticos como el info-gap son innecesarios y no producen reglas de decisión nuevas o mejores.
Como lo atestigua la rica literatura sobre optimización robusta , maximin proporciona una amplia gama de métodos para la toma de decisiones ante una incertidumbre severa.
De hecho, como se analiza en la crítica a la teoría de la decisión de la brecha de información , el modelo de robustez de la brecha de información puede interpretarse como un ejemplo del modelo maximin general.
En cuanto al principio de razón insuficiente de Laplaces , en este contexto es conveniente verlo como un ejemplo de análisis bayesiano .
La esencia del análisis bayesiano es aplicar probabilidades para diferentes realizaciones posibles de los parámetros inciertos. En el caso de la incertidumbre Knightiana (no probabilística) , estas probabilidades representan el "grado de creencia" del tomador de decisiones en una realización específica.
En nuestro ejemplo, supongamos que sólo hay cinco realizaciones posibles de la función incierta de asignación de ingresos. Quien toma las decisiones cree que la función estimada es la más probable y que la probabilidad disminuye a medida que aumenta la diferencia con la estimación. La Figura 11 ejemplifica dicha distribución de probabilidad.
Ahora bien, para cualquier asignación, se puede construir una distribución de probabilidad de los ingresos, basada en sus creencias previas. El tomador de decisiones puede entonces elegir la asignación con el mayor ingreso esperado, con la menor probabilidad de un ingreso inaceptable, etc.
El paso más problemático de este análisis es la elección de las probabilidades de realización. Cuando existe una experiencia pasada extensa y relevante, un experto puede utilizar esta experiencia para construir una distribución de probabilidad. Pero incluso con una amplia experiencia pasada, cuando algunos parámetros cambian, es posible que el experto solo pueda estimar que es más probable que , pero no podrá cuantificar de manera confiable esta diferencia. Además, cuando las condiciones cambian drásticamente, o cuando no existe ninguna experiencia pasada, puede resultar difícil incluso estimar si es más probable que .
Sin embargo, desde el punto de vista metodológico, esta dificultad no es tan problemática como basar el análisis de un problema sujeto a una gran incertidumbre en una única estimación puntual y su vecindad inmediata, como se hace con la brecha de información. Y lo que es más, a diferencia de la brecha de información, este enfoque es global, más que local.
Aun así, hay que subrayar que el análisis bayesiano no se ocupa expresamente de la cuestión de la robustez.
El análisis bayesiano plantea la cuestión de aprender de la experiencia y ajustar las probabilidades en consecuencia. En otras palabras, la decisión no es un proceso único, sino que se beneficia de una secuencia de decisiones y observaciones.
Sniedovich [47] plantea dos puntos sobre la brecha de información, desde el punto de vista de la teoría de la decisión clásica, uno sustantivo y otro académico:
Sniedovich ha cuestionado la validez de la teoría de la brecha de información para tomar decisiones en condiciones de gran incertidumbre.
En el marco de la teoría de la decisión clásica , el modelo de robustez de la brecha de información puede interpretarse como un ejemplo del modelo Maximin de Wald y su modelo de oportunidad es un ejemplo del modelo Minimin clásico. Ambos operan en la vecindad de una estimación del parámetro de interés cuyo valor verdadero está sujeto a una gran incertidumbre y, por lo tanto, es probable que sea sustancialmente incorrecto . Además, las consideraciones que influyen en el proceso de decisión mismo también se originan en la localidad de esta estimación poco confiable y, por lo tanto, pueden reflejar o no toda la gama de decisiones e incertidumbres.
Ahora bien, como se describe en la literatura sobre brechas de información, Info-Gap fue diseñada expresamente como una metodología para resolver problemas de decisión que están sujetos a una incertidumbre severa. Y es más, su objetivo es buscar soluciones que sean sólidas .
Por lo tanto, para tener una idea clara del modus operandi de info-gap y su papel y lugar en la teoría de la decisión y la optimización robusta, es imperativo examinarlo dentro de este contexto. En otras palabras, es necesario establecer la relación de la brecha de información con la teoría de decisión clásica y la optimización robusta. Para ello es necesario abordar las siguientes cuestiones:
A este respecto es necesario aclarar desde el principio dos puntos importantes:
Entonces, primero aclaremos los supuestos que implica una incertidumbre severa .
La teoría de la decisión de la brecha de información emplea tres constructos simples para capturar la incertidumbre asociada con los problemas de decisión:
Sin embargo, cabe señalar que, como tales, estos constructos son genéricos, lo que significa que pueden emplearse para modelar situaciones en las que la incertidumbre no es grave sino leve, de hecho muy leve. Por lo tanto, es vital dejar claro que para expresar adecuadamente la gravedad de la incertidumbre, en el marco de Info-Gap se da un significado específico a estos tres constructos.
Supuestos de trabajo
- La región de incertidumbre es relativamente grande. De hecho, Ben-Haim (2006, p. 210) indica que en el contexto de la teoría de la decisión de brecha de información la mayoría de las regiones de incertidumbre que se encuentran comúnmente son ilimitadas.
- La estimación es una mala aproximación del valor real de . Es decir, la estimación es una mala indicación del verdadero valor de (Ben-Haim, 2006, p. 280) y es probable que sea sustancialmente errónea (Ben-Haim, 2006, p. 281).
En la imagen se representa el valor verdadero (desconocido) de .
Lo que hay que señalar aquí es que las condiciones de incertidumbre severa implican que la estimación puede, en términos relativos, estar muy distante del valor real . Esto es particularmente pertinente para metodologías, como info-gap, que buscan solidez ante la incertidumbre. De hecho, suponer lo contrario equivaldría, desde el punto de vista metodológico, a hacer ilusiones.
La idea básica detrás de este famoso paradigma se puede expresar en lenguaje sencillo como sigue:
Regla de MaximinoDebemos adoptar la alternativa cuyo peor resultado sea superior al peor resultado de las demás.
Rawls [65] (1971, pág. 152)
Así, según este paradigma, en el marco de la toma de decisiones bajo incertidumbre severa, la robustez de una alternativa es una medida de qué tan bien esta alternativa puede hacer frente al peor resultado incierto que pueda generar. No hace falta decir que esta actitud hacia una gran incertidumbre conduce a menudo a la selección de alternativas muy conservadoras . Esta es precisamente la razón por la que este paradigma no siempre es una metodología satisfactoria para la toma de decisiones en condiciones de incertidumbre severa (Tintner 1952).
Como se indica en la descripción general, el modelo de robustez de Info-gap es un modelo de Maximin disfrazado. Más específicamente, es una instancia simple del modelo Maximin de Wald donde:
Por lo tanto, aparte de la cuestión del conservadurismo , es necesario abordar una cuestión mucho más grave. Ésta es la cuestión de validez que surge de la naturaleza local del análisis de robustez de info-gap.
La validez de los resultados generados por el análisis de robustez de info-gap depende de la calidad de la estimación . Según los propios supuestos de trabajo de Info-gap, esta estimación es pobre y probablemente sea sustancialmente errónea (Ben-Haim, 2006, p. 280-281).
El problema con esta característica del modelo de robustez de info-gap se pone de manifiesto con más fuerza en la imagen. El círculo blanco representa la vecindad inmediata de la estimación sobre la cual se realiza el análisis de Maximin. Dado que la región de incertidumbre es grande y la calidad de la estimación es pobre, es muy probable que el valor verdadero de esté distante del punto en el que se realiza el análisis de Maximin.
Entonces, dada la gravedad de la incertidumbre bajo consideración, ¿qué tan válido/útil puede ser realmente este tipo de análisis de Maximin?
Hasta qué punto un análisis de robustez local a la Maximin en la vecindad inmediata de una estimación deficiente puede representar acertadamente una gran región de incertidumbre.
Los métodos de optimización robustos invariablemente adoptan una visión mucho más global de la robustez. Hasta tal punto que la planificación y generación de escenarios son cuestiones centrales en este ámbito. Esto refleja un fuerte compromiso con una representación adecuada de toda la región de incertidumbre en la definición de robustez y en el propio análisis de robustez.
Esto tiene que ver con la descripción de la contribución del info-gap al estado del arte en la teoría de la decisión, y su papel y lugar frente a otras metodologías.
Info-gap es enfático en su avance del estado del arte en la teoría de la decisión (aquí se usa el color para enfatizar):
La teoría de la decisión de la brecha de información es radicalmente diferente de todas las teorías actuales de decisión en condiciones de incertidumbre. La diferencia se origina en el modelado de la incertidumbre como una brecha de información más que como una probabilidad .
Ben-Haim (2006, pág.xii)En este libro nos concentramos en el concepto bastante nuevo de incertidumbre por brecha de información, cuyas diferencias con los enfoques más clásicos de la incertidumbre son reales y profundas . A pesar del poder de las teorías de decisión clásicas, en muchas áreas como la ingeniería, la economía, la administración, la medicina y las políticas públicas, ha surgido la necesidad de un formato diferente para las decisiones basadas en evidencia severamente incierta .
Ben-Haim (2006, p. 11)
Estas fuertes afirmaciones deben ser fundamentadas. En particular, se debe dar una respuesta clara e inequívoca a la siguiente pregunta: ¿en qué manera el modelo genérico de robustez de Info-gap es diferente, de hecho radicalmente diferente , del análisis del peor de los casos a la Maximin ?
Las secciones siguientes de este artículo describen varios aspectos de la teoría de la decisión de la brecha de información y sus aplicaciones, cómo propone hacer frente a los supuestos de trabajo descritos anteriormente, la naturaleza local del análisis de robustez de la brecha de información y su íntima relación con el paradigma Maximin clásico de Wald y sus peores consecuencias. -analisis de CASO.
El punto principal a tener en cuenta aquí es que la razón de ser de info-gap es proporcionar una metodología para tomar decisiones en condiciones de gran incertidumbre. Esto significa que su prueba principal sería la eficacia de su manejo y afrontamiento de una incertidumbre severa . Para este fin, primero se debe establecer cómo se comportan o funcionan los modelos de robustez/oportunidad de Info-Gap, a medida que aumenta/disminuye la gravedad de la incertidumbre.
En segundo lugar, debe establecerse si los modelos de robustez/oportunidad de info-gap dan una expresión adecuada a la variabilidad potencial de la función de desempeño en toda la región de incertidumbre. Esto es particularmente importante porque Info—Gap generalmente se ocupa de regiones de incertidumbre relativamente grandes, de hecho ilimitadas.
Entonces, denotemos la región total de incertidumbre y consideremos estas preguntas clave:
- ¿Cómo responde el análisis de robustez/oportunidad a un aumento/disminución en el tamaño de ?
- ¿Cómo afecta un aumento/disminución en el tamaño de la solidez u oportunidad de una decisión?
- ¿Cuán representativos son los resultados generados por el análisis de robustez/oportunidad de info-gap de lo que ocurre en la región total relativamente grande de incertidumbre ?
Supongamos entonces que se ha calculado la robustez para una decisión y se observa que para alguna .
La pregunta entonces es: ¿cómo se vería afectada la robustez de , es decir , si la región de incertidumbre fuera, digamos, dos veces más grande que , o quizás incluso 10 veces más grande que ?
Consideremos entonces el siguiente resultado, que es una consecuencia directa de la naturaleza local del análisis de robustez/oportunidad de las brechas de información y de la propiedad de anidamiento de las regiones de incertidumbre de las brechas de información (Sniedovich 2007):
La robustez de la decisión es invariante con el tamaño de la región total de incertidumbre para todos aquellos que
En otras palabras, para cualquier decisión dada, el análisis de info-gap arroja los mismos resultados para todas las regiones totales de incertidumbre que contienen . Esto se aplica tanto al modelo de robustez como al de oportunidad.
Esto se ilustra en la imagen: la solidez de una decisión dada no cambia a pesar de un aumento en la región de incertidumbre de a .
En resumen, a fuerza de centrarse exclusivamente en la vecindad inmediata de la estimación de la brecha de información, los modelos de robustez/oportunidad son inherentemente locales . Por esta razón son - en principio - incapaces de incorporar en el análisis de y regiones de incertidumbre que se encuentran fuera de las vecindades y de la estimación , respectivamente.
Para ilustrar, considere un ejemplo numérico simple donde la región total de incertidumbre es la estimación y para alguna decisión obtenemos . La imagen es esta:
donde el término "tierra de nadie" se refiere a la parte de la región total de incertidumbre que se encuentra fuera de la región .
Tenga en cuenta que en este caso la solidez de la decisión se basa en su desempeño (en el peor de los casos) en no más que una parte minúscula de la región total de incertidumbre que es una vecindad inmediata de la estimación . Dado que normalmente la región total de incertidumbre de la brecha de información es ilimitada, esta ilustración representa un caso habitual más que una excepción.
La solidez y oportunidad de Info-gap son, por definición, propiedades locales. Como tales, no pueden evaluar el desempeño de las decisiones en la región total de incertidumbre. Por esta razón, no está claro cómo los modelos de Robustez/Oportunidad de Info-Gap pueden proporcionar una base significativa/sólida/útil para tomar decisiones bajo una incertidumbre severa donde la estimación es deficiente y es probable que sea sustancialmente errónea.
Esta cuestión crucial se aborda en secciones posteriores de este artículo.
Desde hace más de sesenta años, el modelo Maximin de Wald ha figurado en la teoría de la decisión clásica y áreas relacionadas (como la optimización robusta ) como el principal paradigma no probabilístico para el modelado y el tratamiento de la incertidumbre severa.
La brecha de información se propone (por ejemplo, Ben-Haim 2001, 2006) como una nueva teoría no probabilística que es radicalmente diferente de todas las teorías de decisión actuales para la decisión en condiciones de incertidumbre. Por lo tanto, es imperativo examinar en esta discusión en qué manera, si es que hay alguna, el modelo de robustez de Info-gap es radicalmente diferente de Maximin . Por un lado, existe una evaluación bien establecida de la utilidad de Maximin . Por ejemplo, Berger (Capítulo 5) [66] sugiere que incluso en situaciones en las que no hay información previa disponible (el mejor de los casos para Maximin ), Maximin puede conducir a malas reglas de decisión y ser difícil de implementar. Recomienda la metodología bayesiana . Y como se indicó anteriormente,
También hay que señalar que el principio minimax, aunque sea aplicable, conduce a una política extremadamente conservadora.
Tintner (1952, pág. 25) [67]
Sin embargo, aparte de las ramificaciones que establecer este punto podría tener para la utilidad del modelo de robustez de las brechas de información, la razón por la que nos corresponde aclarar la relación entre las brechas de información y Maximin es la centralidad de este último en la teoría de la decisión. Después de todo, esta es una metodología de decisión clásica importante. Por lo tanto, se esperaría que cualquier teoría que pretendiera proporcionar una nueva metodología no probabilística para la decisión en condiciones de incertidumbre severa fuera comparada con esta incondicional teoría de la decisión. Y, sin embargo, no sólo está ausente una comparación del modelo de robustez de Info-Gap con Maximin en los tres libros que exponen Info-Gap (Ben-Haim 1996, 2001, 2006), sino que Maximin ni siquiera se menciona en ellos como la principal metodología teórica de decisión para gran incertidumbre de que así sea.
En otras partes de la literatura sobre la brecha de información, se pueden encontrar discusiones que abordan las similitudes y diferencias entre estos dos paradigmas, así como discusiones sobre la relación entre la brecha de información y el análisis del peor de los casos, [7] [16] [35] [37 ] [53] [68] Sin embargo, la impresión general es que no se ha identificado la conexión íntima entre estos dos paradigmas. De hecho, se argumenta lo contrario. Por ejemplo, Ben-Haim (2005 [35] ) sostiene que el modelo de robustez de info-gap es similar a Maximin pero no es un modelo de Maximin .
La siguiente cita expresa elocuentemente la evaluación de Ben-Haim sobre la relación de info-gap con Maximin y proporciona una amplia motivación para el análisis que sigue.
Observamos que la confiabilidad robusta no es enfáticamente un análisis del peor de los casos. En el análisis clásico mínimo-máximo del peor de los casos, el diseñador minimiza el impacto del caso de máximo daño. Pero un modelo de incertidumbre con brecha de información es una familia ilimitada de conjuntos anidados: , para todos . En consecuencia, no existe el peor de los casos: cualquier suceso adverso es menos dañino que algún otro evento más extremo que ocurra con un valor mayor de . ¿Qué ecuación? (1) expresa es el mayor nivel de incertidumbre consistente con el no fracaso. Cuando el diseñador elige q maximizar, está maximizando su inmunidad a una incertidumbre ambiental ilimitada. Lo más cercano a "min-maxing" es que el diseño se elige de modo que los eventos "malos" (que causan una recompensa menor que ) ocurran lo más "lejos" posible (más allá de un valor maximizado de ).
Ben-Haim, 1999, págs. 271–2 [69]
El punto a tener en cuenta aquí es que esta afirmación pasa por alto el hecho de que el horizonte de incertidumbre está limitado arriba (implícitamente) por el requisito de desempeño.
y esa brecha de información lleva a cabo su análisis del peor de los casos (un análisis a la vez para un determinado caso ) dentro de cada una de las regiones de incertidumbre .
En resumen, dadas las discusiones en la literatura sobre la brecha de información sobre este tema, es obvio que se debe resaltar el parentesco entre el modelo de robustez de la brecha de información y el modelo Maximin de Wald , así como el parentesco de la brecha de información con otros modelos de la teoría de la decisión clásica. a la luz. Por lo tanto, el objetivo de esta sección es colocar los modelos de robustez y oportunidad de info-gap en su contexto adecuado, es decir, dentro de los marcos más amplios de la teoría de la decisión clásica y la optimización robusta .
La discusión se basa en la perspectiva teórica clásica de la decisión esbozada por Sniedovich (2007 [70] ) y en textos estándar en esta área (por ejemplo, Resnik 1987, [63] French 1988 [64] ).
El marco conceptual básico que proporciona la teoría de la decisión clásica para abordar la incertidumbre es el de un juego de dos jugadores. Los dos actores son el tomador de decisiones (DM) y la Naturaleza, donde la Naturaleza representa la incertidumbre. Más específicamente, la Naturaleza representa la actitud del DM hacia la incertidumbre y el riesgo.
Obsérvese que a este respecto se hace una clara distinción entre quien toma decisiones pesimista y quien toma decisiones optimistas , es decir, entre una actitud en el peor de los casos y una actitud en el mejor de los casos . Un tomador de decisiones pesimista asume que la Naturaleza juega en su contra , mientras que un tomador de decisiones optimista asume que la Naturaleza juega con él.
Para expresar matemáticamente estas nociones intuitivas, la teoría de la decisión clásica utiliza un modelo simple que consta de los tres constructos siguientes:
- Un conjunto que representa el espacio de decisión disponible para el DM.
- Un conjunto de conjuntos que representan espacios de estados asociados con las decisiones en .
- Una función que estipula los resultados generados por los pares de estado de decisión .
La función se llama función objetivo, función de pago, función de retorno, función de costo , etc.
El proceso de toma de decisiones (juego) definido por estos objetos consta de tres pasos:
- Paso 1: El DM selecciona una decisión .
- Paso 2: En respuesta, dado , la Naturaleza selecciona un estado .
- Paso 3: El resultado se asigna a DM.
Tenga en cuenta que, a diferencia de los juegos considerados en la teoría de juegos clásica , aquí el primer jugador (DM) se mueve primero para que el segundo jugador (Naturaleza) sepa qué decisión seleccionó el primer jugador antes de seleccionar su decisión. Por tanto, las complicaciones conceptuales y técnicas relativas a la existencia del punto de equilibrio de Nash no son pertinentes aquí. La naturaleza no es un actor independiente, es un dispositivo conceptual que describe la actitud del DM hacia la incertidumbre y el riesgo.
A primera vista, la simplicidad de este marco puede parecer ingenuo. Sin embargo, como lo atestigua la variedad de instancias específicas que abarca, es rico en posibilidades, flexible y versátil. A los efectos de esta discusión, basta considerar la siguiente configuración genérica clásica:
donde y representan los criterios de optimización de DM y de la Naturaleza, respectivamente, es decir, cada uno es igual a o .
Si entonces el juego es cooperativo y si entonces el juego no es cooperativo. Así, este formato representa cuatro casos: dos juegos no cooperativos (Maximin y Minimax) y dos juegos cooperativos (Minimin y Maximax). Las formulaciones respectivas son las siguientes:
Cada caso está especificado por un par de criterios de optimización empleados por DM y Nature. Por ejemplo, Maximin describe una situación en la que DM se esfuerza por maximizar el resultado y la Naturaleza se esfuerza por minimizarlo. De manera similar, el paradigma Minimin representa situaciones en las que tanto DM como la Naturaleza se esfuerzan por minimizar el resultado.
De particular interés para esta discusión son los paradigmas Maximin y Minimin porque subsumen los modelos de robustez y oportunidad de la brecha de información, respectivamente. Entonces aquí están:
- Paso 1: El DM selecciona una decisión con miras a maximizar el resultado .
- Paso 2: En respuesta, dado , la Naturaleza selecciona un estado que minimiza sobre .
- Paso 3: El resultado se asigna a DM.
- Paso 1: El DM selecciona una decisión con miras a minimizar el resultado .
- Paso 2: En respuesta, dado , la Naturaleza selecciona un estado que minimiza sobre .
- Paso 3: El resultado se asigna a DM.
Teniendo esto en cuenta, consideremos ahora los modelos de solidez y oportunidad de Info-gap.
Desde un punto de vista teórico de decisión clásico, el modelo de robustez de info-gap es un juego entre el DM y la Naturaleza, donde el DM selecciona el valor de (apuntando al mayor posible) mientras que la Naturaleza selecciona el peor valor de in . En este contexto, el peor valor de pertenecer a un par determinado es un que viola el requisito de desempeño . Esto se logra minimizando más de .
Hay varias formas de incorporar el objetivo del DM y la respuesta antagónica de la Naturaleza en un solo resultado. Para ello se puede utilizar, por ejemplo, la siguiente función característica:
Tenga en cuenta que, como se desee, para cualquier triplete de interés tenemos
por lo tanto, desde el punto de vista del DM, satisfacer la restricción de desempeño equivale a maximizar .
En breve,
- Paso 1: El DM selecciona un horizonte de incertidumbre con miras a maximizar el resultado .
- Paso 2: En respuesta, dada , la Naturaleza selecciona una que minimiza sobre .
- Paso 3: El resultado se asigna a DM.
Claramente, la alternativa óptima del DM es seleccionar el valor más grande de tal que el peor satisfaga el requisito de desempeño.
Como se muestra en Sniedovich (2007), [47] el modelo de robustez de Info-gap es un ejemplo simple del modelo maximin de Wald . Específicamente,
Del mismo modo, el modelo de oportunidad de info-gap es una instancia simple del modelo Minimin genérico. Eso es,
dónde
observando que, como se desee, para cualquier triplete de interés tenemos
por lo tanto, para un par determinado , el DM satisfaría el requisito de desempeño minimizando el resultado sobre . El comportamiento de la naturaleza es un reflejo de su postura comprensiva aquí.
Observación: Esta actitud hacia el riesgo y la incertidumbre, que supone que la Naturaleza jugará con nosotros, es bastante ingenua. Como señala Resnik (1987, p. 32 [63] ) "...Pero esa regla seguramente tendría poca adherencia...". Sin embargo, a menudo se utiliza en combinación con la regla de Maximin en la formulación de la regla de optimismo-pesimismo de Hurwicz (Resnik 1987, [63] French 1988 [64] ) con miras a mitigar el conservadurismo extremo de Maximin .
Para resaltar con más fuerza que el modelo de robustez de Info-gap es una instancia del modelo genérico Maximin , y el modelo de oportunidad de Info-gap es una instancia del modelo genérico Minimin, es instructivo examinar los formatos equivalentes llamados Programación Matemática (MP) de estos modelos genéricos (Ecker y Kupferschmid, [71] 1988, pp. 24-25; Thie 1988 [72] pp. 314-317; Kouvelis y Yu, [59] 1997, p. 27):
Así, en el caso de la brecha de información tenemos
Para verificar la equivalencia entre los formatos de info-gap y los respectivos formatos teóricos de decisión, recordemos que, por construcción, para cualquier triplete de interés tenemos
Esto significa que en el caso de robustez/ Maximin , una Naturaleza antagónica minimizará (efectivamente) minimizando, mientras que en el caso de oportunidad/Minimin, una Naturaleza comprensiva maximizará (efectivamente) minimizando .
El análisis de robustez de Info-gap estipula que dado un par , se realiza el peor elemento de . Por supuesto, este es un análisis típico de Maximin . En el lenguaje de la teoría de la decisión clásica :
La robustez de la decisión es el mayor horizonte de incertidumbre, de modo que el peor valor de in satisface el requisito de desempeño .
De manera similar, el análisis de oportunidad de info-gap estipula que dado un par , se obtiene el mejor elemento de . Por supuesto, este es un análisis típico de Minimin. En el lenguaje de la teoría de la decisión clásica :
La oportunidad de la decisión es el horizonte de incertidumbre más pequeño , tal que el mejor valor de in satisface el requisito de desempeño .
Las transliteraciones matemáticas de estos conceptos son sencillas y dan como resultado modelos típicos de Maximin/Minimin, respectivamente.
Lejos de ser restrictiva, la estructura esbelta de los modelos genéricos Maximin/Minimin es una bendición disfrazada. El punto principal aquí es que el carácter abstracto de los tres constructos básicos de los modelos genéricos
- Decisión
- Estado
- Resultado
de hecho, permite una gran flexibilidad en el modelado.
Por lo tanto, se requiere un análisis más detallado para resaltar toda la fuerza de la relación entre la brecha de información y los modelos teóricos de decisión clásicos genéricos. Consulte #Notas sobre el arte del modelado matemático.
A continuación se presenta un resumen pictórico del debate de Sniedovich (2007) sobre la robustez local versus global. Con fines ilustrativos, se presenta aquí como una búsqueda del tesoro. Muestra cómo se relacionan entre sí los elementos del modelo de robustez de Info-gap y cómo se trata la incertidumbre severa en el modelo.
En resumen:
El modelo de robustez de Info-gap es una representación matemática de un análisis local del peor de los casos en la vecindad de una estimación dada del valor real del parámetro de interés. En condiciones de incertidumbre severa, se supone que la estimación es una mala indicación del valor real del parámetro y es probable que sea sustancialmente errónea.
Por lo tanto, la pregunta fundamental es: dada la
- Gravedad de la incertidumbre
- Naturaleza local del análisis.
- Mala calidad de la estimación.
¿Qué tan significativos y útiles son los resultados generados por el análisis y qué tan sólida es la metodología en su conjunto?
Se puede encontrar más información sobre esta crítica en el sitio web de Sniedovich.
Cualquier problema satisfactorio puede formularse como un problema de optimización. Para ver que esto es así, sea la función objetivo del problema de optimización la función indicadora de las restricciones pertenecientes al problema satisfactorio. Por lo tanto, si nuestra preocupación es identificar el peor de los casos relacionado con una restricción, esto se puede hacer mediante un análisis adecuado del peor de los casos Maximin/Minimax de la función indicadora de la restricción.
Esto significa que los modelos teóricos de decisión genéricos pueden manejar resultados inducidos por requisitos que satisfacen restricciones en lugar de, por ejemplo, la maximización de beneficios.
En particular, tenga en cuenta la equivalencia
dónde
y por lo tanto
En términos prácticos, esto significa que una Naturaleza antagonista intentará seleccionar un estado que viole la restricción, mientras que una Naturaleza comprensiva intentará seleccionar un estado que satisfaga la restricción. En cuanto al resultado, la penalización por violar la restricción es tal que quien toma la decisión se abstendrá de seleccionar una decisión que permita a la Naturaleza violar la restricción dentro del espacio de estados correspondiente a la decisión seleccionada.
Cabe destacar que la característica según el modelo de robustez de Info-Gap, su carácter típico de Maximin, no es la presencia de ambos y en la formulación del modelo de Info-Gap. Más bien, la razón de esto es más profunda. Va al corazón del marco conceptual que captura el modelo Maximin : la naturaleza jugando contra el DM. Esto es lo crucial aquí.
Para ver que esto es así, generalicemos el modelo de robustez de info-gap y consideremos en su lugar el siguiente modelo modificado:
donde en este contexto hay algún conjunto y alguna función activada . Tenga en cuenta que no se supone que sea una función de valor real. También tenga en cuenta que "min" no está presente en este modelo.
Todo lo que necesitamos hacer para incorporar un min en este modelo es expresar la restricción
como requisito del peor de los casos. Esta es una tarea sencilla, observando que para cualquier triplete de interés tenemos
dónde
por eso,
que, por supuesto, es un modelo de Maximin a la Programación Matemática.
En breve,
Tenga en cuenta que, aunque el modelo de la izquierda no incluye un "min" explícito, sigue siendo un modelo típico de Maximin. La característica que lo convierte en un modelo Maximin es el requisito que se presta a una formulación e interpretación intuitiva del peor de los casos.
De hecho, la presencia de un doble "máximo" en un modelo de robustez con brecha de información no altera necesariamente el hecho de que este modelo sea un modelo Maximin . Por ejemplo, considere el modelo de robustez
Este es un ejemplo del siguiente modelo Maximin
dónde
El "mínimo interno" indica que la Naturaleza juega contra el DM (el jugador "máximo"), por lo que el modelo es un modelo de robustez.
Esta cuestión de modelado se analiza aquí porque se ha afirmado que, si bien existe una estrecha relación entre los modelos de robustez y oportunidad de info-gap y los modelos genéricos maximin y Minimin, respectivamente, la descripción de info-gap como un ejemplo de estos modelos es demasiado fuerte. El argumento esgrimido es que si bien es cierto que el modelo de robustez de info-gap puede expresarse como un modelo maximin , el primero no es un ejemplo del segundo.
Esta objeción aparentemente surge del hecho de que cualquier problema de optimización puede formularse como un modelo maximin mediante el simple empleo de variables ficticias . Es decir, claramente
dónde
para cualquier conjunto arbitrario no vacío .
El punto de esta objeción parece ser que corremos el riesgo de diluir el significado del término instancia si así sostenemos que cualquier problema de minimización es una instancia del modelo maximin .
Por lo tanto, hay que señalar que esta preocupación es totalmente injustificada en el caso de la relación info-brecha/maximin/minimin. La correspondencia entre el modelo de robustez de info-gap y el modelo maximin genérico no es ideada ni formulada con la ayuda de objetos ficticios. La correspondencia es inmediata, intuitiva y convincente, por lo que se describe acertadamente con el término instancia de .
Específicamente, como se muestra arriba, el modelo de robustez de info-gap es una instancia del modelo maximin genérico especificado por las siguientes construcciones:
Además, aquellos que se oponen al uso del término instancia de deben tener en cuenta que el modelo de Maximin formulado anteriormente tiene una formulación equivalente llamada Programación Matemática (MP) que se deriva del hecho de que
donde denota la línea real.
Así que aquí están uno al lado del otro el modelo de robustez de info-gap y las dos formulaciones equivalentes del paradigma maximin genérico :
Tenga en cuenta que la equivalencia entre estas tres representaciones de la misma situación de toma de decisiones no utiliza variables ficticias. Se basa en la equivalencia.
derivado directamente de la definición de la función característica .
Claramente entonces, el modelo de robustez de info-gap es un ejemplo del modelo maximin genérico .
De manera similar, para el modelo de oportunidad de info-gap tenemos
Una vez más, cabe destacar que la equivalencia entre estas tres representaciones de la misma situación de toma de decisiones no utiliza variables ficticias. Se basa en la equivalencia.
derivado directamente de la definición de la función característica .
Por lo tanto, para "ayudar" al DM a minimizar , una Naturaleza comprensiva seleccionará una que minimice sobre .
Claramente, el modelo de oportunidad de info-gap es un ejemplo del modelo minimin genérico.
Por supuesto, existen otras representaciones válidas de los modelos de robustez/oportunidad. Por ejemplo, en el caso del modelo de robustez, los resultados se pueden definir de la siguiente manera (Sniedovich 2007 [70] ):
donde la operación binaria se define de la siguiente manera:
El formato MP correspondiente del modelo Maximin sería entonces el siguiente:
En palabras, para maximizar la robustez, el DM selecciona el valor más grande de tal que la restricción de desempeño sea satisfecha por todos . En lenguaje sencillo: el DM selecciona el valor más grande cuyo peor resultado en la región de incertidumbre de tamaño satisface el requisito de desempeño.
Como regla general, las formulaciones clásicas de Maximin no son particularmente útiles cuando se trata de resolver los problemas que representan, ya que no se dispone de ningún solucionador Maximin de "propósito general" (Rustem y Howe 2002 [60] ).
Por lo tanto, es una práctica común simplificar la formulación clásica con miras a derivar una formulación que sea fácilmente susceptible de solución. Esta es una tarea específica de un problema que implica explotar las características específicas de un problema. En este sentido , el formato de programación matemática de Maximin suele ser más fácil de usar.
El mejor ejemplo es, por supuesto, el modelo clásico de Maximin de juegos de suma cero para dos personas que, una vez simplificado, se reduce a un modelo de programación lineal estándar (Thie 1988, [72] págs. 314-317) que se resuelve fácilmente mediante algoritmos de programación lineal. .
Para reiterar, este modelo de programación lineal es un ejemplo del modelo genérico de Maximin obtenido mediante la simplificación de la formulación clásica de Maximin del juego de suma cero de 2 personas .
Otro ejemplo es la programación dinámica donde el paradigma Maximin se incorpora en la ecuación funcional de programación dinámica que representa procesos de decisión secuenciales que están sujetos a una incertidumbre severa (por ejemplo, Sniedovich 2003 [73] [74] ).
Recordemos que en lenguaje sencillo el paradigma Maximin sostiene lo siguiente:
Regla de MaximinoLa regla maximin nos dice que clasifiquemos las alternativas según sus peores resultados posibles: debemos adoptar la alternativa cuyo peor resultado sea superior al peor resultado de las demás.
Rawls (1971, pág.152)
El modelo de robustez de Info-gap es un ejemplo simple de este paradigma que se caracteriza por un espacio de decisión específico, espacios de estados y una función objetivo, como se discutió anteriormente.
Se puede ganar mucho viendo la teoría de la brecha de información desde esta perspectiva.