Álgebra de eventos condicionales

En teoría de probabilidad , un álgebra de eventos condicionales ( ACE ) es una alternativa a un álgebra booleana estándar de eventos posibles (un conjunto de eventos posibles relacionados entre sí por las operaciones familiares y , o , y no ) que contiene no solo eventos ordinarios sino también eventos condicionales que tienen la forma "si A , entonces B ". La motivación habitual para un ACE es fundamentar la definición de una función de probabilidad para eventos, P , que satisface la ecuación P (si A, entonces B ) = P ( A y B ) / P ( A ).

Motivación

En la teoría de probabilidad estándar , la ocurrencia de un evento corresponde a un conjunto de resultados posibles, cada uno de los cuales es un resultado que corresponde a la ocurrencia del evento. P ( A ), la probabilidad del evento A , es la suma de las probabilidades de todos los resultados que corresponden al evento A ; P ( B ) es la suma de las probabilidades de todos los resultados que corresponden al evento B ; y P ( A y B ) es la suma de las probabilidades de todos los resultados que corresponden tanto a A como a B . En otras palabras, y , habitualmente representado por el símbolo lógico ∧ , se interpreta como intersección de conjuntos: P ( A ∧ B ) = P ( A ∩ B ). En la misma línea, o , ∨, se convierte en unión de conjuntos, ∪, y no , ¬, se convierte en complementación de conjuntos, ′. Cualquier combinación de eventos que utilice las operaciones y , o , y no también es un evento, y asignar probabilidades a todos los resultados genera una probabilidad para cada evento. En términos técnicos, esto significa que el conjunto de eventos y las tres operaciones juntas constituyen un álgebra booleana de conjuntos, con una función de probabilidad asociada .

En la práctica estándar, P (si A , entonces B ) no se interpreta como P ( A′∪B ), siguiendo la regla de implicación material , sino como la probabilidad condicional de B dado A , P ( B | A ) = P (A∩B ) / P ( A ) . Esto plantea una pregunta: ¿qué pasa con una probabilidad como P (si A , entonces B , y si C , entonces D )? Para esto, no hay una respuesta estándar. Lo que se necesitaría, por coherencia, es un tratamiento de si-entonces como una operación binaria, →, tal que para los eventos condicionales A → B y C → D , P ( A → B ) = P ( B | A ), P ( C → D ) = P ( D | C ), y P (( A → B )∧( C → D )) estén bien definidos y sean razonables. Filósofos, incluido Robert Stalnaker, argumentaron que, idealmente, un álgebra de eventos condicionales, o CEA, admitiría una función de probabilidad que cumpliera tres condiciones:

1. La función de probabilidad satisface los axiomas habituales .

2. Para dos eventos ordinarios cualesquiera A y B , si P ( A ) > 0, entonces P ( A → B ) = P ( B | A ) = P ( A ∧ B ) / P ( A ).

3. Para el evento ordinario A y la función de probabilidad aceptable P , si P ( A ) > 0, entonces P _A = P ( ⋅ | A ), la función producida al condicionar A , también es una función de probabilidad aceptable.

Sin embargo, David Lewis demostró en 1976 un hecho que ahora se conoce como el resultado de trivialidad de Lewis : estas condiciones solo se pueden cumplir con enfoques casi estándar en ejemplos triviales. En particular, esas condiciones solo se pueden cumplir cuando hay solo dos resultados posibles, como, por ejemplo, con un lanzamiento de moneda. Con tres o más resultados posibles, construir una función de probabilidad requiere elegir cuál de las tres condiciones anteriores violar. Interpretar A → B como A ′ ∪ B produce un álgebra booleana ordinaria que viola 2. Con CEA, la elección es entre 1 y 3. ^[1]

Tipos de álgebra de eventos condicionales

CEA de tres eventos

Los CEA tri-evento se inspiran en la lógica trivaluada , donde la identificación de conjunción lógica, disyunción y negación con operaciones de conjuntos simples ya no se aplica. Para los eventos ordinarios A y B , el tri-evento A → B ocurre cuando A y B ocurren, no ocurre cuando A ocurre pero B no, y es indeciso cuando A no ocurre. (El término “tri-evento” proviene de de Finetti (1935): triévénement .) Los eventos ordinarios, que nunca son indecisos, se incorporan al álgebra como tri-eventos condicionales a Ω, el evento vacío representado por todo el espacio muestral de resultados; por lo tanto, A se convierte en Ω → A .

Puesto que hay muchas lógicas trivalentes, hay muchas álgebras tri-evento posibles. Sin embargo, dos tipos han atraído más interés que los otros. En un tipo, A ∧ B y A ∨ B son cada uno indecisos sólo cuando tanto A como B son indecisos; cuando sólo uno de ellos lo es, la conjunción o disyunción sigue al otro conjunto o disyunto. Cuando la negación se maneja de la manera obvia, con ¬ A indeciso sólo en caso de que A lo sea, este tipo de álgebra tri-evento corresponde a una lógica trivalente propuesta por Sobociński (1920) y favorecida por Belnap (1973), y también implícita en la “cuasi-conjunción” de Adams (1975) para condicionales. Schay (1968) fue el primero en proponer un tratamiento algebraico, que Calabrese (1987) desarrolló de forma más adecuada. ^[2]

El otro tipo de álgebra de tres eventos trata la negación de la misma manera que el primero, pero trata la conjunción y la disyunción como funciones mínima y máxima, respectivamente, con la ocurrencia como el valor alto, el fracaso como el valor bajo y la indecisión en el medio. Este tipo de álgebra de tres eventos corresponde a una lógica de tres valores propuesta por Łukasiewicz (1920) y también defendida por de Finetti (1935). Goodman, Nguyen y Walker (1991) finalmente proporcionaron la formulación algebraica.

La probabilidad de cualquier tri-evento se define como la probabilidad de que ocurra dividida por la probabilidad de que ocurra o deje de ocurrir. ^[3] Con esta convención, las condiciones 2 y 3 anteriores se satisfacen para los dos tipos principales de CEA de tri-evento. Sin embargo, la condición 1 falla. En un álgebra de tipo Sobociński, ∧ no se distribuye sobre ∨, por lo que P ( A ∧ ( B ∨ C )) y P (( A ∧ B ) ∨ ( A ∧ C )) no necesitan ser iguales. ^[4] En un álgebra de tipo Łukasiewicz, ∧ se distribuye sobre ∨ pero no sobre exclusivo o, ( A B = ( A ∧ ¬ B ) ∨ (¬ A ∧ B )). ^[5] Además, los CEA tri-evento no son redes complementadas , solo pseudocomplementadas , porque en general, ( A → B ) ∧ ¬( A → B ) no puede ocurrir pero puede ser indeciso y por lo tanto no es idéntico a Ω → ∅, el elemento inferior de la red. Esto significa que P ( C ) y P ( C (( A → B ) ∧ ¬( A → B ))) pueden diferir, cuando clásicamente no lo harían. $\oplus$ $\oplus$ $\oplus$

CEA del espacio de productos

Si P (si A , entonces B ) se considera como la probabilidad de que A -y- B ocurran antes de A -y- no- B en una serie de ensayos, esto se puede calcular como una suma infinita de probabilidades simples: la probabilidad de A -y- B en el primer ensayo, más la probabilidad de no- A (y B o no- B ) en el primer ensayo y A -y- B en el segundo, más la probabilidad de no- A en los primeros dos ensayos y A -y- B en el tercero, y así sucesivamente, es decir, P ( A ∧ B ) + P (¬ A ) P ( A ∧ B ) + P (¬ A ) ²P ( A ∧ B ) + …, o, en forma factorizada, P ( A ∧ B )[1 + P (¬ A ) + P (¬ A ) ² + …]. Dado que el segundo factor es la expansión de la serie de Maclaurin de 1 / [1 – P ( ¬A )] = 1 / P ( A ), la suma infinita es igual a P ( A ∧ B ) / P ( A ) = P ( B | A ).

La suma infinita es en sí misma una probabilidad simple, pero con el espacio muestral que ahora contiene no resultados ordinarios de ensayos individuales sino secuencias infinitas de resultados ordinarios. Por lo tanto, la probabilidad condicional P ( B | A ) se convierte en probabilidad simple P ( B → A ) reemplazando Ω, el espacio muestral de todos los resultados ordinarios, con Ω*, el espacio muestral de todas las secuencias de resultados ordinarios, e identificando el evento condicional A → B con el conjunto de secuencias donde el primer resultado ( A ∧ B ) viene antes del primer resultado ( A ∧ ¬ B ). En notación de producto cartesiano , Ω* = Ω × Ω × Ω × …, y A → B es la unión infinita [( A ∩ B ) × Ω × Ω × …] ∪ [ A ′ × ( A ∩ B ) × Ω × Ω × …] ∪ [ A ′ × A ′ × ( A ∩ B ) × Ω × Ω × … ∪ …. El evento incondicional A está, nuevamente, representado por el evento condicional Ω → A. ^[6] A diferencia de los CEA de trieventos, este tipo de CEA admite la identificación de ∧, ∨ y ¬ con las operaciones familiares ∩, ∪ y ′ no solo para eventos ordinarios e incondicionales sino también para los condicionales. Debido a que Ω* es un espacio definido por un producto cartesiano infinitamente largo, el álgebra booleana de subconjuntos de eventos condicionales de Ω* se denomina CEA de espacio de producto. Este tipo de CEA fue introducido por van Fraassen (1976), en respuesta al resultado de Lewis, y luego fue descubierto de forma independiente por Goodman y Nguyen (1994).

Las funciones de probabilidad asociadas con los CEA del espacio de productos satisfacen las condiciones 1 y 2 anteriores. Sin embargo, dada la función de probabilidad P que satisface las condiciones 1 y 2, si P ( A ) > 0, se puede demostrar que P _A ( C | B ) = P ( C | A ∧ B ) y P _A ( B → C ) = P ( B ∧ C | A ) + P ( B ′ | A ) P ( C | B ). ^[7] Si A , B y C son compatibles por pares pero P ( A ∧ B ∧ C ) = 0, entonces P ( C | A ∧ B ) = P ( B ∧ C | A ) = 0 pero P ( B ′ | A ) P ( C | B ) > 0. Por lo tanto, P _A ( B → C ) no es igual de manera confiable a P _A ( C | B ). Dado que P _A no cumple la condición 2, P no cumple la condición 3.

Si-entonces anidados

¿Qué sucede con las construcciones condicionales anidadas? En un CEA de tres eventos, las construcciones anidadas por la derecha se manejan más o menos automáticamente, ya que es natural decir que A → ( B → C ) toma el valor de B → C (posiblemente indeciso) cuando A es verdadero y es indeciso cuando A es falso. Sin embargo, la anidación por la izquierda requiere una elección más deliberada: cuando A → B es indeciso, ¿debería ( A → B ) → C ser indeciso o debería tomar el valor de C ? Las opiniones varían. Calabrese adopta la última visión, identificando ( A → B ) → ( C → D ) con ((¬ A ∨ B ) ∧ C ) → D . ^[8]

Con un CEA de espacio de producto, los condicionales anidados requieren construcciones de secuencias anidadas: evaluar P (( A → B ) → ( C → D )) requiere un espacio muestral de metasecuencias de secuencias de resultados ordinarios. Las probabilidades de las secuencias ordinarias se calculan como antes. Dada una serie de ensayos donde los resultados son secuencias de resultados ordinarios, P (( A → B ) → ( C → D )) es P ( C → D | A → B ) = P (( A → B ) ∧ ( C → D )) / P ( A → B ), la probabilidad de que una (( A → B ) ∧ ( C → B ))-secuencia se encuentre antes que una (( A → B ) ∧ ¬( C → B ))-secuencia. Las iteraciones de orden superior de condicionales requieren construcciones metasecuenciales de orden superior. ^[9]

En cualquiera de los dos tipos principales de CEA de trievento, A → ( B → C ) = ( A ∧ B ) → C . ^[10] Los CEA del espacio de productos, por otra parte, no admiten esta identidad. El último hecho se puede inferir del fracaso, ya señalado, de P _A ( B → C ) para ser igual a P _A ( C | B ), ya que P _A ( C | B ) = P (( A ∧ B ) → C ) y P _A ( B → C ) = P ( A → ( B → C )). Sin embargo, para un análisis directo, considere una metasecuencia cuya primera secuencia miembro comienza con un resultado ( A ∧ ¬ B ∧ C ), seguido por un resultado (¬ A ∧ B ∧ C ), seguido por un resultado ( A ∧ B ∧ ¬ C ). Esa metasecuencia pertenecerá al evento A → ( B → C ), porque la primera secuencia miembro es una secuencia ( A ∧ ( B → C )), pero la metasecuencia no pertenecerá al evento ( A ∧ B ) → C , porque la primera secuencia miembro es una secuencia (( A ∧ B ) → ¬ C ).

Aplicaciones

El impulso inicial de los CEA es teórico (es decir, el desafío de responder al resultado de trivialidad de Lewis ), pero se han propuesto aplicaciones prácticas. Si, por ejemplo, los eventos A y C involucran señales emitidas por estaciones de radar militares y los eventos B y D involucran lanzamientos de misiles , una fuerza militar opuesta con un sistema de defensa antimisiles automatizado puede querer que el sistema sea capaz de calcular P (( A → B ) ∧ ( C → D )) y/o P (( A → B ) → ( C → D )). ^[11] Otras aplicaciones van desde la interpretación de imágenes ^[12] hasta la detección de ataques de denegación de servicio en redes informáticas. ^[13]

Notas

^ La literatura de CEA utiliza ( B | A ) para significar “si A , entonces B ”, pero esta convención hace que ciertos puntos sean más difíciles de expresar con claridad. Por esa razón, y para mejorar la legibilidad, el presente artículo utiliza el más conocido A → B .
^ Schay especificó dos álgebras, una asociada con ∧ y la otra con ∨. Esta línea de desarrollo no ha sido seguida por otros.
^ De Finetti 1935, p. 184. Técnicamente, hay dos funciones de probabilidad: P , que abarca eventos ordinarios, y P *, que está determinada por P y abarca eventos condicionales. Aquí ignoraremos esa sutileza de notación.
^ Consideremos el caso donde A es verdadero, B está indeciso y C es falso.
^ Con A B indeciso cuando A o B lo son, compare A ∧ ( B C ) y ( A ∧ B ) ( A ∧ C ) cuando A es indeciso y B y C son ambos verdaderos. $\oplus$ $\oplus$ $\oplus$
^ Dado que Ω ∩ A = A y Ω′ = ∅, la unión infinita que representa Ω → A se reduce a A × Ω × Ω × Ω ×….
^ Goodman, Mahler y Nguyen 1999, p. 7, proporciona la fórmula necesaria para el último resultado: P (( A → B ) ∧ ( C → D )) = [ P ( A ∧ B ∧ C ∧ D ) + P ( A ′ ∧ C ∧ D ) P ( B | A ) + P ( C ′ ∧ A ∧ B ) P ( D | C )] / P ( A ∨ C ). El caso especial de interés es P ((Ω → A ) ∧ ( B → C )).
^ Calabrese 1987, pág. 217.
^ Goodman y Nguyen 1995, págs. 281-283.
^ Esta identidad corresponde lógicamente a la ley de importación-exportación, como se la llama.
^ Goodman, Mahler y Nguyen 1999.
^ Kelly, Derin y Gong 1999.
^ Sun y otros 2014.

Referencias

Adams, EW 1975. La lógica de los condicionales. D. Reidel, Dordrecht.

Bamber, D., Goodman, IR y Nguyen, HT 2004. "Deducción a partir del conocimiento condicional". Soft Computing 8: 247–255.

Belnap, ND 1973. "Cuantificación restringida y aserción condicional", en H. Leblanc (ed.), Verdad, sintaxis y modalidad, Holanda Septentrional, Amsterdam. 48–75.

Calabrese, P. 1987. "Una síntesis algebraica de los fundamentos de la lógica y la probabilidad". Ciencias de la Información 42:187-237.

de Finetti, Bruno. 1935. "La lógica de la probabilidad". Actes du Congrès Internacional Filosofía Científica . París.

van Fraassen, Bas C. 1976. "Probabilidades de condicionales" en WL Harper y CA Hooker (eds.), Fundamentos de la teoría de la probabilidad, la inferencia estadística y las teorías estadísticas de la ciencia , vol. ID Reidel, Dordrecht, págs. 261–308.

Goodman, IR, Mahler, RPS y Nguyen, HT 1999. "¿Qué es el álgebra de eventos condicionales y por qué debería importarnos?" Actas de SPIE , vol. 3720.

Goodman, IR, Nguyen, HT y Walker, E .A. 1991. Inferencia condicional y lógica para sistemas inteligentes: una teoría de condicionamiento sin medida . Oficina del Jefe de Investigación Naval, Arlington, Virginia.

Goodman, IR y Nguyen, HT 1994. "Una teoría de la información condicional para la inferencia probabilística en sistemas inteligentes: II, Enfoque del espacio de productos; III Apéndice matemático". Ciencias de la Información 76:13-42; 75: 253-277.

Goodman, IR y Nguyen, HT 1995. "Fundamentos matemáticos de los condicionales y sus asignaciones probabilísticas". Revista internacional de incertidumbre, imprecisión y sistemas basados en el conocimiento 3(3): 247-339

Kelly, PA, Derin, H. y Gong, W.-B. 1999. "Algunas aplicaciones de eventos condicionales y conjuntos aleatorios para estimación de imágenes y modelado de sistemas". Actas de SPIE 3720: 14-24.

Łukasiewicz, J. 1920. "O logice trójwartościowej" (en polaco). Ruch Filozoficzny 5:170–171. Traducción al inglés: "Sobre la lógica de tres valores", en L. Borkowski (ed.), Obras seleccionadas de Jan Łukasiewicz , Holanda Septentrional, Ámsterdam, 1970, págs. ISBN 0-7204-2252-3

Schay, Geza. 1968. "Un álgebra de eventos condicionales". Revista de análisis matemático y aplicaciones 24: 334-344.

Sobociński, B. 1952. "Axiomatización de un sistema parcial de cálculo trivalente de proposiciones". Journal of Computing Systems 1(1):23-55.

Sun, D., Yang, K., Jing, X., Lv, B. y Wang, Y. 2014. "Detección de tráfico de red anormal basada en álgebra de eventos condicionales". Applied Mechanics and Materials 644-650: 1093-1099.