stringtranslate.com

teorema de cox

El teorema de Cox , que lleva el nombre del físico Richard Threlkeld Cox , es una derivación de las leyes de la teoría de la probabilidad a partir de un determinado conjunto de postulados . [1] [2] Esta derivación justifica la llamada interpretación "lógica" de la probabilidad, ya que las leyes de probabilidad derivadas del teorema de Cox son aplicables a cualquier proposición. La probabilidad lógica (también conocida como bayesiana objetiva) es un tipo de probabilidad bayesiana . Otras formas de bayesianismo, como la interpretación subjetiva, reciben otras justificaciones.

Las suposiciones de Cox

Cox quería que su sistema cumpliera las siguientes condiciones:

  1. Divisibilidad y comparabilidad: la plausibilidad de una proposición es un número real y depende de la información que tenemos relacionada con la proposición.
  2. Sentido común: las plausibilidades deben variar sensiblemente con la evaluación de plausibilidades en el modelo.
  3. Coherencia: si la verosimilitud de una proposición se puede derivar de muchas maneras, todos los resultados deben ser iguales.

Los postulados aquí expuestos están tomados de Arnborg y Sjödin. [3] [4] [5] El " sentido común " incluye coherencia con la lógica aristotélica en el sentido de que proposiciones lógicamente equivalentes tendrán la misma plausibilidad.

Los postulados establecidos originalmente por Cox no eran matemáticamente rigurosos (aunque más que la descripción informal anterior), como señaló Halpern . [6] [7] Sin embargo, parece posible aumentarlos con varias suposiciones matemáticas hechas implícita o explícitamente por Cox para producir una prueba válida.

Notación de Cox:

La plausibilidad de una proposición dada alguna información relacionada se denota por .

Los postulados y ecuaciones funcionales de Cox son:

En forma de ecuación funcional.
Debido a la naturaleza asociativa de la conjunción en lógica proposicional, la coherencia con la lógica da una ecuación funcional que dice que la función es una operación binaria asociativa .
Todas las operaciones binarias asociativas estrictamente crecientes sobre números reales son isomorfas a la multiplicación de números en un subintervalo de [0, +∞] , lo que significa que existe una función monótona que asigna plausibilidades a [0, +∞] tal que
Esto será válido para cualquier proposición que conduzca a
Esto será válido para cualquier proposición que, sin pérdida de generalidad, conduzca a una solución.
Debido al requisito de monotonicidad, esto significa que asigna plausibilidades al intervalo [0, 1] .
Esto postula la existencia de una función tal que
Debido a que "una doble negativa es afirmativa", la coherencia con la lógica da una ecuación funcional
diciendo que la función es una involución , es decir, que es su propia inversa.
Las ecuaciones funcionales anteriores y la coherencia con la lógica implican que
Como es lógicamente equivalente a , también obtenemos
Si, en particular, , entonces también y y obtenemos
y
Abreviando y obtenemos la ecuación funcional.

Implicaciones de los postulados de Cox

Las leyes de probabilidad que se derivan de estos postulados son las siguientes. [8] Sea la plausibilidad de la proposición dada que satisface los postulados de Cox. Entonces hay una función que asigna plausibilidades al intervalo [0,1] y un número positivo tal que

  1. La certeza está representada por

Es importante señalar que los postulados implican sólo estas propiedades generales. Podemos recuperar las leyes habituales de la probabilidad estableciendo una nueva función, denotada convencionalmente o igual a . Luego obtenemos las leyes de probabilidad en una forma más familiar:

  1. Cierta verdad está representada por , y cierta falsedad por

La regla 2 es una regla para la negación y la regla 3 es una regla para la conjunción. Dado que cualquier proposición que contenga conjunción, disyunción y negación se puede reformular de manera equivalente usando solo conjunción y negación (la forma normal conjuntiva ), ahora podemos manejar cualquier proposición compuesta.

Las leyes así derivadas producen una aditividad finita de probabilidad, pero no una aditividad contable . La formulación teórica de medidas de Kolmogorov supone que una medida de probabilidad es contablemente aditiva. Esta condición ligeramente más fuerte es necesaria para obtener ciertos resultados. Un ejemplo elemental (en el que esta suposición simplemente simplifica el cálculo en lugar de ser necesaria) es que la probabilidad de ver cara por primera vez después de un número par de lanzamientos en una secuencia de lanzamientos de moneda es . [9]

Interpretación y discusión adicional.

El teorema de Cox ha llegado a utilizarse como una de las justificaciones para el uso de la teoría de probabilidad bayesiana . Por ejemplo, en Jaynes se analiza en detalle en los capítulos 1 y 2 y es la piedra angular del resto del libro. [8] La probabilidad se interpreta como un sistema formal de lógica , la extensión natural de la lógica aristotélica (en la que cada afirmación es verdadera o falsa) al ámbito del razonamiento en presencia de incertidumbre.

Se ha debatido hasta qué punto el teorema excluye modelos alternativos para razonar sobre la incertidumbre . Por ejemplo, si se abandonaran ciertos supuestos matemáticos "no intuitivos", se podrían idear alternativas, por ejemplo, un ejemplo proporcionado por Halpern. [6] Sin embargo, Arnborg y Sjödin [3] [4] [5] sugieren postulados adicionales de "sentido común", que permitirían relajar los supuestos en algunos casos y al mismo tiempo descartar el ejemplo de Halpern. Hardy [10] o Dupré y Tipler idearon otros enfoques . [11]

La formulación original del teorema de Cox se encuentra en Cox (1946), que se amplía con resultados adicionales y más discusión en Cox (1961). Jaynes [8] cita a Abel [12] por el primer uso conocido de la ecuación funcional de asociatividad. János Aczél [13] proporciona una larga prueba de la "ecuación de asociatividad" (páginas 256-267). Jaynes [8] : 27  reproduce la prueba más breve de Cox en la que se supone la diferenciabilidad. Una guía del teorema de Cox de Van Horn tiene como objetivo presentar al lector de forma exhaustiva todas estas referencias. [14]

Baoding Liu, el fundador de la teoría de la incertidumbre , critica el teorema de Cox por suponer que el valor de verdad de la conjunción es una función dos veces diferenciable de los valores de verdad de las dos proposiciones y , es decir , que excluye la "medida incierta" de la teoría de la incertidumbre desde su inicio, porque la función , [a] utilizada en la teoría de la incertidumbre, no es diferenciable con respecto a y . [15] Según Liu, "no existe ninguna evidencia de que el valor de verdad de la conjunción esté completamente determinado por los valores de verdad de las proposiciones individuales, y mucho menos una función dos veces diferenciable". [15]

Ver también

Notas

  1. ^ Liu usa el símbolo ∧ como "operador mínimo", probablemente refiriéndose a una operación binaria que toma dos números y devuelve el menor (o mínimo) de los dos.

Referencias

  1. ^ Cox, RT (1946). "Probabilidad, frecuencia y expectativa razonable". Revista Estadounidense de Física . 14 (1): 1–10. Código bibliográfico : 1946AmJPh..14....1C. doi :10.1119/1.1990764.
  2. ^ Cox, RT (1961). El álgebra de la inferencia probable . Baltimore, MD: Prensa de la Universidad Johns Hopkins.
  3. ^ ab Stefan Arnborg y Gunnar Sjödin, Sobre los fundamentos del bayesianismo, Preimpresión: Nada, KTH (1999) - http://www.stats.org.uk/cox-theorems/ArnborgSjodin2001.pdf
  4. ^ ab Stefan Arnborg y Gunnar Sjödin, Una nota sobre los fundamentos del bayesianismo, Preimpresión: Nada, KTH (2000a) - http://www.stats.org.uk/bayesian/ArnborgSjodin1999.pdf
  5. ^ ab Stefan Arnborg y Gunnar Sjödin, "Reglas de Bayes en modelos finitos", en Conferencia europea sobre inteligencia artificial, Berlín, (2000b) - https://frontiersinai.com/ecai/ecai2000/pdf/p0571.pdf
  6. ^ ab Joseph Y. Halpern, "Un contraejemplo de los teoremas de Cox y Fine", Journal of AI research, 10, 67–85 (1999) — http://www.jair.org/media/536/live-536- 2054-jair.ps.Z Archivado el 25 de noviembre de 2015 en Wayback Machine.
  7. ^ Joseph Y. Halpern, "Apéndice técnico, revisión del teorema de Cox", Journal of AI research, 11, 429–435 (1999) — http://www.jair.org/media/644/live-644-1840-jair .ps.Z Archivado el 25 de noviembre de 2015 en Wayback Machine.
  8. ^ abcd Edwin Thompson Jaynes , Teoría de la probabilidad: la lógica de la ciencia, Cambridge University Press (2003). - versión preimpresa (1996) en "Copia archivada". Archivado desde el original el 19 de enero de 2016 . Consultado el 19 de enero de 2016 .{{cite web}}: CS1 maint: archived copy as title (link); Capítulos 1 a 3 de la versión publicada en http://bayes.wustl.edu/etj/prob/book.pdf
  9. ^ Price, David T. (1974), "Aditividad contable para medidas de probabilidad", American Mathematical Monthly , 81 : 886–889, doi : 10.2307/2319450, JSTOR  2319450, MR  0350798
  10. ^ Michael Hardy, "Álgebras booleanas escaladas", Avances en matemáticas aplicadas , agosto de 2002, páginas 243–292 (o preimpresión); Hardy ha dicho: "Afirmo allí que creo que las suposiciones de Cox son demasiado fuertes, aunque realmente no digo por qué. Sí digo con qué las reemplazaría". (La cita proviene de una página de discusión de Wikipedia, no del artículo).
  11. ^ Dupré, Maurice J. y Tipler, Frank J. (2009). "Nuevos axiomas para una probabilidad bayesiana rigurosa", Análisis bayesiano , 4 (3): 599-606.
  12. ^ Niels Henrik Abel "Untersuchung der Functionen zweier unabhängig veränderlichen Gröszen x und y , wie f ( x , y ), welche die Eigenschaft haben, dasz f [ z , f ( x , y )] eine symmetrische Function von z , x und y ist.", Jour. Reina u. ángulo. Matemáticas. (Crelle's Jour.), 1, 11-15, (1826).
  13. ^ János Aczél , Conferencias sobre ecuaciones funcionales y sus aplicaciones, Academic Press, Nueva York, (1966).
  14. ^ Van Horn, KS (2003). "Construcción de una lógica de inferencia plausible: una guía para el teorema de Cox". Revista internacional de razonamiento aproximado . 34 : 3–24. doi :10.1016/S0888-613X(03)00051-3.
  15. ^ ab Liu, Baoding (2015). Teoría de la incertidumbre . Springer Uncertainty Research (4ª ed., 2015 ed.). Berlín, Heidelberg: Springer Berlín Heidelberg: Pie de imprenta: Springer. págs. 459–460. ISBN 978-3-662-44354-5.

Otras lecturas