probabilidad bayesiana

La probabilidad bayesiana ( / ˈ b eɪ z i ən / BAY -zee-ən o / ˈ b eɪ ʒ ən / BAY -zhən ) ^[1] es una interpretación del concepto de probabilidad , en la que, en lugar de frecuencia o propensión de algunos En un fenómeno, la probabilidad se interpreta como una expectativa razonable ^[2] que representa un estado de conocimiento ^[3] o como una cuantificación de una creencia personal. ^[4]

La interpretación bayesiana de la probabilidad puede verse como una extensión de la lógica proposicional que permite razonar con hipótesis ; ^[5]^[6] es decir, con proposiciones cuya verdad o falsedad se desconoce. En la visión bayesiana, se asigna una probabilidad a una hipótesis, mientras que bajo la inferencia frecuentista , una hipótesis generalmente se prueba sin que se le asigne una probabilidad.

La probabilidad bayesiana pertenece a la categoría de probabilidades probatorias; Para evaluar la probabilidad de una hipótesis, el probabilista bayesiano especifica una probabilidad previa . Esto, a su vez, se actualiza a una probabilidad posterior a la luz de datos nuevos y relevantes (evidencia). ^[7] La interpretación bayesiana proporciona un conjunto estándar de procedimientos y fórmulas para realizar este cálculo.

El término bayesiano deriva del matemático y teólogo del siglo XVIII Thomas Bayes , quien proporcionó el primer tratamiento matemático de un problema no trivial de análisis de datos estadísticos utilizando lo que hoy se conoce como inferencia bayesiana . ^[8]^{: 131} El matemático Pierre-Simon Laplace fue pionero y popularizó lo que ahora se llama probabilidad bayesiana. ^[8]^{: 97–98}

metodología bayesiana

Los métodos bayesianos se caracterizan por los conceptos y procedimientos siguientes:

El uso de variables aleatorias , o más generalmente cantidades desconocidas, ^[9] para modelar todas las fuentes de incertidumbre en modelos estadísticos, incluida la incertidumbre resultante de la falta de información (ver también incertidumbre aleatoria y epistémica ).
La necesidad de determinar la distribución de probabilidad previa teniendo en cuenta la información (previa) disponible.
El uso secuencial del teorema de Bayes : a medida que haya más datos disponibles, calcule la distribución posterior utilizando el teorema de Bayes; posteriormente, la distribución posterior se convierte en la siguiente anterior.
Mientras que para el frecuentista una hipótesis es una proposición (que debe ser verdadera o falsa ) de modo que la probabilidad frecuentista de una hipótesis sea 0 o 1, en la estadística bayesiana la probabilidad que se puede asignar a una hipótesis también puede ser en un rango de 0 a 1 si el valor de verdad es incierto.

Probabilidades bayesianas objetivas y subjetivas

En términos generales, existen dos interpretaciones de la probabilidad bayesiana. Para los objetivistas, que interpretan la probabilidad como una extensión de la lógica , la probabilidad cuantifica la expectativa razonable de que todos (incluso un "robot") que comparte el mismo conocimiento deberían compartirlo de acuerdo con las reglas de la estadística bayesiana, lo que puede justificarse mediante el teorema de Cox . ^[3]^[10] Para los subjetivistas, la probabilidad corresponde a una creencia personal. ^[4] La racionalidad y la coherencia permiten una variación sustancial dentro de las limitaciones que plantean; las restricciones están justificadas por el argumento del libro holandés o por la teoría de la decisión y el teorema de De Finetti . ^[4] Las variantes objetiva y subjetiva de la probabilidad bayesiana difieren principalmente en su interpretación y construcción de la probabilidad previa.

Historia

El término bayesiano deriva de Thomas Bayes (1702-1761), quien demostró un caso especial de lo que ahora se llama teorema de Bayes en un artículo titulado " Un ensayo para resolver un problema en la doctrina de las posibilidades ". ^[11] En ese caso especial, las distribuciones anterior y posterior fueron distribuciones beta y los datos provinieron de ensayos de Bernoulli . Fue Pierre-Simon Laplace (1749-1827) quien introdujo una versión general del teorema y lo utilizó para abordar problemas de mecánica celeste , estadística médica, confiabilidad y jurisprudencia . ^[12] La inferencia bayesiana temprana, que utilizaba antecedentes uniformes siguiendo el principio de razón insuficiente de Laplace , se llamaba " probabilidad inversa " (porque infiere hacia atrás de las observaciones a los parámetros, o de los efectos a las causas). ^[13] Después de la década de 1920, la "probabilidad inversa" fue suplantada en gran medida por una colección de métodos que llegaron a denominarse estadísticas frecuentistas . ^[13]

En el siglo XX, las ideas de Laplace se desarrollaron en dos direcciones, dando lugar a corrientes objetivas y subjetivas en la práctica bayesiana.La teoría de la probabilidad de Harold Jeffreys (publicada por primera vez en 1939) jugó un papel importante en el resurgimiento de la visión bayesiana de la probabilidad, seguida de los trabajos de Abraham Wald (1950) y Leonard J. Savage (1954). El propio adjetivo bayesiano data de la década de 1950; El bayesianismo derivado , el neobayesianismo , es acuñado en la década de 1960. ^[14]^[15]^[16] En la corriente objetivista, el análisis estadístico depende únicamente del modelo asumido y de los datos analizados. ^[17] No es necesario que intervengan decisiones subjetivas. Por el contrario, los estadísticos "subjetivistas" niegan la posibilidad de un análisis plenamente objetivo para el caso general.

En la década de 1980, hubo un crecimiento espectacular en la investigación y las aplicaciones de los métodos bayesianos, atribuido principalmente al descubrimiento de los métodos de Monte Carlo de la cadena de Markov y la consiguiente eliminación de muchos de los problemas computacionales, y a un creciente interés en aplicaciones complejas y no estándar. ^[18] Si bien las estadísticas frecuentistas siguen siendo sólidas (como lo demuestra el hecho de que gran parte de la enseñanza universitaria se basa en ellas ^[19] ), los métodos bayesianos son ampliamente aceptados y utilizados, por ejemplo, en el campo del aprendizaje automático . ^[20]

Justificación

El uso de probabilidades bayesianas como base de la inferencia bayesiana ha sido respaldado por varios argumentos, como los axiomas de Cox , el argumento del libro holandés , argumentos basados en la teoría de la decisión y el teorema de De Finetti .

Enfoque axiomático

Richard T. Cox demostró que la actualización bayesiana se deriva de varios axiomas, incluidas dos ecuaciones funcionales y una hipótesis de diferenciabilidad. ^[10]^[21] El supuesto de diferenciabilidad o incluso continuidad es controvertido; Halpern encontró un contraejemplo basado en su observación de que el álgebra de Boole de enunciados puede ser finito. ^[22] Otras axiomatizaciones han sido sugeridas por varios autores con el propósito de hacer más rigurosa la teoría. ^[9]

Enfoque del libro holandés

Bruno de Finetti propuso el argumento del libro holandés basado en las apuestas. Un corredor de apuestas inteligente hace una apuesta holandesa fijando las probabilidades y las apuestas para garantizar que el corredor de apuestas obtenga ganancias (a expensas de los jugadores) independientemente del resultado del evento (una carrera de caballos, por ejemplo) en el que los jugadores apostaron. Se asocia con probabilidades implícitas en que las probabilidades no sean coherentes .

Sin embargo, Ian Hacking señaló que los argumentos tradicionales de los libros holandeses no especificaban la actualización bayesiana: dejaban abierta la posibilidad de que reglas de actualización no bayesianas pudieran evitar los libros holandeses. Por ejemplo, Hacking escribe ^[23]^[24] "Y ni el argumento del libro holandés, ni ningún otro en el arsenal personalista de pruebas de los axiomas de probabilidad, implica el supuesto dinámico. Ninguno implica el bayesianismo. Así que el personalista requiere el supuesto dinámico "Ser bayesiano. Es cierto que, en coherencia, un personalista podría abandonar el modelo bayesiano de aprender de la experiencia. La sal podría perder su sabor".

De hecho, existen reglas de actualización no bayesianas que también evitan los libros holandeses (como se analiza en la literatura sobre " cinemática de probabilidad " ^[25] tras la publicación de la regla de Richard C. Jeffrey , que a su vez se considera bayesiana ^[26] ). Las hipótesis adicionales suficientes para (exclusivamente) especificar la actualización bayesiana son sustanciales ^[27] y no universalmente se consideran satisfactorias. ^[28]

Enfoque de la teoría de la decisión

Abraham Wald dio una justificación teórica del uso de la inferencia bayesiana (y, por tanto, de las probabilidades bayesianas) , quien demostró que todo procedimiento estadístico admisible es un procedimiento bayesiano o un límite de los procedimientos bayesianos. ^[29] Por el contrario, todo procedimiento bayesiano es admisible . ^[30]

Probabilidades personales y métodos objetivos para construir antecedentes.

Siguiendo el trabajo sobre la teoría de la utilidad esperada de Ramsey y von Neumann , los teóricos de la decisión han explicado el comportamiento racional utilizando una distribución de probabilidad para el agente . Johann Pfanzagl completó la Teoría de los juegos y el comportamiento económico proporcionando una axiomatización de la probabilidad subjetiva y la utilidad, una tarea que von Neumann y Oskar Morgenstern dejaron incompleta : su teoría original suponía que todos los agentes tenían la misma distribución de probabilidad, por conveniencia. ^[31] La axiomatización de Pfanzagl fue respaldada por Oskar Morgenstern: "Von Neumann y yo hemos anticipado... [la cuestión de si las probabilidades] podría, tal vez más típicamente, ser subjetiva y hemos afirmado específicamente que en el último caso se podrían encontrar axiomas a partir de los cuales pudimos derivar la utilidad numérica deseada junto con un número para las probabilidades (cf. p. 19 de La teoría de los juegos y del comportamiento económico). Esto no lo llevamos a cabo; lo demostró Pfanzagl... con todo el rigor necesario". . ^[32]

Ramsey y Savage observaron que la distribución de probabilidad de un agente individual podría estudiarse objetivamente en experimentos. Los procedimientos para probar hipótesis sobre probabilidades (usando muestras finitas) se deben a Ramsey (1931) y de Finetti (1931, 1937, 1964, 1970). Tanto Bruno de Finetti ^[33]^[34] como Frank P. Ramsey ^[34]^[35] reconocen sus deudas con la filosofía pragmática , particularmente (para Ramsey) con Charles S. Peirce . ^[34]^[35]

El "test de Ramsey" para evaluar distribuciones de probabilidad se puede implementar en teoría y ha mantenido ocupados a los psicólogos experimentales durante medio siglo. ^[36] Este trabajo demuestra que las proposiciones de probabilidad bayesiana pueden ser falsificadas y, por lo tanto, cumplen con un criterio empírico de Charles S. Peirce , cuyo trabajo inspiró a Ramsey. (Este criterio de falsabilidad fue popularizado por Karl Popper . ^[37]^[38] )

El trabajo moderno sobre la evaluación experimental de probabilidades personales utiliza los procedimientos de aleatorización, cegamiento y decisión booleana del experimento de Peirce-Jastrow. ^[39] Dado que los individuos actúan de acuerdo con diferentes juicios de probabilidad, las probabilidades de estos agentes son "personales" (pero susceptibles de estudio objetivo).

Las probabilidades personales son problemáticas para la ciencia y para algunas aplicaciones donde los tomadores de decisiones carecen del conocimiento o del tiempo para especificar una distribución de probabilidad informada (sobre la cual están preparados para actuar). Para satisfacer las necesidades de la ciencia y las limitaciones humanas, los estadísticos bayesianos han desarrollado métodos "objetivos" para especificar probabilidades previas.

De hecho, algunos bayesianos han argumentado que el estado previo del conocimiento define la distribución de probabilidad previa (única) para problemas estadísticos "normales"; cf. problemas bien planteados . Encontrar el método correcto para construir tales antecedentes "objetivos" (para clases apropiadas de problemas regulares) ha sido la búsqueda de los teóricos de la estadística desde Laplace hasta John Maynard Keynes , Harold Jeffreys y Edwin Thompson Jaynes . Estos teóricos y sus sucesores han sugerido varios métodos para construir antecedentes "objetivos" (desafortunadamente, no está claro cómo evaluar la "objetividad" relativa de los antecedentes propuestos bajo estos métodos):

Cada uno de estos métodos aporta antecedentes útiles para problemas "regulares" de un parámetro, y cada uno de ellos puede manejar algunos modelos estadísticos desafiantes (con "irregularidad" o varios parámetros). Cada uno de estos métodos ha sido útil en la práctica bayesiana. De hecho, métodos para construir antecedentes "objetivos" (alternativamente, "predeterminados" o "ignorancia") han sido desarrollados por bayesianos declarados subjetivos (o "personales") como James Berger ( Universidad de Duke ) y José-Miguel Bernardo ( Universitat de València ). , simplemente porque esos antecedentes son necesarios para la práctica bayesiana, particularmente en la ciencia. ^[40] La búsqueda de "el método universal para construir antecedentes" continúa atrayendo a los teóricos de la estadística. ^[40]

Por lo tanto, el estadístico bayesiano necesita utilizar antecedentes informados (utilizando experiencia relevante o datos previos) o elegir entre los métodos en competencia para construir antecedentes "objetivos".

Ver también

Un ensayo para resolver un problema en la doctrina de las posibilidades
Epistemología bayesiana
Paradoja de Bertrand : una paradoja de la probabilidad clásica
red credal
Credencia (estadísticas)
El juego de De Finetti : un procedimiento para evaluar la probabilidad subjetiva de alguien
Evidencia bajo el teorema de Bayes
El problema de Monty Hall
QBism : una interpretación de la mecánica cuántica basada en la probabilidad bayesiana subjetiva
Problema de clase de referencia

Referencias

^ "Bayesiano". Diccionario Merriam-Webster.com .
^ Cox, RT (1946). "Probabilidad, frecuencia y expectativa razonable". Revista Estadounidense de Física . 14 (1): 1–10. Código bibliográfico : 1946AmJPh..14....1C. doi :10.1119/1.1990764.
^ ab Jaynes, et (1986). "Métodos bayesianos: antecedentes generales". En Justicia, JH (ed.). Métodos de máxima entropía y bayesianos en estadística aplicada . Cambridge: Prensa de la Universidad de Cambridge. CiteSeerX 10.1.1.41.1055 .
^ abc de Finetti, Bruno (2017). Teoría de la probabilidad: un tratamiento introductorio crítico . Chichester: John Wiley & Sons Ltd. ISBN 9781119286370.
^ Granizo, Theodore (1996). Lógica de probabilidad sentencial: orígenes, desarrollo, estado actual y aplicaciones técnicas . Londres: Associated University Press. ISBN 0934223459.
^ Howson, Colin (2001). "La lógica de la probabilidad bayesiana". En Corfield, D.; Williamson, J. (eds.). Fundamentos del bayesianismo . Dordrecht: Kluwer. págs. 137-159. ISBN 1-4020-0223-8.
^ Paulos, John Allen (5 de agosto de 2011). "Las matemáticas para cambiar de opinión [por Sharon Bertsch McGrayne]". Reseña del libro. New York Times . Archivado desde el original el 1 de enero de 2022 . Consultado el 6 de agosto de 2011 .
^ ab Stigler, Stephen M. (marzo de 1990). La historia de la estadística . Prensa de la Universidad de Harvard. ISBN 9780674403413.
^ ab Dupré, Maurice J.; Tipler, Frank J. (2009). "Nuevos axiomas para una probabilidad bayesiana rigurosa". Análisis bayesiano . 4 (3): 599–606. CiteSeerX 10.1.1.612.3036 . doi :10.1214/09-BA422.
^ ab Cox, Richard T. (1961). El álgebra de la inferencia probable (Reimpresión ed.). Baltimore, MD; Londres, Reino Unido: Johns Hopkins Press; Prensa de la Universidad de Oxford [distribuidor]. ISBN 9780801869822.
^ McGrayne, Sharon Bertsch (2011). La teoría que no moriría . [https://archive.org/details/theorythatwouldn0000mcgr/page/10 10] , pág. 10, en libros de Google .
^ Stigler, Stephen M. (1986). "Capítulo 3" . La Historia de la Estadística . Prensa de la Universidad de Harvard. ISBN 9780674403406.
^ ab Fienberg, Stephen. E. (2006). "¿Cuándo se volvió la inferencia bayesiana" bayesiana "?" (PDF) . Análisis bayesiano . 1 (1): 5, 1–40. doi : 10.1214/06-BA101 . Archivado desde el original (PDF) el 10 de septiembre de 2014.
^ Harris, Marshall Dees (1959). "Desarrollos recientes del llamado enfoque bayesiano de la estadística". Centro de Derecho Agrario. Investigación Jurídico-Económica . Universidad de Iowa: 125 (nota al pie #52), 126. Los trabajos de Wald , Statistical Decision Functions (1950) y Savage , The Foundation of Statistics (1954) se consideran comúnmente puntos de partida para los enfoques bayesianos actuales.
^ Anales del Laboratorio de Computación de la Universidad de Harvard . vol. 31. 1962. p. 180. Esta revolución, que puede tener éxito o no, es el neobayesianismo. Jeffreys intentó introducir este enfoque, pero en ese momento no logró darle un atractivo general.
^ Kempthorne, Óscar (1967). El problema clásico de la inferencia: la bondad del ajuste. Quinto Simposio de Berkeley sobre probabilidad y estadística matemática. pag. 235. Es curioso que incluso en sus actividades ajenas a la ética, la humanidad busque una religión. En la actualidad, la religión que más se está "impulsando" es el bayesianismo.
^ Bernardo, JM (2005). "Análisis de referencias". Pensamiento bayesiano: modelado y computación . Manual de estadística. vol. 25. Manual de Estadística. págs. 17–90. doi :10.1016/S0169-7161(05)25002-2. ISBN 9780444515391.
^ Wolpert, RL (2004). "Una conversación con James O. Berger". Ciencia estadística . 9 : 205–218. doi : 10.1214/088342304000000053 .
^ Bernardo, José M. (2006). Una introducción a la estadística matemática bayesiana (PDF) . ICOTS-7. Berna. Archivado (PDF) desde el original el 9 de octubre de 2022.
^ Obispo, CM (2007). Reconocimiento de patrones y aprendizaje automático . Saltador.
^ Smith, C. Ray; Erickson, Gary (1989). "De la racionalidad y la coherencia a la probabilidad bayesiana". En Skilling, John (ed.). Máxima Entropía y Métodos Bayesianos . Dordrecht: Kluwer. págs. 29–44. doi :10.1007/978-94-015-7860-8_2. ISBN 0-7923-0224-9.
^ Halpern, J. (1999). "Un contraejemplo de los teoremas de Cox y Fine" (PDF) . Revista de investigación en inteligencia artificial . 10 : 67–85. doi : 10.1613/jair.536 . S2CID 1538503. Archivado (PDF) desde el original el 9 de octubre de 2022.
^ Hacking (1967), Sección 3, página 316
^ Hackear (1988, página 124)
^ Skyrms, Brian (1 de enero de 1987). "Cinemática de probabilidad y coherencia dinámica". Filosofía de la Ciencia . 54 (1): 1–20. CiteSeerX 10.1.1.395.5723 . doi :10.1086/289350. JSTOR 187470. S2CID 120881078.
^ Joyce, James (30 de septiembre de 2003). "Teorema de Bayes". La Enciclopedia de Filosofía de Stanford . stanford.edu.
^ Fuchs, Christopher A.; Schack, Rüdiger (1 de enero de 2012). "Condicionamiento bayesiano, principio de reflexión y decoherencia cuántica". En Ben-Menahem, Yemima; Hemmo, Meir (eds.). Probabilidad en Física . La colección Fronteras. Springer Berlín Heidelberg. págs. 233–247. arXiv : 1103.5950 . doi :10.1007/978-3-642-21329-8_15. ISBN 9783642213281. S2CID 119215115.
^ van Frassen, Bas (1989). Leyes y Simetría . Prensa de la Universidad de Oxford. ISBN 0-19-824860-1.
^ Wald, Abraham (1950). Funciones de decisión estadística . Wiley.
^ Bernardo, José M.; Smith, Adrián FM (1994). Teoría bayesiana . Juan Wiley. ISBN 0-471-92416-4.
^ Pfanzagl (1967, 1968)
^ Morgenstern (1976, página 65)
^ Galavotti, María Carla (1 de enero de 1989). "Antirrealismo en la filosofía de la probabilidad: el subjetivismo de Bruno de Finetti". Erkenntnis . 31 (2/3): 239–261. doi :10.1007/bf01236565. JSTOR 20012239. S2CID 170802937.
^ abc Galavotti, Maria Carla (1 de diciembre de 1991). "La noción de probabilidad subjetiva en la obra de Ramsey y de Finetti". Teoría . 57 (3): 239–259. doi :10.1111/j.1755-2567.1991.tb00839.x. ISSN 1755-2567.
^ ab Dokic, Jérôme; Engel, Pascal (2003). Frank Ramsey: verdad y éxito . Rutledge. ISBN 9781134445936.
^ Davidson y col. (1957)
^ Thornton, Stephen (7 de agosto de 2018). "Karl Popper". Enciclopedia de Filosofía de Stanford. Laboratorio de Investigación en Metafísica, Universidad de Stanford.
^ Popper, Karl (2002) [1959]. La lógica del descubrimiento científico (2ª ed.). Rutledge. pag. 57.ISBN 0-415-27843-0- a través de libros de Google.(traducción del original de 1935, en alemán).
^ Peirce y Jastrow (1885)
^ ab Bernardo, JM (2005). "Análisis de referencia". En Dey, DK; Rao, CR (eds.). Manual de estadística (PDF) . vol. 25. Ámsterdam: Elsevier. págs. 17–90. Archivado (PDF) desde el original el 9 de octubre de 2022.

Bibliografía

Berger, James O. (1985). Teoría de la decisión estadística y análisis bayesiano . Serie Springer en Estadística (Segunda ed.). Springer-Verlag. ISBN 978-0-387-96098-2.
Bessière, Pierre; Mazer, E.; Ahuacatzin, J.-M.; Mekhnacha, K. (2013). Programación Bayesiana . Prensa CRC. ISBN 9781439880326.
Bernardo, José M .; Smith, Adrián FM (1994). Teoría bayesiana . Wiley. ISBN 978-0-471-49464-5.
Bickel, Peter J .; Doksum, Kjell A. (2001) [1976]. Temas básicos y seleccionados . Estadística Matemática. vol. 1 (Segunda ed.). Pearson Prentice-Hall. ISBN 978-0-13-850363-5. MR 0443141. (impresión actualizada, 2007, de Holden-Day, 1976)
Davidson, Donald ; Suppes, Patricio ; Siegel, Sydney (1957). Toma de decisiones: un enfoque experimental . Prensa de la Universidad de Stanford .
de Finetti, Bruno (1937). "La Prévision: ses lois logiques, ses sources subjetivas" [Previsión: sus leyes lógicas, sus fuentes subjetivas]. Annales de l'Institut Henri Poincaré (en francés). 7 (1): 1–68.
de Finetti, Bruno (septiembre de 1989) [1931]. "Probabilismo: un ensayo crítico sobre la teoría de la probabilidad y sobre el valor de la ciencia". Erkenntnis . 31 .(traducción de de Finetti, 1931)
de Finetti, Bruno (1964) [1937]. "Previsión: sus leyes lógicas, sus fuentes subjetivas". En Kyburg, HE; Smokler, ÉL (eds.). Estudios de probabilidad subjetiva . Nueva York, Nueva York: Wiley.(traducción de de Finetti, 1937, arriba)
de Finetti, Bruno (1974-1975) [1970]. Teoría de la probabilidad: un tratamiento introductorio crítico . Traducido por Machi, A.; Smith, AFM . Wiley. ISBN 0-471-20141-3., ISBN 0-471-20142-1 , dos volúmenes.
Goertz, Gary y James Mahoney. 2012. Historia de dos culturas: investigación cualitativa y cuantitativa en ciencias sociales . Prensa de la Universidad de Princeton.
DeGroot, Morris (2004) [1970]. Decisiones estadísticas óptimas . Biblioteca de clásicos de Wiley. Wiley. ISBN 0-471-68029-X..
Hacking, Ian (diciembre de 1967). "Probabilidad personal un poco más realista". Filosofía de la Ciencia . 34 (4): 311–325. doi :10.1086/288169. JSTOR 186120. S2CID 14344339.

(Reimpreso parcialmente en Gärdenfors, Peter ; Sahlin, Nils-Eric (1988). Decisión, probabilidad y utilidad: lecturas seleccionadas . Cambridge University Press. ISBN 0-521-33658-9.)

Hajek, A.; Hartmann, S. (2010) [2001]. "Epistemología bayesiana". En Dancy, J.; Sosa, E.; Steup, M. (eds.). Un compañero de la epistemología (PDF) . Wiley. ISBN 978-1-4051-3900-7. Archivado desde el original (PDF) el 28 de julio de 2011.
Hald, Anders (1998). Una historia de la estadística matemática de 1750 a 1930 . Nueva York: Wiley. ISBN 978-0-471-17912-2.
Hartmann, S.; Sprenger, J. (2011). "Epistemología bayesiana". En Bernecker, S.; Pritchard, D. (eds.). Compañero de epistemología de Routledge (PDF) . Rutledge. ISBN 978-0-415-96219-3. Archivado desde el original (PDF) el 28 de julio de 2011.
"Enfoque bayesiano de problemas estadísticos", Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
Howson, C .; Urbach, P. (2005). Razonamiento científico: el enfoque bayesiano (3ª ed.). Compañía editorial Open Court . ISBN 978-0-8126-9578-6.
Jaynes, et (2003). Teoría de la probabilidad: la lógica de la ciencia . C. Prensa Universitaria. ISBN 978-0-521-59271-0.( "Enlace a la edición fragmentaria de marzo de 1996".
McGrayne, SB (2011). La teoría que no moriría: cómo el gobierno de Bayes descifró el código Enigma, persiguió submarinos rusos y salió triunfante de dos siglos de controversia . New Haven, CT: Prensa de la Universidad de Yale. ISBN 9780300169690. OCLC 670481486.
Morgenstern, Oskar (1978). "Algunas reflexiones sobre la utilidad ". En Schotter, Andrew (ed.). Escritos económicos seleccionados de Oskar Morgenstern . Prensa de la Universidad de Nueva York. págs. 65–70. ISBN 978-0-8147-7771-8.
Peirce, CS y Jastrow J. (1885). "Sobre las pequeñas diferencias en las sensaciones". Memorias de la Academia Nacional de Ciencias . 3 : 73–83.
Pfanzagl, J (1967). "Probabilidad subjetiva derivada de la teoría de la utilidad de Morgenstern-von Neumann" . En Martín Shubik (ed.). Ensayos de economía matemática en honor a Oskar Morgenstern . Prensa de la Universidad de Princeton. págs. 237–251.
Pfanzagl, J.; Baumann, V. y Huber, H. (1968). "Eventos, utilidad y probabilidad subjetiva". Teoría de la Medición . Wiley. págs. 195-220.
Ramsey, Frank Plumpton (2001) [1931]. "Capítulo VII: Verdad y Probabilidad". Los fundamentos de las matemáticas y otros ensayos lógicos . Rutledge. ISBN 0-415-22546-9. «Capítulo VII: Verdad y Probabilidad» (PDF) . Archivado desde el original (PDF) el 27 de febrero de 2008.
Stigler, SM (1990). La historia de la estadística: la medición de la incertidumbre antes de 1900 . Prensa Belknap; Prensa de la Universidad de Harvard. ISBN 978-0-674-40341-3.
Stigler, SM (1999). Estadísticas sobre la mesa: la historia de los conceptos y métodos estadísticos . Prensa de la Universidad de Harvard. ISBN 0-674-83601-4.
Piedra, JV (2013). Regla de Bayes: una introducción tutorial al análisis bayesiano . Inglaterra: Sebtel Press. "Capítulo 1 de la regla de Bayes".
Winkler, RL (2003). Introducción a la inferencia y decisión bayesiana (2ª ed.). Probabilístico. ISBN 978-0-9647938-4-2. Libro de texto clásico actualizado. Teoría bayesiana claramente presentada