La paradoja de San Petersburgo o lotería de San Petersburgo [1] es una paradoja que involucra el juego de lanzar una moneda al aire en el que el pago esperado del juego de lotería es infinito pero, sin embargo, parece tener un valor muy pequeño para los participantes. La paradoja de San Petersburgo es una situación en la que un criterio de decisión ingenuo que solo tiene en cuenta el valor esperado predice un curso de acción que presumiblemente ninguna persona real estaría dispuesta a tomar. Se han propuesto varias resoluciones para la paradoja, incluida la cantidad imposible de dinero que necesitaría un casino para continuar el juego indefinidamente.
El problema fue inventado por Nicolas Bernoulli , [2] quien lo enunció en una carta a Pierre Raymond de Montmort el 9 de septiembre de 1713. [3] [4] Sin embargo, la paradoja toma su nombre de su análisis por el primo de Nicolas, Daniel Bernoulli , antiguo residente de San Petersburgo , quien en 1738 publicó sus pensamientos sobre el problema en los Comentarios de la Academia Imperial de Ciencias de San Petersburgo . [5]
Un casino ofrece un juego de azar para un solo jugador en el que se lanza una moneda justa en cada etapa. La apuesta inicial comienza en 2 dólares y se duplica cada vez que sale cruz. La primera vez que sale cara, el juego termina y el jugador gana la apuesta actual. Por lo tanto, el jugador gana 2 dólares si sale cara en el primer lanzamiento, 4 dólares si sale cruz en el primer lanzamiento y cara en el segundo, 8 dólares si sale cruz en los dos primeros lanzamientos y cara en el tercero, y así sucesivamente. Matemáticamente, el jugador gana dólares, donde es el número de lanzamientos consecutivos de cruz. [5] ¿Cuál sería un precio justo a pagar al casino por participar en el juego?
Para responder a esta pregunta, es necesario considerar cuál sería el pago esperado en cada etapa: con probabilidad 1/2 , el jugador gana 2 dólares; con probabilidad 1/4El jugador gana 4 dólares; con probabilidad1/8El jugador gana 8 dólares, y así sucesivamente. Suponiendo que el juego puede continuar mientras el lanzamiento de la moneda resulte en cruz y, en particular, que el casino tiene recursos ilimitados, el valor esperado es entonces
Esta suma crece sin límite por lo que la ganancia esperada es una cantidad infinita de dinero.
Si se considera únicamente el valor esperado del cambio neto en la riqueza monetaria de uno, se debería jugar a cualquier precio si se presenta la oportunidad. Sin embargo, Daniel Bernoulli , después de describir el juego con una apuesta inicial de un ducado , afirmó: "Aunque el cálculo estándar muestra que el valor de la expectativa [del jugador] es infinitamente grande, hay que admitir que cualquier hombre razonable vendería su oportunidad, con gran placer, por veinte ducados". [5] Robert Martin cita a Ian Hacking diciendo: "Pocos de nosotros pagaríamos incluso 25 dólares para entrar en un juego así", y dice que la mayoría de los comentaristas estarían de acuerdo. [6] La aparente paradoja es la discrepancia entre lo que la gente parece dispuesta a pagar para entrar en el juego y el valor esperado infinito. [5]
Se han propuesto varios enfoques para resolver la paradoja.
La resolución clásica de la paradoja implicó la introducción explícita de una función de utilidad , una hipótesis de utilidad esperada y la presunción de una utilidad marginal decreciente del dinero.
Daniel Bernoulli;
La determinación del valor de una cosa no debe basarse en el precio, sino más bien en la utilidad que produce... No hay duda de que una ganancia de mil ducados es más significativa para el pobre que para un rico, aunque ambos ganen la misma cantidad.
Un modelo de utilidad común, sugerido por Daniel Bernoulli, es la función logarítmica U ( w ) = ln( w ) (conocida como log utility ). Es una función de la riqueza total del jugador w , y el concepto de utilidad marginal decreciente del dinero está incorporado en ella. La hipótesis de utilidad esperada postula que existe una función de utilidad que proporciona un buen criterio para el comportamiento de las personas reales; es decir, una función que devuelve un valor positivo o negativo que indica si la apuesta es una buena apuesta. Para cada evento posible, el cambio en la utilidad ln(riqueza después del evento) − ln(riqueza antes del evento) será ponderado por la probabilidad de que ese evento ocurra. Sea c el costo cobrado para ingresar al juego. La utilidad incremental esperada de la lotería ahora converge a un valor finito:
Esta fórmula proporciona una relación implícita entre la riqueza del jugador y la cantidad que debería estar dispuesto a pagar (específicamente, cualquier c que dé un cambio positivo en la utilidad esperada). Por ejemplo, con una utilidad de logaritmo natural, un millonario ($1,000,000) debería estar dispuesto a pagar hasta $20.88, una persona con $1,000 debería pagar hasta $10.95, una persona con $2 debería pedir prestado $1.35 y pagar hasta $3.35.
Antes de que Daniel Bernoulli publicara, en 1728, un matemático de Ginebra , Gabriel Cramer , ya había encontrado partes de esta idea (motivada también por la paradoja de San Petersburgo) al afirmar que
Los matemáticos estiman el dinero en proporción a su cantidad, y los hombres de buen sentido en proporción al uso que pueden hacer de él.
En una carta a Nicolas Bernoulli [7] demostró que una función de raíz cuadrada que describa el beneficio marginal decreciente de las ganancias puede resolver el problema. Sin embargo, a diferencia de Daniel Bernoulli, no consideró la riqueza total de una persona, sino solo la ganancia por la lotería.
Sin embargo, esta solución de Cramer y Bernoulli no es completamente satisfactoria, ya que la lotería puede modificarse fácilmente de forma que reaparezca la paradoja. Para ello, basta con modificar el juego de forma que ofrezca pagos que aumenten aún más rápidamente. Para cualquier función de utilidad ilimitada, se puede encontrar una lotería que permita una variante de la paradoja de San Petersburgo, como señaló por primera vez Menger. [8]
Recientemente, la teoría de la utilidad esperada se ha ampliado para llegar a modelos de decisión más conductuales . En algunas de estas nuevas teorías, como en la teoría de la perspectiva acumulativa , la paradoja de San Petersburgo vuelve a aparecer en ciertos casos, incluso cuando la función de utilidad es cóncava, pero no si está acotada. [9]
El propio Nicolas Bernoulli propuso una idea alternativa para resolver la paradoja. Conjeturó que la gente descuidaría los eventos improbables. [4] Dado que en la lotería de San Petersburgo solo los eventos improbables producen los premios altos que conducen a un valor esperado infinito, esto podría resolver la paradoja. La idea de la ponderación de la probabilidad resurgió mucho más tarde en el trabajo sobre la teoría prospectiva de Daniel Kahneman y Amos Tversky . Paul Weirich escribió de manera similar que la aversión al riesgo podría resolver la paradoja. Weirich continuó escribiendo que aumentar el premio en realidad disminuye la posibilidad de que alguien pague para jugar el juego, afirmando que "hay una cierta cantidad de pájaros en la mano que valen más que cualquier cantidad de pájaros en el arbusto". [10] [11] Sin embargo, esto ha sido rechazado por algunos teóricos porque, como señalan, algunas personas disfrutan el riesgo de jugar y porque es ilógico asumir que aumentar el premio conducirá a más riesgos.
La teoría de la perspectiva acumulativa es una generalización popular de la teoría de la utilidad esperada que puede predecir muchas regularidades de comportamiento. [12] Sin embargo, la sobreponderación de los eventos de pequeña probabilidad introducida en la teoría de la perspectiva acumulativa puede restablecer la paradoja de San Petersburgo. La teoría de la perspectiva acumulativa evita la paradoja de San Petersburgo solo cuando el coeficiente de potencia de la función de utilidad es menor que el coeficiente de potencia de la función de ponderación de probabilidad. [13] Intuitivamente, la función de utilidad no debe ser simplemente cóncava, sino que debe ser cóncava en relación con la función de ponderación de probabilidad para evitar la paradoja de San Petersburgo. Se puede argumentar que las fórmulas para la teoría de la perspectiva se obtienen en la región de menos de $400. [12] Esto no es aplicable para sumas infinitamente crecientes en la paradoja de San Petersburgo.
El juego clásico de San Petersburgo presupone que el casino o el banquero tienen recursos infinitos. Esta suposición ha sido cuestionada durante mucho tiempo por ser poco realista. [14] [15] Alexis Fontaine des Bertins señaló en 1754 que los recursos de cualquier posible patrocinador del juego son finitos. [16] Más importante aún, el valor esperado del juego solo crece logarítmicamente con los recursos del casino. Como resultado, el valor esperado del juego, incluso cuando se juega contra un casino con el bankroll más grande que se pueda concebir de manera realista, es bastante modesto. En 1777, Georges-Louis Leclerc, conde de Buffon, calculó que después de 29 rondas de juego no habría suficiente dinero en el Reino de Francia para cubrir la apuesta. [17]
Si el casino tiene recursos finitos, el juego debe terminar una vez que esos recursos se agoten. [15] Supongamos que los recursos totales (o el premio mayor máximo) del casino son W dólares (de manera más general, W se mide en unidades de la mitad de la apuesta inicial del juego). Entonces, el número máximo de veces que el casino puede jugar antes de que ya no pueda cubrir por completo la próxima apuesta es L = ⌊ log 2 ( W ) ⌋ . [18] [nb 1] Suponiendo que el juego termina cuando el casino ya no puede cubrir la apuesta, el valor esperado E de la lotería se convierte entonces en: [18]
La siguiente tabla muestra el valor esperado E del juego con varios banqueros potenciales y su bankroll W :
Nota: Según las reglas del juego que especifican que si el jugador gana más que el bankroll del casino, se le pagará todo lo que el casino tenga, el valor esperado adicional es menor de lo que sería si el casino tuviera fondos suficientes para cubrir una ronda más, es decir, menos de $1. Para que el jugador gane W, se le debe permitir jugar la ronda L +1 . Por lo tanto, el valor esperado adicional es W /2 L +1 .
La premisa de que los recursos son infinitos produce una variedad de aparentes paradojas en economía. En el sistema de apuestas martingala , un jugador que apuesta a una moneda lanzada al aire duplica su apuesta después de cada pérdida, de modo que una eventual victoria cubra todas las pérdidas; este sistema falla con cualquier fondo de inversión finito. El concepto de ruina del jugador muestra que un jugador persistente que aumenta su apuesta a una fracción fija de su fondo de inversión cuando gana, pero no reduce su apuesta cuando pierde, tarde o temprano e inevitablemente irá a la quiebra, incluso si el juego tiene un valor esperado positivo .
Buffon [17] argumentó que una teoría del comportamiento racional debe corresponderse con lo que un tomador de decisiones racional haría en la vida real, y dado que las personas razonables regularmente ignoran eventos que son bastante improbables, un tomador de decisiones racional también debería ignorar esos eventos raros.
Como estimación del umbral de ignorabilidad, argumentó que, dado que un hombre de 56 años ignora la posibilidad de morir en las próximas 24 horas, que tiene una probabilidad de 1/10189 según las tablas de mortalidad , los eventos con una probabilidad inferior a 1/10.000 podrían ignorarse. Suponiendo que el juego de San Petersburgo tiene un pago esperado de solo .
Varios autores, entre ellos Jean le Rond d'Alembert y John Maynard Keynes , han rechazado la maximización de las expectativas (incluso de la utilidad) como regla de conducta adecuada. [23] [24] Keynes, en particular, insistió en que el riesgo relativo [ aclaración necesaria ] de una alternativa podría ser lo suficientemente alto como para rechazarlo incluso si sus expectativas fueran enormes. [24] Recientemente, algunos investigadores han sugerido reemplazar el valor esperado por la mediana como valor justo. [25] [26]
En 1870, William Allen Whitworth propuso una resolución temprana que contenía los argumentos matemáticos esenciales que suponían una dinámica multiplicativa . [27] Peters hizo un vínculo explícito con el problema de la ergodicidad en 2011. [28] Estas soluciones son matemáticamente similares al uso del criterio de Kelly o la utilidad logarítmica. La dinámica general más allá del caso puramente multiplicativo puede corresponder a funciones de utilidad no logarítmicas, como señalaron Carr y Cherubini en 2020. [29]
Aunque esta paradoja tiene tres siglos de antigüedad, en los últimos años se han introducido nuevos argumentos.
William Feller propuso una solución que implicaba un muestreo . [30] Intuitivamente, la respuesta de Feller es "realizar este juego con una gran cantidad de personas y calcular el valor esperado a partir de la extracción de la muestra". En este método, cuando los juegos son posibles un número infinito de veces, el valor esperado será infinito y, en el caso de un número finito, el valor esperado será un valor mucho menor.
Paul Samuelson resuelve la paradoja [31] argumentando que, incluso si una entidad tuviera recursos infinitos, el juego nunca se ofrecería. Si la lotería representa una ganancia esperada infinita para el jugador, entonces también representa una pérdida esperada infinita para el anfitrión. No se podría observar a nadie pagando para jugar el juego porque nunca se ofrecería. Como Samuelson resumió el argumento, "Paul nunca estará dispuesto a dar tanto como Peter exigirá por tal contrato; y por lo tanto, la actividad indicada tendrá lugar en el nivel de equilibrio de intensidad cero".
Se proponen muchas variantes del juego de San Petersburgo para contrarrestar las soluciones propuestas al juego. [11]
Por ejemplo, el "juego de Pasadena": [32] sea el número de lanzamientos de moneda; si es impar, el jugador gana unidades de ; de lo contrario, el jugador pierde unidades de utilidad. La utilidad esperada del juego es entonces . Sin embargo, dado que la suma no es absolutamente convergente , puede reorganizarse para sumar cualquier número, incluido el infinito positivo o negativo. Esto sugiere que la utilidad esperada del juego de Pasadena depende del orden de suma, pero la teoría de decisiones estándar no proporciona una forma basada en principios para elegir un orden de suma.
{{cite journal}}
: CS1 maint: nombres múltiples: lista de autores ( enlace ) CS1 maint: nombres numéricos: lista de autores ( enlace )[N]uestra refutación de la paradoja de San Petersburgo consiste en la observación de que cualquiera que ofrezca permitir al agente jugar el juego de San Petersburgo es un mentiroso porque está fingiendo tener un banco indefinidamente grande.