stringtranslate.com

Principio de elección restringida

El principio de elección restringida es una pauta utilizada en juegos de cartas como el puente de contrato para intuir información oculta. Se puede decir: "El juego de una carta que pudo haber sido seleccionada como una elección de jugadas iguales aumenta la posibilidad de que el jugador comenzara con una posesión en la que su elección estaba restringida". [1] Fundamentalmente, ayuda a jugar "en situaciones que solían considerarse conjeturas".

Por ejemplo, Sur juega con una espada baja, Oeste juega con una espada baja, Norte juega con la dama y Este gana con el rey. El as y el rey son cartas equivalentes; El juego del rey por parte de Este disminuye la probabilidad de que Este tenga el as y aumenta la probabilidad de que Oeste tenga el as. El principio ayuda a otros jugadores a inferir la ubicación de cartas equivalentes no observadas, como el as de espadas, después de observar al rey. El aumento o disminución de la probabilidad es un ejemplo de actualización bayesiana a medida que se acumula evidencia y aplicaciones particulares de elección restringida son similares al problema de Monty Hall .

En muchas de esas situaciones la regla derivada del principio es jugar por honores divididos . Después de observar una carta equivalente, es decir, se debe continuar jugando como si dos cartas equivalentes estuvieran divididas entre los jugadores contrarios, de modo que no hubiera elección sobre cuál jugar. Quien jugó el primero no tiene el otro.

Cuando el número de cartas equivalentes es superior a dos, el principio se complica porque su equivalencia puede no ser manifiesta. Cuando un compañero tiene Q y 10, digamos, y el otro tiene J, normalmente es cierto que esas tres cartas son equivalentes, pero el que tiene dos de ellas no lo sabe. La elección restringida siempre se introduce en términos de dos cartas que se tocan (clasificaciones consecutivas del mismo palo, como QJ o KQ) donde la equivalencia es manifiesta.

Si no hay razón para preferir una carta específica (por ejemplo, para hacer una señal a su compañero), un jugador que tenga dos o más cartas equivalentes a veces debería aleatorizar su orden de juego (consulte la nota sobre el equilibrio de Nash). Los cálculos de probabilidad en la cobertura de elección restringida a menudo dan por sentada la aleatorización uniforme, pero eso es problemático.

El principio de elección restringida se aplica incluso a la elección por parte del oponente de una salida inicial de palos equivalentes. Véase Kelsey y Glauert (1980).

Ejemplo

Considere la combinación de trajes representada a la izquierda. Hay cuatro cartas de espadas 8754 en el Sur (mano cerrada) y cinco AJ1096 en el Norte (ficticia, visible para todos los jugadores). Oeste y Este tienen las cuatro espadas restantes KQ32 en sus dos manos cerradas.

Antes de jugar, son posibles 16 tenencias o "mentiras" diferentes de espadas de Oeste y Este desde la perspectiva de Sur. Estos se enumeran en la Tabla 1, ordenados primero por "división" de números iguales a desiguales de cartas, luego por la tenencia de Oeste de más fuerte a más débil.

Sur juega una espada pequeña, Oeste juega el 2 (o 3), el muerto Norte juega la J y Este gana con el K. Más tarde, después de ganar una baza de palo lateral, Sur juega otra espada pequeña y Oeste sigue. bajo con el 3 (o 2). En este punto, con el Norte y el Este aún por jugar, no se ha establecido la ubicación únicamente de la Q. Sur está en un punto de decisión y sabe que sólo dos de las 16 mentiras originales siguen siendo posibles (en negrita en la Tabla 1), porque Oeste ha jugado ambas cartas bajas y Este el rey. A primera vista, puede parecer que las probabilidades ahora son iguales, 1:1, por lo que Sur debería esperar que le vaya igualmente bien con cualquiera de las dos posibles continuaciones. Sin embargo, el principio de elección restringida nos dice que si bien ambas mentiras de las cartas son posibles, las probabilidades son 2:1 a favor de asumir que Oeste tiene Q32 y, por lo tanto, jugar el diez.

Si Este tuviera KQ, igualmente podría haber jugado la dama en lugar del rey. Por lo tanto, algunos acuerdos con la mentira original 32 y KQ no llegarían a esta etapa; algunos, en cambio, llegarían a la etapa paralela donde solo faltaba K, ya que Sur había observado 32 y Q. En contraste, cada trato con la mentira original Q32 y K llegaría a esta etapa, porque Este jugó el rey forzosamente (sin elección, o por "restringido"). elección").

Si Este ganara la primera baza con el rey o la dama uniformemente al azar desde KQ, entonces esa mentira original 32 y KQ llegaría a esta etapa la mitad del tiempo y tomaría la otra bifurcación en el camino la mitad del tiempo. Así, en la secuencia real del juego, las probabilidades no son pares sino de medio a uno, o 1:2. Este retendría la dama del KQ original aproximadamente un tercio de las veces y no retendría espadas del K original aproximadamente dos tercios de las veces. El principio de elección restringida postula que hacer delicadeza jugando el 10 tiene casi el doble de probabilidades de tener éxito.

Es importante destacar que esto supone que los defensores no tienen un sistema de señalización, de modo que la jugada al oeste de (digamos) el 3 seguido del 2 no indica un doubleton. Durante el transcurso de muchos tratos equivalentes, Este con KQ debería, en teoría, ganar la primera baza con el rey o la dama uniformemente al azar; es decir, la mitad de cada uno sin ningún patrón. [2]

Mayor precisión

A priori , cuatro cartas pendientes se "dividen" como se muestra en las dos primeras columnas de la Tabla 2 a continuación. Por ejemplo, tres cartas están juntas y la cuarta está sola, una "división 3-1" con una probabilidad del 49,74%. Para comprender el "número de mentiras específicas", consulte la lista anterior de todas las mentiras en la Tabla 1.

La última columna proporciona la probabilidad a priori de cualquier tenencia original específica, como 32 y KQ; ese está representado por la fila uno que cubre la división 2-2. La otra mentira que aparece en nuestro ejemplo de juego del palo de espadas, Q32 y K, está representada por la fila dos que cubre la división 3-1.

Así, la tabla muestra que las probabilidades a priori de estas dos mentiras específicas no eran iguales, sino ligeramente a favor de la primera, alrededor de 6,78 a 6,22 para KQ contra K.

¿Cuáles son las probabilidades a posteriori , en el momento de la verdad en nuestro ejemplo del juego del palo de espadas? Si Este gana con KQ la primera baza uniformemente al azar con el rey o la dama – y con K gana la primera baza con el rey, sin tener otra opción – las probabilidades posteriores son de 3,39 a 6,22, un poco más de 1: 2, en términos porcentuales un poco más del 35% para KQ. Para jugar el as A de Norte en la segunda ronda se debe ganar alrededor del 35%, mientras que para hacer de nuevo la delicadeza con el diez 10 se gana alrededor del 65%.

El principio de elección restringida es general, pero este cálculo de probabilidad específico supone que Este ganaría con el rey de KQ precisamente la mitad de las veces (lo cual es mejor). Si Este ganara con el rey de KQ más o menos de la mitad de las veces, entonces Sur gana más o menos del 35% jugando el as. De hecho, si Este ganara con el rey el 92% de las veces (=6,22/6,78), entonces Sur gana el 50% jugando el as y el 50% repitiendo la finesse. Sin embargo, si eso es cierto, Sur gana casi el 100% repitiendo la finesse después de que Este gane con la dama, ya que la dama de ese jugador de Este casi niega el rey.

Teoría matemática

El principio de elección restringida es una aplicación del teorema de Bayes sobre la probabilidad condicional. A continuación: Kp representa la condición de que Este juegue el Rey en la primera baza; KQ representa la condición de que Este tenga KQ y; K representa la condición de que Este tenga K.

Las dos condiciones son las siguientes:

Suponemos que cuando Este tiene KQ, juega cada uno el 50% del tiempo y cuando tiene el K solo, debe jugar el K. Esto se representa de la siguiente manera:

Además, basándose en el juego de la baza 1, sólo dos de las 16 tenencias originales (es decir, a priori ) posibles que se muestran en la Tabla 1 anterior permanecen disponibles para Este, cada una igualmente posible.

Resolviendo, encontramos ( posteriori ) que...

En conclusión, podemos decir que "después de que Este haya jugado el K en la primera ronda, la probabilidad de que Este haya comenzado con el K singleton es dos veces mayor que la de que haya comenzado con el KQ".

Las dos primeras ecuaciones son el teorema de Bayes , el resto es álgebra simple.

Los aumentos y disminuciones en las probabilidades de mentiras originales de las cartas contrarias, a medida que avanza el juego de la mano, son ejemplos de actualización bayesiana a medida que se acumula evidencia.

Ver también

Notas

  1. ^ Frey, Richard L.; Truscott, Alan F. , eds. (1964). La enciclopedia oficial de Bridge (1ª ed.). Nueva York: Crown Publishers. pag. 457.LCCN 64023817  .Todas las ediciones posteriores de la Enciclopedia (hasta la séptima en 2011) conservan esta definición. El artículo original fue escrito por Jeff Rubens como lo indican sus iniciales al final del artículo en la 1ª edición; el artículo completo sigue siendo el mismo en las siete ediciones de la Enciclopedia.
  2. ^ Eso debería ser en el sentido del equilibrio de Nash . La teoría de Nash implica que los oponentes son capaces de observar cualquier patrón y aprovecharlo. La lección es bien conocida entre los expertos en bridge y se acepta su aplicación a jugadas como ésta. Respecto al ejemplo as-rey del párrafo principal, Rubens (1964, 457) supone que "Este jugaría sus mismos honores con la misma frecuencia... Se puede demostrar que ésta es, de hecho, la mejor estrategia de Este". Ver también estrategia mixta en combinaciones de palos.

Otras lecturas

enlaces externos