q , ¿cuál es la probabilidad de que A esté estrictamente por delante de B durante todo el recuento?" La respuesta es ">
En combinatoria , el problema de la votación de Bertrand es la pregunta: "En una elección donde el candidato A recibe p votos y el candidato B recibe q votos con p > q , ¿cuál es la probabilidad de que A esté estrictamente por delante de B durante todo el recuento?" La respuesta es
El resultado fue publicado por primera vez por WA Whitworth en 1878, pero lleva el nombre de Joseph Louis François Bertrand , quien lo redescubrió en 1887. [1] [2] [3] [4] [5]
En el artículo original de Bertrand, esboza una prueba basada en una fórmula general para el número de secuencias favorables utilizando una relación de recursión . Señala que parece probable que un resultado tan simple pueda probarse mediante un método más directo. Tal prueba fue dada por Désiré André [6], basándose en la observación de que las secuencias desfavorables pueden dividirse en dos casos igualmente probables, uno de los cuales (el caso en el que B recibe el primer voto) se calcula fácilmente; demuestra la igualdad mediante una biyección explícita . Una variación de su método se conoce popularmente como el método de reflexión de André , aunque André no utilizó ninguna reflexión. [7]
El teorema de votación de Bertrand está relacionado con el lema del ciclo . Ofrecen fórmulas similares, pero el lema del ciclo considera los cambios circulares de un orden de recuento de votos determinado en lugar de todas las permutaciones.
Supongamos que hay 5 votantes, de los cuales 3 votan por el candidato A y 2 por el candidato B (por lo que p = 3 y q = 2). Hay diez órdenes igualmente probables en los que se podrían contar los votos:
Para la orden AABAB , el recuento de votos a medida que avanza la elección es:
Para cada columna, el recuento de votos para A siempre es mayor que el de B , por lo que A siempre está estrictamente por delante de B. Para el orden AABBA, el recuento de votos a medida que avanza la elección es:
Para este orden, B está empatado con A después de la cuarta votación, por lo que A no siempre está estrictamente por delante de B. De los 10 órdenes posibles, A siempre está por delante de B solo para AAABB y AABAB . Por lo tanto, la probabilidad de que A siempre esté estrictamente por delante es
y esto es de hecho igual a lo que predice el teorema.
En lugar de calcular la probabilidad de que un orden aleatorio de recuento de votos tenga la propiedad deseada, se puede calcular el número de órdenes de recuento favorables y luego dividir por el número total de formas en que se podrían haber contado los votos (este es el método que utilizó Bertrand). El número total de formas es el coeficiente binomial ; la prueba de Bertrand muestra que el número de órdenes favorables en los que se pueden contar los votos es (aunque no da este número explícitamente). Y, de hecho, después de la división, esto da .
Otro problema equivalente es calcular el número de recorridos aleatorios sobre los números enteros que constan de n pasos de longitud unitaria, comenzando en el origen y terminando en el punto m , que nunca se vuelven negativos. Como n y m tienen la misma paridad y , este número es
Cuando y es par, se obtiene el número de Catalan . Por lo tanto, la probabilidad de que un recorrido aleatorio nunca sea negativo y vuelva al origen en el momento es . Según la fórmula de Stirling, cuando , esta probabilidad es .
[Obsérvese que tienen la misma paridad de la siguiente manera: sea el número de movimientos "positivos", es decir, hacia la derecha, y sea el número de movimientos "negativos", es decir, hacia la izquierda. Como y , tenemos y . Como y son números enteros, tienen la misma paridad]
Para que A esté estrictamente por delante de B durante todo el recuento de votos, no puede haber empates. Separar las secuencias de recuento según el primer voto. Cualquier secuencia que comience con un voto por B debe llegar a un empate en algún momento, porque A finalmente gana. Para cualquier secuencia que comience con A y llegue a un empate, reflejar los votos hasta el punto del primer empate (de modo que cualquier A se convierta en B, y viceversa) para obtener una secuencia que comience con B. Por lo tanto, cada secuencia que comience con A y llegue a un empate está en correspondencia uno a uno con una secuencia que comience con B, y la probabilidad de que una secuencia comience con B es , por lo que la probabilidad de que A siempre lleve la delantera en la votación es
Otro método de prueba es por inducción matemática :
Una prueba sencilla se basa en el lema del ciclo de Dvoretzky y Motzkin. [8] Llamemos dominante a una secuencia de votaciones si A está estrictamente por delante de B durante todo el recuento de los votos. El lema del ciclo afirma que cualquier secuencia de A y B, donde , tiene permutaciones cíclicas precisamente dominantes. Para ver esto, simplemente ordene la secuencia dada de A y B en un círculo y elimine repetidamente los pares adyacentes AB hasta que solo queden A. Cada uno de estos A fue el comienzo de una permutación cíclica dominante antes de que se eliminara algo. Entonces, de las permutaciones cíclicas de cualquier disposición de votos A y votos B, los votos son dominantes.
Definamos el proceso estocástico de "conteo inverso"
¿Dónde está la ventaja del candidato A sobre el B, después de haber contado los votos?
Reclamación: es un proceso martingala .
Dado , sabemos que , por lo que de los primeros votos, fueron para el candidato A, y fueron para el candidato B.
Entonces, con probabilidad , tenemos , y . Lo mismo ocurre con el otro. Luego, calcula para encontrar .
Defina el tiempo de parada como el mínimo tal que , o si no hay tal . Entonces la probabilidad de que el candidato A esté al frente todo el tiempo es simplemente , que por el teorema de parada opcional es
Bertrand expresó la solución como
donde es el número total de votantes y es el número de votantes del primer candidato. Afirma que el resultado se desprende de la fórmula
donde es el número de secuencias favorables, pero "parece probable que un resultado tan simple pueda demostrarse de una manera más directa". De hecho, Désiré André pronto produjo una prueba más directa. Su enfoque a menudo es etiquetado erróneamente como "el principio de reflexión" por los autores modernos, pero de hecho utiliza una permutación. Muestra que las secuencias "desfavorables" (aquellas que alcanzan un empate intermedio) consisten en un número igual de secuencias que comienzan con A que las que comienzan con B. Toda secuencia que comienza con B es desfavorable, y existen tales secuencias con una B seguida de una secuencia arbitraria de ( q -1) B y p A. Cada secuencia desfavorable que comienza con A puede transformarse en una secuencia arbitraria de ( q -1) B y p A encontrando la primera B que viola la regla (haciendo que los recuentos de votos empaten) y eliminándola, e intercambiando el orden de las partes restantes. Para invertir el proceso, tome cualquier secuencia de ( q -1) B y p A y busque desde el final para encontrar dónde el número de A excede primero al número de B, y luego intercambie el orden de las partes y coloque una B en el medio. Por ejemplo, la secuencia desfavorable AAB B ABAA corresponde únicamente a la secuencia arbitraria ABAA AAB . De esto, se deduce que el número de secuencias favorables de p A y q B es
y por lo tanto la probabilidad requerida es
Como se esperaba.
El problema original es hallar la probabilidad de que el primer candidato siempre esté estrictamente por delante en el recuento de votos. En cambio, se puede considerar el problema de hallar la probabilidad de que el segundo candidato nunca esté por delante (es decir, que se permitan los empates). En este caso, la respuesta es
El problema de la variante se puede resolver mediante el método de reflexión de una manera similar al problema original. El número de secuencias de votos posibles es . Llamemos a una secuencia "mala" si el segundo candidato siempre va por delante, y si se puede enumerar el número de secuencias malas, entonces se puede encontrar el número de secuencias "buenas" mediante la resta y se puede calcular la probabilidad.
Represente una secuencia de votación como una ruta reticular en el plano cartesiano de la siguiente manera:
Cada uno de estos caminos corresponde a una secuencia única de votos y terminará en ( p , q ). Una secuencia es "buena" exactamente cuando el camino correspondiente nunca pasa por encima de la línea diagonal y = x ; equivalentemente, una secuencia es "mala" exactamente cuando el camino correspondiente toca la línea y = x + 1.
Para cada camino "malo" P , defina un nuevo camino P ′ reflejando la parte de P hasta el primer punto en que toca la línea que lo cruza. P ′ es un camino desde (−1, 1) hasta ( p , q ). La misma operación aplicada nuevamente restaura el P original . Esto produce una correspondencia uno a uno entre los caminos "malos" y los caminos desde (−1, 1) hasta ( p , q ). El número de estos caminos es y, por lo tanto, ese es el número de secuencias "malas". Esto deja el número de secuencias "buenas" como
Como hay todos ellos en total, la probabilidad de que una secuencia sea buena es .
De hecho, las soluciones del problema original y del problema de la variante se relacionan fácilmente. Para que el candidato A esté estrictamente por delante durante todo el recuento de votos, debe recibir el primer voto y, para los votos restantes (ignorando el primero), debe estar estrictamente por delante o empatado durante todo el recuento. Por lo tanto, la solución del problema original es
según sea necesario.
Por el contrario, el caso de empate se puede derivar del caso de no empate. Nótese que el número de secuencias sin empate con p+1 votos para A es igual al número de secuencias empatadas con p votos para A. El número de votos sin empate con p + 1 votos para A votos es , que por manipulación algebraica es , por lo que la fracción de secuencias con p votos para A votos es .