El valor esperado de una martingala en un momento de detención es igual a su valor esperado inicial
En teoría de la probabilidad , el teorema de detención opcional (o a veces el teorema de muestreo opcional de Doob , para el probabilista estadounidense Joseph Doob ) dice que, bajo ciertas condiciones, el valor esperado de una martingala en un momento de detención es igual a su valor esperado inicial. Dado que las martingalas se pueden utilizar para modelar la riqueza de un jugador que participa en un juego justo, el teorema de detención opcional dice que, en promedio, nada se puede ganar al detener el juego en función de la información obtenible hasta el momento (es decir, sin mirar hacia el futuro). Ciertas condiciones son necesarias para que este resultado sea cierto. En particular, el teorema se aplica a las estrategias de duplicación .
El teorema de detención opcional es una herramienta importante de las finanzas matemáticas en el contexto del teorema fundamental de fijación de precios de activos .
Declaración
A continuación se presenta una versión de tiempo discreto del teorema, donde 0 denota el conjunto de números enteros naturales, incluido el cero.
Sea X = ( X t ) t ∈ 0 una martingala de tiempo discreto y τ un tiempo de parada con valores en 0 ∪ {∞ }, ambos con respecto a una filtración ( F t ) t ∈ 0 . Supongamos que se cumple una de las tres condiciones siguientes:
- ( a ) El tiempo de parada τ está casi seguramente acotado, es decir, existe una constante c ∈ tal que τ ≤ c cuando
- ( b ) El tiempo de detención τ tiene una expectativa finita y las expectativas condicionales del valor absoluto de los incrementos de martingala están casi seguramente acotadas, más precisamente, y existe una constante c tal que casi seguramente en el evento { τ > t } para todo t ∈ 0 .
- ( c ) Existe una constante c tal que | X t ∧ τ | ≤ c para todo t ∈ 0 donde ∧ denota el operador mínimo .
Entonces X τ es una variable aleatoria casi seguramente bien definida y
De manera similar, si el proceso estocástico X = ( X t ) t ∈ 0 es una submartingala o una supermartingala y se cumple una de las condiciones anteriores, entonces
para una submartingala, y
para una supermartingala.
Observación
Bajo la condición ( c ) es posible que τ = ∞ ocurra con probabilidad positiva. En este caso, X τ se define como el límite puntual de ( X t ) t ∈ 0 que existe casi con seguridad . Vea la prueba a continuación para obtener más detalles.
Aplicaciones
- El teorema de parada opcional puede utilizarse para demostrar la imposibilidad de estrategias de apuestas exitosas para un jugador con una vida finita (que da la condición ( a )) o un límite de la casa en las apuestas (condición ( b )). Supongamos que el jugador puede apostar hasta c dólares en un lanzamiento de moneda justo en los momentos 1, 2, 3, etc., ganando su apuesta si la moneda sale cara y perdiéndola si la moneda sale cruz. Supongamos además que puede dejar de jugar cuando quiera, pero no puede predecir el resultado de las apuestas que aún no han sucedido. Entonces, la fortuna del jugador a lo largo del tiempo es una martingala, y el momento τ en el que decide dejar de jugar (o se arruina y se ve obligado a dejar de jugar) es un momento de parada. Por lo tanto, el teorema dice que E[ X τ ] = E[ X 0 ] . En otras palabras, el jugador se va con la misma cantidad de dinero en promedio que cuando comenzó. (El mismo resultado se cumple si el jugador, en lugar de tener un límite de la casa en sus apuestas individuales, tiene un límite finito en su línea de crédito o en el grado de endeudamiento que puede alcanzar, aunque esto es más fácil de demostrar con otra versión del teorema).
- Supóngase un paseo aleatorio que comienza en a ≥ 0 y sube o baja en uno con igual probabilidad en cada paso. Supóngase además que el paseo se detiene si llega a 0 o m ≥ a ; el tiempo en el que esto ocurre por primera vez es un tiempo de detención. Si se sabe que el tiempo esperado en el que termina el paseo es finito (por ejemplo, a partir de la teoría de cadenas de Markov ), el teorema de detención opcional predice que la posición de detención esperada es igual a la posición inicial a . Resolviendo a = pm + (1 – p )0 para la probabilidad p de que el paseo llegue a m antes de 0 se obtiene p = a / m .
- Ahora considere un paseo aleatorio X que comienza en 0 y se detiene si llega a – m o + m , y use la martingala Y n = X n 2 – n de la sección de ejemplos . Si τ es el tiempo en el que X llega por primera vez a ± m , entonces 0 = E[ Y 0 ] = E[ Y τ ] = m 2 – E[τ] . Esto da E[ τ ] = m 2 .
- Sin embargo, se debe tener cuidado para garantizar que se cumpla una de las condiciones del teorema. Por ejemplo, supongamos que en el último ejemplo se hubiera utilizado un tiempo de parada "unilateral", de modo que la parada solo se produjera en + m , no en − m . El valor de X en este tiempo de parada sería, por tanto, m . Por lo tanto, el valor esperado E[ X τ ] también debe ser m , aparentemente en violación del teorema que daría E[ X τ ] = 0 . El fracaso del teorema de parada opcional muestra que las tres condiciones fallan.
Prueba
Sea X τ el proceso detenido , que también es una martingala (o una submartingala o supermartingala, respectivamente). Bajo la condición ( a ) o ( b ), la variable aleatoria X τ está bien definida. Bajo la condición ( c ), el proceso detenido X τ está acotado, por lo tanto, por el teorema de convergencia de la martingala de Doob , converge puntualmente a una variable aleatoria que llamamos X τ .
Si la condición ( c ) se cumple, entonces el proceso detenido X τ está limitado por la variable aleatoria constante M := c . De lo contrario, escribir el proceso detenido como
da | X t τ | ≤ M para todo t ∈ 0 , donde
- .
Por el teorema de convergencia monótona
- .
Si se cumple la condición ( a ), entonces esta serie solo tiene un número finito de términos distintos de cero, por lo tanto M es integrable.
Si se cumple la condición ( b ), entonces continuamos insertando una expectativa condicional y usando que el evento { τ > s } se conoce en el tiempo s (nótese que se supone que τ es un tiempo de detención con respecto a la filtración), por lo tanto
donde se utiliza una representación del valor esperado de variables aleatorias de valores enteros no negativos para la última igualdad.
Por lo tanto, bajo cualquiera de las tres condiciones del teorema, el proceso detenido está dominado por una variable aleatoria integrable M . Dado que el proceso detenido X τ converge casi con seguridad a X τ , el teorema de convergencia dominada implica
Por la propiedad martingala del proceso detenido,
por eso
De manera similar, si X es una submartingala o supermartingala, respectivamente, cambie la igualdad en las dos últimas fórmulas por la desigualdad apropiada.
Referencias
- Grimmett, Geoffrey R.; Stirzaker, David R. (2001). Probabilidad y procesos aleatorios (3.ª ed.). Oxford University Press. págs. 491–495. ISBN 9780198572220.
- Bhattacharya, Rabi; Waymire, Edward C. (2007). Un curso básico de teoría de la probabilidad. Springer. Págs. 43–45. ISBN. 978-0-387-71939-9.
Enlaces externos
- Teorema de parada opcional de Doob