Teorema de parada opcional

En teoría de la probabilidad , el teorema de parada opcional (o a veces el teorema de muestreo opcional de Doob , para el probabilista estadounidense Joseph Doob ) dice que, bajo ciertas condiciones, el valor esperado de una martingala en un tiempo de parada es igual a su valor esperado inicial. Dado que las martingalas pueden usarse para modelar la riqueza de un jugador que participa en un juego justo, el teorema de detención opcional dice que, en promedio, no se puede ganar nada deteniendo el juego basándose en la información disponible hasta el momento (es decir, sin mirar hacia el futuro). ). Ciertas condiciones son necesarias para que este resultado sea cierto. En particular, el teorema se aplica a las estrategias de duplicación .

El teorema de parada opcional es una herramienta importante de las finanzas matemáticas en el contexto del teorema fundamental de la fijación de precios de activos .

Declaración

A continuación se proporciona una versión del teorema en tiempo discreto, donde $0$ indica el conjunto de números enteros naturales, incluido el cero. $\mathbb {N}$

Sea $\mathbb {N}$ una martingala de tiempo discreto y $τ$ un tiempo de parada con valores en $0$ $\cup {\infty$ }, ambos con respecto a una filtración $($ $F$ $t$ $)$ $t$ $\in$ $0$ . Supongamos que se cumple una de las siguientes tres condiciones: $\mathbb {N}$ $\mathbb {N}$

( a ) El tiempo de parada

τ

es casi seguro que está acotado, es decir, existe una constante

\mathbb {N}

tal que

τ \leq c

como

( b ) El tiempo de parada

τ

tiene una expectativa finita y las expectativas condicionales del valor absoluto de los incrementos de la martingala están casi seguramente acotadas, más precisamente, y existe una constante

c

tal que casi con seguridad en el evento

{

τ

>

t

} para todos

t

\in

0

\mathbb {E} [\tau ]<\infty

\mathbb {E} {\bigl [}|X_{t+1}-X_{t}|\,{\big \vert }\,{\mathcal {F}}_{t}{\bigr ]}\leq c

\mathbb {N}

( c ) Existe una constante

c

tal que

| X t \land τ | \leq c

como para todos

\mathbb {N}

donde

\land

denota el operador mínimo .

Entonces $X τ$ es una variable aleatoria casi seguramente bien definida y $\mathbb {E} [X_ {\tau }]=\mathbb {E} [X_ {0}].$

De manera similar, si el proceso estocástico $\mathbb {N}$ es una submartingala o una supermartingala y se cumple una de las condiciones anteriores, entonces

\mathbb {E} [X_ {\tau }]\geq \mathbb {E} [X_ {0}],

para una submartingala, y

\mathbb {E} [X_{\tau }]\leq \mathbb {E} [X_{0}],

para una supermartingala.

Observación

Bajo la condición ( c ) es posible que $τ = \infty$ ocurra con probabilidad positiva. En este evento, $X τ$ se define como el límite puntual casi seguramente existente de $\mathbb {N}$ ; consulte la prueba a continuación para obtener más detalles.

Aplicaciones

El teorema de detención opcional se puede utilizar para demostrar la imposibilidad de estrategias de apuestas exitosas para un jugador con una vida finita (lo que da la condición ( a )) o un límite de apuestas de la casa (condición ( b )). Supongamos que el jugador puede apostar hasta c dólares en un lanzamiento de moneda justo en los momentos 1, 2, 3, etc., ganando su apuesta si la moneda sale cara y perdiéndola si sale cruz. Supongamos además que puede abandonar cuando quiera, pero no puede predecir el resultado de apuestas que aún no se han realizado. Entonces, la fortuna del jugador a lo largo del tiempo es una martingala, y el momento $τ$ en el que decide abandonar (o se arruina y se ve obligado a abandonar) es un momento de parada. Entonces el teorema dice que $E[X τ] = E[X 0]$ . Es decir, el jugador sale con la misma cantidad de dinero de media que cuando empezó. (El mismo resultado se cumple si el jugador, en lugar de tener un límite de la casa en las apuestas individuales, tiene un límite finito en su línea de crédito o hasta dónde puede endeudarse, aunque esto es más fácil de demostrar con otra versión del teorema. )
Supongamos una caminata aleatoria que comienza en $\geq 0$ y sube o baja uno con la misma probabilidad en cada paso. Supongamos además que la caminata se detiene si llega a $0$ o $m \geq a$ ; el momento en que esto ocurre por primera vez es un momento de detención. Si se sabe que el tiempo esperado en el que termina la caminata es finito (por ejemplo, según la teoría de la cadena de Markov ), el teorema de parada opcional predice que la posición de parada esperada es igual a la posición inicial $a$ . Resolviendo $a = pm + (1 - p)0$ para la probabilidad $p$ de que la caminata llegue $a m$ antes de $0$ se obtiene $p = a / m$ .
Ahora considere un paseo aleatorio $X$ que comienza en $0$ y se detiene si llega a $- m$ o $+ m$ , y use la martingala $Y n = X n 2 - n$ de la sección de ejemplos . Si $τ$ es el momento en el que $X$ alcanza por primera vez $\pm m$ , entonces $0 = E[Y 0] = E[Y τ] = m 2 - E[τ]$ . Esto da $E[τ] = m 2$ .
Sin embargo, se debe tener cuidado para asegurar que se cumpla una de las condiciones del teorema. Por ejemplo, supongamos que el último ejemplo hubiera utilizado un tiempo de parada 'unilateral', de modo que la parada sólo se produjera en $+ m$ , no en $- m$ . Por tanto , el valor de $X$ en este momento de parada sería $m$ . Por lo tanto, el valor esperado $E[X τ]$ también debe ser $m$ , aparentemente en violación del teorema que daría $E[X τ] = 0$ . El fracaso del teorema de detención opcional muestra que las tres condiciones fallan.

Prueba

Sea $X τ$ el proceso detenido , también es una martingala (o una submartingala o supermartingala, respectivamente). Bajo la condición ( a ) o ( b ), la variable aleatoria $X τ$ está bien definida. Bajo la condición ( c ), el proceso detenido $X τ$ está acotado, por lo tanto, según el teorema de convergencia de la martingala de Doob , converge puntualmente a una variable aleatoria que llamamos $X τ$ .

Si se cumple la condición ( c ), entonces el proceso detenido $X τ$ está limitado por la variable aleatoria constante $M := c$ . De lo contrario, escribir el proceso detenido como

X_{t}^{\tau }=X_{0}+\sum _{s=0}^{\tau -1\land t-1}(X_{s+1}-X_{s}),\quad t\in {\mathbb {N} }_{0},

da $| X t τ | \leq M$ para todo $\mathbb {N}$ , donde

M:=|X_{0}|+\sum _{s=0}^{\tau -1}|X_{s+1}-X_{s}|=|X_{0}|+\sum _{s=0}^{\infty }|X_{s+1}-X_{s}|\cdot \mathbf {1} _{\{\tau >s\}}

Por el teorema de convergencia monótona

\mathbb {E} [M]=\mathbb {E} [|X_{0}|]+\sum _{s=0}^{\infty }\mathbb {E} {\bigl [}|X_{s+1}-X_{s}|\cdot \mathbf {1} _{\{\tau >s\}}{\bigr ]}

Si se cumple la condición ( a ), entonces esta serie solo tiene un número finito de términos distintos de cero, por lo tanto, $M$ es integrable.

Si se cumple la condición ( b ), entonces continuamos insertando una expectativa condicional y usando que el evento ${τ > s$ } se conoce en el momento $s$ (tenga en cuenta que se supone que $τ$ es un tiempo de parada con respecto a la filtración), por lo tanto

{\begin{aligned}\mathbb {E} [M]&=\mathbb {E} [|X_{0}|]+\sum _{s=0}^{\infty }\mathbb {E} {\bigl [}\underbrace {\mathbb {E} {\bigl [}|X_{s+1}-X_{s}|{\big |}{\mathcal {F}}_{s}{\bigr ]}\cdot \mathbf {1} _{\{\tau >s\}}} _{\leq \,c\,\mathbf {1} _{\{\tau >s\}}{\text{ a.s. by (b)}}}{\bigr ]}\\&\leq \mathbb {E} [|X_{0}|]+c\sum _{s=0}^{\infty }\mathbb {P} (\tau >s)\\&=\mathbb {E} [|X_{0}|]+c\,\mathbb {E} [\tau ]<\infty ,\\\end{aligned}}

donde se utiliza una representación del valor esperado de variables aleatorias con valores enteros no negativos para la última igualdad.

Por lo tanto, bajo cualquiera de las tres condiciones del teorema, el proceso detenido está dominado por una variable aleatoria integrable $M.$ Dado que el proceso detenido $X τ$ converge casi con seguridad a $X τ$ , el teorema de convergencia dominada implica

\mathbb {E} [X_{\tau }]=\lim _{t\to \infty }\mathbb {E} [X_{t}^{\tau }].

Por la propiedad martingala del proceso detenido,

\mathbb {E} [X_{t}^{\tau }]=\mathbb {E} [X_{0}],\quad t\in {\mathbb {N} }_{0},

por eso

\mathbb {E} [X_{\tau }]=\mathbb {E} [X_{0}].

De manera similar, si $X$ es una submartingala o una supermartingala, respectivamente, cambie la igualdad en las dos últimas fórmulas por la desigualdad apropiada.

Referencias

Grimmett, Geoffrey R.; Stirzaker, David R. (2001). Probabilidad y procesos aleatorios (3ª ed.). Prensa de la Universidad de Oxford. págs. 491–495. ISBN 9780198572220.
Bhattacharya, Rabi; Waymire, Edward C. (2007). Un curso básico en teoría de la probabilidad. Saltador. págs. 43–45. ISBN 978-0-387-71939-9.

enlaces externos

Teorema de parada opcional de Doob