Ecuación de Wald

En teoría de la probabilidad , la ecuación de Wald , la identidad de Wald ^[1] o el lema de Wald ^[2] es una identidad importante que simplifica el cálculo del valor esperado de la suma de un número aleatorio de cantidades aleatorias. En su forma más simple, relaciona la esperanza de una suma de un número aleatorio de variables aleatorias independientes, idénticamente distribuidas y de media finita con el número esperado de términos en la suma y la esperanza común de las variables aleatorias bajo la condición de que el número de términos en la suma sea independiente de los sumandos.

La ecuación recibe su nombre del matemático Abraham Wald . La ecuación de Blackwell-Girshick proporciona una identidad para el segundo momento . ^[3]

Versión básica

Sea $\mathbb {N}$ una secuencia de variables aleatorias independientes, idénticamente distribuidas y de valor real, y sea $N \geq 0$ una variable aleatoria de valor entero que es independiente de la secuencia $\mathbb {N}$ . Supongamos que $N$ y $X n$ tienen esperanzas finitas. Entonces

\operatorname {E} [X_{1}+\dots +X_{N}]=\operatorname {E} [N]\operatorname {E} [X_{1}]\,.

Ejemplo

Lanza un dado de seis caras . Toma el número del dado (llámalo $N$ ) y lanza esa cantidad de dados de seis caras para obtener los números $X 1, . . . , X N$ , y suma sus valores. Según la ecuación de Wald, el valor resultante en promedio es

\nombredeloperador {E} [N]\nombredeloperador {E} [X]={\frac {1+2+3+4+5+6}{6}}\cdot {\frac {1+2+3+4+5+6}{6}}={\frac {441}{36}}={\frac {49}{4}}=12,25\,.

Versión general

Sea $\mathbb {N}$ una secuencia infinita de variables aleatorias de valor real y sea $N$ una variable aleatoria de valor entero no negativo.

Supongamos que:

1 .

\mathbb {N}

son todas variables aleatorias integrables (de media finita),

2 .

E[X n 1 {N \geq n}] = E[X n] P(N \geq n)

para cada número natural

n

, y

3. la serie infinita satisface

\sum _{n=1}^{\infty }\operatorname {E} \!{\bigl [}|X_{n}|1_{\{N\geq n\}}{\bigr ]}<\infty .

Luego las sumas aleatorias

S_{N}:=\sum _{n=1}^{N}X_{n},\qquad T_{N}:=\sum _{n=1}^{N}\operatorname {E} [X_{n}]

son integrables y

\operatorname {E} [S_{N}]=\operatorname {E} [T_{N}].

Si además,

4 .

\mathbb {N}

todos tienen la misma expectativa, y

N

tiene expectativa finita ,

entonces

\operatorname {E} [S_{N}]=\operatorname {E} [N]\,\operatorname {E} [X_{1}].

Observación: Generalmente, el nombre ecuación de Wald se refiere a esta última igualdad.

Discusión de supuestos

Claramente, el supuesto ( 1 ) es necesario para formular el supuesto ( 2 ) y $la$ ecuación de Wald. El supuesto ( 2 ) controla la cantidad de dependencia permitida entre la secuencia $\mathbb {N}$ y el número $N$ de términos; véase el contraejemplo a $continuación$ para la necesidad . Nótese que el supuesto ( 2 ) se satisface cuando $N$ es un tiempo de detención para una secuencia de variables aleatorias independientes $\mathbb {N}$ . ^{[ cita requerida ]} El supuesto ( 3 ) es de naturaleza más técnica, implica convergencia absoluta $y$ , por lo tanto, $permite$ el reordenamiento arbitrario de una serie infinita en la prueba.

Si se cumple el supuesto ( 5 ), entonces el supuesto ( 3 ) puede reforzarse a la condición más simple

6 . existe una constante real

C

tal que

E[| X n | 1 {N \geq n}] \leq C P(N \geq n)

para todos los números naturales

n

De hecho, utilizando el supuesto ( 6 ),

\sum _{n=1}^{\infty }\operatorname {E} \!{\bigl [}|X_{n}|1_{\{N\geq n\}}{\bigr ]}\leq C\sum _{n=1}^{\infty }\operatorname {P} (N\geq n),

y la última serie es igual a la esperanza de $N$ ^{[ Prueba ]} , que es finita por el supuesto ( 5 ). Por lo tanto, ( 5 ) y ( 6 ) implican el supuesto ( 3 ).

Supongamos además de ( 1 ) y ( 5 ) que

7 .

N

es independiente de la secuencia

\mathbb {N}

8 . existe una constante

C

tal que

E[| X n |] \leq C

para todos los números naturales

n

Entonces se cumplen todos los supuestos ( 1 ), ( 2 ), ( 5 ) y ( 6 ), y por tanto también ( 3 ). En particular, se cumplen las condiciones ( 4 ) y ( 8 ) si

9. las variables aleatorias

\mathbb {N}

tienen todas la misma distribución.

Nótese que las variables aleatorias de la secuencia $\mathbb {N}$ no necesitan ser independientes.

El punto interesante es admitir cierta dependencia entre el número aleatorio $N$ de términos y la secuencia $\mathbb {N}$ . Una versión estándar es suponer ( 1 ), ( 5 ), ( 8 ) y la existencia de una filtración $\mathbb {N}$ tal que

10.

N

es un tiempo de parada con respecto a la filtración, y

11 .

X n

F n -1

son independientes para cada

\mathbb {N}

Entonces ( 10 ) implica que el evento ${N \geq n} = {N \leq n - 1} c$ está en $F n -1$ , por lo tanto por ( 11 ) independiente de $X n$ . Esto implica ( 2 ), y junto con ( 8 ) implica ( 6 ).

Por conveniencia (ver la prueba a continuación usando el teorema de detención opcional) y para especificar la relación de la secuencia $\mathbb {N}$ y la filtración $\mathbb {N}$ , a menudo se impone la siguiente suposición adicional:

12 . la secuencia

\mathbb {N}

está adaptada a la filtración

\mathbb {N}

, lo que significa que

X n

F n

-medible para cada

\mathbb {N}

Nótese que ( 11 ) y ( 12 ) juntas implican que las variables aleatorias $\mathbb {N}$ son independientes.

Solicitud

Una aplicación en la ciencia actuarial es cuando se considera que el monto total de la reclamación sigue un proceso de Poisson compuesto.

S_{N}=\sum _{n=1}^{N}X_{n}

dentro de un período de tiempo determinado, digamos un año, que surge de un número aleatorio $N$ de reclamaciones de seguros individuales, cuyos tamaños se describen por las variables aleatorias $\mathbb {N}$ . Bajo los supuestos anteriores, la ecuación de Wald se puede utilizar para calcular el monto total esperado de la reclamación cuando se dispone de información sobre el número promedio de reclamaciones por año y el tamaño promedio de las reclamaciones. Bajo supuestos más sólidos y con más información sobre las distribuciones subyacentes, la recursión de Panjer se puede utilizar para calcular la distribución de $S N$ .

Ejemplos

Ejemplo con términos dependientes

Sea $N$ una variable aleatoria integrable de valor $0$ , que es independiente de la variable aleatoria integrable de valor real $Z$ con $E[$ $Z$ $] = 0$ . Defina $X$ $n$ $= (-1)$ $n$ $Z$ para todo $n$ $\in$ . Entonces se satisfacen los supuestos ( 1 ), ( 5 ), ( 7 ) y ( 8 ) con $C$ $:= E[|$ $Z$ $|]$ , por lo tanto también ( 2 ) y ( 6 ), y se aplica la ecuación de Wald. Si la distribución de $Z$ no es simétrica, entonces ( 9 ) no se cumple. Nótese que, cuando $Z$ no es casi seguramente igual a la variable aleatoria cero, entonces ( 11 ) y ( 12 ) no pueden cumplirse simultáneamente para ninguna filtración $($ $F$ $n$ $)$ $n$ $\in$ , porque $Z$ no puede ser independiente de sí mismo ya que $E[$ $Z$ $2$ $] = (E[$ $Z$ $])$ $2$ $= 0$ es imposible. $\mathbb {N}$ $\mathbb {N}$ $\mathbb {N}$

Ejemplo donde el número de términos depende de la secuencia

Sea $\mathbb {N}$ una secuencia de variables aleatorias independientes, simétricas y con valores ${-1, +1 }. Para cada$ $\mathbb {N}$ sea $F n$ la σ-álgebra generada por $X 1, . . . , X n$ y definamos $N = n$ cuando $X n$ es la primera variable aleatoria que toma el valor $+1$ . Nótese que $P(N = n) = 1/2 n$ , por lo tanto $E[N] < \infty$ por la prueba de razón . Los supuestos ( 1 ), ( 5 ) y ( 9 ), por lo tanto ( 4 ) y ( 8 ) con $C = 1$ , ( 10 ), ( 11 ) y ( 12 ) se cumplen, por lo tanto también ( 2 ) y ( 6 ) y se aplica la ecuación de Wald. Sin embargo, ( 7 ) no se cumple, porque $N$ se define en términos de la secuencia $\mathbb {N}$ . Intuitivamente, se podría esperar que $E[S N] > 0$ en este ejemplo, porque la suma se detiene justo después de un uno, lo que aparentemente crea un sesgo positivo. Sin embargo, la ecuación de Wald muestra que esta intuición es engañosa.

Contraejemplos

Un contraejemplo que ilustra la necesidad de la suposición (2)

Consideremos una secuencia $\mathbb {N}$ de variables aleatorias iid (Variables aleatorias independientes e idénticamente distribuidas), que toman cada uno de los dos valores 0 y 1 con probabilidad ⁠1/2⁠ (en realidad, solo se necesita $X 1 en lo siguiente). Defina$ $N = 1 - X 1$ . Entonces $S N$ es idénticamente igual a cero, por lo tanto $E[S N] = 0$ , pero $E[X 1] = ⁠ 1 / 2 ⁠$ y $E[N] = ⁠ 1 / 2 ⁠$ y por lo tanto la ecuación de Wald no se cumple. De hecho,se cumplen los supuestos ( 1 ), ( 3 ), ( 4 ) y ( 5 ), sin embargo, la ecuación en el supuesto ( 2 ) se cumple para todos $\mathbb {N}$ excepto para $n = 1$ .^{[ cita requerida ]}

Un contraejemplo que ilustra la necesidad de la suposición (3)

Muy similar al segundo ejemplo anterior, sea $\mathbb {N}$ una secuencia de variables aleatorias independientes y simétricas, donde $X n$ toma cada uno de los valores $2 n$ y $-2 n$ con probabilidad ⁠1/2⁠ . Sea $N$ el primer $\mathbb {N}$ tal que $X n = 2 n$ . Entonces, como antes, $N$ tiene esperanza finita, por lo tanto se cumple la suposición ( 5 ). Como $E[X n] = 0$ para todo $\mathbb {N}$ , se cumplen las suposiciones ( 1 ) y ( 4 ). Sin embargo, como $S N = 1$ casi con seguridad, la ecuación de Wald no se cumple.

Dado que $N$ es un tiempo de parada con respecto a la filtración generada por $\mathbb {N}$ , se cumple la suposición ( 2 ), véase más arriba. Por lo tanto, solo la suposición ( 3 ) puede fallar y, de hecho, dado que

\{N\geq n\}=\{X_{i}=-2^{i}{\text{ for }}i=1,\ldots ,n-1\}

y por lo tanto $P(N \geq n) = 1/2 n -1$ para cada $\mathbb {N}$ , se sigue que

\sum _{n=1}^{\infty }\operatorname {E} \!{\bigl [}|X_{n}|1_{\{N\geq n\}}{\bigr ]}=\sum _{n=1}^{\infty }2^{n}\,\operatorname {P} (N\geq n)=\sum _{n=1}^{\infty }2=\infty .

Una prueba que utiliza el teorema de detención opcional

Supongamos ( 1 ), ( 5 ), ( 8 ), ( 10 ), ( 11 ) y ( 12 ). Utilizando el supuesto ( 1 ), definamos la secuencia de variables aleatorias .

M_{n}=\sum _{i=1}^{n}(X_{i}-\operatorname {E} [X_{i}]),\quad n\in {\mathbb {N} }_{0}.

El supuesto ( 11 ) implica que la esperanza condicional de $X n$ dado $F n -1$ es igual a $E[X n]$ casi con seguridad para cada $\mathbb {N}$ , por lo tanto $\mathbb {N}$ es una martingala con respecto a la filtración $\mathbb {N}$ por el supuesto ( 12 ). Los supuestos ( 5 ), ( 8 ) y ( 10 ) aseguran que podemos aplicar el teorema de detención opcional , por lo tanto $M N = S N - T N$ es integrable y

Debido al supuesto ( 8 ),

|T_{N}|={\biggl |}\sum _{i=1}^{N}\operatorname {E} [X_{i}]{\biggr |}\leq \sum _{i=1}^{N}\operatorname {E} [|X_{i}|]\leq CN,

y debido al supuesto ( 5 ) este límite superior es integrable. Por lo tanto, podemos agregar la esperanza de $T N$ a ambos lados de la ecuación ( 13 ) y obtener por linealidad

\operatorname {E} [S_{N}]=\operatorname {E} [T_{N}].

Observación: Tenga en cuenta que esta prueba no cubre el ejemplo anterior con términos dependientes.

Prueba general

Esta prueba utiliza únicamente los teoremas de convergencia monótona y dominada de Lebesgue . Demostramos la afirmación tal como se indica más arriba en tres pasos.

Paso 1: Integrabilidad de la suma aleatoriaS.N.

Primero demostramos que la suma aleatoria $S N$ es integrable. Definimos las sumas parciales

Como $N$ toma sus valores en $0$ y como $S$ $0$ $= 0$ , se deduce que $\mathbb {N}$

|S_{N}|=\sum _{i=1}^{\infty }|S_{i}|\,1_{\{N=i\}}.

El teorema de convergencia monótona de Lebesgue implica que

\operatorname {E} [|S_{N}|]=\sum _{i=1}^{\infty }\operatorname {E} [|S_{i}|\,1_{\{N=i\}}].

Por la desigualdad triangular,

|S_{i}|\leq \sum _{n=1}^{i}|X_{n}|,\quad i\in {\mathbb {N} }.

Utilizando esta estimación superior y cambiando el orden de suma (lo cual está permitido porque todos los términos son no negativos), obtenemos

donde la segunda desigualdad se deduce utilizando el teorema de convergencia monótona. Por el supuesto ( 3 ), la secuencia infinita en el lado derecho de ( 15 ) converge, por lo tanto, $S N$ es integrable.

Paso 2: Integrabilidad de la suma aleatoriaT.N.

Ahora demostramos que la suma aleatoria $T N$ es integrable. Definamos las sumas parciales

de números reales. Como $N$ toma sus valores en $0$ y como $T$ $0$ $= 0$ , se sigue que $\mathbb {N}$

|T_{N}|=\sum _{i=1}^{\infty }|T_{i}|\,1_{\{N=i\}}.

Al igual que en el paso 1, el teorema de convergencia monótona de Lebesgue implica que

\operatorname {E} [|T_{N}|]=\sum _{i=1}^{\infty }|T_{i}|\operatorname {P} (N=i).

Por la desigualdad triangular,

|T_{i}|\leq \sum _{n=1}^{i}{\bigl |}\!\operatorname {E} [X_{n}]{\bigr |},\quad i\in {\mathbb {N} }.

Utilizando esta estimación superior y cambiando el orden de suma (lo cual está permitido porque todos los términos son no negativos), obtenemos

Por supuesto ( 2 ),

{\bigl |}\!\operatorname {E} [X_{n}]{\bigr |}\operatorname {P} (N\geq n)={\bigl |}\!\operatorname {E} [X_{n}1_{\{N\geq n\}}]{\bigr |}\leq \operatorname {E} [|X_{n}|1_{\{N\geq n\}}],\quad n\in {\mathbb {N} }.

Sustituyendo esto en ( 17 ) obtenemos

\operatorname {E} [|T_{N}|]\leq \sum _{n=1}^{\infty }\operatorname {E} [|X_{n}|1_{\{N\geq n\}}],

que es finito por el supuesto ( 3 ), por lo tanto $T N$ es integrable.

Paso 3: Prueba de identidad

Para demostrar la ecuación de Wald, básicamente repetimos los mismos pasos sin el valor absoluto, haciendo uso de la integrabilidad de las sumas aleatorias $S N$ y $T N$ para demostrar que tienen la misma expectativa.

Utilizando el teorema de convergencia dominada con variable aleatoria dominante $| S N |$ y la definición de la suma parcial $S i$ dada en ( 14 ), se deduce que

\operatorname {E} [S_{N}]=\sum _{i=1}^{\infty }\operatorname {E} [S_{i}1_{\{N=i\}}]=\sum _{i=1}^{\infty }\sum _{n=1}^{i}\operatorname {E} [X_{n}1_{\{N=i\}}].

Debido a la convergencia absoluta demostrada en ( 15 ) anteriormente utilizando el supuesto ( 3 ), podemos reorganizar la suma y obtener que

\operatorname {E} [S_{N}]=\sum _{n=1}^{\infty }\sum _{i=n}^{\infty }\operatorname {E} [X_{n}1_{\{N=i\}}]=\sum _{n=1}^{\infty }\operatorname {E} [X_{n}1_{\{N\geq n\}}],

donde utilizamos el supuesto ( 1 ) y el teorema de convergencia dominada con variable aleatoria dominante $| X n |$ para la segunda igualdad. Debido al supuesto ( 2 ) y la σ-aditividad de la medida de probabilidad,

{\begin{aligned}\operatorname {E} [X_{n}1_{\{N\geq n\}}]&=\operatorname {E} [X_{n}]\operatorname {P} (N\geq n)\\&=\operatorname {E} [X_{n}]\sum _{i=n}^{\infty }\operatorname {P} (N=i)=\sum _{i=n}^{\infty }\operatorname {E} \!{\bigl [}\operatorname {E} [X_{n}]1_{\{N=i\}}{\bigr ]}.\end{aligned}}

Sustituyendo este resultado en la ecuación anterior, reordenando la suma (lo cual está permitido debido a la convergencia absoluta, ver ( 15 ) arriba), usando la linealidad de la expectativa y la definición de la suma parcial $T i$ de las expectativas dada en ( 16 ),

\operatorname {E} [S_{N}]=\sum _{i=1}^{\infty }\sum _{n=1}^{i}\operatorname {E} \!{\bigl [}\operatorname {E} [X_{n}]1_{\{N=i\}}{\bigr ]}=\sum _{i=1}^{\infty }\operatorname {E} [\underbrace {T_{i}1_{\{N=i\}}} _{=\,T_{N}1_{\{N=i\}}}].

Al utilizar nuevamente la convergencia dominada con la variable aleatoria dominante $| T N |$ ,

\operatorname {E} [S_{N}]=\operatorname {E} \!{\biggl [}T_{N}\underbrace {\sum _{i=1}^{\infty }1_{\{N=i\}}} _{=\,1_{\{N\geq 1\}}}{\biggr ]}=\operatorname {E} [T_{N}].

Si se cumplen los supuestos ( 4 ) y ( 5 ), entonces por linealidad de la expectativa,

\operatorname {E} [T_{N}]=\operatorname {E} \!{\biggl [}\sum _{n=1}^{N}\operatorname {E} [X_{n}]{\biggr ]}=\operatorname {E} [X_{1}]\operatorname {E} \!{\biggl [}\underbrace {\sum _{n=1}^{N}1} _{=\,N}{\biggr ]}=\operatorname {E} [N]\operatorname {E} [X_{1}].

Con esto finaliza la prueba.

Otras generalizaciones

La ecuación de Wald se puede transferir a variables aleatorias de valor $R d$ $\mathbb {N}$ aplicando la versión unidimensional a cada componente.
Si $\mathbb {N}$ son variables aleatorias integrables en Bochner que toman valores en un espacio de Banach , entonces la prueba general anterior se puede ajustar en consecuencia.

Véase también

Notas

^ Janssen, Jacques; Manca, Raimondo (2006). "Teoría de la renovación". Procesos semimarkovianos aplicados . Springer. págs. 45–104. doi :10.1007/0-387-29548-8_2. ISBN . 0-387-29547-X.
^ Thomas Bruss, F.; Robertson, J. B. (1991). "'Lema de Wald' para sumas de estadísticas de orden de variables aleatorias iid". Avances en probabilidad aplicada . 23 (3): 612–623. doi :10.2307/1427625. JSTOR 1427625. S2CID 120678340.
^ Blackwell, D.; Girshick, MA (1946). "Sobre funciones de secuencias de vectores aleatorios independientes con aplicaciones al problema del 'paseo aleatorio' en k dimensiones". Ann. Math. Statist . 17 (3): 310–317. doi : 10.1214/aoms/1177730943 .

Referencias

Wald, Abraham (septiembre de 1944). "Sobre sumas acumulativas de variables aleatorias". Anales de estadística matemática . 15 (3): 283–296. doi : 10.1214/aoms/1177731235 . JSTOR 2236250. MR 0010927. Zbl 0063.08122.
Wald, Abraham (1945). "Algunas generalizaciones de la teoría de sumas acumulativas de variables aleatorias". Anales de estadística matemática . 16 (3): 287–293. doi : 10.1214/aoms/1177731092 . JSTOR 2235707. MR 0013852. Zbl 0063.08129.
Blackwell, D.; Girshick, MA (1946). "Sobre funciones de secuencias de vectores aleatorios independientes con aplicaciones al problema del 'paseo aleatorio' en k dimensiones". Ann. Math. Statist . 17 (3): 310–317. doi : 10.1214/aoms/1177730943 .
Chan, Hock Peng; Fuh, Cheng-Der; Hu, Inchi (2006). "Problema de bandido multiarmado con relaciones de precedencia". Series de tiempo y temas relacionados . Apuntes de clase del Instituto de Estadística Matemática - Serie de monografías. Vol. 52. págs. 223–235. arXiv : math/0702819 . doi :10.1214/074921706000001067. ISBN 978-0-940600-68-3. Número de identificación del sujeto 18813099.

Enlaces externos

"Identidad de Wald", Enciclopedia de Matemáticas , EMS Press , 2001 [1994]