Reducción de varianza

La varianza de puntos generados aleatoriamente dentro de un cuadrado unitario se puede reducir mediante un proceso de estratificación.

En matemáticas , más concretamente en la teoría de los métodos de Montecarlo , la reducción de la varianza es un procedimiento utilizado para aumentar la precisión de las estimaciones obtenidas para una determinada simulación o esfuerzo computacional. ^[1] Cada variable aleatoria de salida de la simulación está asociada con una varianza que limita la precisión de los resultados de la simulación. Para hacer una simulación estadísticamente eficiente, es decir, para obtener una mayor precisión e intervalos de confianza más pequeños para la variable aleatoria de salida de interés, se pueden utilizar técnicas de reducción de la varianza. Los principales métodos de reducción de la varianza son

números aleatorios comunes
variantes antitéticas
el control varía
muestreo de importancia
muestreo estratificado
momento coincidente
Montecarlo condicional
y variables cuasi aleatorias (en el método Quasi-Monte Carlo )

Para la simulación con modelos de caja negra, también se puede utilizar la simulación de subconjuntos y el muestreo de líneas . Bajo estos títulos hay una variedad de técnicas especializadas; por ejemplo, las simulaciones de transporte de partículas hacen un uso extensivo de las técnicas de "ventanas de peso" y "ruleta rusa", que son una forma de muestreo de importancia.

Simulación cruda de Monte Carlo

Supongamos que uno quiere calcular con la variable aleatoria definida en el espacio de probabilidad . Monte Carlo hace esto muestreando iid . copias de y luego estimar mediante el estimador de media muestral $z:=E(Z)$ $Z$ $(\Omega,{\mathcal {F}},P)$ $Z_{1},...,Z_{R}$ $Z$ $z$

{\overline {z}}={\frac {1}{n}}\sum _{i=1}^{n}Z_{i}

En condiciones más suaves, como por ejemplo , se aplicará un teorema de límite central tal que, para valores grandes , la distribución de converge a una distribución normal con media y error estándar . Debido a que la desviación estándar solo converge hacia la tasa , lo que implica que es necesario aumentar el número de simulaciones ( ) en un factor de para reducir a la mitad la desviación estándar de , los métodos de reducción de la varianza suelen ser útiles para obtener estimaciones más precisas sin necesidad de números muy grandes. de simulaciones. $var(Z)<\infty$ $n\rightarrow \infty$ ${\overline {z}}$ $z$ $\sigma /{\sqrt {n}}$ $0$ ${\sqrt {n}}$ $n$ $4$ ${\overline {z}}$ $z$

Números aleatorios comunes (CRN)

La técnica común de reducción de la varianza de números aleatorios es una técnica de reducción de la varianza popular y útil que se aplica cuando comparamos dos o más configuraciones alternativas (de un sistema) en lugar de investigar una sola configuración. CRN también ha sido llamado muestreo correlacionado , flujos emparejados o pares emparejados .

CRN requiere sincronización de los flujos de números aleatorios, lo que garantiza que, además de utilizar los mismos números aleatorios para simular todas las configuraciones, un número aleatorio específico utilizado para un propósito específico en una configuración se use exactamente para el mismo propósito en todas las demás configuraciones. Por ejemplo, en la teoría de colas, si comparamos dos configuraciones diferentes de cajeros en un banco, querríamos que la hora (aleatoria) de llegada del enésimo cliente se generara utilizando el mismo sorteo de un flujo de números aleatorios para ambos. configuraciones.

Principio subyacente de la técnica CRN

Supongamos que y son las observaciones de la primera y segunda configuraciones en la j- ésima replicación independiente. $X_{1j}$ $X_{2j}$

queremos estimar

\xi =E(X_{1j})-E(X_{2j})=\mu _{1}-\mu _{2}.\,

Si realizamos n replicaciones de cada configuración y dejamos

Z_{j}=X_{1j}-X_{2j}\quad {\mbox{for }}j=1,2,\ldots ,n,

entonces y es un estimador insesgado de . $E(Z_{j})=\xi$ $Z(n)={\frac {\sum _{j=1,\ldots ,n}Z_{j}}{n}}$ $\xi$

Y dado que las 's son variables aleatorias independientes distribuidas idénticamente, $Z_{j}$

\operatorname {Var} [Z(n)]={\frac {\operatorname {Var} (Z_{j})}{n}}={\frac {\operatorname {Var} [X_{1j} ]+\nombreoperador {Var} [X_{2j}]-2\nombreoperador {Cov} [X_{1j},X_{2j}]}{n}}.

En el caso de muestreo independiente, es decir, no se utilizan números aleatorios comunes, entonces Cov( X _{1 j} , X _{2 j} ) = 0. Pero si logramos inducir un elemento de correlación positiva entre X ₁ y X ₂ tal que Cov( X _{1 j} , X _{2 j} ) > 0, se puede ver en la ecuación anterior que la varianza se reduce.

También se puede observar que si el CRN induce una correlación negativa, es decir, Cov( X _{1 j} , X _{2 j} ) < 0, esta técnica puede resultar contraproducente, donde la varianza aumenta y no disminuye (como se esperaba). ^[2]

Ver también

varianza explicada

Referencias

^ Botev, Z.; Ridder, A. (2017). "Reducción de la varianza". Wiley StatsRef: Referencia de estadísticas en línea : 1–6. doi : 10.1002/9781118445112.stat07975. ISBN 9781118445112.
^ Hamrick, Jeff. "El método de los números aleatorios comunes: un ejemplo". Proyecto de demostraciones de Wolfram . Consultado el 29 de marzo de 2016 .

Hammersley, JM; Handscomb, CC (1964). Métodos de Montecarlo . Londres: Methuen. ISBN 0-416-52340-4.
Kahn, H.; Marshall, AW (1953). "Métodos para reducir el tamaño de la muestra en cálculos de Monte Carlo". Revista de la Sociedad de Investigación de Operaciones de América . 1 (5): 263–271. doi :10.1287/opre.1.5.263.
MCNP: Código general de transporte de partículas N de Monte Carlo, versión 5 Informe de Los Alamos LA-UR-03-1987