stringtranslate.com

Relación de uniformes

La razón de uniformes es un método propuesto inicialmente por Kinderman y Monahan en 1977 [1] para el muestreo de números pseudoaleatorios , es decir, para extraer muestras aleatorias de una distribución estadística . Al igual que el muestreo de rechazo y el muestreo por transformada inversa , es un método de simulación exacta. La idea básica del método es utilizar un cambio de variables para crear un conjunto acotado, que luego se puede muestrear de manera uniforme para generar variables aleatorias que sigan la distribución original. Una característica de este método es que solo se requiere conocer la distribución a muestrear hasta un factor multiplicativo desconocido, una situación común en estadística computacional y física estadística.

Motivación

La función de densidad de probabilidad de una distribución estadística bimodal se representa gráficamente. La distribución solo se define entre −1,5 y 1,5. Se dibuja un cuadro delimitador rectangular alrededor del gráfico de la función entre las abscisas −1,5 y 1,5 y las coordenadas y 0 y el máximo de la función. El cuadro se divide en dos zonas por la curva: debajo de la curva se encuentra la región de aceptación y encima de ella, la región de rechazo.
Muestreo de rechazo de una distribución estadística acotada con soporte finito.

Una técnica conveniente para muestrear una distribución estadística es el muestreo por rechazo . Cuando la función de densidad de probabilidad de la distribución está acotada y tiene un soporte finito , se puede definir un cuadro delimitador a su alrededor (una distribución propuesta uniforme), extraer muestras uniformes en el cuadro y devolver solo las coordenadas x de los puntos que caen por debajo de la función (ver gráfico). Como consecuencia directa del teorema fundamental de simulación, [2] las muestras devueltas se distribuyen de acuerdo con la distribución original.

Cuando el soporte de la distribución es infinito, es imposible dibujar un cuadro delimitador rectangular que contenga el gráfico de la función. Se puede seguir utilizando el muestreo de rechazo , pero con una distribución de propuesta no uniforme. Puede resultar delicado elegir una distribución de propuesta adecuada [3] , y también hay que saber cómo muestrear de manera eficiente esta distribución de propuesta.

El método de la razón de uniformes ofrece una solución a este problema, utilizando esencialmente como distribución propuesta la distribución creada por la razón de dos variables aleatorias uniformes .

Declaración

La afirmación y la prueba están adaptadas de la presentación de Gobet [4].

Teorema  —  Sea una variable aleatoria multidimensional con función de densidad de probabilidad en . Solo se requiere que la función se conozca hasta una constante, por lo que podemos suponer que solo sabemos dónde , con una constante desconocida o difícil de calcular. Sea , un parámetro que se puede ajustar a nuestro gusto para mejorar las propiedades del método. Podemos definir el conjunto : La medida de Lebesgue del conjunto es finita e igual a .

Además, sea una variable aleatoria uniformemente distribuida en el conjunto . Entonces, es una variable aleatoria en distribuida como .

Prueba

Primero asumiremos que la primera afirmación es correcta, es decir .

Sea una función medible en . Consideremos la esperanza de en el conjunto :

Con el cambio de variables , tenemos

donde podemos ver que efectivamente tiene la densidad .

Volviendo a la primera afirmación, un argumento similar muestra que .

Complementos

Muestreo de rechazo en A f , r {\displaystyle A_{f,r}}

La declaración anterior no especifica cómo se debe realizar el muestreo uniforme en . Sin embargo, el interés de este método es que, en condiciones suaves en (es decir, que y para todos están acotados ), está acotado . Se puede definir el cuadro delimitador rectangular de modo que Esto permite muestrear uniformemente el conjunto mediante muestreo de rechazo dentro de . El parámetro se puede ajustar para cambiar la forma de y maximizar la tasa de aceptación de este muestreo.

Descripción paramétrica del límite de A f , r {\displaystyle A_{f,r}}

La definición de ya es conveniente para el paso de muestreo de rechazo. Para fines ilustrativos, puede ser interesante dibujar el conjunto, en cuyo caso puede ser útil conocer la descripción paramétrica de su límite: o para el caso común donde es una variable unidimensional, .

Razón generalizada de uniformes

Parametrizada anteriormente solo con , la relación de uniformes se puede describir con una clase más general de transformaciones en términos de una transformación g . [5] En el caso unidimensional, si es una función estrictamente creciente y diferenciable tal que , entonces podemos definir tal que

Si es una variable aleatoria distribuida uniformemente en , entonces se distribuye con la densidad .

Ejemplos

Distribución exponencial antes y después del cambio de variables por el método de la razón de uniformes. Arriba: gráfico de la distribución exponencial en . Abajo: el conjunto se representa en el espacio , inscrito en el cuadro delimitador . Los dominios coloreados, de igual probabilidad, se agregaron para ayudar a la asociación visual de los dominios correspondientes de los conjuntos transformados.

La distribución exponencial

Supongamos que queremos muestrear la distribución exponencial con el método de la razón de uniformes. Tomaremos aquí .

Podemos empezar a construir el conjunto :

La condición es equivalente, después del cálculo, a , lo que nos permite representar gráficamente la forma del conjunto (ver gráfico).

Esta desigualdad también nos permite determinar el cuadro delimitador rectangular donde se incluye. En efecto, con , tenemos y , de donde .

Desde aquí, podemos extraer pares de variables aleatorias uniformes y hasta , y cuando eso sucede, devolvemos , que se distribuye exponencialmente.

Distribución normal de la mezcla antes y después del cambio de variables por el método de la razón de uniformes. Arriba: gráfico de la distribución de la mezcla en . Abajo: el conjunto está representado para dos valores diferentes de . Las líneas continuas en la parte superior representan la destransformación de los cuadros delimitadores en la parte inferior. Las líneas continuas en la parte inferior representan las ubicaciones de los diferentes valores de en el conjunto.

Una mezcla de distribuciones normales

Consideremos la mezcla de dos distribuciones normales . Para aplicar el método de la razón de uniformes, con un determinado , primero se deben determinar los límites del cuadro delimitador rectangular que encierra el conjunto . Esto se puede hacer numéricamente, calculando el mínimo y el máximo de y en una cuadrícula de valores de . Luego, se pueden extraer muestras uniformes , conservar solo las que caen dentro del conjunto y devolverlas como .

Es posible optimizar el ratio de aceptación ajustando el valor de , como se ve en los gráficos.

Software

Véase también

Referencias

  1. ^ Kinderman, AJ; Monahan, JF (septiembre de 1977). "Generación informática de variables aleatorias utilizando la proporción de desviaciones uniformes". ACM Transactions on Mathematical Software . 3 (3): 257–260. doi : 10.1145/355744.355750 . S2CID  12884505.
  2. ^ Robert, Christian; Casella, George (2004). Métodos estadísticos de Monte Carlo (2.ª edición). Springer-Verlag. pág. 47. ISBN 978-0-387-21239-5.
  3. ^ Martino, Luca; Luengo, David; Míguez, Joaquín (16 de julio de 2013). "Sobre la razón generalizada de uniformes como una combinación de rechazo transformado y muestreo inverso extendido de densidad". p. 13. arXiv : 1205.0482 [stat.CO].
  4. ^ GOBET, EMMANUEL (2020). MÉTODOS DE MONTE-CARLO Y PROCESOS ESTOCÁSTICOS: de lineal a no lineal. [Sl]: CRC PRESS. ISBN 978-0-367-65846-5.OCLC 1178639517  .
  5. ^ Wakefield, JC; Gelfand, AE; Smith, AFM (1 de diciembre de 1991). "Generación eficiente de variables aleatorias mediante el método de proporción de uniformes". Estadística y computación . 1 (2): 129–133. doi :10.1007/BF01889987. ISSN  1573-1375. S2CID  119824513.
  6. ^ Northrop, PJ (2021), rust: Simulación de relación de uniformes con transformación
  7. ^ Leydold, J.; Hörmann, W. (2021), Runuran: Interfaz R para los generadores de variables aleatorias 'UNU.RAN'