Replicación repetida equilibrada

La replicación repetida balanceada es una técnica estadística para estimar la variabilidad de muestreo de una estadística obtenida mediante muestreo estratificado .

Esquema de la técnica

Seleccionar medias muestras balanceadas de la muestra completa.
Calcule la estadística de interés para cada media muestra.
Estime la varianza de la estadística sobre la base de las diferencias entre los valores de la muestra completa y de la media muestra.

Selección de medias muestras

Versión simplificada

Consideremos primero una situación idealizada, donde cada estrato de nuestra muestra contiene sólo dos unidades. Entonces, cada media muestra contendrá exactamente una de ellas, de modo que las medias muestras compartan la estratificación de la muestra completa. Si hay s estratos, idealmente tomaríamos las 2 ^s formas de elegir el medio estrato; pero si s es grande, esto puede no ser factible.

Si se deben tomar menos medias muestras, se seleccionan de modo que estén "equilibradas" (de ahí el nombre de la técnica). Sea H una matriz de Hadamard de tamaño s y elijamos una fila por media muestra. (No importa cuáles sean las filas; el hecho importante es que todas las filas de H son ortogonales). Ahora, para cada media muestra, elijamos qué unidad tomar de cada estrato según el signo de la entrada correspondiente en H : es decir, para la media muestra h , elegimos la primera unidad del estrato k si H _hk = −1 y la segunda unidad si H _hk = +1. La ortogonalidad de las filas de H garantiza que nuestras elecciones no estén correlacionadas entre medias muestras.

Versión realista

Lamentablemente, puede que no exista una matriz de Hadamard de tamaño s . En este caso, elegimos una de tamaño ligeramente mayor que s . Ahora la submatriz de H que define nuestras elecciones ya no necesita tener filas exactamente ortogonales, pero si el tamaño de H es solo ligeramente mayor que s, las filas serán aproximadamente ortogonales.

El número de unidades por estrato no tiene por qué ser exactamente 2, y normalmente no lo será. En este caso, las unidades de cada estrato se dividen en dos "unidades primarias de muestreo de varianza" (PSU = unidad primaria de muestreo) de tamaño igual o casi igual. Esto se puede hacer al azar, o de manera que las PSU sean lo más similares posible. (Así, por ejemplo, si la estratificación se realizó sobre la base de algún parámetro numérico, las unidades de cada estrato se pueden ordenar en función de este parámetro, y se pueden elegir unidades alternativas para las dos PSU).

Si el número de estratos es muy grande, se pueden combinar varios estratos antes de aplicar la BRR. Los grupos resultantes se conocen como "estratos de varianza".

Fórmula BRR

Sea a el valor de nuestra estadística calculada a partir de la muestra completa; sea a _i ( i = 1,..., n ) la estadística correspondiente calculada para las medias muestras. ( n es el número de medias muestras).

Entonces, nuestra estimación de la varianza de muestreo de la estadística es el promedio de ( a _i − a ) ² . Esta es (al menos en el caso ideal) una estimación imparcial de la varianza de muestreo.

El método de Fay

El método de Fay es una generalización de BRR. En lugar de simplemente tomar muestras de la mitad del tamaño, utilizamos la muestra completa cada vez pero con ponderaciones desiguales: k para las unidades fuera de la mitad de la muestra y 2 − k para las unidades dentro de ella. (BRR es el caso k = 0). La estimación de la varianza es entonces V /(1 − k ) ² , donde V es la estimación dada por la fórmula BRR anterior.

Véase también

Remuestreo (estadísticas)

Referencias y enlaces externos

Replicación repetida equilibrada, de los Institutos Americanos de Investigación
McCarthy, PJ (1969). Pseudo-replicación: medias muestras. Revista del Instituto Internacional de Estadística , 37 (3), 239-264
Krewski, D. y JNK Rao (1981). Inferencia a partir de muestras estratificadas: propiedades de los métodos de linealización, jackknife y replicación repetida equilibrada. Annals of Statistics, 9 (5), 1010-1019.
Judkins, DR (1990). Método de Fay para la estimación de la varianza. Journal of Official Statistics, 6 (3), 223-239.
Rao, JNK y CFJ Wu (1985). Inferencia a partir de muestras estratificadas: análisis de segundo orden de tres métodos para estadísticas no lineales. Journal of the American Statistical Association, 80 (391), 620-630.