stringtranslate.com

Distribución de Behrens-Fisher

En estadística , la distribución de Behrens-Fisher , llamada así en honor a Ronald Fisher y Walter Behrens , es una familia parametrizada de distribuciones de probabilidad que surgen de la solución del problema de Behrens-Fisher propuesto primero por Behrens y varios años después por Fisher. El problema de Behrens-Fisher es el de la inferencia estadística relativa a la diferencia entre las medias de dos poblaciones distribuidas normalmente cuando no se conoce la razón de sus varianzas (y en particular, no se sabe que sus varianzas sean iguales). [1]

Definición

La distribución de Behrens-Fisher es la distribución de una variable aleatoria de la forma

donde T 1 y T 2 son variables aleatorias independientes , cada una con una distribución t de Student , con respectivos grados de libertad ν 1  =  n 1  − 1 y ν 2  =  n 2  − 1, y θ es una constante. Por lo tanto, la familia de distribuciones de Behrens-Fisher está parametrizada por ν 1ν 2θ .

Derivación

Supongamos que se sabe que las varianzas de ambas poblaciones son iguales y se toman muestras de tamaños n 1 y n 2 de las dos poblaciones:

donde "iid" son variables aleatorias independientes e idénticamente distribuidas y N denota la distribución normal . Las dos medias de muestra son

La estimación imparcial " agrupada " habitual de la varianza común σ 2 es entonces

donde S 1 2 y S 2 2 son las estimaciones insesgadas habituales ( corregidas por Bessel ) de las dos varianzas poblacionales.

Bajo estos supuestos, la cantidad fundamental

tiene una distribución t con n 1  +  n 2  − 2 grados de libertad . En consecuencia, se puede encontrar un intervalo de confianza para μ 2  −  μ 1 cuyos puntos finales son

donde A es un cuantil apropiado de la distribución t.

Sin embargo, en el problema de Behrens-Fisher, no se sabe que las dos varianzas de población sean iguales, ni se conoce su relación. Fisher consideró [ cita requerida ] la cantidad fundamental

Esto se puede escribir como

dónde

son las estadísticas t de una muestra habituales y

y se considera que θ está en el primer cuadrante. Los detalles algebraicos son los siguientes:

El hecho de que la suma de los cuadrados de las expresiones entre paréntesis anteriores sea 1 implica que son el coseno al cuadrado y el seno al cuadrado de algún ángulo.

La distribución de Behren-Fisher es en realidad la distribución condicional de la cantidad (1) anterior, dados los valores de las cantidades denominadas cos  θ y sen  θ . En efecto, las condiciones de Fisher se basan en información auxiliar .

Fisher encontró entonces el " intervalo fiducial " cuyos puntos finales son

donde A es el punto porcentual apropiado de la distribución de Behrens-Fisher. Fisher afirmó [ cita requerida ] que la probabilidad de que μ 2  −  μ 1 esté en este intervalo, dados los datos (en última instancia, las X ) es la probabilidad de que una variable aleatoria distribuida por Behrens-Fisher esté entre − AA .

Intervalos fiduciales versus intervalos de confianza

Bartlett [ cita requerida ] demostró que este "intervalo fiducial" no es un intervalo de confianza porque no tiene una tasa de cobertura constante. Fisher no consideró que esto fuera una objeción convincente al uso del intervalo fiducial. [ cita requerida ]


Lectura adicional

Referencias

  1. ^ Kim, Seock-Ho; Cohen, Allan S. (diciembre de 1998). "Sobre el problema de Behrens-Fisher: una revisión". Revista de estadística educativa y conductual . 23 (4): 356–377. doi :10.3102/10769986023004356. ISSN  1076-9986. S2CID  85462934.