stringtranslate.com

Conceptos erróneos sobre la distribución normal

Los estudiantes de estadística y teoría de la probabilidad a veces desarrollan conceptos erróneos sobre la distribución normal, ideas que pueden parecer plausibles pero que son matemáticamente falsas. Por ejemplo, a veces se piensa erróneamente que dos variables aleatorias linealmente no correlacionadas y distribuidas normalmente deben ser estadísticamente independientes . Sin embargo, esto es falso, como se puede demostrar con un contraejemplo. Del mismo modo, a veces se piensa erróneamente que una combinación lineal de variables aleatorias distribuidas normalmente será en sí misma distribuida normalmente, pero nuevamente, los contraejemplos prueban que esto es incorrecto. [1] [2]

Decir que el par de variables aleatorias tiene una distribución normal bivariada significa que cada combinación lineal de y para coeficientes constantes (es decir, no aleatorios) y (no ambos iguales a cero) tiene una distribución normal univariante. En ese caso, si y no están correlacionados, entonces son independientes. [3] Sin embargo, es posible que dos variables aleatorias y estén distribuidas conjuntamente de modo que cada una por sí sola tenga una distribución marginalmente normal, y no estén correlacionadas, pero no sean independientes; a continuación se ofrecen ejemplos.

Ejemplos

Un ejemplo simétrico

Dos variables distribuidas normalmente, no correlacionadas pero dependientes.
Rango conjunto de y . Cuanto más oscuro, mayor es el valor de la función de densidad.

Supongamos que tiene una distribución normal con valor esperado 0 y varianza 1. Sea la distribución de Rademacher , de modo que o , cada una con probabilidad 1/2, y supongamos que es independiente de . Sea . Entonces y no están correlacionados, como se puede verificar calculando su covarianza . Además, ambos tienen la misma distribución normal. Y, sin embargo, y no son independientes. [4] [1] [5]

Para ver que y no son independientes, observa que o que .

Finalmente, la distribución de la combinación lineal simple concentra la probabilidad positiva en 0: . Por lo tanto, la variable aleatoria no se distribuye normalmente, y por lo tanto tampoco se distribuyen normalmente de manera conjunta (según la definición anterior). [4]

Un ejemplo asimétrico

La densidad conjunta de y . Cuanto más oscuro, mayor es el valor de la densidad.

Supongamos que tiene una distribución normal con valor esperado 0 y varianza 1. Sea donde es un número positivo que se especificará a continuación. Si es muy pequeño, entonces la correlación está cerca de si es muy grande, entonces está cerca de 1. Dado que la correlación es una función continua de , el teorema del valor intermedio implica que hay algún valor particular de que hace que la correlación sea 0. Ese valor es aproximadamente 1,54. [2] [nota 1] En ese caso, y no están correlacionados, pero claramente no son independientes, ya que determina completamente .

Para ver que se distribuye normalmente (de hecho, que su distribución es la misma que la de ), se puede calcular su función de distribución acumulativa : [6]

donde la penúltima igualdad se sigue de la simetría de la distribución de y la simetría de la condición de que .

En este ejemplo, la diferencia no se distribuye normalmente, ya que tiene una probabilidad sustancial (aproximadamente 0,88) de ser igual a 0. Por el contrario, la distribución normal, al ser una distribución continua, no tiene una parte discreta, es decir, no concentra más de cero probabilidades en ningún punto. En consecuencia, y no se distribuyen normalmente en conjunto , aunque se distribuyan normalmente por separado. [2]

Ejemplos con soporte casi en todas partes del plano.

Supongamos que las coordenadas de un punto aleatorio en el plano se eligen de acuerdo con la función de densidad de probabilidad. Entonces las variables aleatorias y no están correlacionadas, y cada una de ellas se distribuye normalmente (con media 0 y varianza 1), pero no son independientes. [7] : 93 

Es bien sabido que la relación de dos desviaciones aleatorias normales estándar independientes y tiene una distribución de Cauchy . [8] [9] [7] : 122  Se puede empezar igualmente con la variable aleatoria de Cauchy y derivar la distribución condicional de para satisfacer el requisito de que con y independiente y normal estándar. De ello se deduce que en donde es una variable aleatoria de Rademacher y es una variable aleatoria de Chi-cuadrado con dos grados de libertad.

Consideremos dos conjuntos de , . Nótese que no está indexado por – es decir, se utiliza la misma variable aleatoria de Cauchy en la definición de ambos y . Esta compartición de da como resultado dependencias entre los índices: ni ni es independiente de . Sin embargo, todos los y no están correlacionados ya que las distribuciones bivariadas tienen simetría de reflexión en los ejes. [ cita requerida ]

Distribuciones articulares no normales con marginales normales.

La figura muestra diagramas de dispersión de muestras extraídas de la distribución anterior. Esto proporciona dos ejemplos de distribuciones bivariadas que no están correlacionadas y tienen distribuciones marginales normales pero no son independientes. El panel izquierdo muestra la distribución conjunta de y ; la distribución tiene apoyo en todas partes excepto en el origen. El panel derecho muestra la distribución conjunta de y ; la distribución tiene apoyo en todas partes excepto a lo largo de los ejes y tiene una discontinuidad en el origen: la densidad diverge cuando se aproxima al origen a lo largo de cualquier camino recto excepto a lo largo de los ejes.

Véase también

Referencias

  1. ^ ab Rosenthal, Jeffrey S. (2005). "Una diatriba sobre las variables aleatorias normales no correlacionadas".
  2. ^ abc Melnick, Edward L.; Tenenbein, Aaron (noviembre de 1982). "Errores de especificación de la distribución normal". The American Statistician . 36 (4): 372–373. doi :10.1080/00031305.1982.10483052.
  3. ^ Hogg, Robert ; Tanis, Elliot (2001). "Capítulo 5.4 La distribución normal bivariada". Probabilidad e inferencia estadística (6.ª ed.). Prentice Hall. págs. 258-259. ISBN 0130272949.
  4. ^ ab Ash, Robert B. "Conferencia 21. La distribución normal multivariante" (PDF) . Lectures on Statistics . Archivado desde el original (PDF) el 14 de julio de 2007.
  5. ^ Romano, Joesph P.; Siegel, Andrew F. (1986). Contraejemplos en probabilidad y estadística . Wadsworth & Brooks/Cole. págs. 65–66. ISBN 0-534-05568-0.
  6. ^ Wise, Gary L.; Hall, Eric B. (1993). Contraejemplos en probabilidad y análisis real . Oxford University Press. págs. 140-141. ISBN. 0-19-507068-2.
  7. ^ ab Stoyanov, Jordan M. (2013). Contraejemplos en probabilidad (3.ª ed.). Dover. ISBN 978-0-486-49998-7.
  8. ^ Patel, Jagdish K.; Read, Campbell B. (1996). Manual de la distribución normal (2.ª ed.). Taylor y Francis. pág. 113. ISBN 978-0-824-79342-5.
  9. ^ Krishnamoorthy, K. (2006). Manual de distribuciones estadísticas con aplicaciones . CRC Press. pág. 278. ISBN 978-1-420-01137-1.
Notas
  1. ^ Más precisamente 1,53817..., la raíz cuadrada de la mediana de una distribución chi-cuadrado con 3 grados de libertad.