Los estudiantes de estadística y teoría de la probabilidad a veces desarrollan conceptos erróneos sobre la distribución normal, ideas que pueden parecer plausibles pero que son matemáticamente falsas. Por ejemplo, a veces se piensa erróneamente que dos variables aleatorias linealmente no correlacionadas y distribuidas normalmente deben ser estadísticamente independientes . Sin embargo, esto es falso, como se puede demostrar con un contraejemplo. Del mismo modo, a veces se piensa erróneamente que una combinación lineal de variables aleatorias distribuidas normalmente será en sí misma distribuida normalmente, pero nuevamente, los contraejemplos prueban que esto es incorrecto. [1] [2]
Decir que el par de variables aleatorias tiene una distribución normal bivariada significa que cada combinación lineal de y para coeficientes constantes (es decir, no aleatorios) y (no ambos iguales a cero) tiene una distribución normal univariante. En ese caso, si y no están correlacionados, entonces son independientes. [3] Sin embargo, es posible que dos variables aleatorias y estén distribuidas conjuntamente de modo que cada una por sí sola tenga una distribución marginalmente normal, y no estén correlacionadas, pero no sean independientes; a continuación se ofrecen ejemplos.
Ejemplos
Un ejemplo simétrico
Supongamos que tiene una distribución normal con valor esperado 0 y varianza 1. Sea la distribución de Rademacher , de modo que o , cada una con probabilidad 1/2, y supongamos que es independiente de . Sea . Entonces y no están correlacionados, como se puede verificar calculando su covarianza . Además, ambos tienen la misma distribución normal. Y, sin embargo, y no son independientes. [4] [1] [5]
Para ver que y no son independientes, observa que o que .
Finalmente, la distribución de la combinación lineal simple concentra la probabilidad positiva en 0: . Por lo tanto, la variable aleatoria no se distribuye normalmente, y por lo tanto tampoco se distribuyen normalmente de manera conjunta (según la definición anterior). [4]
Un ejemplo asimétrico
Supongamos que tiene una distribución normal con valor esperado 0 y varianza 1. Sea
donde es un número positivo que se especificará a continuación. Si es muy pequeño, entonces la correlación está cerca de si es muy grande, entonces está cerca de 1. Dado que la correlación es una función continua de , el teorema del valor intermedio implica que hay algún valor particular de que hace que la correlación sea 0. Ese valor es aproximadamente 1,54. [2] [nota 1] En ese caso, y no están correlacionados, pero claramente no son independientes, ya que determina completamente .
Para ver que se distribuye normalmente (de hecho, que su distribución es la misma que la de ), se puede calcular su función de distribución acumulativa : [6]
donde la penúltima igualdad se sigue de la simetría de la distribución de y la simetría de la condición de que .
En este ejemplo, la diferencia no se distribuye normalmente, ya que tiene una probabilidad sustancial (aproximadamente 0,88) de ser igual a 0. Por el contrario, la distribución normal, al ser una distribución continua, no tiene una parte discreta, es decir, no concentra más de cero probabilidades en ningún punto. En consecuencia, y no se distribuyen normalmente en conjunto , aunque se distribuyan normalmente por separado. [2]
Ejemplos con soporte casi en todas partes del plano.
Supongamos que las coordenadas de un punto aleatorio en el plano se eligen de acuerdo con la función de densidad de probabilidad. Entonces las variables aleatorias y no están correlacionadas, y cada una de ellas se distribuye normalmente (con media 0 y varianza 1), pero no son independientes. [7] : 93
Es bien sabido que la relación de dos desviaciones aleatorias normales estándar independientes y tiene una distribución de Cauchy . [8] [9] [7] : 122 Se puede empezar igualmente con la variable aleatoria de Cauchy y derivar la distribución condicional de para satisfacer el requisito de que con y independiente y normal estándar. Se deduce que
en donde es una variable aleatoria de Rademacher y es una variable aleatoria de Chi-cuadrado con dos grados de libertad.
Consideremos dos conjuntos de , . Nótese que no está indexado por – es decir, se utiliza la misma variable aleatoria de Cauchy en la definición de ambos y . Esta compartición de da como resultado dependencias entre los índices: ni ni es independiente de . Sin embargo, todos los y no están correlacionados ya que las distribuciones bivariadas tienen simetría de reflexión en los ejes. [ cita requerida ]
La figura muestra diagramas de dispersión de muestras extraídas de la distribución anterior. Esto proporciona dos ejemplos de distribuciones bivariadas que no están correlacionadas y tienen distribuciones marginales normales pero no son independientes. El panel izquierdo muestra la distribución conjunta de y ; la distribución tiene soporte en todas partes excepto en el origen. El panel derecho muestra la distribución conjunta de y ; la distribución tiene soporte en todas partes excepto a lo largo de los ejes y tiene una discontinuidad en el origen: la densidad diverge cuando se aproxima al origen a lo largo de cualquier camino recto excepto a lo largo de los ejes.
^ ab Rosenthal, Jeffrey S. (2005). "Una diatriba sobre las variables aleatorias normales no correlacionadas".
^ abc Melnick, Edward L.; Tenenbein, Aaron (noviembre de 1982). "Errores de especificación de la distribución normal". The American Statistician . 36 (4): 372–373. doi :10.1080/00031305.1982.10483052.
^ Hogg, Robert ; Tanis, Elliot (2001). "Capítulo 5.4 La distribución normal bivariada". Probabilidad e inferencia estadística (6.ª ed.). Prentice Hall. págs. 258-259. ISBN0130272949.
^ ab Ash, Robert B. "Conferencia 21. La distribución normal multivariante" (PDF) . Lectures on Statistics . Archivado desde el original (PDF) el 14 de julio de 2007.