Ejemplo con las dos primeras preguntas del tema 9 9.1. Distribución normal bidimensional. Un vector aleatorio ( ; ) sigue una distribución normal bidimensional, o bivariante, si su función de densidad conjunta es igual a f ( x; i ) 1 2 1 2 1 2 e 1 2 1 2 x 2 x 1 y 2 1 2 1 2 1 y2 2 2 siendo el campo de variación de las variables aleatorias unidimensionales y el eje real, - < x < y - < y < . La expresión 2 x 2 x 1 y 2 y 2 1 2 Q( x; y ) 2 1 2 1 1 2 2 1 es la forma cuadrática del exponente de la función y es conveniente expresarla matricialmente Q( x; y ) x 1 1 12 1 2 y 2 2 1 2 1 1 2 1 x 1 X RX . 1 x 2 22 1 2 2 La matriz R de la forma cuadrática Q(x;y) y, por tanto ésta, es definida no negativa. Esto supone que puede ser definida positiva o semidefinida positiva. Establecer esta distinción es fundamental a la hora de analizar la distribución normal bidimensional, pues, en el primer caso, conduce a una distribución normal no singular y en el segundo sí, ya que aquí, al poder ser Q(x;y) = 0, implica que una variable aleatoria es función lineal de la otra. 9.2. Distribución normal bidimensional no singular. 9.2.1. Significado estadístico de las constantes de la forma cuadrática. La función de densidad conjunta, y su forma cuadrática Q(x;y), dependen de cinco parámetros: 1, 2, 1, 2, ; el significado estadístico lo determinamos mediante la función característica conjunta de (;) cuya expresión es t1; t 2 e i 1 t1 2 t 2 1 2 2 2 2 t1 1 t 2 2 2 1 2 t1t 2 2 Por las propiedades de la función característica sabemos que (t1;0) es la función característica de la distribución marginal de la variable aleatoria , y que (0;t2) lo es de la variable . Haciendo alternativamente en (t1;t2), t2 = 0 y t1 = 0, tenemos, respectivamente, t1;0 1 i1t1 t12 12 2 e 0; t 2 1 i 2 t 2 t 22 22 2 e La primera función característica corresponde a una variable normal unidimensional con media 1 y desviación típica 1, N(1;1), y la segunda a una normal con media 2 y desviación típica 2, N(2;2), obteniéndose por consiguiente las dos funciones de densidad marginal. 9.2.2. Las distribuciones marginales. Las distribuciones marginales son aquellas derivadas de una bidimensional cuyas funciones de densidad son: f1 ( x ) f 2 ( y) 1 1 2 1 2 2 1 x 1 2 1 e 2 1 y2 2 e 2 2 El parámetro es el coeficiente de correlación lineal de las variables y . Para comprobarlo recurrimos a la propiedad de la función característica que permite obtener los momentos con respecto al origen: 1 h k t1; t 2 hk i h k h t1 k t 2 t t 0 1 2 La covarianza de las variables aleatorias, cov(;), es igual a 11-12, y el momento mixto 11 es, según la expresión deducida de la función característica, 1 2 t1; t 2 11 i 2 t1t 2 t t 0 1 2 Hallamos, en primer lugar, la derivada de la función característica conjunta respecto a t1 i 1t1 2 t 2 t12 12 t 22 22 2 1 2 t1t 2 t1; t 2 2 2 iu1 t1 1 1 2t 2 e t1 1 y la segunda derivada con respecto a t2 i 1t1 2 t 2 t12 12 t 22 22 2 1 2 t1t 2 2 t1; t 2 2 1 2 e t1t 2 1 i1 t1 12 1 2 t 2 i 2 t 2 22 1 2 t1 e i 1 t1 2 t 2 1 2 2 2 2 t1 1 t 2 2 2 1 2 t1t 2 2 Si particularizamos la segunda derivada para t1 = t2 = 0 queda 2 t ; t 1 2 i 2 1 2 i 2 1 2 t1t 2 t t 0 0 2 por tanto, 11 = 12 + 12 y cov(;) = 12 + 12 - 12 = 12 siendo el coeficiente de correlación lineal de las variables y . El campo de variación del coeficiente de correlación es el intervalo [-1;1], sin embargo cuando, como en lo que llevamos visto, la matriz R es no singular se verifica que |R| 0, es decir, 12 22 2 12 22 0 y esta desigualdad se cumple si y sólo si 2 < 1, o || < 1, lo que conduce a que el campo admisible de variación de , cuando R es definida positiva, no sea el intervalo cerrado [-1,1] sino el abierto (-1;1), en otras palabras, el coeficiente de correlación no puede ser || = 1, pues de tomar uno de estos valores la matriz R deja de ser definitiva positiva. Si invertimos la matriz R y la denominamos , R-1 = , resulta igual a 2 1 1 2 cov ; 1 2 V V 22 cov ; denominándose matriz de covarianzas siendo, por tanto, R = -1. 9.2.3. Distribuciones condicionales. La función de densidad condicional de dado , f(y/x), es 1 f x; y 2 1 2 1 f1 x f y / x e 2 1 2 1 2 x 2 x 1 y 2 1 2 1 1 2 1 1 2 1 x 1 2 1 e 2 operando llegamos a la expresión del exponente 1 2 1 2 1 1 x 2 x 1 y 2 1 2 1 1 2 2 1 2 y2 2 2 2 1 x 1 2 1 2 x 1 y 2 1 2 2 x 1 1 y 2 1 2 2 2 1 2 2 1 2 22 1 2 2 x 1 , y 2 1 por lo cual la función de densidad condicional de dado es f y / x 1 2 1 2 2 1 2 2 e 2 2 1 2 x 1 y 2 1 función de densidad de una variable aleatoria normal N 2 2 x 1 ; 2 1 2 1 La esperanza de esta distribución condicional E / x 2 2 x 1 1 recibe el nombre de regresión de / 2 y2 2 2 De forma análoga obtenemos la función de densidad condicional de respecto a , f(x/y) f x / y 1 1 1 1 2 2 2 2 e 2 1 1 1 y 2 x 1 2 2 que es N 1 1 y 2 ; 1 1 2 2 La esperanza de esta distribución condicional / E / y 1 1 y 2 2 es la regresión de / . Hemos visto que si una variable aleatoria sigue la distribución normal bidimensional, sus distribuciones marginales y condicionales son normales unidimensionales, no siendo necesariamente cierto el recíproco, es decir, si dos variables son normales, su distribución conjunta no tiene por qué serlo. EJEMPLO Tenemos la función de densidad conjunta bidimensional f ( x; y ) 1 12 0,6 e 1 x 1 2 4 2,4 y 2 2,4 9 1 x 1 y 2 La matriz de la forma cuadrática es la matriz -1. De la forma cuadrática deducimos los valores de las medias, varianzas, covarianzas y coeficiente de correlación: 1 1; 2 2; 12 4; cov ; 1 2 22 9; cov ; 2,4; 2,4 0,4 23 Distribuciones marginales: la variable es N(-1;2) y N(2;3). Distribuciones condicionales: - De / N 0,6x 2,5;3 0,84 . - De / 2 N 0,4 y 2,3;2 0,84 . 3 9.2.4. Independencia. Si las variables aleatorias y son independientes, el coeficiente de correlación lineal es nulo, = 0, convirtiéndose la función de densidad conjunta en f x; y 1 2 1 2 e 2 1 x 1 y 2 2 1 2 2 que no es otra cosa que el producto de las funciones de densidad marginales. Esta conclusión no es sino el cumplimiento de la condición de independencia de dos variables aleatorias continuas, f(x;y) = f1(x) f2(y) Mientras que siempre que dos variables aleatorias son independientes, su coeficiente de correlación es cero, por serlo la covarianza, el recíproco no es cierto salvo cuando la distribución conjunta de las dos variables es normal. Si las variables aleatorias y son N(0;1) e independientes, por la independencia el coeficiente de correlación es nulo ( = 0), y la función de densidad conjunta de la variable aleatoria bidimensional ( ; ) tiene por expresión x2 y2 1 2 f x; y e 2 siendo la matriz R de la forma cuadrática correspondiente y su inversa 1 0 1 0 R ; 0 1 0 1 9.2.5. Propiedades de la distribución normal bidimensional (Teoremas) TEOREMA Si una variable aleatoria es normal bidemensional y se define una variable = a + b, esta nueva variable es normal unidimensional. Para demostrarlo calculamos la función característica de E e t E e it E e i a b t i a b t i a1 b 2 t i a1 b 2 t e i a1 b 2 t E e ia 1 t b 2 t e i a1 b 2 t 1 t 2 a 2 12 b 2 22 2 ab 1 2 e 2 1 i a1 b 2 t t 2 a 2 12 b 2 22 2 ab 1 2 2 e resultando la función característica de una distribución normal unidimensional N a1 b 2 ; a 2 12 b 2 22 2ab1 2 EJEMPLO Partiendo de la función de densidad conjunta del ejemplo de la página 465 definimos la variable aleatoria = - + 2. Su función de densidad, unidimensional, es N 5; 30,4 , ya que E a1 b 2 1 1 2 2 5 V a 2 12 2abcov ; b 2 22 a 2 12 2ab1 2 b 2 22 30,4 TEOREMA Consideremos n variables aleatorias, 1, 2, ..., n, independientes N(j;j). Definimos dos variables y , combinaciones lineales de las primeras, n a j j ; j 1 n b j j j 1 no siendo todas las constantes aj y bj iguales a cero. La función de densidad conjunta de las nuevas variables es normal bidimensional. Hallamos, primero, las esperanzas de las nuevas variables y n n j 1 i 1 n E E a j j a j E j a j j j 1 n E b j j j 1 y a continuación, las varianzas n 2 V a j j a 2j V j a 2j 2j j 1 j 1 j 1 n n n 2 b 2j 2j j 1 recordemos que las variables j son independientes. Por último, hallamos la covarianza de y cov ; E E E n n n n E a j j a j j b j j b j j j 1 j 1 j 1 j 1 n n E j j a j j j b j j 1 j 1 n n n 2 E j j a j b j j j k k a j bk j 1 k 1 j 1 jk n n n a j b j j j 2 a j bk E j j k k j 1 j 1 k 1 jk la esperanza del doble producto es nula por ser las variables j y k independientes, resultando n cov ; a j b j 2j j 1 EJEMPLO Tenemos tres variables aleatorias independientes 1 ditribuidas N(i;i) y definimos dos nuevas variables y cuya función de densidad conjunta calculamos. Las variables son: = 1 + 22 + 33 = -1 + 42 - 53 E[] = 11 + 22 + 33 = 14 E[] = -11 + 42 - 53 = -8 V() = 11 + 44 + 99 = 98 V() = 11 + 164 + 259 = 290 cov (;) = -11 + 84 - 159 = -104 = -0,617 La expresión de la función de densidad conjunta resulta 1 98 104 u 14 v 8 104 298 v 18 u 14 1 f (u; v ) e 1, 2386 265,336 1 A continuación expresamos la función de densidad conjunta de dos maneras distintas, forma en que pueden presentarse u 14 u 14 v 8 1, 234 0 ,8074 98 98 290 2 1 f ( u; v ) e 265,336 f (u; v ) 0,0012e 0 , 000088 149 u 2 v 8 290 104 uv 49 v 2 3340 u 672 v 20692 9.3. Distribución normal bidimensional singular. Fin del ejemplo 2