Análisis de Datos I Esquema del Tema 6 Tema 6. Combinación lineal de variables 1. DOS VARIABLES MEDIA VARIANZA 2. J VARIABLES MEDIA VARIANZA 3. EJEMPLOS (resueltos) 4. EJERCICIOS __________________ Bibliografía: Tema 6 (pág. 165-174) Ejercicios recomendados: 1, 2, 4, 5, 7, 8, 9, 10 y 11. Carmen Ximénez 1 Análisis de Datos I Esquema del Tema 6 1. DOS VARIABLES X Suma, Ti = Xi + Yi S X T X Y MEDIA: VARIANZA: Y ST2 Sx2 S y2 2 Sxy Y 2 x S xy S yx S y2 X Y S Resta, Ti = Xi - Yi T X Y MEDIA: VARIANZA: ST2 Sx2 Sy2 2 Sxy 2. J VARIABLES Caso 1: Suma de J variables Ti = Xi1 + Xi2 +... + XiJ Nos centraremos en el caso de tres variables: Ti = Xi1 + Xi2 + Xi3 Matriz de Varianzas- Covarianzas, S: X1 X 2 X 3 S12 S12 S13 S21 S22 S23 S31 S32 S23 X S 1 X2 X3 X1 X2 Matriz de Correlaciones, R: R X1 X2 X1 X2 X3 1 r12 1 r13 r23 X3 1 X3 T X1 X 2 X3 2 2 2 2 VARIANZA: ST S1 S 2 S 3 2( S12 S13 S 23 ) MEDIA: Caso 2: Combinación lineal de J variables Ti = k1 ·Xi1 + k2 ·Xi2 Matriz de Varianzas- covarianzas, S: k1 X 1 k2 X 2 kX S 1 1 k2 X 2 S12 S21 X1 MEDIA: S12 S22 X2 k12 S21 k1k2 S12 k2k1 S21 k22 S22 k1 X1 k2 X2 T k1 X 1 k2 X 2 VARIANZA: Carmen Ximénez ST2 k12 S12 k22 S 22 2( k1k 2 S12 ) 2 Análisis de Datos I Esquema del Tema 6 3. EJEMPLOS RESUELTOS EJEMPLO 1: Administramos un test de Ansiedad “antes” (X) y “después” (Y) de aplicar un tratamiento. Se define D como la diferencia entre las puntuaciones antes y después del tratamiento (efectividad del tratamiento) y T como la suma entre las puntuaciones antes y después (nivel global). Xi 8 5 8 7 7 Yi 2 5 1 3 4 Obtenga las medias y varianzas de D y T. Solución 1: Aplicando las propiedades Xi 8 5 8 7 7 35 Yi 2 5 1 3 4 15 Xi Yi 16 25 8 21 28 98 Xi2 64 25 64 49 49 251 Yi2 4 25 1 9 16 55 35 7; 5 X Y 15 3 5 251 2 7 1, 2 ; SY2 55 32 2 5 5 98 S xy 7 3 1,4 5 S2X Medias: D X Y 7 3 4 Varianzas: S2D S2X SY2 2 S xy 1, 2 2 (2)( 1,4) 6 ST2 S2X SY2 2 S xy 1, 2 2 (2)( 1, 4) 0, 4 T X Y 7 3 10 Solución 2: Cálculo directo Xi 8 5 8 7 7 35 Yi 2 5 1 3 4 15 Di 6 0 7 4 3 20 Ti 10 10 9 10 11 50 Di2 36 0 49 16 9 110 Ti2 100 100 81 100 121 502 D 20 4; 5 S 2D 502 110 2 102 0, 4 4 2 6 ; ST 5 5 T 50 10 5 Solución 3: A partir de la matriz S X S= Y X 1,2 -1,4 Y -1,4 2 Medias: 7 3 Carmen Ximénez D X Y 7 3 4 ...…. -0,2 ...…. 0,6 0,4 .....…. 10 T X Y 7 3 10 S2D S2X SY2 2 S xy 1, 2 2 (2)( 1,4) 6 ST2 S2X SY2 2 S xy 1, 2 2 (2)( 1, 4) 0, 4 3 Análisis de Datos I Esquema del Tema 6 EJEMPLO 2: Se han obtenido los siguientes datos en tres ítems: X1 X2 X3 1 4 2 3 5 6 5 3 7 Media: Varianza: 3 2,67 4 0,67 5 4,67 X1 2,67 0,67 3,33 S X2 0,67 0,33 X 3 4,67 1. Obtenga la matriz de correlaciones 2. Obtenga la media y varianza para las variables U, V y W. Donde: a) U = X1 + X2 b) V = X2 – X3 c) W = X1 + X2 + X3 Solución: - 0,67 1. r12 S12 -0,50 ; S1 S2 2,67 0,67 r23 r13 S13 3,33 0,95 ; S1 S3 2,67 4,67 S23 - 0,33 0,19 S2 S3 0,67 4,67 X 1 1 0, 50 1 R X2 X 3 0, 95 0,19 1 2. a) U = X1 + X2 U X1 X 2 3 4 7 S 2U S X2 1 S X2 2 2 S X 1 X 2 2, 67 0, 67 (2)( 0, 67) 2 b) V = X2 – X3 V X 2 X 3 4 5 1 S 2V S X2 2 S X2 3 2 S X 2 X 3 0, 67 4, 67 (2)( 0, 33) 6 c) W = X1 + X2 + X3 W X 1 X 2 X 3 3 4 5 12 SW2 SX21 SX2 2 SX2 3 2(SX1X2 SX1X3 SX2 X3 ) 2, 67 0, 67 4, 67 2( 0, 67 3, 33 0, 33) 12, 67 Carmen Ximénez 4 Análisis de Datos I Esquema del Tema 6 4. EJERCICIOS EJERCICIO 1 Se dispone de los datos descriptivos para las variables V, X e Y: V X Y 12 10 14 V S= 10 15 9 X 14 9 20 Y 35 17 26 1. Obtenga la matriz de correlaciones 2. Obtenga la media y varianza de la variable T1 = V - X 3. Obtenga la media y varianza de la variable T2 = V + X + Y EJERCICIO 2 Tras medir en una muestra las variables E : Extroversión S= B: Búsqueda de sensaciones nuevas I: Impulsividad C: Control Se obtuvieron los siguientes estadísticos: E B I C E 16 B 20,4 36 I 12 18 25 C -3,2 12 -15 16 35 45 37 18 1. Obtenga la matriz de correlaciones 2. Obtenga las medias y varianzas de las siguientes variables: Orientación externa, T1 = E + B Hiperactividad, T2 = I - C Externalidad irreflexiva, T3 = E + B + I Carmen Ximénez 5