EXAMEN DE MATEMÀTIQUES. 1 Bat B. ESTADISTICA. 15-JUNY-2010 1. Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color. La siguiente tabla nos da los seis primeros pares de datos obtenidos: X : B Y N8 1 11 72 11 4 1 0 Y : C o l o r 3 34 99 51 0 65 85 3 a) Halla la recta de regresión de Y sobre X. b) ¿Cuánto nos costaría imprimir una página en color en una impresora en la que el coste por página en blanco y negro fuera de 12 céntimos de euro? ¿Es fiable la estimación? (Sabemos que r 0,97). 2. La estatura, en centímetros, de seis chicos de la misma edad y la de sus padres viene recogida en la siguiente tabla: X : H i j o1 6 01 5 01 6 01 7 01 8 01 7 0 Y : P a d r e1 8 01 7 01 7 51 8 51 8 01 7 5 a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las dos variables? 3. Una librería ha recogido la siguiente información sobre el número de libros leídos anualmente por 20 clientes, y, y el tiempo en horas que tardan diariamente en llegar a su trabajo usando el transporte público, x. Y 1 33 55 7 X 0 1 4 9 0 1 2 0 3 4 a Obtén el coeficiente de correlación e interprétalo. b Calcula la recta de regresión de Y sobre X. c Si una persona tarda tres cuartos de hora en llegar a su trabajo, ¿cuántos libros al año se prevé que lea? Nota.- Les qüestions 1 i 2 valen 3 punts; la 3 val 4 punts. Sort. Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color. La siguiente tabla nos da los seis primeros pares de datos obtenidos: X : B Y N8 1 11 72 11 4 1 0 Y : C o l o r 3 34 99 51 0 65 85 3 a) Halla la recta de regresión de Y sobre X. b) ¿Cuánto nos costaría imprimir una página en color en una impresora en la que el coste por página en blanco y negro fuera de 12 céntimos de euro? ¿Es fiable la estimación? (Sabemos que r 0,97). Solución: a) T o ta l x i y i 2 x i x iy i 8 3 3 6 4 2 6 4 1 1 4 9 1 2 1 5 3 9 1 7 9 5 2 8 9 1 6 1 5 2 1 1 0 6 4 4 1 2 2 2 6 1 4 5 8 1 9 6 8 1 2 1 0 5 3 1 0 0 5 3 0 8 1 3 9 4 1 2 1 1 5 9 8 6 Medias: 81 13,5 6 394 y 65,67 6 x Varianza de X: 2 1211 2 13 , 5 19 , 58 x 6 Covarianza: 5986 13 , 5 65 , 67 111 , 12 xy 6 Coeficiente de regresión: , 12 xy111 m 2 5 , 68 yx 19 , 58 x Ecuación de la recta de regresión de Y sobre X : y 65 , 67 5 , 68 x 13 , 5 y 5 , 68 x 11 , 01 ˆ b̂) y 12 5 , 68 12 11 , 01 y 12 57 , 15 céntimos de euro Como la correlación es alta, r 0,97, y x 12 queda dentro del intervalo de valores que tenemos, la estimación sí es fiable. Si el coste de la página en blanco y negro es de 12 céntimos de euro, muy probablemente costará 57,15 céntimos de euro imprimirla en color. Ejercicio nº 2.La estatura, en centímetros, de seis chicos de la misma edad y la de sus padres viene recogida en la siguiente tabla: X : H i j o1 6 01 5 01 6 01 7 01 8 01 7 0 Y : P a d r e1 8 01 7 01 7 51 8 51 8 01 7 5 a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las dos variables? Solución: a) T o ta l Medias: 990 165 6 1065 y 177 ,5 6 x x i y i 2 x i 2 y i 1 6 0 1 8 0 2 5 6 0 0 3 2 4 0 0 2 8 8 0 0 1 5 0 1 7 0 2 2 5 0 0 2 8 9 0 0 2 5 5 0 0 1 6 0 1 7 5 2 5 6 0 0 3 0 6 2 5 2 8 0 0 0 1 7 0 1 8 5 2 8 9 0 0 3 4 2 2 5 3 1 4 5 0 1 8 0 1 8 0 3 2 4 0 0 3 2 4 0 0 3 2 4 0 0 1 7 0 1 7 5 2 8 9 0 0 3 0 6 2 5 2 9 7 5 0 9 9 0 10 6 5 1 6 3 9 0 0 1 8 9 1 7 5 1 7 5 9 0 0 x iy i Desviaciones típicas: 1 6 9 0 0 2 1 6 5 9 1 ,6 79 , 5 7 x 6 1 8 9 1 7 5 2 1 7 7 , 5 2 2 , 9 24 , 7 9 y 6 Covarianza: 1 7 5 9 0 0 1 6 5 1 7 7 , 5 2 9 , 1 7 6 x y Coeficientes de regresión: 2 9 , 1 7 Y s o b r e X m 0 , 3 2 y x 9 1 , 6 7 2 9 , 1 7 X s o b r e Y m 1 , 2 7 x y 2 2 , 9 2 Rectas de regresión: Y s o b r e X y 1 7 7 , 5 0 , 3 2 x 1 6 5 yx 0 , 3 2 1 2 4 , 7 X s o b r e Yx 1 6 5 1 , 2 7 1 7 7 , 5 y x1 ,27 y60 ,43 x 60 , 43 y y 0 , 79 x 47 , 58 1 , 27 Representación: b) La correlación entre las variables no es demasiado fuerte, pues las dos rectas no están muy 29 , 17 próximas. Comprobam s que el coeficien e de correla n es : r 0 , 636 9 , 57 4 , 79 Ejercicio nº 3.Una librería ha recogido la siguiente información sobre el número de libros leídos anualmente por 20 clientes, y, y el tiempo en horas que tardan diariamente en llegar a su trabajo usando el transporte público, x. Y 1 33 55 7 X 0 1 4 9 0 1 2 0 3 4 a Obtén el coeficiente de correlación e interprétalo. b Calcula la recta de regresión de Y sobre X. c Si una persona tarda tres cuartos de hora en llegar a su trabajo, ¿cuántos libros al año se prevé que lea? Solución: a Consideramos xi, yi las marcas de clase: Distribución marginal de X: x i f i x if i 2 x if i 0 , 5 1 3 6 , 5 3 , 2 5 1 , 5 7 1 0 , 51 5 , 7 5 2 0 1 7 1 9 17 x 0,85 20 1 9 2 0 ,8 5 0 ,4 8 x 2 0 Distribución marginal de Y: y y if i 2 y if i y i f i 2 4 8 4 1 2 4 8 1 9 2 6 4 2 4 1 4 4 2 0 8 0 3 5 2 1 6 80 4 20 3 5 2 2 4 1 ,2 6 y 2 0 Covarianza: xi yi fi 0,5 · 2 · 4 0,5 · 4 · 9 1,5 · 4 · 3 1,5 · 6 · 4 76 7 6 0 ,8 5 40 ,4 x y 2 0 Coeficiente de correlación: 0 ,4 r 0 ,6 6 0 ,4 8 1 ,2 6 La correlación entre las variables es positiva a más tiempo de viaje, más libros se leen pero no es muy fuerte. b Calculamos la pendiente de la recta: myx xy 1 ,7 4 x2 m yx Luego: y 4 1,74 x 0,85 y 1,74x 2,521 3 c ) S i x d e h o r a 0 , 7 5 h1 y , 7 4 0 , 7 5 2 , 5 2 1 3 , 8 2 6 4 4 Si una persona tarda diariamente tres cuartos de hora en llegar a su trabajo usando el transporte público, podría llegar a leer al año casi 4 libros.