RELACIÓN 2: RELACIÓN ENTRE DOS VARIABLES 1.- Un cierto día pusieron por televisión una película a las 9 y un debate a las 11. Se ha encuestado a 3.820 personas obteniéndose los datos siguientes: Vieron el debate No vieron el debate Vieron la película 2.712 No vieron la película 1.041 1.187 3.820 Completa la tabla. 2.- La talla media de una muestra de padres es de 1’68 m, con una desviación típica de 5 cm, y la talla media de una muestra de sus hijos es de 1’70 m, con una desviación típica de 7’5 cm. El coeficiente de correlación entre las tallas de hijos y padres es 0’7. Estimar la talla de dos hijos si la talla de sus padres fuera 1’80 y 1’60 m, respectivamente. 3.- Un resorte se alarga cuando en el extremo se coloca un peso. La longitud del resorte en cm y el peso en g colgado viene dado por la siguiente tabla: Peso 0 2 5 11 17 Longitud 11 22 31 49 67 a) Haz la nube de puntos y a la vista de ésta, di si existe correlación entre las variables e interpreta su valor. b) Calcula el coeficiente de correlación lineal. ¿Qué longitud se supone que tendrá el resorte al colgarle un peso de 6 g? 4.- Se considera la variable estadística bidimensional (X,Y) que toma los valores (xi,yi) de la siguiente tabla: xi 0’42 0’74 0 0’30 0’86 0’63 0’53 0’11 0’21 yi 0’65 –0’86 0 –0’55 0’93 0’79 –0’73 –0’33 0’46 Halla la covarianza y el coeficiente de correlación de la anterior distribución bidimensional. ¿Hay correlación lineal fuerte o débil entre ambas variables? Dibuja la correspondiente nube de puntos y estima si entre X e Y hay una correlación (no necesariamente lineal) fuerte. 5.- La siguiente tabla recoge las calificaciones de 40 alumnos en Matemáticas y Física: Matemáticas X 3 4 5 6 6 7 7 8 10 Física Y 2 5 5 6 7 6 7 9 10 Nº de alumnos 4 6 12 4 5 4 2 1 2 a) Escribe las distribuciones marginales de X e Y. Halla las respectivas medias y desviaciones típicas. b) Calcula el coeficiente de correlación lineal. c) ¿Qué nota de Matemáticas se puede esperar que saque un alumno que ha obtenido 7’5 en Física? ¿Es fiable el resultado? 6.- Las edades de los novios en las bodas celebradas durante una semana en una ciudad quedan reflejadas en la siguiente tabla: Edad del novio 25 27 31 34 36 40 45 Edad de la novia 18 29 25 27 27 30 36 a) Determinar la intensidad de la interrelación lineal entre ambas variables. b) Predecir la edad del novio que se casa con una mujer de 20 años. c) Predecir la edad de la novia que se casa con un hombre de 30 años. 7.- Una compañía discográfica ha recopilado la siguiente información sobre el número de conciertos dados por 15 grupos musicales y las ventas de discos de estos grupos (expresados en miles), obteniendo los datos siguientes: Conciertos (1,5] CD (5,10] (10,20] (10,30] (30,40] (40,80] 3 0 0 1 4 1 0 1 5 a) Calcular el número medio de CD vendidos por estos grupos. b) Obtener la recta de regresión del número de conciertos respecto al número de CD vendidos. c) Si un grupo musical ha vendido 18.000 CD, ¿qué número de conciertos es previsible que dé? 8.- A través de una encuesta se sabe que los 13 alumnos de un curso de enseñanza primaria dedican a ver la televisión las horas semanales identificadas con la variable X. Los valores de la variable Y son las calificaciones medias obtenidas por estos alumnos. X 16 25 12 10 24 11 20 15 8 23 18 15 12 Y 5 2 6 8 5 10 4 6 9 2 4 8 9 a) Representa la nube de puntos. b) Halla el coeficiente de correlación lineal entre las referidas variables. c) Halla la recta de regresión de Y respecto de X. d) Estima la calificación media de un alumno que dedique 3 horas diarias a ver la televisión. RELACIÓN 2: RELACIÓN ENTRE DOS VARIABLES (SOLUCIÓN) 1.Vieron el debate No vieron el debate Vieron la película No vieron la película 1120 1592 2.712 67 1.041 1108 1.187 2633 3.820 2.- X: Talla padres x = 168 σx = 5 Y: Talla hijos y = 170 σ y = 7'5 0'7 = σ xy Y−y= r = 0’7 σ xy 5 ⋅ 7'5 Y−y= σ xy σx 2 σx 2 (X − x ) ⇒ σ xy = 26'25 ( X − x ) ⇒ Y − 170 = 26'25 ( X − 168) ⇒ Y = 1'05 X − 6'4 25 Y = 1'05 ⋅ 180 − 6'4 ⇒ Y = 182'6 Y = 1'05 ⋅ 160 − 6'4 ⇒ Y = 161'6 3.80 70 60 50 40 30 20 10 0 0 2 4 6 8 10 12 14 16 18 Debe ser correlación positiva y fuerte, es decir cercana a 1. b) xi yi fi xi ·yi · fi 0 0 11 1 44 2 22 1 155 5 31 1 539 11 49 1 17 67 1 1139 5 1877 σ xy = 1877 − 7 ⋅ 36 = 123'4 5 r= 123'4 = 0'996 6'23 ⋅ 19'88 Y − 36 = 4.- 123'4 ( X − 7 ) ⇒ Y = 32'82 cm. 38'81 σ xy = 0'0323 r = 0'1805 La correlación lineal es bastante débil. 1.5 1 0.5 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 -0.5 -1 No hay una correlación no lineal fuerte, pues aparecería la gráfica de algo que no es una función. 5.xi 3 4 5 6 7 8 10 x = 5'5 σ x = 1'612 fi 4 6 12 9 6 1 2 40 xi · fi 12 24 60 54 42 8 20 220 2 xi ⋅ f i 36 96 300 324 294 64 200 1314 yi 2 5 6 7 9 10 y = 5'6 b) σ xy = 2 yi · fi y i ⋅ f i 8 16 90 450 48 288 49 343 9 81 20 200 224 1378 σ y = 1'758 1336 2'6 − 5'5 ⋅ 5'6 = 2'6 ⇒ r = = 0'917 40 1'612 ⋅ 1'758 c) X − 5'5 = 6.- fi 4 18 8 7 1 2 40 2'6 (7'5 − 5'6) ⇒ X = 7'09 3'09 Novio X Novia Y x = 34 σ x = 6'547 y = 27'43 σ y = 5'038 σ xy = 6718 − 34 ⋅ 27'43 = 27'09 7 a) r = 27'09 = 0'821 6'547 ⋅ 5'038 b) X − 34 = 27'09 (20 − 27'43) ⇒ X = 26'069 ⇒ X = 26 25'381 c) Y − 27'43 = 7.- 27'09 (30 − 34) ⇒ Y = 24'90 ⇒ Y = 25 42'86 a) xi (1,5] 3 (5,10] 7.5 (10,20] 15 fi xi · fi 3 9 6 45 6 90 15 144 x = 9'6 b) Y − 41 = 63'4 ( X − 9'6) 22'14 c) Y − 41 = 8.- 63'4 (18 − 9'6) ⇒ Y = 65'05 ⇒ Y = 65 conciertos. 22'14 a) 12 10 8 6 4 2 0 0 b) r = –0’87 c) Y = −0'413 X + 12'639 d) Y = −0'413 ⋅ 21 + 12'639 = 3'966 ≈ 4 5 10 15 20 25 30