MATEMÁTICAS Unidad 6. Estadística SOLUCIONES 1.- Se tienen las siguientes notas de 20 alumnos que son las siguientes: 9, 5 ,6, 6, 7, 7, 3, 3, 6, 7, 5, 6, 3, 7, 8, 7, 6, 5, 4, 6 Calcular la media y la varianza de las notas. En primer lugar se hace una tabla con los valores de la frecuencia absoluta de cada valor de la variable. (El número de veces que aparece en la serie cada valor de la variable) xi 3 4 5 6 7 8 9 fi 3 1 3 6 5 1 1 Para calcular la media se aplica la fórmula correspondiente: x x1 f1 x 2 f 2 x3 f 3 ... x n f n N En este caso sería: x 3 3 4 1 5 3 6 6 7 5 8 1 9 1 20 El resultado de la operación anterior es: x 116 5´8 20 Para el cálculo de la varianza se utiliza la siguiente fórmula: 2 x 2 f x 2 2 f 2 x 3 2 f3 ... x n 2 fn Sx2 1 1 x N En este caso sería: Sx2 32 3 42 1 52 3 62 6 72 5 82 1 92 1 5´8 2 20 El resultado de la operación anterior es: S x 2 36´2 33´64 2´56 Curso de Acceso a Ciclos Formativos de Grado Superior Página 1 de 12 MATEMÁTICAS Unidad 6. Estadística 2.- Para realizar una estadística del peso de los alumnos de un Centro, se ha tomado una muestra de 50 alumnos y se ha anotado sus tallas. Resulta que hay: [50,55) 6 alumnos [55,60) 14 alumnos [60,65) 18 alumnos [65,70) 12 alumnos Calcular la media, la desviación típica y el coeficiente de variación Para calcular la media se aplica la fórmula correspondiente: x x1 f1 x 2 f 2 x3 f 3 ... x n f n N En este caso como la variable es continua en cada intervalo se calcula la marca de clase haciendo la media de los límites en cada intervalo. 52´5 en el primer intervalo, 57´5 en el segundo, 62´5 en el tercero y 67´5 en el cuarto Sería: x 52´5 6 57´5 14 62´5 18 67´5 12 50 El resultado de la operación anterior es: x 3055 61´1 50 Para el cálculo de la varianza se utiliza la siguiente fórmula: 2 x 2 f x 2 2 f 2 x 3 2 f3 ... x n 2 fn Sx2 1 1 x N En este caso, teniendo en cuenta la marca de clase de cada intervalo sería: Sx2 52´5 2 6 57´5 2 14 62´5 2 18 67´5 2 12 61´12 50 El resultado de la operación anterior es: Sx 2 187812´5 61´12 3756´25 3733´21 23´04 50 Para calcular la desviación típica ( ) se hace la raíz cuadrada de la varianza: S x S x 2 23´04 4´8 Para calcular el coeficiente de variación CV se aplica la fórmula: CV = Sx x En este caso sería: CV = 4´8 0´07856 61´1 Curso de Acceso a Ciclos Formativos de Grado Superior Página 2 de 12 MATEMÁTICAS Unidad 6. Estadística 3.- En un colegio se ha realizado un estudio estadístico sobre la altura de sus alumnos. Para ello se ha tomado un muestra aleatoria de 50 alumnos. Se han obtenido los siguientes resultados: Hay 5 alumnos de 100 cm o más y menos de 110 cm. Hay 7 alumnos de 110 cm o más y menos de 120 cm Hay 12 alumnos de 120 cm o más y de menos de 130 cm Hay 20 alumnos de 130 cm o más y de menos de 140 cm Hay 6 alumnos de 140 cm o más y de menos de 150 cm a) Realizar la tabla de frecuencias agrupando los datos en 5 intervalos, señalando las marcas de clase para cada intervalo. b) Calcular la media y el coeficiente de variación a) En primer lugar se hace una tabla con los valores de la frecuencia absoluta. En este caso es una variable continua y es necesario agruparlos en intervalos. Para hacer la tabla en la primera columna se señalan los intervalos, en la segunda la marca de clase y en la tercera los valores de la frecuencia absoluta de cada intervalo. La tabla sería: xi xi fi [100,110) 105 5 [110,120) 115 7 [120,130) 125 12 [130,140) 135 20 [140,150) 145 6 b) Para calcular la media se aplica la fórmula correspondiente: x x1 f1 x 2 f 2 x3 f 3 ... x n f n N En este caso como la variable es continua en cada intervalo se utiliza la marca de clase como valor representativo en cada intervalo.Sería: x 105 5 115 7 125 12 135 20 145 6 50 El resultado de la operación anterior es: x 6400 128 50 Para el cálculo de la varianza se utiliza la siguiente fórmula: 2 x 2 f x 2 2 f 2 x 3 2 f3 ... x n 2 fn Sx2 1 1 x N Curso de Acceso a Ciclos Formativos de Grado Superior Página 3 de 12 MATEMÁTICAS Unidad 6. Estadística En este caso, teniendo en cuenta la marca de clase de cada intervalo sería: Sx2 105 2 5 115 2 7 125 2 12 135 2 20 145 2 6 128 2 50 El resultado de la operación anterior es: Sx 2 825850 128 2 16517 16384 133 50 Para calcular la desviación típica ( ) se hace la raíz cuadrada de la varianza: S x S x 2 133 11´53 Para calcular el coeficiente de variación CV se aplica la fórmula: CV = Sx x En este caso sería: CV = 11´53 0´09 128 4.- Se han seleccionado al azar 8 alumnos y se han preguntado sus pesos y alturas, dando como resultado la siguiente tabla: Peso (Kg) 49 55 43 47 51 60 63 58 Altura (cm) 158 165 155 161 154 167 162 171 a) Representar gráficamente el diagrama de dispersión, deduce si hay correlación positiva o negativa. Diagrama de dispersión altura 172 170 168 166 164 162 160 158 156 154 152 0 10 20 30 40 50 60 70 peso Hay una correlación positiva, al aumentar el peso aumenta la altura b) Calcular la covarianza entre ambas variables Curso de Acceso a Ciclos Formativos de Grado Superior Página 4 de 12 MATEMÁTICAS Unidad 6. Estadística Para calcular la covarianza el primer paso es calcular las medias marginales. Es decir la media de los pesos, x y las medias de las alturas, y Para los pesos sería: x 49 55 43 47 51 60 63 58 53´25 kg 8 Para las alturas sería: y 158 165 155 161 154 167 162 171 161´625 cm 8 Una vez que se tienen las medias marginales se aplica la fórmula de la covarianza, x y x 2 y 2 x 3 y 3 ... x n y n S xy 1 1 xy N En este caso sería: S xy 49 158 55 165 43 155 47 161 51 154 60 167 63 162 58 171 53´25 161´62 8 S xy 24´34 c) Analizar la dispersión calculando el coeficiente de correlación Para calcular el coeficiente de correlación se necesitan las desviaciones típicas marginales, es decir de los pesos, S x y de las alturas, S y Para los pesos la varianza sería: Sx2 49 2 55 2 43 2 47 2 512 60 2 63 2 58 2 53´25 2 41´6875 8 y la desviación típica sería: S x 41´6875 6´456 Para las alturas la varianza sería: Sy2 158 2 165 2 155 2 1612 154 2 167 2 162 2 1712 161´625 2 30´484 8 y la desviación típica sería: S y 30´484 5´52 Una vez que se tienen las desviaciones típicas marginales se aplica la fórmula del coeficiente de correlación: S xy Sx Sy En este caso sería: 24´34 6´456 5´52 0´683 Es una relación fuerte ya que el valor es próximo a 0´7. Curso de Acceso a Ciclos Formativos de Grado Superior Página 5 de 12 MATEMÁTICAS Unidad 6. Estadística Es una correlación positiva, como ya se dedujo del diagrama. Esto significa que a mayor peso mayor altura. 5.- En una clase se preguntó a seis alumnos elegidos al azar, las horas que dedicaban semanalmente a ver la televisión y a estudiar. Los resultados obtenidos fueron los siguientes: Horas de TV 12 10 15 20 28 8 Horas de estudio 7 8 5 2 3 10 a) Representa el diagrama de puntos, deduce si hay correlación positiva o negativa b) Calcula el coeficiente de correlación. c) Halla la ecuación de la recta de regresión d) Si una persona ve 5 horas de TV a la semana estima con la recta de regresión las horas que estudiará a la semana. a) Diagrama de dispersión 12 horas de estudio 10 8 6 4 2 0 0 5 10 15 20 25 30 horas de TV Hay una correlación negativa, al aumentar las horas que se ve la TV disminuye el número de horas de estudio b) Calcula el coeficiente de correlación. Para calcular el coeficiente de correlación el primer paso es calcular las medidas marginales, tanto las medias como las desviaciones típicas. Es decir la media de los horas de TV, x y la media de las horas de estudio, y . Por otro lado la desviación típica de las horas de TV , S x y la desviación típica de las horas de estudio, S y La media de los horas de TV sería: Curso de Acceso a Ciclos Formativos de Grado Superior Página 6 de 12 MATEMÁTICAS Unidad 6. Estadística x 12 10 15 20 28 8 15´5 horas 6 La varianza de los horas de TV sería: 12 2 10 2 15 2 20 2 28 2 8 2 15´5 2 45´917 6 Sx2 y la desviación típica sería: S x 45´917 6´78 Para las horas de estudio la media sería: y 7 8 5 2 3 10 5´83 horas 6 La varianza de los horas de estudio sería: Sy2 7 2 8 2 5 2 2 2 3 2 10 2 5,83 2 7´844 6 y la desviación típica sería: S y 7´844 2´8 Una vez que se tienen las medias marginales se necesita también la covarianza: x y x 2 y 2 x 3 y 3 ... x n y n S xy 1 1 xy N En este caso sería: S xy 12 7 10 8 15 5 20 2 28 3 8 10 15´5 5´83 6 S xy 16´53 Una vez que se tienen las medidas marginales y la covarianza se aplica la fórmula del coeficiente de correlación: S xy Sx Sy En este caso sería: 16´53 6´78 2´79 0´87 Es una relación fuerte ya que el valor es próximo a 0´9. Es una correlación negativa, como ya se dedujo del diagrama. Esto significa que a mayor horas de TV menos horas de estudio. c) Halla la ecuación de la recta de regresión La ecuación de la recta de regresión de y sobre x es: y axb Curso de Acceso a Ciclos Formativos de Grado Superior Página 7 de 12 MATEMÁTICAS Unidad 6. Estadística Siendo: S xy a= S 2 x y a x b= En este caso sería: a= 16´53 0´36 45´917 b = 5´83 ( 0´36) 15´5 11,41 Realizando las operaciones quedaría: y 0´36 x 11´41 d) Si una persona ve 5 horas de TV a la semana estima con la recta de regresión las horas que estudiará a la semana. Si sustituimos en la ecuación de la recta de regresión el valor x = 5 se obtiene el valor estimado de las horas de estudio: y 0´36 5 11´41 9,61 horas 6.- Se ha preguntado a 6 personas dos cuestiones, la primera la calificación en un examen de matemáticas y la segunda el número de días que han dedicado a estudiarlo. La representación de la nube de puntos de las respuestas es: Diagrama de dispersión días de estudio 7 6 5 4 3 2 1 0 0 2 4 6 8 10 calificación a) Rellena la siguiente tabla de datos a partir de la nube de puntos. Calificación (X) … … … … … … Días de estudio (Y) … … … … … … b) Calcula el coeficiente de correlación e interprétalo c) Hallar la recta de regresión Curso de Acceso a Ciclos Formativos de Grado Superior Página 8 de 12 MATEMÁTICAS Unidad 6. Estadística a) Rellena la siguiente tabla de datos a partir de la nube de puntos. Calificación (X) 2 3 5 5 7 8 Días de estudio (Y) 1 3 4 5 5 6 b) Calcular el coeficiente de correlación e interpretarlo Para calcular el coeficiente de correlación el primer paso es calcular las medidas marginales, tanto las medias como las desviaciones típicas. Es decir la media de las calificaciones, x y la media del número de días de estudio, y . Por otro lado la desviación típica de las calificaciones, S x y la desviación típica del número de días, S y La media de las calificaciones sería: x 235578 5 6 La varianza de las calificaciones sería: Sx2 22 32 52 52 72 82 5 2 4´326 6 y la desviación típica sería: S x 4´326 2´08 Para el número de días de estudio la media sería: y 1 3 4 5 5 6 4 días 6 La varianza del número de días sería: Sy2 12 3 2 4 2 5 2 5 2 6 2 4 2 2´667 6 y la desviación típica sería: S y 2´667 1´63 Una vez que se tienen las medias marginales se necesita también la covarianza: x y x 2 y 2 x 3 y 3 ... x n y n S xy 1 1 xy N En este caso sería: S xy 2 1 3 3 5 4 5 5 7 5 8 6 54 6 S xy 3´17 Curso de Acceso a Ciclos Formativos de Grado Superior Página 9 de 12 MATEMÁTICAS Unidad 6. Estadística Una vez que se tienen las medidas marginales y la covarianza se aplica la fórmula del coeficiente de correlación: S xy Sx Sy En este caso sería: 3´17 2´08 1´63 0´93499 Es una relación fuerte ya que el valor es mayor que 0´9. Es una correlación positiva, a mayor calificación mayor número de días se ha dedicado a prepararlo. c) Hallar la recta de regresión La ecuación de la recta de regresión de y sobre x es: y axb Siendo: S xy a= S 2 x yb= y a x En este caso sería: a= 3´17 = 0´73 2´08 2 b = 4 0´73 5 0´35 Realizando las operaciones quedaría: y 0´73 x 0´35 7.- La siguiente tabla muestra las alturas y los pesos de cinco individuos elegidos al azar en una clase de bachillerato: Altura (cm) 166 172 160 171 176 Peso (Kg) 58 80 55 73 73 a) Calcular la recta de regresión de y sobre x b) Hallar el peso estimado de un individuo que mida 180 cm. Curso de Acceso a Ciclos Formativos de Grado Superior Página 10 de 12 MATEMÁTICAS Unidad 6. Estadística a) Para calcular el coeficiente de correlación el primer paso es calcular las medidas marginales, tanto las medias como las desviaciones típicas. Es decir, la media de las alturas, x y la media del peso, y . Por otro lado la desviación típica de las alturas, S x y la desviación típica del peso, S y Las medias serían: x 166 172 160 171 176 169 cm 5 y 58 80 55 73 73 67´8 Kg 5 Las varianzas serían: Sx2 166 2 172 2 160 2 1712 176 2 169 2 30´4 5 Sy2 58 2 80 2 55 2 73 2 73 2 67´8 2 92´56 5 y las desviaciones típicas son: S y 92´56 9´62 S x 30´4 5´51 Una vez que se tienen las medias marginales se necesita también la covarianza. En este caso sería: S xy 166 58 172 80 160 55 171 73 176 73 169 67´8 5 S xy 45´6 Una vez que se tienen las medidas marginales y la covarianza se aplica la fórmula del coeficiente de correlación: 45´6 5´51 9´62 0´86 La ecuación de la recta de regresión de y sobre x es: y axb S xy a= S 2 x Siendo: yb= y a x En este caso sería: a= 45´6 = 1´5 30´4 b = 67 ´8 1´5 169 185 ´7 Realizando las operaciones quedaría: y 1´5 x 185´7 b) Para calcular el peso estimado de un individuo que mida 180 cm. se sustituye en la ecuación de la recta de regresión el valor x = 180 Por tanto: Curso de Acceso a Ciclos Formativos de Grado Superior Página 11 de 12 MATEMÁTICAS Unidad 6. Estadística y 1´5 180 185´7 y = 84´3 kg. Curso de Acceso a Ciclos Formativos de Grado Superior Página 12 de 12