. Módulo 8 Estadı́stica Descriptiva Guı́a de Ejercicios Índice Unidad I. Introducción a la Estadı́stica Descriptiva. Ejercicios Resueltos ............................................................................................ pág. 02 Ejercicios Propuestos .......................................................................................... pág. 09 Unidad II. Medidas Estadı́sticas. Ejercicios Resueltos ............................................................................................ pág. 13 Ejercicios Propuestos .......................................................................................... pág. 19 Unidad III. Correlación y Regresión Lineal. Ejercicios Resueltos ............................................................................................ pág. 22 Ejercicios Propuestos .......................................................................................... pág. 24 1 Unidad I. Introducción a la Estadı́stica Descriptiva. Ejercicios Resueltos 1. En un canal de televisión desea conocer las edades de los televidentes que ven una telenovela. Para esto se lleva a cabo un estudio y se seleccionan al azar 350 adultos de familia de cinco municipios. ¿Cuál serı́a un dato de estudio?. ¿Cuál serı́a la muestra?. Solución Dato: la edad de un televidente. Población: el conjunto de las edades de los televidentes. Muestra: el conjunto de las edades de los 350 adultos encuestados. 2. Decir de las variables siguientes cuáles representan datos discretos y cuáles datos continuos. a) Número de acciones vendidas cada dı́a en un mercado de valores. b) Temperaturas registradas cada media hora en un observatorio. c) Periodo de duración de los tubos de televisión producidos por una compañia. d) Censos anuales del olegio de profesores. e) Longitud de 1.000 cerrojos producidos en una fábrica. Solución a) Discreta. b) Continua. c) Continua. d) Discreta. e) Continua. 3. La unión de empleados de una compañia solicita una guarderı́a para los ni˜os de los trabajadores como parte de sus beneficios. Para determinar el número de niños menores de seis años que cada empleado tiene, la generencia aplicó un uestinario a sus 50 empleados. Los resultados fueron: 2 1 0 0 3 0 0 1 2 1 0 2 1 0 3 2 0 1 1 0 0 1 1 2 4 2 0 1 1 0 0 0 2 4 1 1 0 1 2 0 1 1 0 3 5 1 2 1 3 2 Organizar los datos en una tabla de frecuencia. 2 Solución Primero se identifica cada dato distinto y se prepara una lista ordenada en una columna. Ésta serı́a: 0, 1, 2, 3, 4 y 5. Luego se identifican las veces que cada uno se repite; esto es, su frecuencia. Y ası́ resulta: Número de niños 0 1 2 3 4 5 Total Frecuencia 16 18 9 4 2 1 50 4. En un grupo de 50 personas, se registraron las estaturas, en cm, de cada uno de ellos. 161 170 177 182 163 175 183 162 167 183 167 180 177 185 183 176 183 167 178 176 172 180 183 172 184 171 177 182 179 183 166 188 168 174 184 175 173 175 183 184 187 164 183 172 187 177 163 172 184 178 Organizar los datos en una tabla de frecuencia. Solución Para ordenarlos y agruparlos, establecemos los intervalos que se usarán para distribuirlos, determinando el rango de estos datos. Dato mayor: 188 Dato menor: 161 Rango: 88 - 61 = 27 De acuerdo con el rango y teniendo en cuenta que la cantidad de datos es pequeña, los agruparemos e solo 6 clases, representadas por los respectivos intervalos, como muestra el cuadro siguiente. Intervalos de estaturas 160 - 164 165 - 169 170 - 174 175 - 179 180 - 184 185 - 189 3 Frecuencia 5 5 8 12 16 4 5. Encontrar la marca de clase para cada intervalo del problema 4. Solución En el primer intervalo, 60 - 64, que representa a la primera clase de la distribución de frecuencias, la marca de clase es 162. 160 + 164 324 = = 162 2 2 Las marcas de clase de los siguientes intervalos se calculan de igual manera 2o intervalo : 3er intervalo : o 4 intervalo : 5o intervalo : o 6 intervalo : 165+169 2 170+174 2 175+179 2 180+184 2 185+189 2 Intervalos de estaturas 160 - 164 165 - 169 170 - 174 175 - 179 180 - 184 185 - 189 = = = = = 334 2 344 2 354 2 364 2 374 2 = 167 = 172 = 177 = 182 = 187 Marca de clase 162 167 172 177 182 187 6. Los siguientes datos corresponden a las estaturas, en metros, de 80 perosnas. Construir una tabla de frecuencia que incluya las columnas de frecuencia absoluta, relativa y relativa porcentual. 1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92 1,75 1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75 1,78 1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93 1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84 1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,75 1,78 1,77 1,74 1,73 1,83 1,76 1,83 1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,76 1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77 4 Solución Estatura mayor = 1,93 m Estatura menor = 1,66 m Rango = 1,93 - 1,66 = 0,27 m = 27 cm Formaremos 6 intervalos. Para calcular su tamaño dividimos: 27 : 6 = 4, 5 ≈ 5 Por lo tanto, los intervalos serán de tamaño 5 cm, es decir, 0,05 m Intervalos de estaturas 1,65 - 1,69 1,70 - 1,74 1,75 - 1,79 1,80 - 1,84 1,85 - 1,89 1,90 - 1,94 Frecuencia 6 12 30 22 8 2 Frecuencia total = 80 Para encontrar la siguiente columna, frecuencia relativa, se divide la frecuencia absoluta de cada clase por la frecuencia total. Intervalos de estaturas 1,65 - 1,69 1,70 - 1,74 1,75 - 1,79 1,80 - 1,84 1,85 - 1,89 1,90 - 1,94 Frecuencia 6 12 30 22 8 2 80 5 F. relativa 0,075 0,150 0,375 0,275 0,1 0,025 1 F. relativa porcentual 7,5 15 37,5 27,5 10 2,5 100 % 7. Dibujar el histograma correspondiente a los datos del problema 4. Solución 8. La siguiente tabla corresponde a resultados de la Prueba de Selección Universitaria de los alumnos de un colegio. Puntaje Frecuencia 350 - 399 4 400 - 449 6 450 - 499 9 500 - 549 20 550 - 599 31 600 - 649 80 650 - 699 42 700 - 749 10 750 - 799 8 800 - 849 2 212 Completar la tabla con las columnas de frecuenncia acumulada, acumulada relativa y acumulada relativa porcentual. 6 Solución Puntaje Frecuencia 350 - 399 4 400 - 449 6 450 - 499 9 500 - 549 20 550 - 599 31 600 - 649 80 650 - 699 42 700 - 749 10 750 - 799 8 800 - 849 2 212 Frecuencia acumulada 4 4 + 6 = 10 4 + 6 + 9 = 10 + 9 = 19 19 + 20 = 39 39 + 31 = 70 70 + 80 = 150 150 + 42 = 192 192 + 10 = 202 202 + 8 = 210 210 + 2 = 212 Para encontrar la frecuencia acumulada relativa para las distintas clases, se divide la frecuencia acumulada por el total. Por ejemplo para la clase 550 - 599, la frecuencia acumulada relativa es: 70 = 0, 3302 212 Finalmente para encontrar la frecuencia acumulada relativa porcentual, se multiplica por 100 el valor de la frecuencia acumulada relativa de cada clase. Puntaje Frecuencia 350 - 399 4 400 - 449 6 450 - 499 9 500 - 549 20 550 - 599 31 600 - 649 80 650 - 699 42 700 - 749 10 750 - 799 8 800 - 849 2 212 F. acumulada 4 10 19 39 70 150 192 202 210 212 7 F. acumulada relativa 0,0189 0,0472 0,0896 0,1840 0,3302 0,7075 0,9057 0,9528 0,9906 1 F. a. r. porcentual 1,89 4,72 8,96 18,4 33,02 70,75 90,57 95,28 99,06 100 9. Graficar mediante una poligonal de frecuencias acumuladas los datos del problema 8. Solución La distribución acumulada que correponde a los datos del problema 8 se pueden presentar de la siguiente manera: Puntaje Frecuencia acumulada Menor que 349,5 0 Menor que 399,5 4 Menor que 449,5 10 Menor que 499,5 19 Menor que 549,5 39 Menor que 599,5 70 Menor que 649,5 150 Menor que 699,5 192 Menor que 749,5 202 Menor que 799,5 210 Menor que 849,5 212 Con esta tabla podemos graficar la poligonal de frecuencia acumulada. 8 Ejercicios Propuestos 1. ¿Cuál serı́a un dato de cada estudio?. El conjnto de datos que se recopilará, ¿representa una muestra o una población?. a) Un municipio desea conocer las edades de los residentes de un barrio. Para esto, se lleva a cabo un estudio y se seleccionan 50 habitantes de ese barrio. b) Se recabaron datos referentes al nvel de colesterol de 900 residentes del área metropolitana para estudiar la condición de salud de los habitantes. c) El departamento de educación desea saber cuántos profesores tiene entre 20 y 25 años de servicio. d) Una estación de televisión desea saber la proporción de televidentes que miran su uevo programa al menos una vez a la semana. Un grupo aleatorio de 1000 televidentes fueron encuestados. 2. Decir cuáles de los siguentes datos representan una variable discreta y cuáles una variable continua. a) Centı́metros de precipitación de una cuidad durante varios meses del año. b) Velocidad de un automóvil en kilometros por hora. c) Número de billetes de 20 dólares circulando a la vez en Estados Unidos. d) Estudiantes matriculados en una universidad en un número de años. 3. Una prueba de hemoglobina que se aplica a las personas con diabetes durante sus exámenes rutinarios de control, indica el nivel de azúcar en la sangre durante dos o tres meses antes de la prueba. Los siguientes datos se obtuvieron de 40 personas diabéticas en una clı́nica: 6,5 5,0 5,6 7,6 4,8 8,0 7,5 7,9 8,0 9,2 6,4 6,0 5,6 6,0 5,7 9,2 8,1 8,0 6,5 6,6 5,0 8,0 6,5 6,1 6,4 6,6 7,2 5,9 4,0 5,7 7,0 6,0 5,6 6,0 6,2 7,7 6,7 7,7 8,2 9,0 Organizar los datos en una tbala de frecuencia agrupada en seis intervalos. Utiliza las clases: 3,7 a 4,6; 4,7 a 5,6; 5,7 a 6,6; 6,7 a 7,6; 7,7 a 8,6; 8,7 a 9,6 9 4. Considerar los datos siguientes: 7 12 14 8 9 15 14 10 8 11 12 8 8 15 14 13 10 8 9 12 12 7 10 8 12 13 11 9 a) Ordenarlos en forma creciente. b) Calcular el rango de los datos. c) Establecer la frecuencia de los datos 8, 10 y 15. d) De todos los datos, ¿cuál tiene mayor frecuencia? 5. Dado el siguiente conjunto de datos: 7 20 15 12 8 10 7 14 13 9 12 19 20 13 8 7 10 12 15 18 18 16 7 8 9 12 14 15 9 12 13 10 10 7 9 13 14 16 17 19 20 18 12 14 16 16 7 10 15 10 a) Calcular el rango. b) ¿En cuántos intervalos de igual tamaño se agruparı́an los datos si el primero fuera 6 - 8? c) Encontrar la frecuencia de la clase 12 - 14. d) Construir la tabla de distribución de frecuencias, considerando 5 intervalos iguales, a partir del 6 - 8. e) ¿Qué tamaño tienen los intervalos de la distribución anterior? f) ¿Cuáles son las marcas de clase de la distribución? g) ¿Cuál es la clase con menor frecuencia? 10 6. La distribución de frecuencias muestra la cantidad de colesterol total de un grupo de pacientes cuya edad es de 50 a 60 ańos. Colesterol total (mg/dl) Frecuencia 170 - 179 4 180 - 189 7 190 - 199 12 200 - 209 16 210 - 219 35 220 - 229 37 230 - 239 11 240 - 249 8 a) Calcular las frecuencias relativas. b) Determinar las frecuencias porcentuales. c) Identificar la clase con mayor frecuencia. d) Identificar la clase con menor frecuencia relativa porcentual. e) Calcular la suma de las frecuencias relativas. f) Calcular la suma de las frecuencias porcentuales. g) Explicar por qué la suma de las frecuencias relativas no es 1, en este caso. 7. Un curso de 44 alumnos obtuvo las siguientes notasen una asignatura 5,0 2,8 6,8 6,2 5,7 5,9 3,7 3,8 3,3 2,2 4,9 2,7 5,1 5,5 4,3 4,3 3,7 3,9 3,0 7,0 2,7 4,8 3,2 3,4 4,2 4,3 4,8 4,9 5,3 5,7 4,0 4,0 4,1 4,1 4,5 5,0 4,6 5,3 5,3 5,6 6,0 5,3 4,5 4,3 a) Construir una tabla de distribución de frecuencias absolutas y relativas porcentuales, con intervalo de igual tamaño, comenzando con el intervalo 2,1 - 2,5. b) Dibujar el histograma de frecuencias relativas porcentuales. c) Establecer a qué intervalos corresponde la mayor frecuencia. d) Dibujar los polı́gonos de frecuencias absolutas. 11 8. La siguiente tabla corresponde a la distribución de los puntajes promedio de la Prueba de Selección Universitaria Puntaje Estándar 200 - 249 250 - 299 300 - 349 350 - 399 400 - 449 450 - 499 500 - 549 550 - 599 600 - 649 650 - 699 700 - 749 750 - 799 800 - 849 Frecuencia 1 139 5.474 17.810 21.239 20.184 18.517 16.597 13.583 9.619 4.848 1.026 11 a) ¿Cuántos alumnos rindieron la prueba? b) ¿Qué porcentaje de alumnos obtuvo puntajes menores que los del intervalo 500 - 549? c) ¿Qué porcentaje de alumnos obtuvo puntajes iguales o superiores a los del intervalo 700 - 749? d) Dibujar una curva de distribución de frecuencias. e) En la tabal dada, construir la columna correspondiente a Frecuencia Acumulada Porcentual. 12 Unidad II. Medidas Estadı́sticas. Ejercicios Resueltos 1. Las calificaciones de un estudiante en seis pruebas fueron 64, 59, 70, 68, 58 y 57. Hallar el promedio de las calificaciones. Solución X̄ = ΣX 64 + 59 + 70 + 68 + 58 + 57 376 = = = 62, 6 N 6 6 2. Las puntuaciones finales de un estudiante en matemáticas, fı́sica, inglés e historia son, respectivamnte, 64, 53, 66 y 48. Si la importanci que se asigna a estas asignaturas son de 3, 5, 3 y 1, respectivamente, determinar el promedio ponderado de puntuación adecuado. Solución X̄ = ΣwX 3 · 64 + 5 · 53 + 3 · 66 + 1 · 48 694 = = = 57, 8 Σw 3+5+3+1 12 3. Utilizar la siguiente tabla para hallar el promedio del peso de 100 estudiantes. Peso (kg) Frecuencia (f) 60 - 62 5 63 - 65 18 66 - 68 42 69 - 71 27 72 - 74 8 Solución El trabajo puede ser ordenado como aparece en la siguiente tabla. Peso (kg) Frecuencia (f) Marca de clase X 60 - 62 5 61 63 - 65 18 64 66 - 68 42 A → 67 69 - 71 27 70 72 - 74 8 73 13 Desviaciones d = X - A fd -6 -30 -3 -54 0 0 3 81 6 48 Se toma la marca de clase 67 como el promedio supuesto A, ya que es la de mayor frecuencia.Con esto se puede calcular el promedio utilizando la siguiente relación: X̄ = A + 45 Σf d = 67 + = 67, 45kg N 100 4. Las calificaiones de un estudiante en seis exámes fueron 67, 58, 45, 63, 55 y 70. Hallar la mediana de las calificaiones. Solución Puestas en orden, las calificaiones son 45, 55, 58, 63, 67, 70. Al haber un número par de términos hay dos valores centrales 58 y 63, cuyo promedio 1 (58 + 63) = 60, 5 es la mediana pedida. 2 5. Hallar la mediana de las estaturas de 40 personas utilizando la siguiente tabla. Estatura (cm) Frecuencias 118 - 126 3 127 - 135 5 136 - 144 9 145 - 153 12 152 - 162 5 163 - 171 4 172 - 180 2 Solución Puesto que la suma de las frecuencias de las tres y cuatro primeras clases son respectivamente 3 + 5 + 9 = 17 y 3 + 5 + 9 + 12 = 29, está claro que la mediana se encuentra en la cuarta clase, que será, por tanto, la clase mediana. Entonces L1 = lı́mite real inf erior de la clase mediana = 144, 5 N = número de datos = 40 (Σf )1 = suma de todas las clases inf eriores de la clase mediana = 3 + 5 + 9 = 17 fmediana = f recuencia de la clase mediana = 12 c = tamaño del intervalo de la clase mediana = 9 Ası́ se tiene: N/2 − (Σf )1 40/2 − 17 M ediana = L1 + · c = 144, 5 + · 9 = 146, 8 cm fmediana 12 14 6. Hallar el promedio, mediana y moda de los números: a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 b) 51,6; 48,7; 50,3; 49,5; 48,9 Solución a) Puestos en orden de magnitud, los números son 2, 2, 3, 5, 5, 5, 6, 6, 8, 9. 1 (2 + 2 + 3 + 5 + 5 + 5 + 6 + 6 + 8 + 9) = 5, 1 10 1 M ediana = media aritmética de los valores centrales = (5 + 5) = 5 2 M oda = número que se presenta con mayor f recuencia = 5 P romedio = b) Puestos en orden de magnitud, los números son 48,7; 48,9; 49,5; 50,3; 51,6. 1 (48, 7 + 48, 9 + 49, 5 + 50, 3 + 51, 6) = 49, 8 5 M ediana = número central = 49, 5 M oda = número que se presenta con mayor f recuencia; aquı́ no existe P romedio = 7. Hallar la desviación media de la serie de números 12, 6, 7, 3, 15, 10, 18, 5 Solución Promedio: X̄ = 12 + 6 + 7 + 3 + 15 + 10 + 18 + 5 76 = = 9, 5 8 8 Desviación media: M.D. Σ|X − X̄| N |12 − 9, 5| + |6 − 9, 5| + |7 − 9, 5| + |3 − 9, 5| + |15 − 9, 5| + |10 − 9, 5| = 8 |18 − 9, 5| + |5 − 9, 5| + 8 2, 5 + 3, 5 + 2, 5 + 6, 5 + 5, 5 + 0, 5 + 8, 5 + 4, 5 = 8 34 = = 4, 25 8 = 15 8. Hallar la desviación media de los pesos de 100 estudiantes utilizando la tabla del ejercicio 3. Solución Del problema 3, el promedio es X̄ = 67, 45 Peso (kg) Frecuencia (f) Marca de clase X 60 - 62 5 61 63 - 65 18 64 66 - 68 42 67 69 - 71 27 70 72 - 74 8 73 M.D. = |X − X̄| = |X − 67, 45| f |X − X̄| 6,45 32,35 3,45 62,10 0,45 18,90 2,55 68,85 5,55 44,40 Σf |X − X̄| 226, 5 = = 2, 26 kg N 100 9. Hallar la desviación tı́pica de la serie 9, 3, 8, 8, 9, 8, 9, 18. Solución Promedio: X̄ = 9 + 3 + 8 + 8 + 9 + 8 + 9 + 18 72 = =9 8 8 Desviación tı́pica: s Σ(X − X̄)2 N s (9 − 9)2 + (3 − 9)2 + (8 − 9)2 + (8 − 9)2 + (9 − 9)2 + (8 − 9)2 + (9 − 9)2 + (18 − 9)2 = 8 √ = 15 = 3, 87 s = 16 10. Hallar la desviación tı́pica de los pesos de 100 estudiantes utilizando la tabla del ejercicio 3. Solución Peso (kg) Marca de clase X 60 - 62 61 63 - 65 64 66 - 68 67 69 - 71 70 72 - 74 73 s s= X − X̄ = X − 67, 45 (X − X̄)2 -6,45 41,6025 -3,45 11,9025 -0,45 0,2025 2,55 6,5025 5,55 30,8025 Σf (X − X̄)2 = N s f |X − X̄|2 208,0125 214,2450 8,5050 175,5675 246,4200 852, 75 q = 8, 5275 = 2, 92 kg 100 11. Hallar a) Los cuartiles Q1 , Q2 y Q3 b) Los deciles D1 , D2 , ..., D9 , de los salarios de los 65 empleados de una compañia Salarios (dólares) Número de empleados 50,00 - 59,99 8 60,00 - 69,99 10 70,00 - 79,99 16 80,00 - 89,99 14 90,00 - 99,99 10 100,00 - 109,99 5 110,00 - 119,99 2 Solución a) El primer cuartil Q1 es aquel valor que se obtiene para el N/4 = 65/4 = 16, 25 de los casos comenzando por la clase primera (la más baja). Puesto que la primera clase contiene 8 casos, tomaremos 8,25 casos (16,25 - 8) de los 10 que tienen la segunda clase. Por el método de interpolación linel se tiene Q1 = $59, 995 + 8, 25 ($10, 00) = $68, 25 10 El segundo cuartil Q2 es aquel valor que se obtiene para el 2N/4 = N/2 = 65/2 = 32,5 de los casos. Puesto que las dos primeras clases comprenden 18 casos , tomaremos 32,5 - 18 = 14,5 de los 16 casos de la tercera clase, entonces Q2 = $69, 995 + 14, 5 ($10, 00) = $79, 06 16 17 Este cuartil Q2 realmente es la mediana. El tercer cuartil Q3 es aquel valor que se obtiene para el 3N/4 = 34 · 65 = 48,75 de los casos. Puesto que las cuatro primeras clases comprenden 48 casos, tomaremos 48,75 48 = 0,75 de los 10 casos de la quinta clase, entonces Q3 = $89, 995 + 0, 75 ($10, 00) = $90, 75 10 De aquı́ que el 25 % de los empleados gana $68,25 o menos, el 50 % gana $79,06 o menos y el 75 % gana $90,75 o menos. b) El primero, segundo, ..., neveno decil son los valores que se obtienen para N/10, 2N/10, ..., 9N/10 de los casos comenzando por la clase primera (la más baja). Tenemos D1 = $49, 995 + D2 = $59, 995 + D3 = $69, 995 + D4 = $69, 995 + D5 = $69, 995 + D6 = $69, 995 + D7 = $69, 995 + D8 = $69, 995 + D9 = $69, 995 + 6, 5 ($10, 00) = $58, 12 8 5 ($10, 00) = $65, 00 10 1, 5 ($10, 00) = $70, 94 16 8 ($10, 00) = $75, 00 16 14, 5 ($10, 00) = $79, 06 16 5 ($10, 00) = $83, 57 14 11, 5 ($10, 00) = $88, 21 14 4 ($10, 00) = $94, 00 10 0, 5 ($10, 00) = $101, 00 5 De aquı́ que el 10 % de los empleados gana $58,12 o menos, el 20 % gana $65,00 o menos, ..., el 90 % gana $101,00 o menos. El quinto decil es la mediana. El segundo, cuarto, sexto y octavo deciles que dividen la distribución en cinco partes iguales se llaman quintiles. 18 Ejercicios Propuestos 1. Los tiempo de reacción de un individuo a determinados estı́mulos fueron 0,53; 0,46; 0,5; 0,49; 0,52; 0,53; 0,44 y 0,55 segundos, respectivamente. Determinar el tiempo medio de reacción del individuo a los estı́mulos. 2. Las calificaciones de un estudiante en las tres asignaturas del curso fueron 70, 56 y 64. a) Si los pesos asignados a cada asignatura son 2, 4 y 5, respectivamente, ¿cuál es el promedio adecuado para sus calificaciones?. b) ¿Cuál serı́a si todos los pesos fueran iguales?. 3. La siguiente tabla muestra la distribución de la carga en toneladas que soortan ciertos cables producidos por una compañia. Determinar el promedio de la carga máxima. Máximo de carga (toneladas) Número de cables 9,3 - 9,7 2 9,8 - 10,2 5 10,3 - 10,7 12 10,8 - 11,2 17 11,3 - 11,7 14 11,8 - 12,2 6 12,3 - 12,7 3 12,8 - 13,2 1 4. Hallar el promedio y la mediana de los siguientes números: a) 5, 4, 8, 3, 7, 2, 9 b) 18,3; 20,6; 19,3; 22,4; 20,2; 18,8; 19,7; 20 5. Hallar la mediana para las cargas máximas de los cables del problema 3. 6. Hallar el promedio, la mediana y la moda para los siguientes datos: a) 7, 4, 10, 9, 15, 12, 7, 9, 7 b) 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7 7. Hallar la desviación tı́pica de los números: a) 3, 6, 2, 1, 7, 5 b) 3,2; 4,6; 2,8; 5,2; 4,4 c) 0, 0, 0, 0, 0, 1, 1, 1 19 8. Hallar la desviación tı́pica s de los diámetros de los remaches. Diámetro (cm) Frecuencia 0,7247 - 0,7249 2 0,7250 - 0,7252 6 0,7253 - 0,7255 8 0,7256 - 0,7258 15 0,7259 - 0,7261 42 0,7262 - 0,7264 68 0,7265 - 0,7267 49 0,7268 - 0,7270 25 0,7271 - 0,7273 18 0,7274 - 0,7276 12 0,7277 - 0,7279 4 0,7279 - 0,7282 1 9. Hallar las desviaciones medias de las series de números: a) 3, 7, 9, 5 b) 2, 4, 1, 6, 3, 8, 41, 3, 4 10. Hallar la desviación media (M.D.) de los diámetros de los remeaches de la tabla del problema 8. 11. La siguiente tabla muestra una distribuión de frecuecias de las calificaiones del examen final de álgebra. a) Hallar los cuartiles de la distribución. b) Interpretar el significado de cada uno Calificación 90 - 100 80 - 89 70 - 79 60 - 69 50 - 59 40 - 49 30 - 39 Número de estudiantes 9 32 43 21 11 3 1 20 12. Hallar, utilizando los siguientes datos a) El segundo decil. b) El cuarto decil. c) El 90o percentil. d) El 68o percentil. e) Interprete cada uno de los resultados anteriores. Edad de los cabeza de familia (años) Número (en millones) Menor de 25 2,22 25 - 29 4,05 30 - 34 5,08 35 - 44 10,45 45 - 54 9,47 55 - 64 6,63 65 - 74 4,16 75 y más 1,66 21 Unidad III. Correlación y Regresión Lineal. Ejercicios Resueltos 1. La empresa Soto Hnos., es un negocio familiar que vende al detalle en la ciudad de Chimbarongo muebles de caña, mimbre y otros materiales nobles. Se anuncia ampliamente por las emisoras locales, destcándo sus bajos precios y condiciones de crédito. A los hermanos les gustarı́a analizar la relación entre las ventas y lo que pasa con la publicidad. A continuación se encuentra la información acerca de as ventas y los gastos de pulicidad, en millones de pesos, de los últimos cuatro años. Mes Gastos en publicidad Julio 2.000.000 Agosto 1.000.000 Septiembre 3.000.000 Octubre 4.000.000 Ingrsos por ventas 7.000.000 3.000.000 8.000.000 10.000.000 a) A los hermanos les gustarı́a pronosticar las ventas con base en los gasto publicitarios. ¿ Cuál es la variable dependiente?. b) Determine el coeficiente de correlación. c) Interprete la fuerza del coeficiente de correlación. d) Evalue el coeficiente de determinación, e interprete su respuesta. e) Determine la ecuación de regresión. f) Interprete los valores de a y b. g) Calcule los ingresos por ventas cuando se gastas 3 millones de pesos en publicidad. Solución a) El gasto en publicidad es la variable independiente y el ingreso por ventas la variable dependiente. b) x y xy 2 7 14 1 3 3 3 8 24 4 10 40 10 28 81 r=√ x2 4 1 9 16 30 y2 49 9 64 100 222 4 · 81 − 10 · 28 44 44 =√ = = 0, 9648 2 2 45, 6070 4 · 30 − 10 · (4 · 22 − 28 ) 2080 c) Existe una fuerte correlación entre el gasto y el ingreso por ventas. 22 d) r2 = 0, 93; es decir, el 93 % de la variación en las ventas se explica por la variación en publicidad . e) b= 324 − 280 4 · 81 − 10 · 28 = 2, 2 = 2 4 · 30 − 10 120 − 100 a= 28 10 − 2, 2 · = 7 − 5, 5 = 1, 5 4 4 f) La pendiente es 2,2. Esto indica que un aumento de un millón de pesos en publicidad resultara en un incremneto de 2,2 millones en ventas. La intersección es 1,5. Si no hubiera gastos en publicidad, las ventas serı́an de 1,5 millones de pesos unicamente. g) Se tiene y 0 = 1, 5 + 2, 2x, luego: y 0 = 1, 2 + 2, 2 · 3 = 8, 1 23 Ejercicios Propuestos 1. Se han colgado sucesivamente del extremo de un resorte cinco masas, X, en gramos, y se han registrado los alargamientos, Y, en milı́metros producidos por las cargas. He aquı́ la tabla. X (g) Y (mm) 3 4 5 6 7 1,2 1,9 2,4 3 3,7 a) Dibuja la nubre de puntos. b) Hallar la recta de regresión c) Hallar el coeficiente de correlación lineal. d) Deducir lo que se estirarı́a el muelle si colgáramos una masa de 15 gramos. 2. En la siguiente tabla muestra el número de accidentes de tráfico en los últimos 7 años: Año (X) 1992 1993 1994 1995 1996 1997 1998 N accid. (Y) 510 515 518 522 528 532 536 o a) Determine el número medio de accidentes en los 7 años. b) Dibuje la nubre de puntos. c) Calcule la recta de regresión de X (años) sobre Y (no de accidentes). d) Obtenga el coeficiente de correlación lineal. e) ¿Cuántos accidentes estimarı́as para el año 2000?. 3. Ajustar la recta de regresión con los puntos dados hallando el coeficiente de correlación lineal. ¿Por qué da ”r” ese valor?. X Y -2 -1 0 3 -3 -1 1 7 4. Supongamos que un analista toma una muestra aleatoria de 10 embarques recientes por camión realizados por una compańı́a y registra las siguientes distancias en kilómetros y el tiempo de entrega al medio dı́a más cercano a partir del momento en que el embraque estuvo listo para su carga. Embraque de muestreado Distancia (x) en kilómetros Tiempo de entrega (y), en dı́as 1 2 3 4 5 6 7 8 9 10 825 215 1070 550 480 920 1350 325 670 1215 3,5 1 4 2 1 3 4,5 1,5 3 5 a) Elabore el diagrama de dispersión. b) Calcule el coeficiente de correlación y el coeficiente de determinación e interpretelos. c) Determie la recta de regresión. d) Calcule la variación total. e) Calcule la variación del error. 24 5. En la table se presentan datos muestrales relativos al número de horas de estudio fuera de clase durantes el periodo de tres semanas de alumnos de un curso de estadı́stica aplcada a la economı́a y a sus calificaciones en el examen final de ese periodo. Estudiantes muestreado Horas de estudio (x) Calificaciones en examen (y) 1 2 3 4 5 6 7 8 20 16 34 23 27 32 18 22 64 61 84 70 88 92 72 77 a) Calcular el coeficiente de correlación y el coeficiente de determincación e interpretelos. b) Construir el gráfico de dispersión. c) Calcular la ecuación de regresión. d) Estimar el error. 6. El MOP estudia las relaciones entre el número de licitaciones para un proyecto en la carretera, y la propuesta ganadora (la de más bajo costo) para el proyecto. De particular interés es si el número de postores aumenta disminuye el importe de licitación ganadora. Proyecto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Número de licitaciones x 9 9 3 10 10 5 10 7 11 6 6 4 7 7 6 Oferta ganadora (millones de dólares) y 5,1 8 9,7 7,8 7,8 7,7 5,5 8,3 5,5 10,3 8 8,8 9,4 8,1 7,8 a) Determine la ecuación de regresión e interprete. ¿ Más licitaiones tienden a aumnetar o disminuir el importe de la propuesta ganadora?. b) Estime el monto de la oferta ganadora si hubiese postores. c) Caclucle el coeficiente de determinación e interprete su valor. d) Evalue el error estandar de estimación. e) Trace el modelo de dispersión. f) Calcule el coeficiente de correlación e interprete. 25