Matemática Aplicada y Estadı́stica - Farmacia Hoja 1: Estadı́stica descriptiva 1. Los pesos (en Kgs.) de los niños recién nacidos en una clı́nica maternal durante el último año han sido: Peso No de niños [2.5,2.75) 27 [2.75,3) 36 [3,3.25) 85 [3.25,3.5) 144 [3.5,3.75) 98 [3.75,4) 56 [4,4.25) 32 [4.25,4.5] 32 a) Construir la tabla de frecuencias. b) Representarla gráficamente en un histograma las frecuencias relativas. Solución Apartado a): Se trata de una variable cuantitativa continua distribuida en intervalos de clase de la misma amplitud. Construimos la tabla de frecuencias absoluta, ni , y relativa, fi . Para completar la tabla, representamos también los porcentajes y las marcas de clase: [2.5, 2.75) 27 ni Frecuencia relativa fi = N 0.0529 [2.75, 3) 36 0.0706 7.06 % 2.88 [3, 3.25) 85 0.1667 16.67 % 3.13 [3.25, 3.5) 144 0.2824 28.24 % 3.38 [3.5, 3.75) 98 0.1922 19.22 % 3.63 [3.75, 4) 56 0.1098 10.98 % 3.88 [4, 4.25) 32 0.0627 6.27 % 4.13 [4.25, 4.5] 32 0.0627 6.27 % 4.38 Total 510 1 100 % --- Peso Frecuencia absoluta (ni ) Apartado b): Representamos ahora gráficamente en un histograma las frecuencias relativas. Para ello, se levanta sobre cada intervalo de clase un rectángulo de área proporcional a la frecuencia correspondiente a dicho intervalo. Teniendo en cuenta que los intervalos tienen la misma amplitud, la altura de cada uno de los rectángulos se toma igual a la frecuencia correspondiente. % Marca de clase 5.29 % 2.63 0.2824 0.1922 0.1667 0.1098 0.0706 0.0529 2.5 2.75 3 3.25 3.5 peso 3.75 4 4.25 4.5 2. Un profesor facilita las notas de sus alumnos por medio de la siguiente tabla: Nota No alumnos [10,20) 9 [20,30) 13 [30,50) 21 [50,60] 11 a) Construir la tabla de frecuencias acumuladas. Calcular la media aritmética y la desviación tı́pica. b) Completar la tabla del apartado anterior con la distribución de frecuencias porcentuales acumuladas. c) ¿Qué porcentaje de alumnos tienen una nota menor que 30? d ) Suponiendo que los datos se distribuyen de modo homogéneo en cada intervalo, ¿ qué porcentaje de alumnos tienen una nota menor que 40? ¿ Y menor que 38? Dpto. EDAN - 26 de septiembre de 2013 —1— Curso 2013/14 Matemática Aplicada y Estadı́stica - Farmacia Hoja 1: Estadı́stica descriptiva Sol.: a) media=35.2777, desviación tı́pica=13.4858; c) 40.73 %; d) porcentaje de alumnos tienen una nota ¡40: 60.17 %; y ¡38: 56.28 %. Solución Apartado a): Al tratarse de una variable cuantitativa continua distribuida en intervalos de clase, la media aritmética se calcula considerando las marcas de clases ci y las frecuencias absolutas ni de cada clase: x= 4 1 X ci ni N i=1 Ası́ que necesitamos calcular las marcas de cada clase, ampliando la tabla del enunciado en el sentido siguiente: Nota Marca de clase (ci = Li−1 +Li ) 2 ni fi = ni N (ci − x)2 [10, 20) 15 9 0.1666 (15 − 35.2777)2 = 411.1851 [20, 30) 25 13 0.2407 (25 − 35.2777)2 = 105.6311 [30, 50) 40 21 0.3888 (40 − 35.2777)2 = 22.3001 [50, 60) 55 11 0.2037 (55 − 35.2777)2 = 388.9691 --- 54 1 --- Total Aquı́, N = 54. La media aritmética, x, viene dada por la expresión: x= 4 15 · 9 + 25 · 13 + 40 · 21 + 55 · 11 1 X ci ni = = 35.2777 N i=1 54 y la desviación tı́pica, s: s = = v r u 4 u1 X 1 2 t (ci − x̄) ni = (411.1851 · 9 + 105.6311 · 13 + 22.3001 · 21 + 388.9691 · 11) N i=1 54 13.4858 Apartado b): Completamos ahora la tabla anterior con los porcentajes y la distribución de frecuencias porcentuales acumuladas: % acumulado i X Pi = pj Marca Li−1 + Li ci = 2 Fr. absoluta [10, 20) = [L0 , L1 ) 15 9 0.1666 16.66 16.66 = P1 [20, 30) = [L1 , L2 ) 25 13 0.2407 24.07 40.73 = P2 [30, 50) = [L2 , L3 ) 40 21 0.3888 38.88 79.61 = P3 [50, 60) = [L3 , L4 ) 55 11 0.2037 20.37 --- 54 1 100 % Nota Total ni Fr. relativa ni fi = N % pi = 100 fi j=1 --- Apartado c): De la tabla anterior se deduce fácilmente que el porcentaje de alumnos con nota menor que 30 es un 40.73 %. Dpto. EDAN - 26 de septiembre de 2013 —2— Curso 2013/14 Matemática Aplicada y Estadı́stica - Farmacia Hoja 1: Estadı́stica descriptiva Apartado d): Se trata de calcular el porcentaje de alumnos con una nota menor que 40. Se observa que 40 ∈ [30, 50). Tenemos L2 = 30 y L3 = 50, y P2 = 40.73 y P3 = 79.61 los porcentajes acumulados correspondientes. El porcentaje buscado es la ordenada, y, de la recta que interpola los valores (L2 , P2 ) y (L3 , P3 ) correspondiente a la abscisa x = 40. Usando la fórmula del polinomio de interpolación lineal, se tiene trivialmente que y = P3 + P4 − P3 (x − L3 ) L4 − L3 100 79.61 40.73 P3 P2 16.66 L2 de donde 10 20 30 L3 50 60 79.61 − 40.73 y = 40.73 + (x − 30), 50 − 30 es decir, y = 40.73 + 3.744 (x − 30). Sustituyendo x = 40, obtenemos y = 60.17, luego el porcentaje de alumnos con una nota menos que 40 es un 60.17 %. En otras palabras, el valor 40 es percentil 67.17. Para conocer el número de alumnos con nota menor que 38, sustituimos x = 38 en la recta anterior y obtenemos y = 56.28, luego es un 56.28 %. 3. Las puntuaciones obtenidas por un grupo de universitarios en unas pruebas para acceder a un puesto de trabajo en una industria fueron: Puntuación Frecuencia absoluta (ni ) [0, 10) 10 [10, 20) 34 [20, 30) 48 [30, 40) 72 [40, 50) 164 [50, 60) 142 [60, 70) 118 [70, 80) 78 [80, 90) 40 [90, 100) 34 [100, 110] 12 Total 752 a) Calcular la media aritmética y la desviación tı́pica. b) Si la empresa piensa rechazar al 40 % de los que han sacado peor puntuación, ¿cuál es la puntuación mı́nima requerida para ser admitido? Sol.: a): media= 54.3617, desviación tı́pica=20.9766; b): puntuación mı́nima=48.35 Solución Apartado a): Al tratarse de una variable cuantitativa continua, necesitamos calcular las marcas de cada clase, ampliando la tabla del enunciado en el sentido siguiente: Dpto. EDAN - 26 de septiembre de 2013 —3— Curso 2013/14 Matemática Aplicada y Estadı́stica - Farmacia Puntuación [0, 10) [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110] Total Hoja 1: Estadı́stica descriptiva Marca de clase (ci ) 5 15 25 35 45 55 65 75 85 95 105 --- Fr. absoluta (ni ) 10 34 48 72 164 142 118 78 40 34 12 752 Fr. relativa (fi = 0.0132 0.0452 0.0638 0.0957 0.218 0.1888 0.1569 0.1037 0.0531 0.0452 0.0159 1 ni N) Aquı́, N = 752. La media aritmética, x, viene dada por la expresión: x = K 1 X ci ni N i=1 = 1 (5 · 10 + 15 · 34 + 25 · 48 + 35 · 72 + 45 · 164 + 55 · 142 + 65 · 118 + 75 · 78 752 + 85 · 40 + 95 · 34 + 105 · 12) = 54.3617 y la desviación tı́pica viene dada por v u K u1 X (ci − x)2 ni s = t N i=1 1 (5 − 54.3617)2 · 10 + (15 − 54.3617)2 · 34 + (25 − 54.3617)2 · 48 752 = √ + (35 − 54.3617)2 · 72 + (45 − 54.3617)2 · 164 + (55 − 54.3617)2 · 142 + (65 − 54.3617)2 · 118 + (75 − 54.3617)2 · 78 + (85 − 54.3617)2 · 40 1/2 (95 − 54.3617)2 · 34 + (105 − 54.3617)2 · 12 = 20.9766 + Apartado b): Necesitamos completar la tabla anterior con los porcentajes y la distribución de frecuencias porcentuales acumuladas: Puntuación Marca de clase (ci ) Fr. absoluta (ni ) [0, 10) 5 10 [10, 20) 15 [20, 30) ni N) % % acumulados 0.0133 1.33 1.33 34 0.0452 4.52 5.85 25 48 0.0638 6.38 12.23 [30, 40) 35 72 0.0957 9.57 21.80 [40, 50) 45 164 0.2181 21.81 43.61 [50, 60) 55 142 0.1888 18.88 62.49 [60, 70) 65 118 0.1569 15.69 78.18 [70, 80) 75 78 0.1037 10.37 88.55 [80, 90) 85 40 0.05312 5.32 93.87 [90, 100) 95 34 0.0452 4.52 98.39 [100, 110] 105 12 0.0160 1.6 100 Total --- 752 1 100 % --- Dpto. EDAN - 26 de septiembre de 2013 —4— Fr. relativa (fi = Curso 2013/14 Matemática Aplicada y Estadı́stica - Farmacia Hoja 1: Estadı́stica descriptiva Para rechazar el 40 % de los que han sacado peor puntuación (suponiendo que los datos se distribuyen de manera homogénea en cada intervalo), construimos la recta que interpola los puntos (40, 21.80) y (50, 43.61), que es: y = 21.80 + 100 87.18 43.61 − 21.80 (x − 40), 50 − 40 62.49 P5 es decir, 43.61 y = 21.80 + 2.18 (x − 40). 21.8 Por tanto, para conocer cuál es la puntuación mı́nima requerida para ser admitido, sustituimos y = 40 en la recta anterior, y obtenemos x = 48.35, que es la nota buscada. P4 12.23 5.85 1.33 0 L4 10 20 30 40 L5 50 60 70 80 90 100 110 En otras palabras, el valor 48.35 es un percentil 40, es decir deja a su izquierda un 40 % de los alumnos y los demás a su derecha. 4. La talla (en centı́metros) de 200 reclutas está recogida en la siguiente tabla: Talla (xi ) Fr. absoluta (ni ) [160,164) 18 [164,168) 20 [168,172) 60 [172,176) 52 [176,180) 30 [180,184] 20 Calcular el porcentaje de reclutas cuya altura está en el intervalo (x − s, x + s), siendo s la desviación tı́pica y x la media aritmética. Sol.: intervalo (x − s, x + s) = (166.83, 177.81); el porcentaje es: 65.705 % Solución Se trata de una variable cuantitativa continua. Para calcular la media y la desviación tı́pica, necesitamos calcular las marcas de cada clase. También añadimos los porcentajes, que utilizaremos para responder al enunciado: Talla (xi ) Marca de clase (ci = Li−1 +Li ) 2 Fr. absoluta (ni ) Fr. relativa (fi = ni N) % % acumulado [160, 164) 162 18 0.09 9% 9% [164, 168) 166 20 0.1 10 % 19 % [168, 172) 170 60 0.3 30 % 49 % [172, 176) 174 52 0.26 26 % 75 % [176, 180) 178 30 0.15 15 % 90 % [180, 184) 182 20 0.1 10 % 100 % Total --- 200 1 100 % --- Para calcular el porcentaje de reclutas en el intervalo (x − s, x + s), necesitamos calcular la media aritmética, x, y la desviación tı́pica, s. La media aritmética, x, viene dada por: x= K 1 1 X ci ni = (162 · 18 + 166 · 20 + 170 · 60 + 174 · 52 + 178 · 30 + 182 · 20) = 172.32 N i=1 200 y la desviación tı́pica, s, por la expresión: Dpto. EDAN - 26 de septiembre de 2013 —5— Curso 2013/14 Matemática Aplicada y Estadı́stica - Farmacia Hoja 1: Estadı́stica descriptiva v u K u1 X s = t (ci − x̄)2 ni N i=1 = + 1 (162 − 172.32)2 · 18 + (166 − 172.32)2 · 20 + (170 − 172.32)2 · 60 200 1/2 (174 − 172.32)2 · 52 + (178 − 172.32)2 · 30 + (182 − 172.32)2 · 20 = 5.4898 √ Entonces, (x − s, x + s) = (172.32 − 5.4898, 172.32 + 5.4898) = (166.83, 177.81) Veamos qué porcentaje corresponde a cada uno de los extremos del intervalo anterior. Para ello (suponiendo que los datos se distribuyen de manera homogénea en cada intervalo), necesitamos construir dos rectas: La recta que interpola los puntos (164, 9) y (168, 19), que es; 100 90 19 − 9 (x − 164), y =9+ 168 − 164 75 es decir, y =9+ 5 (x − 164). 2 49 Si sustituimos x = 166.83, obtenemos el tanto por ciento de reclutas cuya talla es menor que 166.83, y que es y = 16.075 %. 19 9 0 160 164 168 172 176 180 184 La recta que pasa por los puntos (176, 75) y (180, 90): y − 75 = 90 − 75 (x − 176), 180 − 176 es decir, 15 (x − 176). 4 Si sustituimos x = 177.81, obtenemos el tanto por ciento de reclutas cuya talla es menor que 177.81, y que es y = 81.78 %. y = 75 + En conclusión, el porcentaje de reclutas con talla en el intervalo (166.83, 177.81) es 81.78 %−16.075 % = 65.705 %. 5. Se ha aplicado un test de aptitudes a los empleados de una factorı́a. Las puntuaciones (xi ), agrupadas en clases, están recogidas en la siguiente tabla: Puntuación (xi ) Fr. absoluta (ni ) [38,50) 15 [50,56) 15 [56,62) 25 [62,68) 18 [68,80] 15 a) Dibujar el histograma de distribución de frecuencias absolutas. b) Calcular la media aritmética y la desviación tı́pica. c) Suponiendo que los datos se distribuyen de manera homogénea en cada intervalo, hallar la puntuación por encima de la cual queda el 30 % de los empleados. d ) Calcular el porcentaje de empleados cuya puntuación está en el intervalo (50,70). Dpto. EDAN - 26 de septiembre de 2013 —6— Curso 2013/14 Matemática Aplicada y Estadı́stica - Farmacia Hoja 1: Estadı́stica descriptiva Sol.: b): media=59.20, desviación tı́pica=9.524; c): 64.2; d): 68.74 % Solución Apartado a): Se trata de una variable cuantitativa continua y los intervalos [Li−1 , Li ) tienen amplitudes diferentes. Para construir el histograma, se levanta sobre cada intervalo de clase un rectángulo de altura hi conocida como densidad de frecuencia del intervalo [Li−1 , Li ): hi = ni ai siendo ai = Li − Li−1 la amplitud del intervalo correspondiente. Completamos la tabla del enunciado con los datos que nos hacen falta y dibujamos el histograma: 4.17 xi ci ni Ni ai [38, 50) 44 15 15 12 ni hi = ai 1.25 [50, 56) 53 15 30 6 2.5 2809 [56, 62) 59 25 55 6 4.17 3481 [62, 68) 65 18 73 6 3 4225 [68, 80] 74 15 88 12 1.25 5476 --- 88 --- --- --- --- Total c2i 1936 3 2.5 1.25 38 50 56 62 68 80 Apartado b): La media aritmética, x, viene dada por la expresión: x= K 1 X 1 ci ni = (44 · 15 + 53 · 15 + 59 · 25 + 65 · 18 + 74 · 15) = 59.2 N i=1 88 y la desviación tı́pica, s, por la expresión (los valores de c2i están en la tabla anterior): s = = v r u K u1 X 1 2 2 t c ni − x̄ = (1936 · 15 + 2809 · 15 + 3481 · 25 + 4225 · 18 + 5476 · 15) − 59.22 N i=1 i 88 √ 3595.34 − 3504.64 = √ 90.7 = 9.524 Apartado c): El valor que deja por encima el 30 % de los empleados es el que deja por debajo el resto, es decir, el 70 % de empleados. Se trata de calcular entonces el percentil 70. Calculamos los porcentajes acumulados. La tabla con los porcentajes acumulados viene dada en el siguiente apartado y el polı́gono de frecuencias porcentuales acumuladas está representado en la figura de la derecha. 100 P 82.93 4 P 62.48 3 Se observa que: 34.08 P3 = 62.48 % < 70 % < P4 = 82.93 % 17.04 0 38 Dpto. EDAN - 26 de septiembre de 2013 —7— L3 50 56 62 L4 68 80 Curso 2013/14 Matemática Aplicada y Estadı́stica - Farmacia Hoja 1: Estadı́stica descriptiva Tenemos L3 = 62 y L4 = 68. Necesitamos construir una recta que pasa por los puntos (L3 , P3 ) = (62, 62.48) y (L4 , P4 ) = (68, 82.93). Dicha recta viene dada por y = P3 + 82.93 − 62.48 20.45 P4 − P3 (x − L3 ) = 62.48 + (x − 62) = 62.48 + (x − 62) L4 − L3 68 − 62 6 Sustituyendo en esta ecuación y = 70, despejamos x (que es la puntuación buscada): 20.45 20.45 x = 70 − 62.48 + 6 6 ⇒ 20.45 x = 218.8367 6 ⇒ x ≈ 64.2 Apartado d): Para calcular el porcentaje de empleados cuya puntuación está en el intervalo (50,70), de nuevo usamos los porcentajes acumulados: xi [38, 50) [50, 56) [56, 62) [62, 68) [68, 80] Total ci ni 44 53 59 65 74 --- 15 15 25 18 15 88 Fr. relativa (fi = 0.1704 0.1704 0.284 0.2045 0.1704 1 Es claro, a partir de los valores de la tabla, que el porcentaje de empleados cuya puntuación está por debajo de 50 es 17.04 %. Vamos a calcular el porcentaje de empleados cuya puntuación está por debajo de 70 y luego restaremos del valor obtenido el 17.04 %. Tenemos que 70 ∈ (68, 80). Suponiendo que los datos se distribuyen de manera homogénea en cada intervalo, vamos a construir la recta que pasa por los puntos (L4 , P4 ) = (68, 82.93) y (L5 , P5 ) = (80, 100): ni ) N % % acumulado (Pi ) 17.04 % 17.04 % 28.4 % 20.45 % 17.04 % 100 % 17.04 % 34.08 % 62.48 % 82.93 % 100 % --- 100 P5 82.93 P4 62.48 34.08 17.04 100 − 82.93 17.04 y = 82.93+ (x−68) = 82.93+ (x−68). 80 − 68 12 L 0 38 4 50 56 62 L 5 68 80 Si sustituimos x = 70, obtenemos el porcentaje de empleados con puntuación inferior a 70 es y = 85.78 %. Por tanto, el porcentaje de empleados con la puntuación comprendida entre 50 y 70 es 85.78 % − 17.04 % = 68.74 %. 6. Los pesos en miligramos de 50 pastillas de ciertos medicamentos distintos vienen dados por la siguiente tabla: Peso (mg.) No pastillas [200,210) 3 [210,215) 10 [215,220) 14 [220,230) 13 [230,240] 10 a) Dibujar el histograma de frecuencias absolutas. b) Suponiendo que los datos se distribuyen de manera homogénea en cada intervalo, calcular el tanto por ciento de pastillas con peso menor que 212 mg. c) Calcular el peso de las pastillas por debajo del cual se encuentra el 15 % de las mismas, y el peso por encima del cual se encuentra el 74 % de las pastillas de medicamentos. Dpto. EDAN - 26 de septiembre de 2013 —8— Curso 2013/14 Matemática Aplicada y Estadı́stica - Farmacia Hoja 1: Estadı́stica descriptiva Sol.: b:) 14 %; c:) 212.25 mg. Solución Apartado a): Se trata de una variable cuantitativa continua y los intervalos [Li−1 , Li ) tienen amplitudes diferentes. Para construir el histograma, se levanta sobre cada intervalo de clase un rectángulo de altura hi conocida como densidad de frecuencia del intervalo [Li−1 , Li ): Completamos la tabla del enunciado con los datos que nos hacen falta: hi = ni ai siendo ai = Li − Li−1 la amplitud del intervalo correspondiente. Peso (mg.) ci = Li−1 +Li 2 Fr. absoluta (ni ) Fr. relativa (fi = ni N) ai = Li − Li−1 hi = ni ai [200, 210) 205 3 0.06 10 0.3 [210, 215) 212.5 10 0.2 5 2 [215, 220) 217.5 14 0.28 5 2.8 [220, 230) 225 13 0.26 10 1.3 [230, 240] 235 10 0.2 10 1 Total --- 50 1 --- --- El histograma de frecuencias absolutas es de la forma: 2.8 2 1.3 1 0.3 200 210 215 220 peso 230 240 Apartado b): Para responder a este apartado, es más cómodo trabajar con frecuencias relativas y con porcentajes acumulados. Completamos la tabla anterior: Peso (mg.) ci Fr. absoluta (ni ) [200, 210) 205 3 [210, 215) 212.5 [215, 220) ni ) N % % acumulados 0.06 6% 6% 10 0.2 20 % 26 % 217.5 14 0.28 28 % 54 % [220, 230) 225 13 0.26 26 % 80 % [230, 240] 235 10 0.2 20 % 100 % Total --- 50 1 100 % --- Dpto. EDAN - 26 de septiembre de 2013 Fr. relativa (fi = —9— Curso 2013/14 Matemática Aplicada y Estadı́stica - Farmacia Hoja 1: Estadı́stica descriptiva Para saber qué tanto por ciento de pastillas tiene peso menor que 212 mg, observemos que 212 ∈ (210, 215) y vamos a construir la recta que pasa por los puntos (210, 6) y (215, 26), que es; y =6+ 26 − 6 (x − 210) = 6 + 4 (x − 210). 215 − 210 Por tanto, para conocer cuál es la cantidad que corresponde a 212 mg., sustituimos x = 212 en la ecuación anterior, y obtenemos y = 14, que es el tanto por ciento buscado. Apartado c): Para conocer el peso de las pastillas por debajo del cual se encuentra el 15 % de las pastillas (suponiendo que los datos se distribuyen de manera homogénea en cada intervalo), usamos la ecuación de recta del apartado anterior. Ahora, debemos sustituir y = 15, de manera que obtenemos x = 212.25 mg. que es el peso buscado. Conocer el peso de las pastillas por encima del cual se encuentra el 74 % de las pastillas es equivalente a conocer cual es el peso de las pastillas por debajo del cual se encuentra el 26 %. Observemos que de la tabla se puede ver que corresponde a 215 mg. Dpto. EDAN - 26 de septiembre de 2013 — 10 — Curso 2013/14