universidad de murcia departamento de estadı́stica e investigación operativa Dra. Josefa Marı́n Fernández. Soluciones de los problemas propuestos en el Capı́tulo 3 de la 2a edición del libro Estadı́stica Aplicada a las Ciencias de la Documentación 3.1. 2.7. Moda=Mo = 5 keywords (es el resultado más frecuente) Primer Decil=D1 = 4 keywords (deja por debajo de él el 10 % de los datos) Primer Cuartil=Q1 = 5 keywords (deja por debajo de él el 25 % de los datos) Mediana=Me = 7 keywords (deja por debajo de él el 50 % de los datos) Tercer Cuartil=Q3 = 9 keywords (deja por debajo de él el 75 % de los datos) Noveno Decil=D9 = 10 keywords (deja por debajo de él el 90 % de los datos) Media aritmética=x = 70 0 b 5 keywords Media geométrica=MG = 60 5688 keywords Media cuadrática=MQ = 70 5166 keywords Media armónica=MH = 60 0796 keywords Recorrido=R = 11 keywords ⇒ R/2 = 50 5 y R/3 = 30 6667 Recorrido intercuartı́lico=RI = 4 keywords ⇒ RI < R/2 ⇒ la mediana es representativa Desviación media respecto de la media=Dx = 20 1472 keywords Desviación media respecto de la mediana=DMe = 20 1389 keywords. Como DMe es un poco menor que Dx entonces la mediana es un poco más representativa que la media aritmética Varianza=s2 = 60 7191 keywords2 Desviación tı́pica=s = 20 5921 keywords ⇒ s < R/3 ⇒ la media es representativa Cuasivarianza=S 2 = 60 8138 keywords2 Cuasidesviación tı́pica=S = 20 6103 keywords Coeficiente de variación mediana=VMe = 00 3703 Coeficiente de variación media de Pearson=CV = 00 3674 Coeficiente de asimetrı́a de Pearson=CA = 00 7930 (levemente asimétrica por la derecha) Coeficiente de asimetrı́a de Fisher=g1 = 00 3978 (levemente asimétrica por la derecha) Coeficiente de apuntamiento de Fisher=g2 = −00 4510 (menos apuntada que la normal) 2.8. Moda=Mo = 22 centı́metros (es el resultado más frecuente) Primer Decil=D1 = 17 centı́metros (deja por debajo de él el 10 % de los datos) Primer Cuartil=Q1 = 18 centı́metros (deja por debajo de él el 25 % de los datos) Mediana=Me = 21 centı́metros (deja por debajo de él el 50 % de los datos) Tercer Cuartil=Q3 = 23 centı́metros (deja por debajo de él el 75 % de los datos) Noveno Decil=D9 = 25 centı́metros (deja por debajo de él el 90 % de los datos) Media aritmética=x = 200 8065 centı́metros Media geométrica=MG = 200 6043 centı́metros Media cuadrática=MQ = 210 0077 centı́metros Media armónica=MH = 200 4025 centı́metros Recorrido=R = 12 centı́metros ⇒ R/2 = 6 y R/3 = 4 Recorrido intercuartı́lico=RI = 5 centı́metros ⇒ RI < R/2 ⇒ la mediana es representativa Desviación media respecto de la media=Dx = 20 4058 centı́metros Desviación media respecto de la mediana=DMe = 20 3871 centı́metros. Como DMe es un poco menor que Dx entonces la mediana es un poco más representativa que la media aritmética Varianza=s2 = 80 4142 centı́metros2 Josefa Marı́n Fernández. Soluciones de problemas del cap. 3 de la 2a ed. de “Estadı́stica Aplicada a las CC. de la Documentación” 2 Desviación tı́pica=s = 20 9007 centı́metros ⇒ s < R/3 ⇒ la media es representativa Cuasivarianza=S 2 = 80 6946 centı́metros2 Cuasidesviación tı́pica=S = 20 9487 centı́metros Coeficiente de variación mediana=VMe = 00 1381 Coeficiente de variación media de Pearson=CV = 00 1394 Coeficiente de asimetrı́a de Pearson=CA = −00 4115 (casi simétrica) Coeficiente de asimetrı́a de Fisher=g1 = 00 1925 (casi simétrica) Coeficiente de apuntamiento de Fisher=g2 = −00 6580 (menos apuntada que la normal) 2.9. Moda=Mo = 13 palabras (es el resultado más frecuente) Primer Decil=D1 = 9 palabras (deja por debajo de él el 10 % de los datos) Primer Cuartil=Q1 = 11 palabras (deja por debajo de él el 25 % de los datos) Mediana=Me = 12 palabras (deja por debajo de él el 50 % de los datos) Tercer Cuartil=Q3 = 13 palabras (deja por debajo de él el 75 % de los datos) Noveno Decil=D9 = 14 palabras (deja por debajo de él el 90 % de los datos) Media aritmética=x = 110 8 b 3 palabras Media geométrica=MG = 110 5207 palabras Media cuadrática=MQ = 120 0692 palabras Media armónica=MH = 110 0797 palabras Recorrido=R = 13 palabras ⇒ R/2 = 60 5 y R/3 = 40 3333 Recorrido intercuartı́lico=RI = 2 palabras ⇒ RI < R/2 ⇒ la mediana es representativa Desviación media respecto de la media=Dx = 10 6806 palabras Desviación media respecto de la mediana=DMe = 10 625 palabras. Como DMe es un poco menor que Dx entonces la mediana es un poco más representativa que la media aritmética Varianza=s2 = 50 63 b 8 palabras2 Desviación tı́pica=s = 20 3746 palabras ⇒ s < R/3 ⇒ la media es representativa Cuasivarianza=S 2 = 50 7589 palabras2 Cuasidesviación tı́pica=S = 20 3998 palabras Coeficiente de variación mediana=VMe = 00 1979 Coeficiente de variación media de Pearson=CV = 00 2007 Coeficiente de asimetrı́a de Pearson=CA = −00 4913 (levemente asimétrica por la izquierda) Coeficiente de asimetrı́a de Fisher=g1 = −10 0431 (asimétrica por la izquierda) Coeficiente de apuntamiento de Fisher=g2 = 20 1786 (más apuntada que la normal) 2.10. Hay dos modas: Mo = 15 palabras y Mo = 17 palabras. Primer Decil=D1 = 12 palabras (deja por debajo de él el 10 % de los datos) Primer Cuartil=Q1 = 140 5 palabras (deja por debajo de él el 25 % de los datos) Mediana=Me = 17 palabras (deja por debajo de él el 50 % de los datos) Tercer Cuartil=Q3 = 19 palabras (deja por debajo de él el 75 % de los datos) Noveno Decil=D9 = 21 palabras (deja por debajo de él el 90 % de los datos) Media aritmética=x = 160 7 palabras Media geométrica=MG = 160 3763 palabras Media cuadrática=MQ = 170 0074 palabras Media armónica=MH = 160 0398 palabras Recorrido=R = 13 palabras ⇒ R/2 = 60 5 y R/3 = 40 3333 Recorrido intercuartı́lico=RI = 40 5 palabras ⇒ RI < R/2 ⇒ la mediana es representativa Desviación media respecto de la media=Dx = 20 68 palabras Desviación media respecto de la mediana=DMe = 20 65 palabras. Como DMe es un poco menor que Dx entonces la mediana es un poco más representativa que la media aritmética Josefa Marı́n Fernández. Soluciones de problemas del cap. 3 de la 2a ed. de “Estadı́stica Aplicada a las CC. de la Documentación” 3 Varianza=s2 = 100 36 palabras2 Desviación tı́pica=s = 30 2187 palabras ⇒ s < R/3 ⇒ la media es representativa Cuasivarianza=S 2 = 100 6256 palabras2 Cuasidesviación tı́pica=S = 30 2597 palabras Coeficiente de variación mediana=VMe = 00 1893 Coeficiente de variación media de Pearson=CV = 00 1927 El coeficiente de asimetrı́a de Pearson no se puede calcular (ya que hay dos modas). Coeficiente de asimetrı́a de Fisher=g1 = −00 0614 (casi simétrica) Coeficiente de apuntamiento de Fisher=g2 = −00 7752 (menos apuntada que la normal) 2.11. Moda=Mo = 300 6 llamadas (es el resultado más frecuente) Primer Decil=D1 = 180 75 llamadas (deja por debajo de él el 10 % de los datos) Primer Cuartil=Q1 = 240 9375 llamadas (deja por debajo de él el 25 % de los datos) Mediana=Me = 300 6429 llamadas (deja por debajo de él el 50 % de los datos) Tercer Cuartil=Q3 = 360 45 llamadas (deja por debajo de él el 75 % de los datos) Noveno Decil=D9 = 410 5 llamadas (deja por debajo de él el 90 % de los datos) Media aritmética=x = 300 4 llamadas Recorrido=R = 42 llamadas ⇒ R/2 = 21 y R/3 = 14 Recorrido intercuartı́lico=RI = 110 5125 llamadas ⇒ RI < R/2 ⇒ la mediana es representativa Desviación media respecto de la media=Dx = 60 3644 llamadas Desviación media respecto de la mediana=DMe = 60 4238 llamadas. Como Dx es un poco menor que DMe entonces la media aritmética es un poco más representativa que la mediana Varianza=s2 = 670 84 llamadas2 Desviación tı́pica=s = 80 2365 llamadas ⇒ s < R/3 ⇒ la media es representativa b llamadas2 Cuasivarianza=S 2 = 690 3 81 Cuasidesviación tı́pica=S = 80 3296 llamadas Coeficiente de variación mediana=VMe = 00 2688 Coeficiente de variación media de Pearson=CV = 00 2709 Coeficiente de asimetrı́a de Pearson=CA = −00 0243 (casi simétrica) Coeficiente de asimetrı́a de Fisher=g1 = −00 2231 (casi simétrica) Coeficiente de apuntamiento de Fisher=g2 = −00 3363 (menos apuntada que la normal) 2.12. Moda=Mo = 320 8571 palabras (es el resultado más frecuente) b palabras (deja por debajo de él el 10 % de los datos) Primer Decil=D1 = 300 2 27 Primer Cuartil=Q1 = 360 2857 palabras (deja por debajo de él el 25 % de los datos) Mediana=Me = 470 8571 palabras (deja por debajo de él el 50 % de los datos) Tercer Cuartil=Q3 = 600 3571 palabras (deja por debajo de él el 75 % de los datos) Noveno Decil=D9 = 720 25 palabras (deja por debajo de él el 90 % de los datos) Media aritmética=x = 490 3676 palabras Recorrido=R = 60 palabras ⇒ R/2 = 30 y R/3 = 20 Recorrido intercuartı́lico=RI = 240 0714 palabras ⇒ RI < R/2 ⇒ la mediana es representativa Desviación media respecto de la media=Dx = 120 3393 palabras Desviación media respecto de la mediana=DMe = 120 5525 palabras. Como Dx es un poco menor que DMe entonces la media aritmética es un poco más representativa que la mediana Varianza=s2 = 2280 6075 palabras2 Desviación tı́pica=s = 150 1198 palabras ⇒ s < R/3 ⇒ la media es representativa Cuasivarianza=S 2 = 2290 9602 palabras2 Josefa Marı́n Fernández. Soluciones de problemas del cap. 3 de la 2a ed. de “Estadı́stica Aplicada a las CC. de la Documentación” 4 Cuasidesviación tı́pica=S = 150 1644 palabras Coeficiente de variación mediana=VMe = 00 3159 Coeficiente de variación media de Pearson=CV = 00 3063 Coeficiente de asimetrı́a de Pearson=CA = 10 0920 (asimétrica por la derecha) Coeficiente de asimetrı́a de Fisher=g1 = 00 3794 (levemente asimétrica por la derecha) Coeficiente de apuntamiento de Fisher=g2 = −00 8302 (menos apuntada que la normal) 2.13. Moda=Mo = 1 675 pesetas (es el resultado más frecuente) Primer Decil=D1 = 9840 4737 pesetas (deja por debajo de él el 10 % de los datos) b pesetas (deja por debajo de él el 25 % de los datos) Primer Cuartil=Q1 = 1 4380 63 Mediana=Me = 2 1130 b 8 pesetas (deja por debajo de él el 50 % de los datos) Tercer Cuartil=Q3 = 2 975 pesetas (deja por debajo de él el 75 % de los datos) Noveno Decil=D9 = 3 7020 5 pesetas (deja por debajo de él el 90 % de los datos) Media aritmética=x = 2 2580 b 3 pesetas Recorrido=R = 4 900 pesetas ⇒ R/2 = 2 450 y R/3 = 1 6330 3333 b pesetas ⇒ RI < R/2 ⇒ la mediana es represenRecorrido intercuartı́lico=RI = 1 5360 36 tativa Desviación media respecto de la media=Dx = 8370 3016 pesetas Desviación media respecto de la mediana=DMe = 8400 7407 pesetas. Como Dx es un poco menor que DMe entonces la media aritmética es un poco más representativa que la mediana Varianza=s2 = 1 010 5550 557 pesetas2 Desviación tı́pica=s = 1 0050 2639 pesetas ⇒ s < R/3 ⇒ la media es representativa Cuasivarianza=S 2 = 1 022 7300 925 pesetas2 Cuasidesviación tı́pica=S = 1 0110 3016 pesetas Coeficiente de variación mediana=VMe = 00 4756 Coeficiente de variación media de Pearson=CV = 00 4451 Coeficiente de asimetrı́a de Pearson=CA = 00 5803 (levemente asimétrica por la derecha) Coeficiente de asimetrı́a de Fisher=g1 = 00 5904 (levemente asimétrica por la derecha) Coeficiente de apuntamiento de Fisher=g2 = −00 2943 (menos apuntada que la normal) 3.2. La distribución de frecuencias es: xi 0 1 2 3 4 5 6 7 a) fi 7 13 18 15 11 6 4 2 suma Fi 7 20 38 53 64 70 74 76 xi fi 0 13 36 45 44 30 24 14 206 Gráfico de frecuencias acumuladas absolutas: es la representación gráfica de las frecuencias acumuladas absolutas, F , para todo valor numérico, x. Es una gráfica en forma de “escalera”. Mediana=Me = 20 5 periódicos. b) Como el recorrido intercuartı́lico es RI = 3 periódicos y la mitad del recorrido es R/2 = 30 5 periódicos, entonces se cumple que RI es un poco menor que R/2 y, como consecuencia, la mediana es representativa (pero no se puede decir que es muy representativa). c) La moda es única y su valor es Mo = 2 periódicos. Josefa Marı́n Fernández. Soluciones de problemas del cap. 3 de la 2a ed. de “Estadı́stica Aplicada a las CC. de la Documentación” 5 d) Resulta más adecuada la media aritmética, cuyo valor es x = 20 7105 periódicos. 3.3. a) Media (aritmética)=x = 670 7297 personas. Mediana=Me = 670 5 personas. Moda=Mo = 64 personas. b) La desviación tı́pica es s = 80 1677 personas. Como R/3 = 11, entonces se cumple que s es bastante menor que R/3 y, como consecuencia, la media aritmética es bastante representativa. c) El recorrido intercuartı́lico es RI = 14 personas. Como R/2 = 160 5, entonces RI es bastante menor que R/2 y, como consecuencia, la mediana es bastante representativa. 3.4. a) Polı́gono de frecuencias acumuladas absolutas: se sitúan los puntos que resultan de tomar en el eje horizontal los extremos superiores de los intervalos de clase, y en el eje vertical sus correspondientes frecuencias acumuladas absolutas, uniendo después dichos puntos mediante segmentos rectilı́neos. A partir del polı́gono anterior se deduce que la mediana es aproximadamente igual a 28 años. Con la fórmula se obtiene que la mediana es Me = 280 0285 años. b) El recorrido intercuartı́lico es RI = 50 37 años. Como R/2 = 20 entonces RI es mucho menor que R/2 y, como consecuencia, la mediana es muy representativa. c) Moda=Mo = 270 5466 años 3.5. a) La distribución de frecuencias (conteniendo las columnas que posteriormente necesitaremos) es: xi 3 7 12 14 15 16 17 18 20 21 22 24 25 27 30 35 37 40 45 fi 1 1 4 1 1 1 1 1 1 3 1 2 2 2 2 2 1 1 2 suma Fi 1 2 6 7 8 9 10 11 12 15 16 18 20 22 24 26 27 28 30 xi fi (xi − x)2 fi 0 (xi − x)3 fi 0 (xi − x)4 fi 3 7 48 14 15 16 17 18 20 63 22 48 50 54 60 70 37 40 90 402 6711 2580 1378 4890 8844 820 2044 650 0711 490 9378 360 8044 250 6711 90 4044 120 8133 10 1378 10 7422 70 4756 300 9422 960 1422 2840 8089 1940 1378 2860 7378 9620 1422 −8080 2670 −41470 4136 −54210 3879 −7450 3203 −5240 9070 −3520 8936 −2230 2803 −1300 0670 −280 8403 −260 4809 −10 2136 10 6261 140 4527 1210 7061 6660 5861 33980 7194 27040 9864 48550 4264 211020 9861 1621440 0237 666350 1123 599960 6922 67570 5707 42340 2495 24930 7816 13540 5671 6590 0059 880 4436 540 7272 10 2945 10 5177 270 9420 4780 7106 46210 6634 405580 0516 376890 4768 822180 5532 4628580 8279 692 32970 8 b 6 131840 41 b 7 9328740 211 b 5 Polı́gono de frecuencias absolutas: se sitúan los puntos que resultan de tomar en el eje horizontal los distintos valores de la variable, xi , y en el eje vertical sus correspondientes frecuencias absolutas, fi , uniendo después los puntos mediante segmentos rectilı́neos. b) Moda=Mo = 12 cientos de pesetas=1 200 pesetas. Media (aritmética)=x = 230 0 b 6 cientos de pesetas=2 3060 b 6 pesetas. 0 Mediana=Me = 21 5 cientos de pesetas=2 150 pesetas. c) Coeficiente de asimetrı́a de Fisher=g1 = 00 3813. La distribución es casi simétrica (levemente asimétrica por la derecha). d) Como la distribución es casi simétrica, calculamos el coeficiente de apuntamiento de Fisher, cuyo valor es g2 = −00 4268. La distribución es menos apuntada que la normal (o platicúrtica). Josefa Marı́n Fernández. Soluciones de problemas del cap. 3 de la 2a ed. de “Estadı́stica Aplicada a las CC. de la Documentación” 3.6. 6 a) La distribución de frecuencia es: xi 1 2 3 4 5 6 7 8 9 10 12 14 19 20 21 22 23 24 25 26 35 36 37 38 45 46 50 65 fi 3 5 4 2 1 1 2 1 3 1 1 1 1 4 5 5 2 2 2 2 1 2 2 1 1 3 1 1 Fi 3 8 12 14 15 16 18 19 22 23 24 25 26 30 35 40 42 44 46 48 49 51 53 54 55 58 59 60 Como la dispersión es grande, la medida de posición más adecuada es la mediana, cuyo valor es Me = 200 5 veces. b) La distribución de frecuencias con datos agrupados en intervalos de la misma amplitud es: (`i , `i+1 ] (00 8, 10] (10, 190 2] (190 2, 280 4] (280 4, 370 6] (370 6, 460 8] (460 8, 56] (56, 650 2] xi 50 4 140 6 230 8 330 0 420 2 510 4 600 6 fi 23 3 22 5 5 1 1 Fi 23 26 48 53 58 59 60 b Con los datos agrupados en estos intervalos de clase, el valor de la mediana resulta Me = 200 8 72 veces. El verdadero resultado de esta medida descriptiva es el calculado en el apartado anterior, Me = 200 5 veces. 3.7. a) La distribución de frecuencias es: xi fi Fi xi fi 1 1 1 1 2 1 2 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 18 19 20 21 22 24 1 4 3 3 4 3 3 4 4 2 3 1 2 1 2 1 4 1 1 1 3 7 10 13 17 20 23 27 31 33 36 37 39 40 42 43 47 48 49 50 3 16 15 18 28 24 27 40 44 24 39 14 30 16 36 19 80 21 22 24 Tiene 5 modas cuyos valores son: 4,7,10,11 y 20 minutos. Media (aritmética)=x = 100 86 minutos. Mediana=Me = 10 minutos. b) Una posible agrupación de los datos en intervalos de distinta amplitud es: (`i , `i+1 ] fi (0,4] 7 (4,6] 6 (6,8] 7 (8,10] 7 (10,12] 6 (12,15] 6 (15,19] 4 (19,24] 7 suma xi 2 5 7 9 11 130 5 17 210 5 xi fi 14 30 49 63 66 81 68 1500 5 5210 5 Fi 7 13 20 27 33 39 43 50 Con esta clasificación en intervalos, los resultados de las medidas descriptivas anteriores son: Tiene 4 modas cuyos valores son: 2,7,9 y 21’5 minutos. Media (aritmética)=x = 100 43 minutos. Mediana=Me = 90 4286 minutos. Los verdaderos resultados de estas medidas descriptivas son los calculados en el apartado anterior.