Capítulo 3 - Universidad de Murcia

Anuncio
universidad
de murcia
departamento de estadı́stica
e investigación operativa
Dra. Josefa Marı́n Fernández.
Soluciones de los problemas propuestos en el Capı́tulo 3
de la 2a edición del libro
Estadı́stica Aplicada a las Ciencias de la Documentación
3.1. 2.7.
Moda=Mo = 5 keywords (es el resultado más frecuente)
Primer Decil=D1 = 4 keywords (deja por debajo de él el 10 % de los datos)
Primer Cuartil=Q1 = 5 keywords (deja por debajo de él el 25 % de los datos)
Mediana=Me = 7 keywords (deja por debajo de él el 50 % de los datos)
Tercer Cuartil=Q3 = 9 keywords (deja por debajo de él el 75 % de los datos)
Noveno Decil=D9 = 10 keywords (deja por debajo de él el 90 % de los datos)
Media aritmética=x = 70 0 b
5 keywords
Media geométrica=MG = 60 5688 keywords
Media cuadrática=MQ = 70 5166 keywords
Media armónica=MH = 60 0796 keywords
Recorrido=R = 11 keywords ⇒ R/2 = 50 5 y R/3 = 30 6667
Recorrido intercuartı́lico=RI = 4 keywords ⇒ RI < R/2 ⇒ la mediana es representativa
Desviación media respecto de la media=Dx = 20 1472 keywords
Desviación media respecto de la mediana=DMe = 20 1389 keywords. Como DMe es un poco
menor que Dx entonces la mediana es un poco más representativa que la media aritmética
Varianza=s2 = 60 7191 keywords2
Desviación tı́pica=s = 20 5921 keywords ⇒ s < R/3 ⇒ la media es representativa
Cuasivarianza=S 2 = 60 8138 keywords2
Cuasidesviación tı́pica=S = 20 6103 keywords
Coeficiente de variación mediana=VMe = 00 3703
Coeficiente de variación media de Pearson=CV = 00 3674
Coeficiente de asimetrı́a de Pearson=CA = 00 7930 (levemente asimétrica por la derecha)
Coeficiente de asimetrı́a de Fisher=g1 = 00 3978 (levemente asimétrica por la derecha)
Coeficiente de apuntamiento de Fisher=g2 = −00 4510 (menos apuntada que la normal)
2.8.
Moda=Mo = 22 centı́metros (es el resultado más frecuente)
Primer Decil=D1 = 17 centı́metros (deja por debajo de él el 10 % de los datos)
Primer Cuartil=Q1 = 18 centı́metros (deja por debajo de él el 25 % de los datos)
Mediana=Me = 21 centı́metros (deja por debajo de él el 50 % de los datos)
Tercer Cuartil=Q3 = 23 centı́metros (deja por debajo de él el 75 % de los datos)
Noveno Decil=D9 = 25 centı́metros (deja por debajo de él el 90 % de los datos)
Media aritmética=x = 200 8065 centı́metros
Media geométrica=MG = 200 6043 centı́metros
Media cuadrática=MQ = 210 0077 centı́metros
Media armónica=MH = 200 4025 centı́metros
Recorrido=R = 12 centı́metros ⇒ R/2 = 6 y R/3 = 4
Recorrido intercuartı́lico=RI = 5 centı́metros ⇒ RI < R/2 ⇒ la mediana es representativa
Desviación media respecto de la media=Dx = 20 4058 centı́metros
Desviación media respecto de la mediana=DMe = 20 3871 centı́metros. Como DMe es un
poco menor que Dx entonces la mediana es un poco más representativa que la media
aritmética
Varianza=s2 = 80 4142 centı́metros2
Josefa Marı́n Fernández. Soluciones de problemas del cap. 3 de la 2a ed. de “Estadı́stica Aplicada a las CC. de la Documentación”
2
Desviación tı́pica=s = 20 9007 centı́metros ⇒ s < R/3 ⇒ la media es representativa
Cuasivarianza=S 2 = 80 6946 centı́metros2
Cuasidesviación tı́pica=S = 20 9487 centı́metros
Coeficiente de variación mediana=VMe = 00 1381
Coeficiente de variación media de Pearson=CV = 00 1394
Coeficiente de asimetrı́a de Pearson=CA = −00 4115 (casi simétrica)
Coeficiente de asimetrı́a de Fisher=g1 = 00 1925 (casi simétrica)
Coeficiente de apuntamiento de Fisher=g2 = −00 6580 (menos apuntada que la normal)
2.9.
Moda=Mo = 13 palabras (es el resultado más frecuente)
Primer Decil=D1 = 9 palabras (deja por debajo de él el 10 % de los datos)
Primer Cuartil=Q1 = 11 palabras (deja por debajo de él el 25 % de los datos)
Mediana=Me = 12 palabras (deja por debajo de él el 50 % de los datos)
Tercer Cuartil=Q3 = 13 palabras (deja por debajo de él el 75 % de los datos)
Noveno Decil=D9 = 14 palabras (deja por debajo de él el 90 % de los datos)
Media aritmética=x = 110 8 b
3 palabras
Media geométrica=MG = 110 5207 palabras
Media cuadrática=MQ = 120 0692 palabras
Media armónica=MH = 110 0797 palabras
Recorrido=R = 13 palabras ⇒ R/2 = 60 5 y R/3 = 40 3333
Recorrido intercuartı́lico=RI = 2 palabras ⇒ RI < R/2 ⇒ la mediana es representativa
Desviación media respecto de la media=Dx = 10 6806 palabras
Desviación media respecto de la mediana=DMe = 10 625 palabras. Como DMe es un poco
menor que Dx entonces la mediana es un poco más representativa que la media aritmética
Varianza=s2 = 50 63 b
8 palabras2
Desviación tı́pica=s = 20 3746 palabras ⇒ s < R/3 ⇒ la media es representativa
Cuasivarianza=S 2 = 50 7589 palabras2
Cuasidesviación tı́pica=S = 20 3998 palabras
Coeficiente de variación mediana=VMe = 00 1979
Coeficiente de variación media de Pearson=CV = 00 2007
Coeficiente de asimetrı́a de Pearson=CA = −00 4913 (levemente asimétrica por la izquierda)
Coeficiente de asimetrı́a de Fisher=g1 = −10 0431 (asimétrica por la izquierda)
Coeficiente de apuntamiento de Fisher=g2 = 20 1786 (más apuntada que la normal)
2.10.
Hay dos modas: Mo = 15 palabras y Mo = 17 palabras.
Primer Decil=D1 = 12 palabras (deja por debajo de él el 10 % de los datos)
Primer Cuartil=Q1 = 140 5 palabras (deja por debajo de él el 25 % de los datos)
Mediana=Me = 17 palabras (deja por debajo de él el 50 % de los datos)
Tercer Cuartil=Q3 = 19 palabras (deja por debajo de él el 75 % de los datos)
Noveno Decil=D9 = 21 palabras (deja por debajo de él el 90 % de los datos)
Media aritmética=x = 160 7 palabras
Media geométrica=MG = 160 3763 palabras
Media cuadrática=MQ = 170 0074 palabras
Media armónica=MH = 160 0398 palabras
Recorrido=R = 13 palabras ⇒ R/2 = 60 5 y R/3 = 40 3333
Recorrido intercuartı́lico=RI = 40 5 palabras ⇒ RI < R/2 ⇒ la mediana es representativa
Desviación media respecto de la media=Dx = 20 68 palabras
Desviación media respecto de la mediana=DMe = 20 65 palabras. Como DMe es un poco
menor que Dx entonces la mediana es un poco más representativa que la media aritmética
Josefa Marı́n Fernández. Soluciones de problemas del cap. 3 de la 2a ed. de “Estadı́stica Aplicada a las CC. de la Documentación”
3
Varianza=s2 = 100 36 palabras2
Desviación tı́pica=s = 30 2187 palabras ⇒ s < R/3 ⇒ la media es representativa
Cuasivarianza=S 2 = 100 6256 palabras2
Cuasidesviación tı́pica=S = 30 2597 palabras
Coeficiente de variación mediana=VMe = 00 1893
Coeficiente de variación media de Pearson=CV = 00 1927
El coeficiente de asimetrı́a de Pearson no se puede calcular (ya que hay dos modas).
Coeficiente de asimetrı́a de Fisher=g1 = −00 0614 (casi simétrica)
Coeficiente de apuntamiento de Fisher=g2 = −00 7752 (menos apuntada que la normal)
2.11.
Moda=Mo = 300 6 llamadas (es el resultado más frecuente)
Primer Decil=D1 = 180 75 llamadas (deja por debajo de él el 10 % de los datos)
Primer Cuartil=Q1 = 240 9375 llamadas (deja por debajo de él el 25 % de los datos)
Mediana=Me = 300 6429 llamadas (deja por debajo de él el 50 % de los datos)
Tercer Cuartil=Q3 = 360 45 llamadas (deja por debajo de él el 75 % de los datos)
Noveno Decil=D9 = 410 5 llamadas (deja por debajo de él el 90 % de los datos)
Media aritmética=x = 300 4 llamadas
Recorrido=R = 42 llamadas ⇒ R/2 = 21 y R/3 = 14
Recorrido intercuartı́lico=RI = 110 5125 llamadas ⇒ RI < R/2 ⇒ la mediana es representativa
Desviación media respecto de la media=Dx = 60 3644 llamadas
Desviación media respecto de la mediana=DMe = 60 4238 llamadas. Como Dx es un poco
menor que DMe entonces la media aritmética es un poco más representativa que la mediana
Varianza=s2 = 670 84 llamadas2
Desviación tı́pica=s = 80 2365 llamadas ⇒ s < R/3 ⇒ la media es representativa
b llamadas2
Cuasivarianza=S 2 = 690 3 81
Cuasidesviación tı́pica=S = 80 3296 llamadas
Coeficiente de variación mediana=VMe = 00 2688
Coeficiente de variación media de Pearson=CV = 00 2709
Coeficiente de asimetrı́a de Pearson=CA = −00 0243 (casi simétrica)
Coeficiente de asimetrı́a de Fisher=g1 = −00 2231 (casi simétrica)
Coeficiente de apuntamiento de Fisher=g2 = −00 3363 (menos apuntada que la normal)
2.12.
Moda=Mo = 320 8571 palabras (es el resultado más frecuente)
b palabras (deja por debajo de él el 10 % de los datos)
Primer Decil=D1 = 300 2 27
Primer Cuartil=Q1 = 360 2857 palabras (deja por debajo de él el 25 % de los datos)
Mediana=Me = 470 8571 palabras (deja por debajo de él el 50 % de los datos)
Tercer Cuartil=Q3 = 600 3571 palabras (deja por debajo de él el 75 % de los datos)
Noveno Decil=D9 = 720 25 palabras (deja por debajo de él el 90 % de los datos)
Media aritmética=x = 490 3676 palabras
Recorrido=R = 60 palabras ⇒ R/2 = 30 y R/3 = 20
Recorrido intercuartı́lico=RI = 240 0714 palabras ⇒ RI < R/2 ⇒ la mediana es representativa
Desviación media respecto de la media=Dx = 120 3393 palabras
Desviación media respecto de la mediana=DMe = 120 5525 palabras. Como Dx es un poco
menor que DMe entonces la media aritmética es un poco más representativa que la mediana
Varianza=s2 = 2280 6075 palabras2
Desviación tı́pica=s = 150 1198 palabras ⇒ s < R/3 ⇒ la media es representativa
Cuasivarianza=S 2 = 2290 9602 palabras2
Josefa Marı́n Fernández. Soluciones de problemas del cap. 3 de la 2a ed. de “Estadı́stica Aplicada a las CC. de la Documentación”
4
Cuasidesviación tı́pica=S = 150 1644 palabras
Coeficiente de variación mediana=VMe = 00 3159
Coeficiente de variación media de Pearson=CV = 00 3063
Coeficiente de asimetrı́a de Pearson=CA = 10 0920 (asimétrica por la derecha)
Coeficiente de asimetrı́a de Fisher=g1 = 00 3794 (levemente asimétrica por la derecha)
Coeficiente de apuntamiento de Fisher=g2 = −00 8302 (menos apuntada que la normal)
2.13.
Moda=Mo = 1 675 pesetas (es el resultado más frecuente)
Primer Decil=D1 = 9840 4737 pesetas (deja por debajo de él el 10 % de los datos)
b pesetas (deja por debajo de él el 25 % de los datos)
Primer Cuartil=Q1 = 1 4380 63
Mediana=Me = 2 1130 b
8 pesetas (deja por debajo de él el 50 % de los datos)
Tercer Cuartil=Q3 = 2 975 pesetas (deja por debajo de él el 75 % de los datos)
Noveno Decil=D9 = 3 7020 5 pesetas (deja por debajo de él el 90 % de los datos)
Media aritmética=x = 2 2580 b
3 pesetas
Recorrido=R = 4 900 pesetas ⇒ R/2 = 2 450 y R/3 = 1 6330 3333
b pesetas ⇒ RI < R/2 ⇒ la mediana es represenRecorrido intercuartı́lico=RI = 1 5360 36
tativa
Desviación media respecto de la media=Dx = 8370 3016 pesetas
Desviación media respecto de la mediana=DMe = 8400 7407 pesetas. Como Dx es un poco
menor que DMe entonces la media aritmética es un poco más representativa que la mediana
Varianza=s2 = 1 010 5550 557 pesetas2
Desviación tı́pica=s = 1 0050 2639 pesetas ⇒ s < R/3 ⇒ la media es representativa
Cuasivarianza=S 2 = 1 022 7300 925 pesetas2
Cuasidesviación tı́pica=S = 1 0110 3016 pesetas
Coeficiente de variación mediana=VMe = 00 4756
Coeficiente de variación media de Pearson=CV = 00 4451
Coeficiente de asimetrı́a de Pearson=CA = 00 5803 (levemente asimétrica por la derecha)
Coeficiente de asimetrı́a de Fisher=g1 = 00 5904 (levemente asimétrica por la derecha)
Coeficiente de apuntamiento de Fisher=g2 = −00 2943 (menos apuntada que la normal)
3.2. La distribución de frecuencias es:
xi
0
1
2
3
4
5
6
7
a)
fi
7
13
18
15
11
6
4
2
suma
Fi
7
20
38
53
64
70
74
76
xi fi
0
13
36
45
44
30
24
14
206
Gráfico de frecuencias acumuladas absolutas: es la representación gráfica de las frecuencias acumuladas absolutas, F , para todo valor numérico, x. Es una gráfica en forma de
“escalera”.
Mediana=Me = 20 5 periódicos.
b) Como el recorrido intercuartı́lico es RI = 3 periódicos y la mitad del recorrido es R/2 = 30 5
periódicos, entonces se cumple que RI es un poco menor que R/2 y, como consecuencia, la
mediana es representativa (pero no se puede decir que es muy representativa).
c) La moda es única y su valor es Mo = 2 periódicos.
Josefa Marı́n Fernández. Soluciones de problemas del cap. 3 de la 2a ed. de “Estadı́stica Aplicada a las CC. de la Documentación”
5
d) Resulta más adecuada la media aritmética, cuyo valor es x = 20 7105 periódicos.
3.3.
a)
Media (aritmética)=x = 670 7297 personas.
Mediana=Me = 670 5 personas.
Moda=Mo = 64 personas.
b) La desviación tı́pica es s = 80 1677 personas. Como R/3 = 11, entonces se cumple que s es
bastante menor que R/3 y, como consecuencia, la media aritmética es bastante representativa.
c) El recorrido intercuartı́lico es RI = 14 personas. Como R/2 = 160 5, entonces RI es bastante
menor que R/2 y, como consecuencia, la mediana es bastante representativa.
3.4.
a)
Polı́gono de frecuencias acumuladas absolutas: se sitúan los puntos que resultan de tomar
en el eje horizontal los extremos superiores de los intervalos de clase, y en el eje vertical sus correspondientes frecuencias acumuladas absolutas, uniendo después dichos puntos
mediante segmentos rectilı́neos.
A partir del polı́gono anterior se deduce que la mediana es aproximadamente igual a 28
años.
Con la fórmula se obtiene que la mediana es Me = 280 0285 años.
b) El recorrido intercuartı́lico es RI = 50 37 años. Como R/2 = 20 entonces RI es mucho menor
que R/2 y, como consecuencia, la mediana es muy representativa.
c) Moda=Mo = 270 5466 años
3.5.
a)
La distribución de frecuencias (conteniendo las columnas que posteriormente necesitaremos)
es:
xi
3
7
12
14
15
16
17
18
20
21
22
24
25
27
30
35
37
40
45
fi
1
1
4
1
1
1
1
1
1
3
1
2
2
2
2
2
1
1
2
suma
Fi
1
2
6
7
8
9
10
11
12
15
16
18
20
22
24
26
27
28
30
xi fi
(xi − x)2 fi
0
(xi − x)3 fi
0
(xi − x)4 fi
3
7
48
14
15
16
17
18
20
63
22
48
50
54
60
70
37
40
90
402 6711
2580 1378
4890 8844
820 2044
650 0711
490 9378
360 8044
250 6711
90 4044
120 8133
10 1378
10 7422
70 4756
300 9422
960 1422
2840 8089
1940 1378
2860 7378
9620 1422
−8080 2670
−41470 4136
−54210 3879
−7450 3203
−5240 9070
−3520 8936
−2230 2803
−1300 0670
−280 8403
−260 4809
−10 2136
10 6261
140 4527
1210 7061
6660 5861
33980 7194
27040 9864
48550 4264
211020 9861
1621440 0237
666350 1123
599960 6922
67570 5707
42340 2495
24930 7816
13540 5671
6590 0059
880 4436
540 7272
10 2945
10 5177
270 9420
4780 7106
46210 6634
405580 0516
376890 4768
822180 5532
4628580 8279
692
32970 8 b
6
131840 41 b
7
9328740 211 b
5
Polı́gono de frecuencias absolutas: se sitúan los puntos que resultan de tomar en el eje
horizontal los distintos valores de la variable, xi , y en el eje vertical sus correspondientes
frecuencias absolutas, fi , uniendo después los puntos mediante segmentos rectilı́neos.
b)
Moda=Mo = 12 cientos de pesetas=1 200 pesetas.
Media (aritmética)=x = 230 0 b
6 cientos de pesetas=2 3060 b
6 pesetas.
0
Mediana=Me = 21 5 cientos de pesetas=2 150 pesetas.
c) Coeficiente de asimetrı́a de Fisher=g1 = 00 3813. La distribución es casi simétrica (levemente
asimétrica por la derecha).
d) Como la distribución es casi simétrica, calculamos el coeficiente de apuntamiento de Fisher,
cuyo valor es g2 = −00 4268. La distribución es menos apuntada que la normal (o platicúrtica).
Josefa Marı́n Fernández. Soluciones de problemas del cap. 3 de la 2a ed. de “Estadı́stica Aplicada a las CC. de la Documentación”
3.6.
6
a) La distribución de frecuencia es:
xi 1 2 3 4 5 6 7 8 9 10 12 14 19 20 21 22 23 24 25 26 35 36 37 38 45 46 50 65
fi 3 5 4 2 1 1 2 1 3 1 1 1 1 4 5 5 2 2 2 2 1 2 2 1 1 3 1 1
Fi 3 8 12 14 15 16 18 19 22 23 24 25 26 30 35 40 42 44 46 48 49 51 53 54 55 58 59 60
Como la dispersión es grande, la medida de posición más adecuada es la mediana, cuyo valor
es Me = 200 5 veces.
b) La distribución de frecuencias con datos agrupados en intervalos de la misma amplitud es:
(`i , `i+1 ]
(00 8, 10]
(10, 190 2]
(190 2, 280 4]
(280 4, 370 6]
(370 6, 460 8]
(460 8, 56]
(56, 650 2]
xi
50 4
140 6
230 8
330 0
420 2
510 4
600 6
fi
23
3
22
5
5
1
1
Fi
23
26
48
53
58
59
60
b
Con los datos agrupados en estos intervalos de clase, el valor de la mediana resulta Me = 200 8 72
veces. El verdadero resultado de esta medida descriptiva es el calculado en el apartado anterior,
Me = 200 5 veces.
3.7.
a) La distribución de frecuencias es:
xi
fi
Fi
xi fi
1
1
1
1
2
1
2
2
3 4 5 6 7 8 9 10 11 12 13 14 15 16 18 19 20 21 22 24
1 4 3 3 4 3 3 4 4 2 3 1 2 1 2 1 4 1 1 1
3 7 10 13 17 20 23 27 31 33 36 37 39 40 42 43 47 48 49 50
3 16 15 18 28 24 27 40 44 24 39 14 30 16 36 19 80 21 22 24
Tiene 5 modas cuyos valores son: 4,7,10,11 y 20 minutos.
Media (aritmética)=x = 100 86 minutos.
Mediana=Me = 10 minutos.
b) Una posible agrupación de los datos en intervalos de distinta amplitud es:
(`i , `i+1 ] fi
(0,4]
7
(4,6]
6
(6,8]
7
(8,10]
7
(10,12]
6
(12,15]
6
(15,19]
4
(19,24]
7
suma
xi
2
5
7
9
11
130 5
17
210 5
xi fi
14
30
49
63
66
81
68
1500 5
5210 5
Fi
7
13
20
27
33
39
43
50
Con esta clasificación en intervalos, los resultados de las medidas descriptivas anteriores son:
Tiene 4 modas cuyos valores son: 2,7,9 y 21’5 minutos.
Media (aritmética)=x = 100 43 minutos.
Mediana=Me = 90 4286 minutos.
Los verdaderos resultados de estas medidas descriptivas son los calculados en el apartado anterior.
Descargar