Módulo 8

Anuncio
.
Módulo 8
Estadı́stica Descriptiva
Guı́a de Ejercicios
Índice
Unidad I.
Introducción a la Estadı́stica Descriptiva.
Ejercicios Resueltos ............................................................................................ pág. 02
Ejercicios Propuestos .......................................................................................... pág. 09
Unidad II.
Medidas Estadı́sticas.
Ejercicios Resueltos ............................................................................................ pág. 13
Ejercicios Propuestos .......................................................................................... pág. 19
Unidad III.
Correlación y Regresión Lineal.
Ejercicios Resueltos ............................................................................................ pág. 22
Ejercicios Propuestos .......................................................................................... pág. 24
1
Unidad I.
Introducción a la Estadı́stica Descriptiva.
Ejercicios Resueltos
1. En un canal de televisión desea conocer las edades de los televidentes que ven una telenovela. Para esto se lleva a cabo un estudio y se seleccionan al azar 350 adultos de
familia de cinco municipios. ¿Cuál serı́a un dato de estudio?. ¿Cuál serı́a la muestra?.
Solución
Dato: la edad de un televidente.
Población: el conjunto de las edades de los televidentes.
Muestra: el conjunto de las edades de los 350 adultos encuestados.
2. Decir de las variables siguientes cuáles representan datos discretos y cuáles datos continuos.
a) Número de acciones vendidas cada dı́a en un mercado de valores.
b) Temperaturas registradas cada media hora en un observatorio.
c) Periodo de duración de los tubos de televisión producidos por una compañia.
d) Censos anuales del olegio de profesores.
e) Longitud de 1.000 cerrojos producidos en una fábrica.
Solución
a) Discreta.
b) Continua.
c) Continua.
d) Discreta.
e) Continua.
3. La unión de empleados de una compañia solicita una guarderı́a para los ni˜os de los trabajadores como parte de sus beneficios. Para determinar el número de niños menores de
seis años que cada empleado tiene, la generencia aplicó un uestinario a sus 50 empleados.
Los resultados fueron:
2
1
0
0
3
0
0
1
2
1
0
2
1
0
3
2
0
1
1
0
0
1
1
2
4
2
0
1
1
0
0
0
2
4
1
1
0
1
2
0
1
1
0
3
5
1
2
1
3
2
Organizar los datos en una tabla de frecuencia.
2
Solución
Primero se identifica cada dato distinto y se prepara una lista ordenada en una columna.
Ésta serı́a: 0, 1, 2, 3, 4 y 5. Luego se identifican las veces que cada uno se repite; esto
es, su frecuencia. Y ası́ resulta:
Número de niños
0
1
2
3
4
5
Total
Frecuencia
16
18
9
4
2
1
50
4. En un grupo de 50 personas, se registraron las estaturas, en cm, de cada uno de ellos.
161
170
177
182
163
175
183
162
167
183
167
180
177
185
183
176
183
167
178
176
172
180
183
172
184
171
177
182
179
183
166
188
168
174
184
175
173
175
183
184
187
164
183
172
187
177
163
172
184
178
Organizar los datos en una tabla de frecuencia.
Solución
Para ordenarlos y agruparlos, establecemos los intervalos que se usarán para distribuirlos, determinando el rango de estos datos.
Dato mayor: 188
Dato menor: 161
Rango: 88 - 61 = 27
De acuerdo con el rango y teniendo en cuenta que la cantidad de datos es pequeña, los
agruparemos e solo 6 clases, representadas por los respectivos intervalos, como muestra
el cuadro siguiente.
Intervalos de estaturas
160 - 164
165 - 169
170 - 174
175 - 179
180 - 184
185 - 189
3
Frecuencia
5
5
8
12
16
4
5. Encontrar la marca de clase para cada intervalo del problema 4.
Solución
En el primer intervalo, 60 - 64, que representa a la primera clase de la distribución de
frecuencias, la marca de clase es 162.
160 + 164
324
=
= 162
2
2
Las marcas de clase de los siguientes intervalos se calculan de igual manera
2o intervalo :
3er intervalo :
o
4 intervalo :
5o intervalo :
o
6 intervalo :
165+169
2
170+174
2
175+179
2
180+184
2
185+189
2
Intervalos de estaturas
160 - 164
165 - 169
170 - 174
175 - 179
180 - 184
185 - 189
=
=
=
=
=
334
2
344
2
354
2
364
2
374
2
= 167
= 172
= 177
= 182
= 187
Marca de clase
162
167
172
177
182
187
6. Los siguientes datos corresponden a las estaturas, en metros, de 80 perosnas. Construir
una tabla de frecuencia que incluya las columnas de frecuencia absoluta, relativa y
relativa porcentual.
1,67
1,72
1,81
1,72
1,74
1,83
1,84
1,88
1,92
1,75
1,84
1,86
1,73
1,84
1,87
1,83
1,81
1,77
1,73
1,75
1,78
1,77
1,67
1,83
1,83
1,72
1,71
1,85
1,84
1,93
1,82
1,69
1,70
1,81
1,66
1,76
1,75
1,80
1,79
1,84
1,86
1,80
1,77
1,80
1,76
1,88
1,75
1,79
1,87
1,79
1,77
1,67
1,74
1,75
1,78
1,77
1,74
1,73
1,83
1,76
1,83
1,77
1,75
1,77
1,77
1,84
1,83
1,79
1,82
1,76
1,76
1,76
1,79
1,88
1,66
1,80
1,72
1,75
1,79
1,77
4
Solución
Estatura mayor = 1,93 m
Estatura menor = 1,66 m
Rango = 1,93 - 1,66 = 0,27 m = 27 cm
Formaremos 6 intervalos. Para calcular su tamaño dividimos:
27 : 6 = 4, 5 ≈ 5
Por lo tanto, los intervalos serán de tamaño 5 cm, es decir, 0,05 m
Intervalos de estaturas
1,65 - 1,69
1,70 - 1,74
1,75 - 1,79
1,80 - 1,84
1,85 - 1,89
1,90 - 1,94
Frecuencia
6
12
30
22
8
2
Frecuencia total = 80
Para encontrar la siguiente columna, frecuencia relativa, se divide la frecuencia absoluta
de cada clase por la frecuencia total.
Intervalos de estaturas
1,65 - 1,69
1,70 - 1,74
1,75 - 1,79
1,80 - 1,84
1,85 - 1,89
1,90 - 1,94
Frecuencia
6
12
30
22
8
2
80
5
F. relativa
0,075
0,150
0,375
0,275
0,1
0,025
1
F. relativa porcentual
7,5
15
37,5
27,5
10
2,5
100 %
7. Dibujar el histograma correspondiente a los datos del problema 4.
Solución
8. La siguiente tabla corresponde a resultados de la Prueba de Selección Universitaria de
los alumnos de un colegio.
Puntaje Frecuencia
350 - 399
4
400 - 449
6
450 - 499
9
500 - 549
20
550 - 599
31
600 - 649
80
650 - 699
42
700 - 749
10
750 - 799
8
800 - 849
2
212
Completar la tabla con las columnas de frecuenncia acumulada, acumulada relativa y
acumulada relativa porcentual.
6
Solución
Puntaje Frecuencia
350 - 399
4
400 - 449
6
450 - 499
9
500 - 549
20
550 - 599
31
600 - 649
80
650 - 699
42
700 - 749
10
750 - 799
8
800 - 849
2
212
Frecuencia acumulada
4
4 + 6 = 10
4 + 6 + 9 = 10 + 9 = 19
19 + 20 = 39
39 + 31 = 70
70 + 80 = 150
150 + 42 = 192
192 + 10 = 202
202 + 8 = 210
210 + 2 = 212
Para encontrar la frecuencia acumulada relativa para las distintas clases, se divide la
frecuencia acumulada por el total.
Por ejemplo para la clase 550 - 599, la frecuencia acumulada relativa es:
70
= 0, 3302
212
Finalmente para encontrar la frecuencia acumulada relativa porcentual, se multiplica
por 100 el valor de la frecuencia acumulada relativa de cada clase.
Puntaje Frecuencia
350 - 399
4
400 - 449
6
450 - 499
9
500 - 549
20
550 - 599
31
600 - 649
80
650 - 699
42
700 - 749
10
750 - 799
8
800 - 849
2
212
F. acumulada
4
10
19
39
70
150
192
202
210
212
7
F. acumulada relativa
0,0189
0,0472
0,0896
0,1840
0,3302
0,7075
0,9057
0,9528
0,9906
1
F. a. r. porcentual
1,89
4,72
8,96
18,4
33,02
70,75
90,57
95,28
99,06
100
9. Graficar mediante una poligonal de frecuencias acumuladas los datos del problema 8.
Solución
La distribución acumulada que correponde a los datos del problema 8 se pueden presentar
de la siguiente manera:
Puntaje
Frecuencia acumulada
Menor que 349,5
0
Menor que 399,5
4
Menor que 449,5
10
Menor que 499,5
19
Menor que 549,5
39
Menor que 599,5
70
Menor que 649,5
150
Menor que 699,5
192
Menor que 749,5
202
Menor que 799,5
210
Menor que 849,5
212
Con esta tabla podemos graficar la poligonal de frecuencia acumulada.
8
Ejercicios Propuestos
1. ¿Cuál serı́a un dato de cada estudio?. El conjnto de datos que se recopilará, ¿representa
una muestra o una población?.
a) Un municipio desea conocer las edades de los residentes de un barrio. Para esto, se
lleva a cabo un estudio y se seleccionan 50 habitantes de ese barrio.
b) Se recabaron datos referentes al nvel de colesterol de 900 residentes del área metropolitana para estudiar la condición de salud de los habitantes.
c) El departamento de educación desea saber cuántos profesores tiene entre 20 y 25 años
de servicio.
d) Una estación de televisión desea saber la proporción de televidentes que miran su
uevo programa al menos una vez a la semana. Un grupo aleatorio de 1000 televidentes
fueron encuestados.
2. Decir cuáles de los siguentes datos representan una variable discreta y cuáles una variable continua.
a) Centı́metros de precipitación de una cuidad durante varios meses del año.
b) Velocidad de un automóvil en kilometros por hora.
c) Número de billetes de 20 dólares circulando a la vez en Estados Unidos.
d) Estudiantes matriculados en una universidad en un número de años.
3. Una prueba de hemoglobina que se aplica a las personas con diabetes durante sus
exámenes rutinarios de control, indica el nivel de azúcar en la sangre durante dos o tres
meses antes de la prueba. Los siguientes datos se obtuvieron de 40 personas diabéticas
en una clı́nica:
6,5
5,0
5,6
7,6
4,8 8,0
7,5
7,9
8,0
9,2
6,4
6,0
5,6
6,0
5,7 9,2
8,1
8,0
6,5
6,6
5,0
8,0
6,5
6,1
6,4 6,6
7,2
5,9
4,0
5,7
7,0
6,0
5,6
6,0
6,2 7,7
6,7
7,7
8,2
9,0
Organizar los datos en una tbala de frecuencia agrupada en seis intervalos. Utiliza las
clases: 3,7 a 4,6; 4,7 a 5,6; 5,7 a 6,6; 6,7 a 7,6; 7,7 a 8,6; 8,7 a 9,6
9
4. Considerar los datos siguientes:
7
12
14
8
9
15
14
10
8
11
12
8
8
15
14
13
10
8
9
12
12
7
10
8
12
13
11
9
a) Ordenarlos en forma creciente.
b) Calcular el rango de los datos.
c) Establecer la frecuencia de los datos 8, 10 y 15.
d) De todos los datos, ¿cuál tiene mayor frecuencia?
5. Dado el siguiente conjunto de datos:
7
20
15
12
8
10
7
14
13
9
12
19
20
13
8
7
10 12
15
18
18
16
7
8
9
12
14 15
9
12
13
10
10
7
9
13
14 16
17
19
20
18
12
14
16
16
7
10
15
10
a) Calcular el rango.
b) ¿En cuántos intervalos de igual tamaño se agruparı́an los datos si el primero fuera 6
- 8?
c) Encontrar la frecuencia de la clase 12 - 14.
d) Construir la tabla de distribución de frecuencias, considerando 5 intervalos iguales, a
partir del 6 - 8.
e) ¿Qué tamaño tienen los intervalos de la distribución anterior?
f) ¿Cuáles son las marcas de clase de la distribución?
g) ¿Cuál es la clase con menor frecuencia?
10
6. La distribución de frecuencias muestra la cantidad de colesterol total de un grupo de
pacientes cuya edad es de 50 a 60 ańos.
Colesterol total (mg/dl) Frecuencia
170 - 179
4
180 - 189
7
190 - 199
12
200 - 209
16
210 - 219
35
220 - 229
37
230 - 239
11
240 - 249
8
a) Calcular las frecuencias relativas.
b) Determinar las frecuencias porcentuales.
c) Identificar la clase con mayor frecuencia.
d) Identificar la clase con menor frecuencia relativa porcentual.
e) Calcular la suma de las frecuencias relativas.
f) Calcular la suma de las frecuencias porcentuales.
g) Explicar por qué la suma de las frecuencias relativas no es 1, en este caso.
7. Un curso de 44 alumnos obtuvo las siguientes notasen una asignatura
5,0
2,8
6,8
6,2
5,7 5,9 3,7
3,8 3,3 2,2
4,9
2,7
5,1
5,5
4,3
4,3 3,7 3,9
3,0 7,0 2,7
4,8
3,2
3,4
4,2
4,3
4,8 4,9 5,3
5,7 4,0 4,0
4,1
4,1
4,5
5,0
4,6
5,3 5,3 5,6
6,0 5,3 4,5
4,3
a) Construir una tabla de distribución de frecuencias absolutas y relativas porcentuales,
con intervalo de igual tamaño, comenzando con el intervalo 2,1 - 2,5.
b) Dibujar el histograma de frecuencias relativas porcentuales.
c) Establecer a qué intervalos corresponde la mayor frecuencia.
d) Dibujar los polı́gonos de frecuencias absolutas.
11
8. La siguiente tabla corresponde a la distribución de los puntajes promedio de la Prueba
de Selección Universitaria
Puntaje Estándar
200 - 249
250 - 299
300 - 349
350 - 399
400 - 449
450 - 499
500 - 549
550 - 599
600 - 649
650 - 699
700 - 749
750 - 799
800 - 849
Frecuencia
1
139
5.474
17.810
21.239
20.184
18.517
16.597
13.583
9.619
4.848
1.026
11
a) ¿Cuántos alumnos rindieron la prueba?
b) ¿Qué porcentaje de alumnos obtuvo puntajes menores que los del intervalo 500 - 549?
c) ¿Qué porcentaje de alumnos obtuvo puntajes iguales o superiores a los del intervalo
700 - 749?
d) Dibujar una curva de distribución de frecuencias.
e) En la tabal dada, construir la columna correspondiente a Frecuencia Acumulada Porcentual.
12
Unidad II.
Medidas Estadı́sticas.
Ejercicios Resueltos
1. Las calificaciones de un estudiante en seis pruebas fueron 64, 59, 70, 68, 58 y 57. Hallar
el promedio de las calificaciones.
Solución
X̄ =
ΣX
64 + 59 + 70 + 68 + 58 + 57
376
=
=
= 62, 6
N
6
6
2. Las puntuaciones finales de un estudiante en matemáticas, fı́sica, inglés e historia son,
respectivamnte, 64, 53, 66 y 48. Si la importanci que se asigna a estas asignaturas son de
3, 5, 3 y 1, respectivamente, determinar el promedio ponderado de puntuación adecuado.
Solución
X̄ =
ΣwX
3 · 64 + 5 · 53 + 3 · 66 + 1 · 48
694
=
=
= 57, 8
Σw
3+5+3+1
12
3. Utilizar la siguiente tabla para hallar el promedio del peso de 100 estudiantes.
Peso (kg) Frecuencia (f)
60 - 62
5
63 - 65
18
66 - 68
42
69 - 71
27
72 - 74
8
Solución
El trabajo puede ser ordenado como aparece en la siguiente tabla.
Peso (kg) Frecuencia (f) Marca de clase X
60 - 62
5
61
63 - 65
18
64
66 - 68
42
A → 67
69 - 71
27
70
72 - 74
8
73
13
Desviaciones d = X - A fd
-6
-30
-3
-54
0
0
3
81
6
48
Se toma la marca de clase 67 como el promedio supuesto A, ya que es la de mayor
frecuencia.Con esto se puede calcular el promedio utilizando la siguiente relación:
X̄ = A +
45
Σf d
= 67 +
= 67, 45kg
N
100
4. Las calificaiones de un estudiante en seis exámes fueron 67, 58, 45, 63, 55 y 70. Hallar
la mediana de las calificaiones.
Solución
Puestas en orden, las calificaiones son 45, 55, 58, 63, 67, 70.
Al haber un número par de términos hay dos valores centrales 58 y 63, cuyo promedio
1
(58 + 63) = 60, 5 es la mediana pedida.
2
5. Hallar la mediana de las estaturas de 40 personas utilizando la siguiente tabla.
Estatura (cm) Frecuencias
118 - 126
3
127 - 135
5
136 - 144
9
145 - 153
12
152 - 162
5
163 - 171
4
172 - 180
2
Solución
Puesto que la suma de las frecuencias de las tres y cuatro primeras clases son respectivamente 3 + 5 + 9 = 17 y 3 + 5 + 9 + 12 = 29, está claro que la mediana se encuentra
en la cuarta clase, que será, por tanto, la clase mediana. Entonces
L1 = lı́mite real inf erior de la clase mediana = 144, 5
N = número de datos = 40
(Σf )1 = suma de todas las clases inf eriores de la clase mediana = 3 + 5 + 9 = 17
fmediana = f recuencia de la clase mediana = 12
c = tamaño del intervalo de la clase mediana = 9
Ası́ se tiene:
N/2 − (Σf )1
40/2 − 17
M ediana = L1 +
· c = 144, 5 +
· 9 = 146, 8 cm
fmediana
12
14
6. Hallar el promedio, mediana y moda de los números:
a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
b) 51,6; 48,7; 50,3; 49,5; 48,9
Solución
a) Puestos en orden de magnitud, los números son 2, 2, 3, 5, 5, 5, 6, 6, 8, 9.
1
(2 + 2 + 3 + 5 + 5 + 5 + 6 + 6 + 8 + 9) = 5, 1
10
1
M ediana = media aritmética de los valores centrales = (5 + 5) = 5
2
M oda = número que se presenta con mayor f recuencia = 5
P romedio =
b) Puestos en orden de magnitud, los números son 48,7; 48,9; 49,5; 50,3; 51,6.
1
(48, 7 + 48, 9 + 49, 5 + 50, 3 + 51, 6) = 49, 8
5
M ediana = número central = 49, 5
M oda = número que se presenta con mayor f recuencia; aquı́ no existe
P romedio =
7. Hallar la desviación media de la serie de números 12, 6, 7, 3, 15, 10, 18, 5
Solución
Promedio:
X̄ =
12 + 6 + 7 + 3 + 15 + 10 + 18 + 5
76
=
= 9, 5
8
8
Desviación media:
M.D.
Σ|X − X̄|
N
|12 − 9, 5| + |6 − 9, 5| + |7 − 9, 5| + |3 − 9, 5| + |15 − 9, 5| + |10 − 9, 5|
=
8
|18 − 9, 5| + |5 − 9, 5|
+
8
2, 5 + 3, 5 + 2, 5 + 6, 5 + 5, 5 + 0, 5 + 8, 5 + 4, 5
=
8
34
=
= 4, 25
8
=
15
8. Hallar la desviación media de los pesos de 100 estudiantes utilizando la tabla del ejercicio 3.
Solución
Del problema 3, el promedio es X̄ = 67, 45
Peso (kg) Frecuencia (f) Marca de clase X
60 - 62
5
61
63 - 65
18
64
66 - 68
42
67
69 - 71
27
70
72 - 74
8
73
M.D. =
|X − X̄| = |X − 67, 45| f |X − X̄|
6,45
32,35
3,45
62,10
0,45
18,90
2,55
68,85
5,55
44,40
Σf |X − X̄|
226, 5
=
= 2, 26 kg
N
100
9. Hallar la desviación tı́pica de la serie 9, 3, 8, 8, 9, 8, 9, 18.
Solución
Promedio:
X̄ =
9 + 3 + 8 + 8 + 9 + 8 + 9 + 18
72
=
=9
8
8
Desviación tı́pica:
s
Σ(X − X̄)2
N
s
(9 − 9)2 + (3 − 9)2 + (8 − 9)2 + (8 − 9)2 + (9 − 9)2 + (8 − 9)2 + (9 − 9)2 + (18 − 9)2
=
8
√
=
15 = 3, 87
s =
16
10. Hallar la desviación tı́pica de los pesos de 100 estudiantes utilizando la tabla del ejercicio
3.
Solución
Peso (kg) Marca de clase X
60 - 62
61
63 - 65
64
66 - 68
67
69 - 71
70
72 - 74
73
s
s=
X − X̄ = X − 67, 45 (X − X̄)2
-6,45
41,6025
-3,45
11,9025
-0,45
0,2025
2,55
6,5025
5,55
30,8025
Σf (X − X̄)2
=
N
s
f |X − X̄|2
208,0125
214,2450
8,5050
175,5675
246,4200
852, 75 q
= 8, 5275 = 2, 92 kg
100
11. Hallar
a) Los cuartiles Q1 , Q2 y Q3
b) Los deciles D1 , D2 , ..., D9 , de los salarios de los 65 empleados de una compañia
Salarios (dólares) Número de empleados
50,00 - 59,99
8
60,00 - 69,99
10
70,00 - 79,99
16
80,00 - 89,99
14
90,00 - 99,99
10
100,00 - 109,99
5
110,00 - 119,99
2
Solución
a) El primer cuartil Q1 es aquel valor que se obtiene para el N/4 = 65/4 = 16, 25 de
los casos comenzando por la clase primera (la más baja). Puesto que la primera clase
contiene 8 casos, tomaremos 8,25 casos (16,25 - 8) de los 10 que tienen la segunda clase.
Por el método de interpolación linel se tiene
Q1 = $59, 995 +
8, 25
($10, 00) = $68, 25
10
El segundo cuartil Q2 es aquel valor que se obtiene para el 2N/4 = N/2 = 65/2 = 32,5
de los casos. Puesto que las dos primeras clases comprenden 18 casos , tomaremos 32,5
- 18 = 14,5 de los 16 casos de la tercera clase, entonces
Q2 = $69, 995 +
14, 5
($10, 00) = $79, 06
16
17
Este cuartil Q2 realmente es la mediana.
El tercer cuartil Q3 es aquel valor que se obtiene para el 3N/4 = 34 · 65 = 48,75 de los
casos. Puesto que las cuatro primeras clases comprenden 48 casos, tomaremos 48,75 48 = 0,75 de los 10 casos de la quinta clase, entonces
Q3 = $89, 995 +
0, 75
($10, 00) = $90, 75
10
De aquı́ que el 25 % de los empleados gana $68,25 o menos, el 50 % gana $79,06 o menos
y el 75 % gana $90,75 o menos.
b) El primero, segundo, ..., neveno decil son los valores que se obtienen para N/10,
2N/10, ..., 9N/10 de los casos comenzando por la clase primera (la más baja). Tenemos
D1 = $49, 995 +
D2 = $59, 995 +
D3 = $69, 995 +
D4 = $69, 995 +
D5 = $69, 995 +
D6 = $69, 995 +
D7 = $69, 995 +
D8 = $69, 995 +
D9 = $69, 995 +
6, 5
($10, 00) = $58, 12
8
5
($10, 00) = $65, 00
10
1, 5
($10, 00) = $70, 94
16
8
($10, 00) = $75, 00
16
14, 5
($10, 00) = $79, 06
16
5
($10, 00) = $83, 57
14
11, 5
($10, 00) = $88, 21
14
4
($10, 00) = $94, 00
10
0, 5
($10, 00) = $101, 00
5
De aquı́ que el 10 % de los empleados gana $58,12 o menos, el 20 % gana $65,00 o menos,
..., el 90 % gana $101,00 o menos.
El quinto decil es la mediana. El segundo, cuarto, sexto y octavo deciles que dividen la
distribución en cinco partes iguales se llaman quintiles.
18
Ejercicios Propuestos
1. Los tiempo de reacción de un individuo a determinados estı́mulos fueron 0,53; 0,46; 0,5;
0,49; 0,52; 0,53; 0,44 y 0,55 segundos, respectivamente. Determinar el tiempo medio de
reacción del individuo a los estı́mulos.
2. Las calificaciones de un estudiante en las tres asignaturas del curso fueron 70, 56 y 64.
a) Si los pesos asignados a cada asignatura son 2, 4 y 5, respectivamente, ¿cuál es el
promedio adecuado para sus calificaciones?.
b) ¿Cuál serı́a si todos los pesos fueran iguales?.
3. La siguiente tabla muestra la distribución de la carga en toneladas que soortan ciertos
cables producidos por una compañia. Determinar el promedio de la carga máxima.
Máximo de carga (toneladas) Número de cables
9,3 - 9,7
2
9,8 - 10,2
5
10,3 - 10,7
12
10,8 - 11,2
17
11,3 - 11,7
14
11,8 - 12,2
6
12,3 - 12,7
3
12,8 - 13,2
1
4. Hallar el promedio y la mediana de los siguientes números:
a) 5, 4, 8, 3, 7, 2, 9
b) 18,3; 20,6; 19,3; 22,4; 20,2; 18,8; 19,7; 20
5. Hallar la mediana para las cargas máximas de los cables del problema 3.
6. Hallar el promedio, la mediana y la moda para los siguientes datos:
a) 7, 4, 10, 9, 15, 12, 7, 9, 7
b) 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7
7. Hallar la desviación tı́pica de los números:
a) 3, 6, 2, 1, 7, 5
b) 3,2; 4,6; 2,8; 5,2; 4,4
c) 0, 0, 0, 0, 0, 1, 1, 1
19
8. Hallar la desviación tı́pica s de los diámetros de los remaches.
Diámetro (cm) Frecuencia
0,7247 - 0,7249
2
0,7250 - 0,7252
6
0,7253 - 0,7255
8
0,7256 - 0,7258
15
0,7259 - 0,7261
42
0,7262 - 0,7264
68
0,7265 - 0,7267
49
0,7268 - 0,7270
25
0,7271 - 0,7273
18
0,7274 - 0,7276
12
0,7277 - 0,7279
4
0,7279 - 0,7282
1
9. Hallar las desviaciones medias de las series de números:
a) 3, 7, 9, 5
b) 2, 4, 1, 6, 3, 8, 41, 3, 4
10. Hallar la desviación media (M.D.) de los diámetros de los remeaches de la tabla del
problema 8.
11. La siguiente tabla muestra una distribuión de frecuecias de las calificaiones del examen
final de álgebra.
a) Hallar los cuartiles de la distribución.
b) Interpretar el significado de cada uno
Calificación
90 - 100
80 - 89
70 - 79
60 - 69
50 - 59
40 - 49
30 - 39
Número de estudiantes
9
32
43
21
11
3
1
20
12. Hallar, utilizando los siguientes datos
a) El segundo decil.
b) El cuarto decil.
c) El 90o percentil.
d) El 68o percentil.
e) Interprete cada uno de los resultados anteriores.
Edad de los cabeza de familia (años) Número (en millones)
Menor de 25
2,22
25 - 29
4,05
30 - 34
5,08
35 - 44
10,45
45 - 54
9,47
55 - 64
6,63
65 - 74
4,16
75 y más
1,66
21
Unidad III.
Correlación y Regresión Lineal.
Ejercicios Resueltos
1. La empresa Soto Hnos., es un negocio familiar que vende al detalle en la ciudad de
Chimbarongo muebles de caña, mimbre y otros materiales nobles. Se anuncia ampliamente por las emisoras locales, destcándo sus bajos precios y condiciones de crédito.
A los hermanos les gustarı́a analizar la relación entre las ventas y lo que pasa con la
publicidad. A continuación se encuentra la información acerca de as ventas y los gastos
de pulicidad, en millones de pesos, de los últimos cuatro años.
Mes
Gastos en publicidad
Julio
2.000.000
Agosto
1.000.000
Septiembre
3.000.000
Octubre
4.000.000
Ingrsos por ventas
7.000.000
3.000.000
8.000.000
10.000.000
a) A los hermanos les gustarı́a pronosticar las ventas con base en los gasto publicitarios.
¿ Cuál es la variable dependiente?.
b) Determine el coeficiente de correlación.
c) Interprete la fuerza del coeficiente de correlación.
d) Evalue el coeficiente de determinación, e interprete su respuesta.
e) Determine la ecuación de regresión.
f) Interprete los valores de a y b.
g) Calcule los ingresos por ventas cuando se gastas 3 millones de pesos en publicidad.
Solución
a) El gasto en publicidad es la variable independiente y el ingreso por ventas la variable
dependiente.
b)
x y xy
2 7 14
1 3
3
3 8 24
4 10 40
10 28 81
r=√
x2
4
1
9
16
30
y2
49
9
64
100
222
4 · 81 − 10 · 28
44
44
=√
=
= 0, 9648
2
2
45, 6070
4 · 30 − 10 · (4 · 22 − 28 )
2080
c) Existe una fuerte correlación entre el gasto y el ingreso por ventas.
22
d) r2 = 0, 93; es decir, el 93 % de la variación en las ventas se explica por la variación
en publicidad .
e)
b=
324 − 280
4 · 81 − 10 · 28
= 2, 2
=
2
4 · 30 − 10
120 − 100
a=
28
10
− 2, 2 ·
= 7 − 5, 5 = 1, 5
4
4
f) La pendiente es 2,2. Esto indica que un aumento de un millón de pesos en publicidad
resultara en un incremneto de 2,2 millones en ventas. La intersección es 1,5. Si no hubiera gastos en publicidad, las ventas serı́an de 1,5 millones de pesos unicamente.
g) Se tiene y 0 = 1, 5 + 2, 2x, luego:
y 0 = 1, 2 + 2, 2 · 3 = 8, 1
23
Ejercicios Propuestos
1. Se han colgado sucesivamente del extremo de un resorte cinco masas, X, en gramos, y se
han registrado los alargamientos, Y, en milı́metros producidos por las cargas. He aquı́ la
tabla.
X (g)
Y (mm)
3
4
5 6 7
1,2 1,9 2,4 3 3,7
a) Dibuja la nubre de puntos.
b) Hallar la recta de regresión
c) Hallar el coeficiente de correlación lineal.
d) Deducir lo que se estirarı́a el muelle si colgáramos una masa de 15 gramos.
2. En la siguiente tabla muestra el número de accidentes de tráfico en los últimos 7 años:
Año (X)
1992 1993 1994 1995 1996 1997 1998
N accid. (Y) 510 515 518 522 528 532 536
o
a) Determine el número medio de accidentes en los 7 años.
b) Dibuje la nubre de puntos.
c) Calcule la recta de regresión de X (años) sobre Y (no de accidentes).
d) Obtenga el coeficiente de correlación lineal.
e) ¿Cuántos accidentes estimarı́as para el año 2000?.
3. Ajustar la recta de regresión con los puntos dados hallando el coeficiente de correlación
lineal. ¿Por qué da ”r” ese valor?.
X
Y
-2 -1 0 3
-3 -1 1 7
4. Supongamos que un analista toma una muestra aleatoria de 10 embarques recientes por
camión realizados por una compańı́a y registra las siguientes distancias en kilómetros y
el tiempo de entrega al medio dı́a más cercano a partir del momento en que el embraque
estuvo listo para su carga.
Embraque de muestreado
Distancia (x) en kilómetros
Tiempo de entrega (y), en dı́as
1
2
3
4
5
6
7
8
9
10
825 215 1070 550 480 920 1350 325 670 1215
3,5
1
4
2
1
3
4,5 1,5
3
5
a) Elabore el diagrama de dispersión.
b) Calcule el coeficiente de correlación y el coeficiente de determinación e interpretelos.
c) Determie la recta de regresión.
d) Calcule la variación total.
e) Calcule la variación del error.
24
5. En la table se presentan datos muestrales relativos al número de horas de estudio fuera
de clase durantes el periodo de tres semanas de alumnos de un curso de estadı́stica
aplcada a la economı́a y a sus calificaciones en el examen final de ese periodo.
Estudiantes muestreado
Horas de estudio (x)
Calificaciones en examen (y)
1 2 3 4 5 6 7 8
20 16 34 23 27 32 18 22
64 61 84 70 88 92 72 77
a) Calcular el coeficiente de correlación y el coeficiente de determincación e interpretelos.
b) Construir el gráfico de dispersión.
c) Calcular la ecuación de regresión.
d) Estimar el error.
6. El MOP estudia las relaciones entre el número de licitaciones para un proyecto en la
carretera, y la propuesta ganadora (la de más bajo costo) para el proyecto. De particular
interés es si el número de postores aumenta disminuye el importe de licitación ganadora.
Proyecto
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Número de licitaciones
x
9
9
3
10
10
5
10
7
11
6
6
4
7
7
6
Oferta ganadora
(millones de dólares) y
5,1
8
9,7
7,8
7,8
7,7
5,5
8,3
5,5
10,3
8
8,8
9,4
8,1
7,8
a) Determine la ecuación de regresión e interprete. ¿ Más licitaiones tienden a aumnetar
o disminuir el importe de la propuesta ganadora?.
b) Estime el monto de la oferta ganadora si hubiese postores.
c) Caclucle el coeficiente de determinación e interprete su valor.
d) Evalue el error estandar de estimación.
e) Trace el modelo de dispersión.
f) Calcule el coeficiente de correlación e interprete.
25
Descargar