Examen estadistica

advertisement
EXAMEN DE MATEMÀTIQUES. 1 Bat B. ESTADISTICA. 15-JUNY-2010
1. Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en
céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color.
La siguiente tabla nos da los seis primeros pares de datos obtenidos:
X
:
B
Y
N8 1
11
72
11
4 1
0
Y
:
C
o
l
o
r 3
34
99
51
0
65
85
3
a) Halla la recta de regresión de Y sobre X.
b) ¿Cuánto nos costaría imprimir una página en color en una impresora en la que el
coste por página en blanco y negro fuera de 12 céntimos de euro? ¿Es fiable la
estimación? (Sabemos que r  0,97).
2. La estatura, en centímetros, de seis chicos de la misma edad y la de sus padres
viene recogida en la siguiente tabla:
X
:
H
i
j
o1
6
01
5
01
6
01
7
01
8
01
7
0
Y
:
P
a
d
r
e1
8
01
7
01
7
51
8
51
8
01
7
5
a) Halla las dos rectas de regresión y represéntalas.
b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la
correlación entre las dos variables?
3. Una librería ha recogido la siguiente información sobre el número de libros leídos
anualmente por 20 clientes, y, y el tiempo en horas que tardan diariamente en
llegar a su trabajo usando el transporte público, x.
Y
1

33

55

7
X
0

1 4
9
0
1

2 0
3
4
a Obtén el coeficiente de correlación e interprétalo.
b Calcula la recta de regresión de Y sobre X.
c Si una persona tarda tres cuartos de hora en llegar a su trabajo, ¿cuántos libros al
año se prevé que lea?
Nota.- Les qüestions 1 i 2 valen 3 punts; la 3 val 4 punts. Sort.
Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en
céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color. La
siguiente tabla nos da los seis primeros pares de datos obtenidos:
X
:
B
Y
N8 1
11
72
11
4 1
0
Y
:
C
o
l
o
r 3
34
99
51
0
65
85
3
a) Halla la recta de regresión de Y sobre X.
b) ¿Cuánto nos costaría imprimir una página en color en una impresora en la que el
coste por página en blanco y negro fuera de 12 céntimos de euro? ¿Es fiable la
estimación? (Sabemos que r  0,97).
Solución:
a)
T
o
ta
l
x
i
y
i
2
x
i
x
iy
i
8
3
3
6
4
2
6
4
1
1
4
9
1
2
1
5
3
9
1
7
9
5
2
8
9
1
6
1
5
2
1
1
0
6
4
4
1
2
2
2
6
1
4
5
8
1
9
6
8
1
2
1
0
5
3
1
0
0
5
3
0
8
1
3
9
4
1
2
1
1
5
9
8
6
 Medias:
81
13,5
6
394
y
 65,67
6
x
 Varianza de X:
2 1211
2


13
,
5

19
,
58
x
6
 Covarianza:
5986

 
13
,
5

65
,
67

111
,
12
xy
6
 Coeficiente de regresión:

,
12
xy111
m
 2

5
,
68
yx
19
,
58

x
 Ecuación de la recta de regresión de Y sobre X :


y

65
,
67

5
,
68
x

13
,
5
y

5
,
68
x

11
,
01
ˆ




b̂)
y
12

5
,
68

12

11
,
01

y
12

57
,
15
céntimos
de
euro
Como la correlación es alta, r  0,97, y x  12 queda dentro del intervalo de valores que
tenemos, la estimación sí es fiable. Si el coste de la página en blanco y negro es de 12
céntimos de euro, muy probablemente costará 57,15 céntimos de euro imprimirla en color.
Ejercicio nº 2.La estatura, en centímetros, de seis chicos de la misma edad y la de sus padres viene
recogida en la siguiente tabla:
X
:
H
i
j
o1
6
01
5
01
6
01
7
01
8
01
7
0
Y
:
P
a
d
r
e1
8
01
7
01
7
51
8
51
8
01
7
5
a) Halla las dos rectas de regresión y represéntalas.
b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la
correlación entre las dos variables?
Solución:
a)
T
o
ta
l
 Medias:
990
165
6
1065
y
177
,5
6
x
x
i
y
i
2
x
i
2
y
i
1
6
0
1
8
0
2
5
6
0
0
3
2
4
0
0
2
8
8
0
0
1
5
0
1
7
0
2
2
5
0
0
2
8
9
0
0
2
5
5
0
0
1
6
0
1
7
5
2
5
6
0
0
3
0
6
2
5
2
8
0
0
0
1
7
0
1
8
5
2
8
9
0
0
3
4
2
2
5
3
1
4
5
0
1
8
0
1
8
0
3
2
4
0
0
3
2
4
0
0
3
2
4
0
0
1
7
0
1
7
5
2
8
9
0
0
3
0
6
2
5
2
9
7
5
0
9
9
0
10
6
5
1
6
3
9
0
0
1
8
9
1
7
5
1
7
5
9
0
0
x
iy
i
 Desviaciones típicas:
1
6
9
0
0
2


1
6
5
9
1
,6
79
,
5
7
x
6
1
8
9
1
7
5
2


1
7
7
,
5
2
2
,
9
24
,
7
9
y
6
 Covarianza:
1
7
5
9
0
0


1
6
5

1
7
7
,
5

2
9
,
1
7
6
x
y
 Coeficientes de regresión:
2
9
,
1
7
Y
s
o
b
r
e
X

m
 
0
,
3
2
y
x
9
1
,
6
7
2
9
,
1
7
X
s
o
b
r
e
Y

m
 
1
,
2
7
x
y
2
2
,
9
2
 Rectas de regresión:
Y
s
o
b
r
e
X

y

1
7
7
,
5

0
,
3
2
x

1
6
5

yx

0
,
3
2

1
2
4
,
7


X
s
o
b
r
e
Yx


1
6
5
1
,
2
7

1
7
7
,
5
y

x1
,27
y60
,43
x

60
,
43
y


y

0
,
79
x

47
,
58
1
,
27
 Representación:
b) La correlación entre las variables no es demasiado fuerte, pues las dos rectas no están muy
29
,
17
próximas.
Comprobam
s
que
el
coeficien
e
de
correla
n
es
:
r

0
,
636
9
,
57

4
,
79
Ejercicio nº 3.Una librería ha recogido la siguiente información sobre el número de libros leídos
anualmente por 20 clientes, y, y el tiempo en horas que tardan diariamente en llegar a
su trabajo usando el transporte público, x.
Y
1

33

55

7
X
0

1 4
9
0
1

2 0
3
4
a Obtén el coeficiente de correlación e interprétalo.
b Calcula la recta de regresión de Y sobre X.
c Si una persona tarda tres cuartos de hora en llegar a su trabajo, ¿cuántos libros al
año se prevé que lea?
Solución:
a Consideramos xi, yi las marcas de clase:
Distribución marginal de X:
x
i
f
i
x
if
i
2
x
if
i
0
,
5
1
3
6
,
5 3
,
2
5
1
,
5
7
1
0
,
51
5
,
7
5
2
0
1
7
1
9
17
x 0,85
20
1
9
2


0
,8
5

0
,4
8
x
2
0
Distribución marginal de Y:
y
y
if
i
2
y
if
i
y
i
f
i
2
4
8
4
1
2
4
8 1
9
2
6
4
2
4 1
4
4
2
0
8
0 3
5
2
1
6
80
4
20
3
5
2 2


4
1
,2
6
y
2
0
Covarianza:
xi yi fi  0,5 · 2 · 4  0,5 · 4 · 9  1,5 · 4 · 3  1,5 · 6 · 4  76
7
6

0
,8
5
40
,4
x
y 
2
0
Coeficiente de correlación:
0
,4
r

0
,6
6
0
,4
8
1
,2
6
La correlación entre las variables es positiva a más tiempo de viaje, más libros se leen
pero no es muy fuerte.
b Calculamos la pendiente de la recta: myx
xy
1
,7
4
x2
m
yx 
Luego:
y  4  1,74 x  0,85  y  1,74x  2,521
3
c
)
S
i
x

d
e
h
o
r
a

0
,
7
5
h1
y

,
7
4

0
,
7
5

2
,
5
2
1

3
,
8
2
6

4
4
Si una persona tarda diariamente tres cuartos de hora en llegar a su trabajo usando el
transporte público, podría llegar a leer al año casi 4 libros.
Descargar