Problema Recuperació del Mig Punt (a puntuar 0 o 0.5) Problema 1

Anuncio
FACULTAT D’INFORMÀTICA. CURS 98-99 Q2.
EXAMEN FINAL D’ESTADÍSTICA 1 (Data: 28 de Juny de 1.999 de 18:30 a 21:30 h)
Professor responsable: Lídia Montero Mercadé
Localització: Edifici U D.421
Normativa de l’examen:
NO ES PERMÈS DE DUR APUNTS.
ES POT DUR CALCULADORA I TAULES ESTADÍSTIQUES
RESPONGUEU CADA PROBLEMA EN FULLS SEPARATS
Durada de l’examen:
3 hores 00 minuts
Problema Recuperació del Mig Punt (a puntuar 0 o 0.5)
Les dades de l´estadística descriptiva numèrica del caràcter continu CONTROL, que indica la quantitat de
colesterol en sang en un grup de pacients, es presenten a continuació:
MTB > Describe
'CONTROL'.
Descriptive Statistics
Variable
CONTROL
N
30
Mean
193,13
Median
187,00
TrMean
192,00
Variable
CONTROL
Minimum
160,00
Maximum
242,00
Q1
178,00
Q3
204,50
StDev
22,30
SE Mean
4,07
MTB >
• Quin és el valor del caràcter CONTROL que garanteix que un 25% de les observacions no el
superen?
És Q1=178.
Problema 1 (6 punts)
El desenvolupament justificat de la resolució es valorarà en la correcció de l’apartat. No hi ha qüestions
encadenades i totes puntuen per igual.
( B ) = 0.4 i
1. Siguin A i B dos successos pertanyents a un mateix conjunt de resultats Ω , tals que P A
P (B) = 0.5 . Si A i B són independents, quina és la probabilitat del succés A?
( B ) = P (PA(∩B )B ) = 1 − PP((AB∪) B ) = 1− P( A) − PP((BB))+ P(A ∩ B ) = 1 − P( B) − PP((BA))(1 − P(B )) = P( A ) = 0.4
PA
( )
D’on surt que P (A) = 1 − P A = 1 − 0.4 = 0.6 .
2 x 0 < x < 1
2. Sigui f X (x ) = 
la f.d.p d´una variable aleatòria contínua. Determineu la seva
 0 altrament
desviació tipus o estàndard i el seu quartil del 75%. Justifiqueu bé tots els pasos.
1
1
1
[ ]
+∞
1
2t 3  2
t4  1
2
2
3
E[ X ] = ∫ t f X (t ) dt = ∫ 2t dt =
=
(
)
i
E
X
=
t
f
t
dt
=
2
t
dt
=
 = .
∫−∞ X
∫0
−∞
0
3  0 3
2 0 2
+∞
[ ]
1
V [ X ] = E X 2 − E[ X ] =
2
2
1
1
→ STDEV ( X ) = V [ X ] =
.
18
3 2
Q3 és x 0 t.q. FX (x 0 ) = 0.75 i FX (x ) =
2
d´on FX (x 0 ) = x0 = 0.75→ x0 =
∫
x
−∞
]
x
2t dt = t 2 0 = x 2 ,
3
.
2
3. La variable aleatòria X té una esperança matemàtica de 1002 i una variança de 100. Es defineix
Z=3X-10. Calculeu COV(Z,X) i VAR(Z-X).
Per una propietat vista a classe, COV ( Z , X ) = E [Z ⋅ X ] − E[Z ]E [X ] .
[
]
[ ]
(
)
E[Z ⋅ X ] = E[(3 X − 10) ⋅ X ] = E 3 X 2 − 10 X = 3E X 2 − 10 E[ X ] = 3 V [ X ] + E[ X ]2 − 10E [X ] =
= 299900300 .
E[Z ] = E [3 X − 10] = 3E [ X ] − 10 = 29990 .
COV ( Z , X ) = E [Z ⋅ X ] − E[Z ]E [ X ] = 300 .
V [Z − X ] = V [Z ] + V [ X ] − 2 ⋅ COV (Z , X ) = 3 2V [ X ] + V [ X ] − 2 ⋅ 300 = 400 .
4. La probabilitat que una empresa A compri un monitor de marca EEE és p=0.2. En una altra empresa
B, aquesta probabilitat és la mateixa. Si es trien a l´atzar 25 monitors existents a l’empresa A i 10
monitors de l’empresa B, quina és la probabilitat que en el conjunt de la mostra no hi hagi cap monitor
de la marca EEE?
Sigui X: V.a. nb.monitors EEE entre 25 a l’empresa A ≈ B(n = 25, p = 0.2 ) .
Sigui Y: V.a. nb. Monitors EEE entre 10 a l’empresa B ≈ B(n = 10, p = 0.2 ) .
Per la propietat aditiva vista a classe de les lleis binomials independents, Z=X+Y
≈ B(n = 25 + 10 = 35, p = 0.2) .
L’enunciat demana calcular la probabilitat d’un succés A definit com A: Cap monitor és de marca
EEE entre els 35 del conjunt de la mostra.
 35
P( A ) = P (Z = 0 ) =   0.2 0 ⋅ 0.8 35 = 0.8 35 = 4,0565x 10− 4 .
0
5. La vida en hores d´un lector de CD Rom es pot considerar distribuïda segons una v.a. exponencial
d’esperança matemàtica 1 0.00025 hores . Si un lector ha durat 6.000 hores, quina és la probabilitat
que visqui com a mínim la seva mitjana de vida?
L’enunciat demana calcular la probabilitat d’un succés A definit com A: Tenir una vida com a
2
mínim la vida mitjana d´un CDRom, condicionat al succés B, definit com B: Tenir una vida
superior a 6.000 hores.
Amb les dades de l’enunciat, si X: v.a. vida d´un lector de CDRom en hores, és una variable
exponencial d´esperança 4.000 hores, aleshores X ≈ Exp(λ = 0.00025) , doncs E[ X ] = 1 .
λ
P( A B) =
P ( A ∩ B ) P( X ≥ 4000∩ X ≥ 6000) P( X ≥ 6000)
=
=
=1 .
P( B)
P( X ≥ 6000)
P( X ≥ 6000)
6. Els ingressos anuals d´un col·lectiu de treballadors responen a una variable aleatòria de mitjana 20.000
Ecu i desviació tipus de 2.000 Ecu. Quina és la probabilitat que la mitjana dels ingressos d´un grup de
100 individus del col·lectiu, triats a l’atzar, sigui inferior als 20.200 Ecu?
Sigui Y: v.a mitjana dels ingressos de 100 individus del col.lectiu.
Sigui Xi: v.a dels ingressos de l´individu i-éssim triat a l’atzar en el col.lectiu , així doncs
E[ X i ] = 20000 i V [ X i ] = 2000 2 .
L’enunciat demana calcular la probabilitat d´un succés A definit com A: Obtenir una mitjana dels
ingressos dels 100 individus sigui inferior als 20.200 Ecu.
De fet Y =
1
( X + L + X 100 ) , com són independents les Xi i n=100 és un número relativament
100 1
elevat, aleshores pel Teorema Central del Límit Y tindrà una distribució aproximadament normal amb
paràmetres:
1 100
1
E[ X i ] = 20000 i V [Y ] =
∑
100 i =1
100 2
Així doncs, Y ≈ N µ = 20000, σ 2 = 2002 .
E[Y ] =
(
)
100
∑V [ X ] = 200
i
2
.
i =1
 20200− 20000
P( A) = P(Y < 20200) = FY (20200) = FZ 
 = FZ (1) = 0.8413 .
200


Problema 2 (4 punts)
El desenvolupament justificat de la resolució es valorarà en la correcció de l’apartat. No hi ha qüestions
encadenades i totes puntuen per igual.
7. Un profesor de Bases de Datos duda entre poner un examen tipo test con 10 preguntas y 4 posibles respuestas
por pregunta, u 8 preguntas con 5 posibles respuestas por pregunta. Finalmente, decide escoger el esquema que
minimice la probabilidad de que un alumno que responda al azar apruebe (la mitad de preguntas contestadas
correctamente, o más). ¿Qué esquema escoge, y cuáles son esas probabilidades?
X1: respuestas correctas sobre test de 10 preguntas, para un alumno respondiendo al azar ~ B(10, 0.25)
X2: respuestas correctas sobre test de 8 preguntas, para un alumno respondiendo al azar ~ B(8, 0.2)
P(X1 >= 5) = 1-P(X1<5) = 1-FX1(4) = 1- 0.9219 = 0.0781
P(X2 >= 4) = 1-P(X2<4) = 1-FX2(3) = 1- 0.9437 = 0.0563
Luego elegirá el esquema de 8 preguntas con 5 opciones
Errores más frecuentes
No declarar las variables (binomiales en este caso), asumiendo que "se supone". No explicitar el
significado de las variables. Solucionar el problema por combinatoria, pero suponiendo que los
3
resultados son equiprobables, que no lo son. Escribir P(X2 >= 5). Escribir "P(X>=x) = 1-P(X<=x)", en
vez de "1-P(X<x)".
8. La conversión de grados Fahrenheit (X) a grados Centígrados (Y) se obtiene mediante la expresión X=1.8Y+32.
La variable aleatoria X, "temperatura exterior" tiene esperanza 38.7 ºF. y desviación típica 12.6 ºF. Si Y expresa
la misma medida en unidades ºC., ¿cuánto valen su esperanza y variancia? (incluir las unidades en la solución).
Deshaciendo la ecuación: Y = 5/9X - 160/9
E(Y) = E(5/9X - 160/9) = 5/9 38.7 - 160/9 = 3.7222 ºC
V(Y) = V(5/9X - 160/9) = (5/9)2 V(X) = (5/9)2 12.6 2 = 49 (ºC)2
Errores más frecuentes
Deshacer mal la ecuación. Poner "V(Y) = (5/9)2 V(X) - 160/9". Expresar "E(Y) = 5/9 E(X). Usar ºC
como unidades de la variancia. Encontrar y aceptar un resultado negativo para la variancia. Se
detectan muchos errores numéricos y de imprecisión, ¡cuidado!: calcular E(Y) como 0.6 E(X) - 17.8 da
5.42 ºC, un error del 46%..
9. Marque la(s) respuesta(s) correcta(s):
Siendo X e Y variables aleatorias, y α, β y γ constantes reales, V(αX-βY+γ) =
a) αV(X) + βV(Y) +γ Cov(X, Y)
b) αV(X) + βV(Y), si X e Y son independientes
c) α 2 V(X) + β 2 V(Y), si X e Y son independientes
d) α 2 V(X) - β2 V(Y) +2 Cov(X, Y)
e) α 2 V(X) - β2 V(Y) + γ2, si X e Y son independientes
f) V(α X) + V(βY) + V(γ) - 2 α β Cov(X,Y)
Errores más frecuentes
De las confusiones que vale la pena comentar, se resalta la confusión de los signos entre V(Y) y
covariancia, y el olvido de que las constantes salen al exterior elevadas al cuadrado. Mencionemos
también que una constante no posee dispersión y, por tanto, V(γ) es igual a 0.
10. Suponga que el tiempo en días que transcurre entre dos terremotos de gran magnitud en el mundo sigue una ley
exponencial de media 437 días. Calcule A) cuál es la mediana del tiempo entre dos terremotos sucesivos (es
decir, el valor x tal que hay un 50% de probabilidades de que el tiempo que separa dos terremotos sea superior a
x). B) cuál es la probabilidad de que en un año dado ocurran más de dos terremotos de gran magnitud.
A)
T: tiempo entre 2 terremotos de GM ~ Exp(λ), λ=1/437
Mediana M: P(T<M) = 0.50 = 1-exp(-λ M); -M/437 = ln(0.5) = -0.6931; M = 437*0.6931 = 302.9
días
B)
N: número de terremotos de GM en un año ~ P(x), donde x es la tasa media de terremotos por
año. 437 días = 1.19726 años, luego x = 1/1.19726 = 0.8352
P(N>2) = 1-P(N<=2) = 1 - f N(0) - f N(1) - f N(2) = 1 - 0.4338 - 0.3623 - 0.1513 = 0.0526
Errores más frecuentes
Dejar de lado la declaración y definición de las variables implicadas. Tomar λ=437, cuando en una
exponencial λ es la inversa del valor esperado. Este error lleva a soluciones sin sentido, por ejemplo:
M=0.001586. ¡Esto significa que hay un 50% de probabilidades de que antes de 2 minutos y 17
segundos haya un terremoto de GM! El estudiante debe percibir que esta solución no es realista.
Algunas veces se ha usado erróneamente la función de densidad de T en vez de la función de
distribución, lo cual carece de sentido [¿fT(M)=0.50?]. Otro error es adoptar el parámetro x de N igual
a 437/365. Peor aún es no darse cuenta que para resolver la segunda cuestión hay que utilizar una
variable nueva que sigue una ley de Poisson (algunos han intentado resolverlo mediante P(T>2)).
4
Descargar