FACULTAT D’INFORMÀTICA. CURS 98-99 Q2. EXAMEN FINAL D’ESTADÍSTICA 1 (Data: 28 de Juny de 1.999 de 18:30 a 21:30 h) Professor responsable: Lídia Montero Mercadé Localització: Edifici U D.421 Normativa de l’examen: NO ES PERMÈS DE DUR APUNTS. ES POT DUR CALCULADORA I TAULES ESTADÍSTIQUES RESPONGUEU CADA PROBLEMA EN FULLS SEPARATS Durada de l’examen: 3 hores 00 minuts Problema Recuperació del Mig Punt (a puntuar 0 o 0.5) Les dades de l´estadística descriptiva numèrica del caràcter continu CONTROL, que indica la quantitat de colesterol en sang en un grup de pacients, es presenten a continuació: MTB > Describe 'CONTROL'. Descriptive Statistics Variable CONTROL N 30 Mean 193,13 Median 187,00 TrMean 192,00 Variable CONTROL Minimum 160,00 Maximum 242,00 Q1 178,00 Q3 204,50 StDev 22,30 SE Mean 4,07 MTB > • Quin és el valor del caràcter CONTROL que garanteix que un 25% de les observacions no el superen? És Q1=178. Problema 1 (6 punts) El desenvolupament justificat de la resolució es valorarà en la correcció de l’apartat. No hi ha qüestions encadenades i totes puntuen per igual. ( B ) = 0.4 i 1. Siguin A i B dos successos pertanyents a un mateix conjunt de resultats Ω , tals que P A P (B) = 0.5 . Si A i B són independents, quina és la probabilitat del succés A? ( B ) = P (PA(∩B )B ) = 1 − PP((AB∪) B ) = 1− P( A) − PP((BB))+ P(A ∩ B ) = 1 − P( B) − PP((BA))(1 − P(B )) = P( A ) = 0.4 PA ( ) D’on surt que P (A) = 1 − P A = 1 − 0.4 = 0.6 . 2 x 0 < x < 1 2. Sigui f X (x ) = la f.d.p d´una variable aleatòria contínua. Determineu la seva 0 altrament desviació tipus o estàndard i el seu quartil del 75%. Justifiqueu bé tots els pasos. 1 1 1 [ ] +∞ 1 2t 3 2 t4 1 2 2 3 E[ X ] = ∫ t f X (t ) dt = ∫ 2t dt = = ( ) i E X = t f t dt = 2 t dt = = . ∫−∞ X ∫0 −∞ 0 3 0 3 2 0 2 +∞ [ ] 1 V [ X ] = E X 2 − E[ X ] = 2 2 1 1 → STDEV ( X ) = V [ X ] = . 18 3 2 Q3 és x 0 t.q. FX (x 0 ) = 0.75 i FX (x ) = 2 d´on FX (x 0 ) = x0 = 0.75→ x0 = ∫ x −∞ ] x 2t dt = t 2 0 = x 2 , 3 . 2 3. La variable aleatòria X té una esperança matemàtica de 1002 i una variança de 100. Es defineix Z=3X-10. Calculeu COV(Z,X) i VAR(Z-X). Per una propietat vista a classe, COV ( Z , X ) = E [Z ⋅ X ] − E[Z ]E [X ] . [ ] [ ] ( ) E[Z ⋅ X ] = E[(3 X − 10) ⋅ X ] = E 3 X 2 − 10 X = 3E X 2 − 10 E[ X ] = 3 V [ X ] + E[ X ]2 − 10E [X ] = = 299900300 . E[Z ] = E [3 X − 10] = 3E [ X ] − 10 = 29990 . COV ( Z , X ) = E [Z ⋅ X ] − E[Z ]E [ X ] = 300 . V [Z − X ] = V [Z ] + V [ X ] − 2 ⋅ COV (Z , X ) = 3 2V [ X ] + V [ X ] − 2 ⋅ 300 = 400 . 4. La probabilitat que una empresa A compri un monitor de marca EEE és p=0.2. En una altra empresa B, aquesta probabilitat és la mateixa. Si es trien a l´atzar 25 monitors existents a l’empresa A i 10 monitors de l’empresa B, quina és la probabilitat que en el conjunt de la mostra no hi hagi cap monitor de la marca EEE? Sigui X: V.a. nb.monitors EEE entre 25 a l’empresa A ≈ B(n = 25, p = 0.2 ) . Sigui Y: V.a. nb. Monitors EEE entre 10 a l’empresa B ≈ B(n = 10, p = 0.2 ) . Per la propietat aditiva vista a classe de les lleis binomials independents, Z=X+Y ≈ B(n = 25 + 10 = 35, p = 0.2) . L’enunciat demana calcular la probabilitat d’un succés A definit com A: Cap monitor és de marca EEE entre els 35 del conjunt de la mostra. 35 P( A ) = P (Z = 0 ) = 0.2 0 ⋅ 0.8 35 = 0.8 35 = 4,0565x 10− 4 . 0 5. La vida en hores d´un lector de CD Rom es pot considerar distribuïda segons una v.a. exponencial d’esperança matemàtica 1 0.00025 hores . Si un lector ha durat 6.000 hores, quina és la probabilitat que visqui com a mínim la seva mitjana de vida? L’enunciat demana calcular la probabilitat d’un succés A definit com A: Tenir una vida com a 2 mínim la vida mitjana d´un CDRom, condicionat al succés B, definit com B: Tenir una vida superior a 6.000 hores. Amb les dades de l’enunciat, si X: v.a. vida d´un lector de CDRom en hores, és una variable exponencial d´esperança 4.000 hores, aleshores X ≈ Exp(λ = 0.00025) , doncs E[ X ] = 1 . λ P( A B) = P ( A ∩ B ) P( X ≥ 4000∩ X ≥ 6000) P( X ≥ 6000) = = =1 . P( B) P( X ≥ 6000) P( X ≥ 6000) 6. Els ingressos anuals d´un col·lectiu de treballadors responen a una variable aleatòria de mitjana 20.000 Ecu i desviació tipus de 2.000 Ecu. Quina és la probabilitat que la mitjana dels ingressos d´un grup de 100 individus del col·lectiu, triats a l’atzar, sigui inferior als 20.200 Ecu? Sigui Y: v.a mitjana dels ingressos de 100 individus del col.lectiu. Sigui Xi: v.a dels ingressos de l´individu i-éssim triat a l’atzar en el col.lectiu , així doncs E[ X i ] = 20000 i V [ X i ] = 2000 2 . L’enunciat demana calcular la probabilitat d´un succés A definit com A: Obtenir una mitjana dels ingressos dels 100 individus sigui inferior als 20.200 Ecu. De fet Y = 1 ( X + L + X 100 ) , com són independents les Xi i n=100 és un número relativament 100 1 elevat, aleshores pel Teorema Central del Límit Y tindrà una distribució aproximadament normal amb paràmetres: 1 100 1 E[ X i ] = 20000 i V [Y ] = ∑ 100 i =1 100 2 Així doncs, Y ≈ N µ = 20000, σ 2 = 2002 . E[Y ] = ( ) 100 ∑V [ X ] = 200 i 2 . i =1 20200− 20000 P( A) = P(Y < 20200) = FY (20200) = FZ = FZ (1) = 0.8413 . 200 Problema 2 (4 punts) El desenvolupament justificat de la resolució es valorarà en la correcció de l’apartat. No hi ha qüestions encadenades i totes puntuen per igual. 7. Un profesor de Bases de Datos duda entre poner un examen tipo test con 10 preguntas y 4 posibles respuestas por pregunta, u 8 preguntas con 5 posibles respuestas por pregunta. Finalmente, decide escoger el esquema que minimice la probabilidad de que un alumno que responda al azar apruebe (la mitad de preguntas contestadas correctamente, o más). ¿Qué esquema escoge, y cuáles son esas probabilidades? X1: respuestas correctas sobre test de 10 preguntas, para un alumno respondiendo al azar ~ B(10, 0.25) X2: respuestas correctas sobre test de 8 preguntas, para un alumno respondiendo al azar ~ B(8, 0.2) P(X1 >= 5) = 1-P(X1<5) = 1-FX1(4) = 1- 0.9219 = 0.0781 P(X2 >= 4) = 1-P(X2<4) = 1-FX2(3) = 1- 0.9437 = 0.0563 Luego elegirá el esquema de 8 preguntas con 5 opciones Errores más frecuentes No declarar las variables (binomiales en este caso), asumiendo que "se supone". No explicitar el significado de las variables. Solucionar el problema por combinatoria, pero suponiendo que los 3 resultados son equiprobables, que no lo son. Escribir P(X2 >= 5). Escribir "P(X>=x) = 1-P(X<=x)", en vez de "1-P(X<x)". 8. La conversión de grados Fahrenheit (X) a grados Centígrados (Y) se obtiene mediante la expresión X=1.8Y+32. La variable aleatoria X, "temperatura exterior" tiene esperanza 38.7 ºF. y desviación típica 12.6 ºF. Si Y expresa la misma medida en unidades ºC., ¿cuánto valen su esperanza y variancia? (incluir las unidades en la solución). Deshaciendo la ecuación: Y = 5/9X - 160/9 E(Y) = E(5/9X - 160/9) = 5/9 38.7 - 160/9 = 3.7222 ºC V(Y) = V(5/9X - 160/9) = (5/9)2 V(X) = (5/9)2 12.6 2 = 49 (ºC)2 Errores más frecuentes Deshacer mal la ecuación. Poner "V(Y) = (5/9)2 V(X) - 160/9". Expresar "E(Y) = 5/9 E(X). Usar ºC como unidades de la variancia. Encontrar y aceptar un resultado negativo para la variancia. Se detectan muchos errores numéricos y de imprecisión, ¡cuidado!: calcular E(Y) como 0.6 E(X) - 17.8 da 5.42 ºC, un error del 46%.. 9. Marque la(s) respuesta(s) correcta(s): Siendo X e Y variables aleatorias, y α, β y γ constantes reales, V(αX-βY+γ) = a) αV(X) + βV(Y) +γ Cov(X, Y) b) αV(X) + βV(Y), si X e Y son independientes c) α 2 V(X) + β 2 V(Y), si X e Y son independientes d) α 2 V(X) - β2 V(Y) +2 Cov(X, Y) e) α 2 V(X) - β2 V(Y) + γ2, si X e Y son independientes f) V(α X) + V(βY) + V(γ) - 2 α β Cov(X,Y) Errores más frecuentes De las confusiones que vale la pena comentar, se resalta la confusión de los signos entre V(Y) y covariancia, y el olvido de que las constantes salen al exterior elevadas al cuadrado. Mencionemos también que una constante no posee dispersión y, por tanto, V(γ) es igual a 0. 10. Suponga que el tiempo en días que transcurre entre dos terremotos de gran magnitud en el mundo sigue una ley exponencial de media 437 días. Calcule A) cuál es la mediana del tiempo entre dos terremotos sucesivos (es decir, el valor x tal que hay un 50% de probabilidades de que el tiempo que separa dos terremotos sea superior a x). B) cuál es la probabilidad de que en un año dado ocurran más de dos terremotos de gran magnitud. A) T: tiempo entre 2 terremotos de GM ~ Exp(λ), λ=1/437 Mediana M: P(T<M) = 0.50 = 1-exp(-λ M); -M/437 = ln(0.5) = -0.6931; M = 437*0.6931 = 302.9 días B) N: número de terremotos de GM en un año ~ P(x), donde x es la tasa media de terremotos por año. 437 días = 1.19726 años, luego x = 1/1.19726 = 0.8352 P(N>2) = 1-P(N<=2) = 1 - f N(0) - f N(1) - f N(2) = 1 - 0.4338 - 0.3623 - 0.1513 = 0.0526 Errores más frecuentes Dejar de lado la declaración y definición de las variables implicadas. Tomar λ=437, cuando en una exponencial λ es la inversa del valor esperado. Este error lleva a soluciones sin sentido, por ejemplo: M=0.001586. ¡Esto significa que hay un 50% de probabilidades de que antes de 2 minutos y 17 segundos haya un terremoto de GM! El estudiante debe percibir que esta solución no es realista. Algunas veces se ha usado erróneamente la función de densidad de T en vez de la función de distribución, lo cual carece de sentido [¿fT(M)=0.50?]. Otro error es adoptar el parámetro x de N igual a 437/365. Peor aún es no darse cuenta que para resolver la segunda cuestión hay que utilizar una variable nueva que sigue una ley de Poisson (algunos han intentado resolverlo mediante P(T>2)). 4