Intervalos de Confianza 1.- Se quiere estudiar la vida útil de unas nuevas pilas que se van a lanzar al mercado. Para ello se examina la duración de 40 de ellas, resultando una media de 63 horas. Suponiendo que el tiempo de vida de las pilas sigue una distribución normal, y que la varianza se puede tomar la misma que las fabricadas anteriormente que era 38,44, se pide: a) Intervalo de confianza del 95% de la duración media de las nuevas pilas. b) Intervalo de confianza del 99% de la duración media de las nuevas pilas. c) Tamaño de la muestra necesario para que con una confianza del 95%, la duración media estimada no difiera de la real en más de una hora. 2.- Durante 15 días se estudió el número de alumnos que pasaban por el almacén de la Escuela, obteniéndose los siguientes resultados: 70, 78, 71, 62, 78, 67, 64, 76, 73, 65, 58, 72, 74, 67, 75 Suponiendo Normalidad de la distribución, calcular: Intervalo de confianza del 95% del número medio de usuarios del almacén. 3.- Para estudiar el número de pulsaciones por minuto de personas entre 20 y 30 años, se eligen 400 al azar, obteniéndose una media de 75 por minuto y una desviación típica de 9. Calcular: a) Intervalo de confianza del 95% del número medio de pulsaciones por minuto en dicha población. b) Tamaño de la muestra necesario para obtener el intervalo de confianza de la misma amplitud que el anterior y con nivel de confianza del 99%. 4.- Una agencia de alquiler de automóviles necesita estimar el número medio de kilómetros diarios que realizas su flota de automóviles; toma los recorridos de 100 vehículos y obtiene una media de 165 km/día y una varianza muestral de 36 km/día. Se pide: a) Intervalo de confianza para la media al 95% b) Intervalo de confianza para la varianza al 95% 5.- Si el coeficiente medio de inteligencia de la población universitaria de la U.P.M. es µ = 95 y σ =14, y se extrae una muestra de 49 estudiantes de esa población. a) ¿Qué probabilidad hay de que resulte una media muestral igual o inferior a 92? b) Hallar un Intervalo de confianza al 95% para la media de la población universitaria, para la muestra de media 92. c) ¿Podemos aceptar la hipótesis de ser la media µ = 95 ? Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 1 Intervalos de Confianza 6.- Se desea estudiar el gasto semanal en euros, de los estudiantes de Madrid. Para ello se ha elegido una muestra aleatoria de 9 de estos estudiantes: 100 150 90 70 75 105 200 120 80 Se supone que la variable aleatoria sigue una distribución normal de desviación típica conocida e igual a 12. Determinar un intervalo de confian Intervalo de confianza al 95% para la media del gasto semanal por estudiante. 7.- Se realiza una encuesta sobre el nivel de conocimientos generales de los estudiantes de bachillerato de los diferentes centros de Madrid. Para ello se ha elegido una muestra aleatoria de 9 de estos estudiantes a los que se ha realizado el examen. Las calificaciones obtenidas han sido las siguientes: 7,8 6,5 5,4 7,1 5 8,3 5,6 6,6 6,2 Se supone que la variable aleatoria sigue una distribución normal de desviación típica conocida e igual a 1. Se pide: a) Un Intervalo de confianza al 98% para la media de las calificaciones en el examen. b) El tamaño mínimo que debería tener la muestra en el caso de admitir un error máximo de 0,5 puntos con un nivel de confianza del 95%. 8.- Se ha tomado una muestra de tamaño 10 del tiempo T, en minutos, entre el paso de dos autobuses en una parada, con los siguientes resultados 9, 10, 6, 4, 15, 6, 1, 5, 4, 10. Si la función de distribución del tiempo es: F(t) = 1 − e −λt a) Estimar, por máxima verosimilitud el valor de λ. b) Calcular la probabilidad estimada de esperar al autobús más de 10 minutos. 9.- Se han escogido al azar 15 probetas de un determinado acero, cuya resistencia a la compresión se supone que se distribuye normalmente, y se ha medido ésta en las unidades adecuadas, habiéndose observado los siguientes resultados: 40,15 65,10 49,5 22,4 38,2 60,4 43,4 26,35 31,2 55,6 47,25 73,2 35,9 49,25 52,4 a) Estimar la resistencia media del acero y su varianza, utilizando estimadores centrados. b) Hallar un Intervalo de confianza del 99% para la resistencia media. c) Hallar un Intervalo de confianza del 99% para la varianza. 10.- La altura de los individuos de una población sigue una distribución normal, de media µ y desviación típica 0,075. Si en una muestra aleatoria simple de tamaño 12 de dicha población se obtuvo una media muestral de 1,75. Se pide: a) Determinar un Intervalo de confianza para µ con un nivel de confianza del 95%. b) ¿Qué tamaño muestral sería necesario para que el intervalo de confianza del mismo nivel tuviese longitud menor que 0,01? Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 2 Intervalos de Confianza 11.- Supuesto que una población se compone de cinco valores: 2, 3, 6, 8, 11. Considérense todas las muestras posibles de tamaño dos que puedan extraerse con reemplazamiento de esta población. Se pide: a) La media y desviación típica de la población. b) La distribución de la media muestral. c) La media y la desviación típica de la distribución de la media muestral. d) Calcular un Intervalo de confianza al 80% para la media de la población si se obtienen muestras de tamaño 3. 12.- Las edades en que se produce la muerte, para una muestra aleatoria de 19 individuos fallecidos por una determinada edad dan una media de 50 años. Suponiendo normal la distribución, hallar un Intervalo de confianza para la media al 99% suponiendo conocido el valor de la varianza de la población σ 2 = 38 . 13.- Se quieren estudiar la vida útil de unas baterías para móviles. Si admitimos que la varianza de la distribución normal de la vida de las baterías es igual a 1.44, ¿qué tamaño muestral deberíamos utilizar para que la semiamplitud del Intervalo de confianza para la media del 95% no sea superior al 0,2? 14.- Suponiendo que la producción de trigo por hectárea es una variable aleatoria con distribución normal, sabiendo que en 25 fincas elegidas al azar se produjeron de media 3200 kg por ha, y la desviación típica fue de 40 kg por ha, calcular: a) Intervalo de confianza al 95% de la producción media de trigo por ha. b) Intervalo de confianza al 95% de la varianza. 15.- Se han recogido firmas para una petición, en cada hoja caben 42 firmas, pero existen hojas que no están firmadas totalmente. Para una muestra de 50 hojas se tienen 1471 los resultados = x = y S2 229 . Se pide dar un intervalo de confianza para la 50 media al 80%. 16.- Sea X la v. a. número de errores al realizar una nivelación. Se estudian 40 nivelaciones escogidas al azar. Los resultados son: X = 18.5 y S = 4. Se pide: a) Intervalo de confianza del 95% para la media. b) Intervalo de confianza para la varianza con un nivel de significación de α =0.01 17.- Se han realizado 15 mediciones de una misma magnitud, se supone que se distribuye normalmente, habiéndose observado los siguientes resultados: 40,15 40,10 40,5 40,4 40,2 40,4 40,4 40,35 40,2 40,6 40,25 40,2 40,9 40,25 40,4 a) Hallar un Intervalo de confianza del 99% para la varianza. b) ¿Cuántas mediciones deberían haberse utilizado si se requiere una precisión en la media de ±0,1 y una confianza del 95%? Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 3 Intervalos de Confianza Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 4 Intervalos de Confianza 1.- Se quiere estudiar la vida útil de unas nuevas pilas que se van a lanzar al mercado. Para ello se examina la duración de 40 de ellas, resultando una media de 63 horas. Suponiendo que el tiempo de vida de las pilas sigue una distribución normal, y que la varianza se puede tomar la misma que las fabricadas anteriormente que era 38,44, se pide: a) Intervalo de confianza del 95% de la duración media de las nuevas pilas. b) Intervalo de confianza del 99% de la duración media de las nuevas pilas. c) Tamaño de la muestra necesario para que con una confianza del 95%, la duración media estimada no difiera de la real en más de una hora. Solución: La duración de las pilas sigue una distribución N ( µ,38.44 ) El intervalo de confianza para una población normal de varianza conocida es: σ X ± z α /2 n a) Para nuestros datos: X = 63; σ = 38.44= 6.2; n= 40; α = 0.05 Tenemos = Z X −µ ≡ N(0,1) σ n P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.05 = 0.95 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.975 DERIVE: #1: #2: NSOLVE(NORMAL(z) = 0.975, z, Real) z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,95996279 O directamente =INTERVALO.CONFIANZA(0,05;6,2;40) X ± zα 1,92136343 σ = 63 ± 1,92136343 n SPSS: IDF. NORMAL(0.975, 0,1) 1,96 6.2 6.2 ⇒ Iα=0.05 = , 63 + 1.96 63 − 1.96 =( 61.08, 64.92 ) 40 40 b) Cambia el nivel de confianza x= 63; σ = 38.44= 6.2; n= 40; α = 0.01 Tenemos = Z X −µ ≡ N(0,1) σ n P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.01 = 0.99 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.995 DERIVE: #1: #2: NSOLVE(NORMAL(z) = 0.995, z, Real) z = 2.575829327 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 5 Intervalos de Confianza EXCEL: =DISTR.NORM.INV(0,995;0;1) 2,5758313 O directamente =INTERVALO.CONFIANZA(0,01;6,2;40) X ± z α /2 SPSS: IDF. NORMAL(0.995, 0,1) 2,5251031 σ = 63 ± 2.5251031 n 2,58 6.2 6.2 ⇒ Iα=0.01 = , 63 + 2.58 63 − 2.58 =( 60.47, 65.53) 40 40 c) Para que la duración estimada no difiera de la real en más de una hora, se tiene que: σ 2 2 = 1 ⇒ n = ( z α /2 ⋅ σ ) = (1,96 ⋅ 6, 2 ) = 147, 67 z α /2 n Por lo que el tamaño de la muestra será de 148 pilas. Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 6 Intervalos de Confianza 2.- Durante 15 días se estudió el número de alumnos que pasaban por el almacén de la Escuela, obteniéndose los siguientes resultados: 70, 78, 71, 62, 78, 67, 64, 76, 73, 65, 58, 72, 74, 67, 75 Suponiendo Normalidad de la distribución, calcular: intervalo de confianza del 95% del número medio de usuarios del almacén. Solución: Calculamos los parámetros estadísticos: ∑ x i 1050 = = 70.13 X = n 15 ∑(x − X) 2 506 = 36.14285714 ⇒ S= 36.14285714= 6.011892975 n −1 14 Se trata de una población que sigue una distribución Normal de varianza desconocida, y muestras pequeñas, por lo que el intervalo de confianza es: S X ± tα/ 2 n X= 70;S= 6; n= 15; α= 0.05 S= 2 i = Buscaremos en la tabla un valor t α / 2 tal que P ( − t α / 2 < t n −1 < t α / 2 ) = 1 − α . P ( t n −1 < t α / 2 ) = 1 − α ⇔ P ( t n −1 > t α / 2 ) = α ⇒ P ( t14 > t α / 2= 0, 05 ⇒ t = 2,145 0,025 ) = DERIVE: #1: #2: NSOLVE(STUDENT(t, 14) = 0.975, t) t = 2.144786715 EXCEL: =INV.T.2C(0,05;14) SPSS: IDF.T(0.975,14) 2,144788596 2,145 6 6 ⇒ Iα=0.05 = , 70 + 2.145 70 − 2.145 =( 66.67698028, 73.32301971) 15 15 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 7 Intervalos de Confianza 3.- Para estudiar el número de pulsaciones por minuto de personas entre 20 y 30 años, se eligen 400 al azar, obteniéndose una media de 75 por minuto y una desviación típica de 9. Calcular: a) Intervalo de confianza del 95% del número medio de pulsaciones por minuto en dicha población. b) Tamaño de la muestra necesario para obtener el intervalo de confianza de la misma amplitud que el anterior y con nivel de confianza del 99%. Solución: σ Por ser el tamaño de la muestra suficientemente grande podemos considerar N µ, n El intervalo de confianza para una población normal es: σ X ± z α /2 n a) Para nuestros datos: X = 75; σ ≈ = S 9; = n 400; α = 0.05 Tenemos = Z X −µ ≡ N(0,1) σ n P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.05 = 0.95 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.975 DERIVE: #1: #2: NSOLVE(NORMAL(z) = 0.975, z, Real) z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 O directamente =INTERVALO.CONFIANZA(0,05;9;400) X ± z α /2 SPSS: IDF. NORMAL(0.975, 0,1) 0,88198379 σ = 75 ± 0,88198379 n 1,96 9 9 ⇒ Iα=0.05 = , 75 + 1.96 75 − 1.96 =( 74.118, 75.882 ) 400 400 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 8 Intervalos de Confianza b) P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.01 = 0.99 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.995 DERIVE: #1: NSOLVE(NORMAL(z) = 0.995, z, Real) #2: z = 2.575829327 EXCEL: =DISTR.NORM.INV(0,995;0;1) 2,5758313 SPSS: IDF. NORMAL(0.995, 0,1) 2,58 2 2 σ z α /2 ⋅ σ 2,58 ⋅ 9 = z α /2 0,88198379 = ⇒n = = 693.1125238 n 0,88198379 0,88198379 Por lo que el tamaño de la muestra será de 694. Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 9 Intervalos de Confianza 4.- Una agencia de alquiler de automóviles necesita estimar el número medio de kilómetros diarios que realizas su flota de automóviles; toma los recorridos de 100 vehículos y obtiene una media de 165 km/día y una varianza muestral de 36 km/día. Se pide: a) Intervalo de confianza para la media al 95%. b) Intervalo de confianza para la varianza al 95%. Solución: σ Por ser el tamaño de la muestra suficientemente grande podemos considerar N µ, n El intervalo de confianza para una población normal es: σ X ± z α /2 n a) Para nuestros datos: X= 165; σ2= S2= 36; n= 100; α= 0.05 Tenemos = Z X −µ ≡ N(0,1) σ n P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.05 = 0.95 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.975 DERIVE: #1: #2: NSOLVE(NORMAL(z) = 0.975, z, Real) z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 O directamente =INTERVALO.CONFIANZA(0,05;6;100) X ± z α /2 1,1759777 σ =± 165 1,1759777 n SPSS: IDF. NORMAL(0.975, 0,1) 1,96 6 6 ⇒ Iα=0.05 =165 − 1.96 ,165 + 1.96 = (163.82,166.18 ) 100 100 (n − 1).S2 (n − 1).S2 < σ2 < b) P = 1− α k1 k2 Buscaremos los valores de k1 y k2 tales que: 2 P ( χ99 0.025 < k1 ) = 2 P ( χ99 0.975 < k2 ) = en las tablas e interpolando, obtenemos k1=73,361y k2= 128,422. Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 10 Intervalos de Confianza EXCEL: =INV.CHICUAD (0,025;99) 73,361103 =INV.CHICUAD (0,975;99) 128,42193 en la prueba de la chi se utiliza la cola de la derecha SPSS: IDF. CHISQ(0.975,99) 128,422 : IDF. CHISQ(0.025,99) 73,361 99 ⋅ 36 99 ⋅ 36 P 0,95 ⇒ 27.75 < σ2 < 48.58 < σ2 < = 0, 216 128.42193 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 11 Intervalos de Confianza 5.- Si el coeficiente medio de inteligencia de la población universitaria de la U.P.M. es µ =95 y σ =14, y se extrae una muestra de 49 estudiantes de esa población. a) ¿Qué probabilidad hay de que resulte una media muestral igual o inferior a 92? b) Hallar un intervalo de confianza al 95% para la media de la población universitaria, para la muestra de media 92. c) ¿Podemos aceptar la hipótesis de ser la media µ =95 ? Solución: 14 σ La distribución de la media muestral es X ≡ N = µ, = N ( 95, 2 ) N 95, n 49 ( ) a) F(92) = P X ≤ 92 ≈ 0.06680720126 DERIVE: #1: NORMAL(92,95,2) #2: 0.06680720126 EXCEL: =DISTR.NORM.(92;95;2;1) SPSS: CDF. NORMAL(92,95,2) 0,0668072 ,06680720 b) El intervalo de confianza para una población normal es: σ X ± z α /2 n Para nuestros datos: X = 92; σ = 14; = n 49; α = 0.05 Tenemos = Z X −µ ≡ N(0,1) σ n P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.05 = 0.95 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.975 DERIVE: #1: NSOLVE(NORMAL(z) = 0.975, z, Real) #2: z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 O diretamente =INTERVALO.CONFIANZA(0,05;14;49) 3,91992797 σ = X ± z α /2 92 ± 3,919927969 n SPSS: IDF. NORMAL(0.975, 0,1) 1,96 14 14 ⇒ Iα=0.05 = ,92 + 1.96 92 − 1.96 =( 88.08,95.92 ) 49 49 c) µ= 95 ∈ Iα=0.05= (88.08,95.92 ) , SÍ SE ACEPTA Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 12 Intervalos de Confianza 6.- Se desea estudiar el gasto semanal en euros, de los estudiantes de Madrid. Para ello se ha elegido una muestra aleatoria de 9 de estos estudiantes: 100 150 90 70 75 105 200 120 80 Se supone que la variable aleatoria sigue una distribución normal de media desconocida y desviación típica conocida e igual a 12. Determinar un intervalo de confianza al 95% para la media del gasto semanal por estudiante. Solución: El gasto sigue una distribución N ( µ,12 ) El intervalo de confianza para una población normal de varianza conocida es: σ X ± z α /2 n Para nuestros datos: 100 + 150 + 90 + 70 + 75+105+200 + 120 + 80 X= = 110; σ= 12; n= 9; α= 0, 05 9 X −µ Tenemos = ≡ N(0,1) Z σ n P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.05 = 0.95 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.975 DERIVE: #1: #2: NSOLVE(NORMAL(z) = 0.975, z, Real) z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 O directamente =INTERVALO.CONFIANZA(0,05;1;9) X ± z α /2 SPSS: IDF. NORMAL(0.975, 0,1) 7,8398559 σ =± 110 7,8398559 n 1,96 12 12 ⇒ Iα=0.02 =110 − 1,96 ,110 + 1,96 =(102.16,117.84 ) 9 9 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 13 Intervalos de Confianza 7.- Se realiza una encuesta sobre el nivel de conocimientos generales de los estudiantes de bachillerato de los diferentes centros de Madrid. Para ello se ha elegido una muestra aleatoria de 9 de estos estudiantes a los que se ha realizado el examen. Las calificaciones obtenidas han sido las siguientes: 7,8 6,5 5,4 7,1 5 8,3 5,6 6,6 6,2 Se supone que la variable aleatoria sigue una distribución normal de desviación típica conocida e igual a 1. Se pide: a) Un intervalo de confianza al 98% para la media de las calificaciones en el examen. b) El tamaño mínimo que debería tener la muestra en el caso de admitir un error máximo de 0,5 puntos con un nivel de confianza del 95% Solución: La calificación del examen sigue una distribución N ( µ,1) a) El intervalo de confianza para una población normal de varianza conocida es: σ X ± z α /2 n Para nuestros datos: 7,8 + 65 + 5, 4 + 7,1 + 5 + 8,3 + 5, 6 + 6, 6 + 6, 2 x= = 6,5; σ= 1; n= 9; α= 0.02 9 X −µ Tenemos = ≡ N(0,1) Z σ n P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.02 = 0.98 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.99 DERIVE: #1: #2: NSOLVE(NORMAL(z) = 0.99, z, Real) z = 2.326347902 EXCEL: =DISTR.NORM.INV(0,99;0;1) 2,3263479 O directamente =INTERVALO.CONFIANZA(0,02;1;9) X ± z α /2 SPSS: IDF. NORMAL(0.99, 0,1) 0,7754493 σ =± 6,5 0, 7754493 n 2,33 1 1 ⇒ Iα=0.02 = 6,5 − 2,33 , 63,5 + 2,33 =( 5.73, 7.27 ) 9 9 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 14 Intervalos de Confianza b) Para un nivel de confianza del 95% X −µ Tenemos = ≡ N(0,1) Z σ n P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.05 = 0.95 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.975 DERIVE: #1: #2: NSOLVE(NORMAL(z) = 0.975, z, Real) z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 SPSS: IDF. NORMAL(0.975, 0,1) 1,96 Con un error del 0,5: 0,5= z α /2 σ 1 1,96 = 1,96 ⇒ n= = 3,92 ⇒ n= 15,3 0,5 n n Debemos tomar una muestra de tamaño n=16 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 15 Intervalos de Confianza 8.- Se ha tomado una muestra de tamaño 10 del tiempo T, en minutos, entre el paso de dos autobuses en una parada, con los siguientes resultados 9, 10, 6, 4, 15, 6, 1, 5, 4, 10. Si la función de distribución del tiempo es: F(t) = 1 − e −λt a) Estimar, por máxima verosimilitud el valor de λ. b) Calcular la probabilidad estimada de esperar al autobús más de 10 minutos. Solución: a) La función de densidad de la distribución de T es: f (t) = F '(t) = λe −λt La función de verosimilitud será: n L(t1...t n / λ) =f (t1...t n / λ) =Π f (t i ) =λe −λt1 .... λe −λt n =λ n e −λ (t1 +...+ t n ) i =1 Tomando logaritmos neperianos ln ( L(t1...t n / λ = ) ) n ln ( λ ) − λ ( t1 + ... + t n ) Buscamos el máximo ∧ ∂ ln ( L(t1...t n / λ) ) n n = − ( t1 + ... + t n ) = 0 ⇒ λ = ∂λ λ t1 + ... + t n ∧ 1 10 Así para nuestra muestra es: λ = = 9 + 10 + 6 + 4 + 15 + 6 + 1 + 5 + 4 + 10 7 b) Para nuestros datos la función de distribución será: F(t) = 1− e P(T > 10) = 1 − P(T < 10) = 1 − F(10) = 1 − 1 − e 1 − 10 7 −λt = 1− e 1 − t 7 1 =10/7 ≈ 0.2396510364 e Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 16 Intervalos de Confianza 9.- Se han escogido al azar 15 probetas de un determinado acero, cuya resistencia a la compresión se supone que se distribuye normalmente, y se ha medido ésta en las unidades adecuadas, habiéndose observado los siguientes resultados: 40,15 65,1 49,5 22,4 38,2 60,4 43,4 26,35 31,2 55,6 47,25 73,2 35,9 49,25 52,4 a) Estimar la resistencia media del acero y su varianza, utilizando estimadores centrados. b) Hallar un intervalo de confianza del 99% para la resistencia media. c) Hallar un intervalo de confianza del 99% para la varianza. Solución: a) El estimador de máxima verosimilitud de la media, es la media muestral, que es un ∧ estimador centrado, luego µ= X= 46, 02 . Pero para la varianza utilizaremos la ∑(x n ∧ 2 S = cuasivarianza muestral, ya que es centrado, ) 2 −X i =1 = 202,532429 n −1 i b) Se trata de una población que sigue una distribución Normal de varianza desconocida, y muestras pequeñas, por lo que el intervalo de confianza es: S X ± tα/ 2 n X= 46.02;S= 14, 2313888; n= 15; α= 0, 01 Buscaremos en la tabla un valor t α / 2 tal que P ( − t α / 2 < t n −1 < t α / 2 ) = 1 − α . P ( t n −1 < t α / 2 ) = 1 − α ⇔ P ( t n −1 > t α / 2 ) = α ⇒ P ( t14 > t α / 2= 0, 01 ⇒ t = 2,98 0,005 ) = DERIVE: #1: #2: NSOLVE(STUDENT(t, 14) = 0.995, t) t = 2.976842746 EXCEL: =INV.T.2C(0,01;14) 2,9768427 SPSS: IDF.T(0.995,14) 2,98 S 60.2 ± 10.9500958 = n 14.2313888 14, 2313888 ⇒ Iα=0.01 = 46.02 − 2.98 , 46.02 + 2.98 = 15 15 X ± tα/ 2 ( 35.0699042,56.9700958) Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 17 Intervalos de Confianza c) Sabiendo que (n − 1). S 2 ≡ χ n2 −1 si la población de partida es N(µ, σ) 2 σ (n − 1).S2 (n − 1).S2 < σ2 < P = 1− α k1 k2 2 P ( χ14 < k1 ) = 0.005 Buscaremos los valores de k1 y k2 tales que: 2 P ( χ14 < k2 ) = 0.995 EXCEL: =INV.CHICUAD (0,005;14) 4,074675 =INV.CHICUAD (0,995;14) 31,31935 en la prueba de la chi se utiliza la cola de la derecha SPSS: IDF. CHISQ(0.995,14) 31,32 : IDF. CHISQ(0.005,14) 4,07 14 ⋅ 202,532429 14 ⋅ 202,532429 P 0,99 ⇒ 90,5317369 < σ2 < 696, 671744 < σ2 < = 31,32 4, 07 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 18 Intervalos de Confianza 10.- La altura de los individuos de una población sigue una distribución normal, de media µ y desviación típica 0,075. Si en una muestra aleatoria simple de tamaño 12 de dicha población se obtuvo una media muestral de 1,75. Se pide: a) Determinar un intervalo de confianza para µ con un nivel de confianza del 95%. b) ¿Qué tamaño muestral sería necesario para que el intervalo de confianza del mismo nivel tuviese longitud menor que 0,01? Solución: a) Se trata de una población que sigue una distribución Normal de varianza conocida, y muestras pequeñas, por lo que el intervalo de confianza es: σ X ± z α /2 n X= 1.75;S= 0.075; n= 12; α= 0, 05 X −µ ≡ N(0,1) σ n Tenemos = Z P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.05 = 0.95 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.975 DERIVE: #1: #2: NSOLVE(NORMAL(z) = 0.975, z, Real) z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 SPSS: IDF. NORMAL(0.975, 0,1) 1,96 0.075 0.075 ,1.75 + 1.96 ⇒ Iα=0.05 =1.75 − 1.96 = (1.707564755,1.792435244 ) 12 12 O directamente com EXCEL =INTERVALO.CONFIANZA(0,05;0,075;12) X ± z α /2 0,0424345 σ = 1, 75 ± 0, 0424345 n b) σ σ El intervalo de confianza en general es Iα = , X − z α /2 X − z α /2 , en nuestro n n caso 0.075 0.075 ,1.75 + 1.96 ⇒ Iα=0.05 =1.75 − 1.96 para n desconocido, cuya longitud es n n ⇒ 1.96 0.075 0.075 0.075 + 1.96 =⋅ 2 1.96 < 0.01 ⇒ n > 29.4 n n n Debemos tomar una muestra de tamaño n=865 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 19 Intervalos de Confianza 11.- Supuesto que una población se compone de cinco valores: 2, 3, 6, 8, 11. Considérense todas las muestras posibles de tamaño dos que puedan extraerse con reemplazamiento de esta población. Se pide: a) La media y desviación típica de la población. b) La distribución de la media muestral. c) La media y la desviación típica de la distribución de la media muestral. d) Calcular un intervalo de confianza al 80% para la media de la población si se obtienen muestras de tamaño 3. Solución: La población está formada por {2,3, 6,8,11} 2 + 3 + 6 + 8 + 11 = 6 5 4 + 9 + 36 + 64 + 121 54 ⇒σ 10.8 ≈ 3.29 σ2= − 36= = 10.8 = 5 5 b) Calculemos las medias de todas las posibles muestras de tamaño 2 2 3 6 8 11 2 2 2.5 4 5 6.5 3 2.5 3 4.5 5.5 7 6 4 4.5 6 7 8.5 8 5 5.5 7 8 9.5 11 6.5 7 8.5 9.5 11 c) 2 xi ni ni xi ni xi a) µ = 2 4 1 5 12,5 2 3 9 1 8 32 2 9 40,5 2 50 2 10 60,5 2 11 6 36 1 84,5 2 13 196 4 28 8 64 1 144,5 2 17 180,5 2 19 121 1 11 25 150 1035 x1 + x 2 + ... + x n 150 Media:= x = = 6 N 25 2 2 2 x 1 + x 2 + ... + x n 1035 2 2 − x= − 36 = 5.4 Varianza: σ= x N 25 σ 2 10.8 2 Obsérvese que X = µ = 6 y que σ x= = = 5.4 ⇒= σx n 2 2 2,5 3 4 4,5 5 5,5 6 6,5 7 8 8,5 9,5 11 5.4 ≈ 2.32 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 20 Intervalos de Confianza d) Sabemos que el estadístico de libertad. Así pues: X −µ sigue una distribución t de Student con n-1 grados S n X−6 16.2 = t 3−1 , ya que = S2 N 2 5 10.8 = σ = 13.5 . N −1 4 3 S S Buscaremos el intervalo Iα = , X + t α /2 X − t α /2 , es decir, n n S S P X − t α /2 < µ < X + t α /2 = 1 − α . En nuestro caso, queda: n n 13.5 13.5 Iα=0.2 = , 6 + 1.88561812 ( 2,10 ) 6 − 1.88561812 = 3 3 DERIVE: NSOLVE(STUDENT(t, 2) = 0.8) EXCEL: =INV.T.2C(0,2;2) t = 1.885618120 1,8856 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 21 Intervalos de Confianza 12.- Las edades en que se produce la muerte, para una muestra aleatoria de 19 individuos fallecidos por una determinada edad dan una media de 50 años. Suponiendo normal la distribución, hallar un intervalo de confianza para la media al 99% suponiendo conocido el valor de la varianza de la población σ 2 =38 . Solución: Tenemos una distribución normal y varianza conocida: σ σ Iα = , X + z α /2 X − z α /2 n n Datos:= n 19;= X 50 ; = σ2 38;1 −= α 0.99 y en la distribución normal = Z F(Z < z α /2 )= X −µ ≡ N(0,1) σ n α + 1 − α= 0.995 ⇒ z α /2= 2.575 2 38 38 ,50 + 2.575 ⇒ Iα=0.01 = 50 − 2.575 =( 46.3584,53.6416 ) 19 19 DERIVE: #1: NSOLVE(NORMAL(z) = 0.995, z, Real) #2: z = 2.575829327 EXCEL: =DISTR.NORM.INV(0,995;0;1) 2,5758313 SPSS: IDF. NORMAL(0.995, 0,1) 2,58 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 22 Intervalos de Confianza 13.- Se quieren estudiar la vida útil de unas baterías para móviles. Si admitimos que la varianza de la distribución normal de la vida de las baterías es igual a 1.44, ¿qué tamaño muestral deberíamos utilizar para que la semiamplitud del intervalo de confianza para la media del 95% no sea superior al 0,2? Solución: Supongamos que el error máximo que queremos admitir es ε . El intervalo será (µ − ε, µ + ε) y con nivel de significación α , comparando con el intervalo obtenido, z σ σ z σ 1.96 ⋅1.2 = ε ⇔ n = α /2 ⇔ n = α /2 = = 138.2976 ε n ε 0.2 2 tenemos que: z α /2 2 Luego necesitamos que n sea igual a 139 Tenemos = Z X −µ ≡ N(0,1) σ n P ( −z α < Z < z α ) = 1− α = 1 − 0.05 = 0.95 ⇒ F(z α ) = P ( Z < zα ) = 0.975 DERIVE: #1: #2: NSOLVE(NORMAL(z) = 0.975, z, Real) z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 SPSS: IDF. NORMAL(0.975, 0,1) 1,96 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 23 Intervalos de Confianza 14.- Suponiendo que la producción de trigo por hectárea es una variable aleatoria con distribución normal, sabiendo que en 25 fincas elegidas al azar se produjeron de media 3200 kg por ha, y la desviación típica fue de 40 kg por ha, calcular: a) Intervalo de confianza al 95% de la producción media de trigo por ha. b) Intervalo de confianza al 95% de la varianza. Solución: La producción de trigo por hectárea sigue una distribución N ( µ, 40 ) El intervalo de confianza para una población normal de varianza conocida es: σ X ± z α /2 n a) Para nuestros datos: X = 3200; σ = 40; = n 25; α = 0.05 Tenemos = Z X −µ ≡ N(0,1) σ n P ( −z α /2 < Z < z α /2 ) = 1− α = 1 − 0.05 = 0.95 ⇒ F(z α /2 ) = P ( Z < z α /2 ) = 0.975 DERIVE: #1: NSOLVE(NORMAL(z) = 0.975, z, Real) #2: z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,95996279 O directamente =INTERVALO.CONFIANZA(0,05;6,2;40) X ± z α /2 SPSS: IDF. NORMAL(0.975, 0,1) 1,92136343 σ = 3200 ± 15, 6797119 n 1,96 40 40 ⇒ Iα=0.05 = 3200 − 1.96 ,3200 + 1.96 = 25 25 ( 3184.320,3215.68) Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 24 Intervalos de Confianza (n − 1).S2 (n − 1).S2 < σ2 < b) P = 1− α k1 k2 Buscaremos los valores de k1 y k2 tales que: P ( χ 224 < k1 ) = 0.025 P ( χ 224 < k 2 ) = 0.975 , obtenemos k1=12,4011503y k2= 39,3640771. 24 ⋅ 402 24 ⋅ 402 2 < σ2 < = P 0,95 ⇒ 975,508709 < σ < 3096, 48695 12, 4011503 39,3640771 DERIVE: #1: #2: NSOLVE(CHI_SQUARE(k, 24) = 0.025, k, 0, 40) k = 12.40115026 #3: #4: NSOLVE(CHI_SQUARE(k, 24) = 0.975, k, 0, 40) k = 39.98770495 EXCEL: =INV.CHICUAD (0,025;24) 12,4011503 =INV.CHICUAD (0,975;24) 39,3640771 SPSS: IDF. CHISQ(0.975,24) IDF. CHISQ(0.025,24) 12,4 39,36 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 25 Intervalos de Confianza 15.- Se han recogido firmas para una petición, en cada hoja caben 42 firmas, pero existen hojas que no están firmadas totalmente. Para una muestra de 50 hojas se tienen los resultados = x 1471 = y S2 229 . Se pide dar un intervalo de confianza 50 para la media al 80%. Solución: Tenemos una muestra de tamaño grande (n=50) y varianza desconocida de una distribución normal: S S Iα = , X + zα / 2 X − zα / 2 n n Datos: = X 1471 = ; S2 229; = 1 − α 0.8 50 y en la distribución normal F(z α / 2 )= α + 1 − α= 0.9 ⇒ z α / 2= 1.28 2 DERIVE: #1: NSOLVE(NORMAL(z, 0, 1) = 0.9, z, Real) #2: z = 1.281551569 EXCEL: =DISTR.NORM.INV(0,9;0;1) 1,281552 O directamente =INTERVALO.CONFIANZA(0,2;raiz(229);50) X ± zα / 2 SPSS: IDF. NORMAL(0.9, 0,1) 2,742640919 S 1471 = ± 2, 742640919 50 n 1,2815515655 WOLFRAMALPHA: normal distribution, mean=0,sd=1 1.28155 (Percentil 90) 1471 229 1471 229 , ⇒ Iα=0.2 = − 1.28 + 1.28 = ( 26.68,32.16 ) 50 50 50 50 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 26 Intervalos de Confianza 16.- Sea X la v. a. número de errores al realizar una nivelación. Se estudian 40 nivelaciones escogidas al azar. Los resultados son: X = 18.5 y S = 4. Se pide: a) Intervalo de confianza del 95% para la media. b) Intervalo de confianza para la varianza con un nivel de significación de α =0.01 Solución: a) Tenemos una muestra de tamaño grande (n=40) y varianza desconocida de una distribución normal: S S Iα = , X + z α /2 X − z α /2 n n Datos: X= 18.5 ; S= 4; α= 0.05 y en la distribución normal α + 1 − α= 0.975 ⇒ λ α /2= 1.96 F(Z < z α /2 )= 2 4 4 ,18.5 + 1.96 ⇒ Iα=0.05 =18.5 − 1.96 = (17.867545,19.132455 ) 40 40 (n − 1).S2 (n − 1).S2 < σ2 < P = 1− α k k 2 1 Datos: S= 4; α= 0.01 y en la distribución Chi-cuadrado b) Buscaremos los valores de k1 y k2 tales que: 2 P ( χ39 < k1 ) = 0.005 2 P ( χ39 < k2 ) = 0.995 , obtenemos k1= 19,9958679 y k2= 65,4755709 39 ⋅ 42 39 ⋅ 42 2 < σ2 < = P 0,99 ⇒ 9,53 < σ < 31, 21 19,99586787 65,4755709 Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 27 Intervalos de Confianza 17.- Se han realizado 15 mediciones de una misma magnitud, se supone que se distribuye normalmente, habiéndose observado los siguientes resultados: 40,15 40,10 40,5 40,4 40,2 40,4 40,4 40,35 40,2 40,6 40,25 40,2 40,9 40,25 40,4 c) Hallar un Intervalo de confianza del 99% para la varianza. d) ¿Cuántas mediciones deberían haberse utilizado si se requiere una precisión en la media de ±0,1 y una confianza del 95%? Solución: 2 X= 40,353;S= 0, 04195238; n= 15; α= 0, 01 (n − 1). S 2 a) Sabiendo que ≡ χ n2 −1 si la población de partida es N(µ, σ) 2 σ (n − 1).S2 (n − 1).S2 < σ2 < P = 1− α k1 k2 Buscaremos los valores de k1 y k2 tales que: 2 P ( χ14 < k1 ) = 0.005 2 P ( χ14 < k2 ) = 0.995 k2 =31,3193496; k1 = 4,07467497 14 ⋅ 0, 04195238 14 ⋅ 0, 04195238 P 0,99 ⇒ 0, 01875305 < σ2 < 0,14414238 < σ2 < = 4, 07467497 31,3193496 S b) X ± t α / 2 n Buscaremos en la tabla un valor t α / 2 tal que P ( − t α / 2 < t n −1 < t α / 2 ) = 1 − α . P ( t n −1 < t α / 2 ) = 1 − α ⇔ P ( t n −1 > t α / 2 ) = α ⇒ P ( t14 > t α / 2= 0, 05 ⇒ t 0,025 = 2,14478669 0,025 ) = Para que la precisión en la media sea de 0,1, se tiene que: 2 t α /2 2 2 S t ⋅S t 2,14478669 = 0,1 ⇒ n = α /2 = α /2 ⋅ S2 = 0, 04195238 = 19,29855577 0,1 n 0,1 0,1 Por lo que el tamaño de la muestra será de 20. Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M. 28 Intervalos de confianza para la media a) Población normal con varianza conocida. Sabemos que N , , luego N(0,1) . Queremos calcular un intervalo de n n forma que la P 1 . A 1 se le llama nivel de confianza A se le llama nivel de significación y es la probabilidad de que el parámetro no esté en el intervalo. Buscaremos en la N(0,1) un valor de forma que P 1 como , y n , son conocidos, tenemos el intervalo . n n El intervalo de confianza sería: x n b) Población cualquiera de varianza finita y muestras grandes. Sabemos que N(, ) . Razonando igual que antes, si la varianza es conocida el n intervalo será P 1 para n>30. n n Si la varianza es desconocida la estimamos por la cuasivarianza, y queda: S S S P . 1 para n>100 y el intervalo es x n n n c) Población normal con varianza desconocida. Buscaremos en un valor t tal que P t t n1 t 1 y el correspondiente intervalo S S de confianza será: P t t 1 n n S y si queremos determinar el tamaño muestral n, resulta Para una muestra concreta: x t n 2 t S t .S de donde n . n Intervalos de confianza para la varianza (n 1). S 2 n2 1 si la población de partida es N(, ) . Por tanto, para tomar el 2 intervalo de confianza de nivel de significación , buscamos los valores k 1 y k 2 , tal que: Se sabe que (n 1). S 2 k2 1 . P k 1 2 Se nos plantea el problema de que la distribución n21 no es simétrica (como ocurría con la Normal y la t de Student) por lo que no es posible determinar con exactitud los valores k 1 y k 2 para que el intervalo esté centrado en S2. Una solución aproximada y generalmente buena es determinar k 1 y k 2 con las condiciones: P n21 k 1 y P n21 k 2 2 2 Método de máxima verosimilitud Método de inferencia estadística que consiste en elegir el valor del parámetro que hace más probables (más verosímiles) los valores obtenidos en la muestra. Este método fue usado por Gauss en el caso especial de la distribución Normal para justificar el método de los mínimos cuadrados y posteriormente desarrollado por R. A. Fisher en sus aspectos esenciales. Si tomamos una muestra 1, 2 ,..., n de una población que depende de unos parámetros 1, 2 ,..., n , sabemos que cada i tiene la misma distribución que la población: f xi , 1, 2 ,..., n . La probabilidad de que salga una muestra 1, 2 ,..., n viene dada por: n f x1, 1, 2 ,..., n ... f xn , 1, 2 ,..., n f xi , 1, 2 ,..., n L x1,..., xn , 1, 2 ,..., n i 1 que es la llamada función de verosimilitud. La idea de este método es coger como estimadores los valores que hacen máxima esta función, basándose en el principio lógico de suponer que los parámetros toman los valores que hacen máxima la probabilidad de obtener cada muestra. Es más cómodo manejar log L, y lo podemos hacer ya que los valores que maximicen L, maximizan log L (por ser el logaritmo una función monótona creciente). En la logL 0 . Estas mayoría de los casos, basta con hallar los valores que anulan su derivada: i ecuaciones que deben satisfacer los parámetros son las ecuaciones de máxima verosimilitud. Observación: El método de máxima verosimilitud no siempre produce estimadores insesgados.