Intervalos de Confianza

Anuncio
Intervalos de Confianza
1.- Se quiere estudiar la vida útil de unas nuevas pilas que se van a lanzar al mercado.
Para ello se examina la duración de 40 de ellas, resultando una media de 63 horas.
Suponiendo que el tiempo de vida de las pilas sigue una distribución normal, y que la
varianza se puede tomar la misma que las fabricadas anteriormente que era 38,44, se
pide:
a) Intervalo de confianza del 95% de la duración media de las nuevas pilas.
b) Intervalo de confianza del 99% de la duración media de las nuevas pilas.
c) Tamaño de la muestra necesario para que con una confianza del 95%, la duración
media estimada no difiera de la real en más de una hora.
2.- Durante 15 días se estudió el número de alumnos que pasaban por el almacén de la
Escuela, obteniéndose los siguientes resultados:
70, 78, 71, 62, 78, 67, 64, 76, 73, 65, 58, 72, 74, 67, 75
Suponiendo Normalidad de la distribución, calcular: Intervalo de confianza del 95%
del número medio de usuarios del almacén.
3.- Para estudiar el número de pulsaciones por minuto de personas entre 20 y 30 años,
se eligen 400 al azar, obteniéndose una media de 75 por minuto y una desviación típica
de 9. Calcular:
a) Intervalo de confianza del 95% del número medio de pulsaciones por minuto en
dicha población.
b) Tamaño de la muestra necesario para obtener el intervalo de confianza de la misma
amplitud que el anterior y con nivel de confianza del 99%.
4.- Una agencia de alquiler de automóviles necesita estimar el número medio de
kilómetros diarios que realizas su flota de automóviles; toma los recorridos de 100
vehículos y obtiene una media de 165 km/día y una varianza muestral de 36 km/día. Se
pide:
a) Intervalo de confianza para la media al 95%
b) Intervalo de confianza para la varianza al 95%
5.- Si el coeficiente medio de inteligencia de la población universitaria de la U.P.M. es
µ = 95 y σ =14, y se extrae una muestra de 49 estudiantes de esa población.
a) ¿Qué probabilidad hay de que resulte una media muestral igual o inferior a 92?
b) Hallar un Intervalo de confianza al 95% para la media de la población universitaria,
para la muestra de media 92.
c) ¿Podemos aceptar la hipótesis de ser la media µ = 95 ?
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
1
Intervalos de Confianza
6.- Se desea estudiar el gasto semanal en euros, de los estudiantes de Madrid. Para ello
se ha elegido una muestra aleatoria de 9 de estos estudiantes:
100
150
90
70
75
105
200
120
80
Se supone que la variable aleatoria sigue una distribución normal de desviación típica
conocida e igual a 12. Determinar un intervalo de confian Intervalo de confianza al
95% para la media del gasto semanal por estudiante.
7.- Se realiza una encuesta sobre el nivel de conocimientos generales de los estudiantes
de bachillerato de los diferentes centros de Madrid. Para ello se ha elegido una muestra
aleatoria de 9 de estos estudiantes a los que se ha realizado el examen. Las
calificaciones obtenidas han sido las siguientes:
7,8
6,5
5,4
7,1
5
8,3
5,6
6,6
6,2
Se supone que la variable aleatoria sigue una distribución normal de desviación típica
conocida e igual a 1. Se pide:
a) Un Intervalo de confianza al 98% para la media de las calificaciones en el examen.
b) El tamaño mínimo que debería tener la muestra en el caso de admitir un error
máximo de 0,5 puntos con un nivel de confianza del 95%.
8.- Se ha tomado una muestra de tamaño 10 del tiempo T, en minutos, entre el paso de
dos autobuses en una parada, con los siguientes resultados 9, 10, 6, 4, 15, 6, 1, 5, 4, 10.
Si la función de distribución del tiempo es: F(t) = 1 − e −λt
a) Estimar, por máxima verosimilitud el valor de λ.
b) Calcular la probabilidad estimada de esperar al autobús más de 10 minutos.
9.- Se han escogido al azar 15 probetas de un determinado acero, cuya resistencia a la
compresión se supone que se distribuye normalmente, y se ha medido ésta en las
unidades adecuadas, habiéndose observado los siguientes resultados:
40,15
65,10
49,5
22,4
38,2
60,4
43,4
26,35 31,2
55,6
47,25
73,2
35,9
49,25 52,4
a) Estimar la resistencia media del acero y su varianza, utilizando estimadores
centrados.
b) Hallar un Intervalo de confianza del 99% para la resistencia media.
c) Hallar un Intervalo de confianza del 99% para la varianza.
10.- La altura de los individuos de una población sigue una distribución normal, de
media µ y desviación típica 0,075. Si en una muestra aleatoria simple de tamaño 12 de
dicha población se obtuvo una media muestral de 1,75. Se pide:
a) Determinar un Intervalo de confianza para µ con un nivel de confianza del 95%.
b) ¿Qué tamaño muestral sería necesario para que el intervalo de confianza del mismo
nivel tuviese longitud menor que 0,01?
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
2
Intervalos de Confianza
11.- Supuesto que una población se compone de cinco valores: 2, 3, 6, 8, 11.
Considérense todas las muestras posibles de tamaño dos que puedan extraerse con
reemplazamiento de esta población. Se pide:
a) La media y desviación típica de la población.
b) La distribución de la media muestral.
c) La media y la desviación típica de la distribución de la media muestral.
d) Calcular un Intervalo de confianza al 80% para la media de la población si se
obtienen muestras de tamaño 3.
12.- Las edades en que se produce la muerte, para una muestra aleatoria de 19
individuos fallecidos por una determinada edad dan una media de 50 años. Suponiendo
normal la distribución, hallar un Intervalo de confianza para la media al 99%
suponiendo conocido el valor de la varianza de la población σ 2 = 38 .
13.- Se quieren estudiar la vida útil de unas baterías para móviles. Si admitimos que la
varianza de la distribución normal de la vida de las baterías es igual a 1.44, ¿qué tamaño
muestral deberíamos utilizar para que la semiamplitud del Intervalo de confianza para
la media del 95% no sea superior al 0,2?
14.- Suponiendo que la producción de trigo por hectárea es una variable aleatoria con
distribución normal, sabiendo que en 25 fincas elegidas al azar se produjeron de media
3200 kg por ha, y la desviación típica fue de 40 kg por ha, calcular:
a) Intervalo de confianza al 95% de la producción media de trigo por ha.
b) Intervalo de confianza al 95% de la varianza.
15.- Se han recogido firmas para una petición, en cada hoja caben 42 firmas, pero
existen hojas que no están firmadas totalmente. Para una muestra de 50 hojas se tienen
1471
los resultados
=
x =
y S2 229 . Se pide dar un intervalo de confianza para la
50
media al 80%.
16.- Sea X la v. a. número de errores al realizar una nivelación. Se estudian 40
nivelaciones escogidas al azar. Los resultados son: X = 18.5 y S = 4. Se pide:
a) Intervalo de confianza del 95% para la media.
b) Intervalo de confianza para la varianza con un nivel de significación de
α =0.01
17.- Se han realizado 15 mediciones de una misma magnitud, se supone que se
distribuye normalmente, habiéndose observado los siguientes resultados:
40,15
40,10
40,5
40,4
40,2
40,4
40,4
40,35 40,2
40,6
40,25
40,2
40,9
40,25 40,4
a) Hallar un Intervalo de confianza del 99% para la varianza.
b) ¿Cuántas mediciones deberían haberse utilizado si se requiere una precisión en
la media de ±0,1 y una confianza del 95%?
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
3
Intervalos de Confianza
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
4
Intervalos de Confianza
1.- Se quiere estudiar la vida útil de unas nuevas pilas que se van a lanzar al
mercado. Para ello se examina la duración de 40 de ellas, resultando una media de
63 horas. Suponiendo que el tiempo de vida de las pilas sigue una distribución
normal, y que la varianza se puede tomar la misma que las fabricadas
anteriormente que era 38,44, se pide:
a) Intervalo de confianza del 95% de la duración media de las nuevas pilas.
b) Intervalo de confianza del 99% de la duración media de las nuevas pilas.
c) Tamaño de la muestra necesario para que con una confianza del 95%, la
duración media estimada no difiera de la real en más de una hora.
Solución:
La duración de las pilas sigue una distribución N ( µ,38.44 )
El intervalo de confianza para una población normal de varianza conocida es:
σ
X ± z α /2
n
a) Para nuestros datos:
X
= 63; σ
= 38.44= 6.2; n= 40; α
= 0.05
Tenemos
=
Z
X −µ
≡ N(0,1)
σ n
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.05 =
0.95 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.975
DERIVE:
#1:
#2:
NSOLVE(NORMAL(z) = 0.975, z, Real)
z = 1.959963962
EXCEL: =DISTR.NORM.INV(0,975;0;1)
1,95996279
O directamente
=INTERVALO.CONFIANZA(0,05;6,2;40)
X ± zα
1,92136343
σ
=
63 ± 1,92136343
n
SPSS: IDF. NORMAL(0.975, 0,1)
1,96
6.2
6.2 

⇒ Iα=0.05 =
, 63 + 1.96
 63 − 1.96
 =( 61.08, 64.92 )
40
40 

b) Cambia el nivel de confianza
x= 63; σ
=
38.44= 6.2; n= 40; α
= 0.01
Tenemos
=
Z
X −µ
≡ N(0,1)
σ n
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.01 =
0.99 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.995
DERIVE:
#1:
#2:
NSOLVE(NORMAL(z) = 0.995, z, Real)
z = 2.575829327
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
5
Intervalos de Confianza
EXCEL: =DISTR.NORM.INV(0,995;0;1)
2,5758313
O directamente
=INTERVALO.CONFIANZA(0,01;6,2;40)
X ± z α /2
SPSS: IDF. NORMAL(0.995, 0,1)
2,5251031
σ
=
63 ± 2.5251031
n
2,58
6.2
6.2 

⇒ Iα=0.01 =
, 63 + 2.58
 63 − 2.58
 =( 60.47, 65.53)
40
40 

c)
Para que la duración estimada no difiera de la real en más de una hora, se tiene que:
σ
2
2
= 1 ⇒ n = ( z α /2 ⋅ σ ) = (1,96 ⋅ 6, 2 ) = 147, 67
z α /2
n
Por lo que el tamaño de la muestra será de 148 pilas.
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
6
Intervalos de Confianza
2.- Durante 15 días se estudió el número de alumnos que pasaban por el almacén
de la Escuela, obteniéndose los siguientes resultados:
70, 78, 71, 62, 78, 67, 64, 76, 73, 65, 58, 72, 74, 67, 75
Suponiendo Normalidad de la distribución, calcular: intervalo de confianza del
95% del número medio de usuarios del almacén.
Solución:
Calculamos los parámetros estadísticos:
∑ x i 1050
=
= 70.13
X =
n
15
∑(x
− X)
2
506
= 36.14285714 ⇒ S= 36.14285714= 6.011892975
n −1
14
Se trata de una población que sigue una distribución Normal de varianza desconocida, y
muestras pequeñas, por lo que el intervalo de confianza es:
S
X ± tα/ 2
n
X= 70;S= 6; n= 15; α= 0.05
S=
2
i
=
Buscaremos en la tabla un valor t α / 2 tal que P ( − t α / 2 < t n −1 < t α / 2 ) = 1 − α .
P ( t n −1 < t α / 2 ) =
1 − α ⇔ P ( t n −1 > t α / 2 ) =
α ⇒ P ( t14 > t α / 2=
0, 05 ⇒ t =
2,145
0,025 ) =
DERIVE:
#1:
#2:
NSOLVE(STUDENT(t, 14) = 0.975, t)
t = 2.144786715
EXCEL: =INV.T.2C(0,05;14)
SPSS: IDF.T(0.975,14)
2,144788596
2,145
6
6 

⇒ Iα=0.05 =
, 70 + 2.145
 70 − 2.145
 =( 66.67698028, 73.32301971)
15
15 

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
7
Intervalos de Confianza
3.- Para estudiar el número de pulsaciones por minuto de personas entre 20 y 30
años, se eligen 400 al azar, obteniéndose una media de 75 por minuto y una
desviación típica de 9. Calcular:
a) Intervalo de confianza del 95% del número medio de pulsaciones por minuto en
dicha población.
b) Tamaño de la muestra necesario para obtener el intervalo de confianza de la
misma amplitud que el anterior y con nivel de confianza del 99%.
Solución:
 σ 
Por ser el tamaño de la muestra suficientemente grande podemos considerar N  µ,

n

El intervalo de confianza para una población normal es:
σ
X ± z α /2
n
a) Para nuestros datos:
X
= 75; σ ≈ =
S 9; =
n 400; α
= 0.05
Tenemos
=
Z
X −µ
≡ N(0,1)
σ n
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.05 =
0.95 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.975
DERIVE:
#1:
#2:
NSOLVE(NORMAL(z) = 0.975, z, Real)
z = 1.959963962
EXCEL: =DISTR.NORM.INV(0,975;0;1)
1,9599628
O directamente
=INTERVALO.CONFIANZA(0,05;9;400)
X ± z α /2
SPSS: IDF. NORMAL(0.975, 0,1)
0,88198379
σ
=
75 ± 0,88198379
n
1,96
9
9 

⇒ Iα=0.05 =
, 75 + 1.96
 75 − 1.96
 =( 74.118, 75.882 )
400
400 

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
8
Intervalos de Confianza
b)
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.01 =
0.99 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.995
DERIVE:
#1:
NSOLVE(NORMAL(z) = 0.995, z, Real)
#2:
z = 2.575829327
EXCEL: =DISTR.NORM.INV(0,995;0;1)
2,5758313
SPSS: IDF. NORMAL(0.995, 0,1)
2,58
2
2
σ
 z α /2 ⋅ σ   2,58 ⋅ 9 
=
z α /2
0,88198379
=
⇒n  =
  =
 693.1125238
n
 0,88198379   0,88198379 
Por lo que el tamaño de la muestra será de 694.
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
9
Intervalos de Confianza
4.- Una agencia de alquiler de automóviles necesita estimar el número medio de
kilómetros diarios que realizas su flota de automóviles; toma los recorridos de 100
vehículos y obtiene una media de 165 km/día y una varianza muestral de 36
km/día. Se pide:
a) Intervalo de confianza para la media al 95%.
b) Intervalo de confianza para la varianza al 95%.
Solución:
 σ 
Por ser el tamaño de la muestra suficientemente grande podemos considerar N  µ,

n

El intervalo de confianza para una población normal es:
σ
X ± z α /2
n
a) Para nuestros datos:
X= 165; σ2= S2= 36; n= 100; α= 0.05
Tenemos
=
Z
X −µ
≡ N(0,1)
σ n
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.05 =
0.95 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.975
DERIVE:
#1:
#2:
NSOLVE(NORMAL(z) = 0.975, z, Real)
z = 1.959963962
EXCEL: =DISTR.NORM.INV(0,975;0;1)
1,9599628
O directamente
=INTERVALO.CONFIANZA(0,05;6;100)
X ± z α /2
1,1759777
σ
=±
165 1,1759777
n
SPSS: IDF. NORMAL(0.975, 0,1)
1,96
6
6 

⇒ Iα=0.05 =165 − 1.96
,165 + 1.96
 = (163.82,166.18 )
100
100 

 (n − 1).S2
(n − 1).S2 
< σ2 <
b) P 
 = 1− α
k1
 k2

Buscaremos los valores de k1 y k2 tales que:
2
P ( χ99
0.025
< k1 ) =
2
P ( χ99
0.975
< k2 ) =
en las tablas e
interpolando, obtenemos k1=73,361y k2= 128,422.
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
10
Intervalos de Confianza
EXCEL:
=INV.CHICUAD (0,025;99)
73,361103
=INV.CHICUAD (0,975;99)
128,42193
en la prueba de la chi se utiliza la cola de la derecha
SPSS: IDF. CHISQ(0.975,99)
128,422
: IDF. CHISQ(0.025,99)
73,361
99 ⋅ 36 
 99 ⋅ 36
P
0,95 ⇒ 27.75 < σ2 < 48.58
< σ2 <
=

0, 216 
 128.42193
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
11
Intervalos de Confianza
5.- Si el coeficiente medio de inteligencia de la población universitaria de la U.P.M.
es µ =95 y σ =14, y se extrae una muestra de 49 estudiantes de esa población.
a) ¿Qué probabilidad hay de que resulte una media muestral igual o inferior a 92?
b) Hallar un intervalo de confianza al 95% para la media de la población
universitaria, para la muestra de media 92.
c) ¿Podemos aceptar la hipótesis de ser la media µ =95 ?
Solución:
14 

 σ 
La distribución de la media muestral es X ≡ N =
µ,
=
 N ( 95, 2 )
 N  95,
n
49 


(
)
a) F(92) = P X ≤ 92 ≈ 0.06680720126
DERIVE: #1: NORMAL(92,95,2)
#2:
0.06680720126
EXCEL: =DISTR.NORM.(92;95;2;1)
SPSS: CDF. NORMAL(92,95,2)
0,0668072
,06680720
b) El intervalo de confianza para una población normal es:
σ
X ± z α /2
n
Para nuestros datos: X
= 92; σ
= 14; =
n 49; α
= 0.05
Tenemos
=
Z
X −µ
≡ N(0,1)
σ n
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.05 =
0.95 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.975
DERIVE: #1: NSOLVE(NORMAL(z) = 0.975, z, Real)
#2:
z = 1.959963962
EXCEL: =DISTR.NORM.INV(0,975;0;1)
1,9599628
O diretamente
=INTERVALO.CONFIANZA(0,05;14;49)
3,91992797
σ
=
X ± z α /2
92 ± 3,919927969
n
SPSS: IDF. NORMAL(0.975, 0,1)
1,96
14
14 

⇒ Iα=0.05 =
,92 + 1.96
 92 − 1.96
 =( 88.08,95.92 )
49
49 

c) µ= 95 ∈ Iα=0.05=
(88.08,95.92 ) , SÍ SE ACEPTA
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
12
Intervalos de Confianza
6.- Se desea estudiar el gasto semanal en euros, de los estudiantes de Madrid. Para ello
se ha elegido una muestra aleatoria de 9 de estos estudiantes:
100
150
90
70
75
105
200
120
80
Se supone que la variable aleatoria sigue una distribución normal de media desconocida
y desviación típica conocida e igual a 12. Determinar un intervalo de confianza al 95%
para la media del gasto semanal por estudiante.
Solución:
El gasto sigue una distribución N ( µ,12 )
El intervalo de confianza para una población normal de varianza conocida es:
σ
X ± z α /2
n
Para nuestros datos:
100 + 150 + 90 + 70 + 75+105+200 + 120 + 80
X=
= 110; σ= 12; n= 9; α= 0, 05
9
X −µ
Tenemos
=
≡ N(0,1)
Z
σ n
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.05 =
0.95 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.975
DERIVE:
#1:
#2:
NSOLVE(NORMAL(z) = 0.975, z, Real)
z = 1.959963962
EXCEL: =DISTR.NORM.INV(0,975;0;1)
1,9599628
O directamente
=INTERVALO.CONFIANZA(0,05;1;9)
X ± z α /2
SPSS: IDF. NORMAL(0.975, 0,1)
7,8398559
σ
=±
110 7,8398559
n
1,96
12
12 

⇒ Iα=0.02 =110 − 1,96
,110 + 1,96
 =(102.16,117.84 )
9
9

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
13
Intervalos de Confianza
7.- Se realiza una encuesta sobre el nivel de conocimientos generales de los
estudiantes de bachillerato de los diferentes centros de Madrid. Para ello se ha
elegido una muestra aleatoria de 9 de estos estudiantes a los que se ha realizado el
examen. Las calificaciones obtenidas han sido las siguientes:
7,8
6,5
5,4
7,1
5
8,3
5,6
6,6
6,2
Se supone que la variable aleatoria sigue una distribución normal de desviación
típica conocida e igual a 1. Se pide:
a) Un intervalo de confianza al 98% para la media de las calificaciones en el
examen.
b) El tamaño mínimo que debería tener la muestra en el caso de admitir un error
máximo de 0,5 puntos con un nivel de confianza del 95%
Solución:
La calificación del examen sigue una distribución N ( µ,1)
a) El intervalo de confianza para una población normal de varianza conocida es:
σ
X ± z α /2
n
Para nuestros datos:
7,8 + 65 + 5, 4 + 7,1 + 5 + 8,3 + 5, 6 + 6, 6 + 6, 2
x=
= 6,5; σ= 1; n= 9; α= 0.02
9
X −µ
Tenemos
=
≡ N(0,1)
Z
σ n
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.02 =
0.98 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.99
DERIVE:
#1:
#2:
NSOLVE(NORMAL(z) = 0.99, z, Real)
z = 2.326347902
EXCEL: =DISTR.NORM.INV(0,99;0;1)
2,3263479
O directamente
=INTERVALO.CONFIANZA(0,02;1;9)
X ± z α /2
SPSS: IDF. NORMAL(0.99, 0,1)
0,7754493
σ
=±
6,5 0, 7754493
n
2,33
1
1 

⇒ Iα=0.02 = 6,5 − 2,33
, 63,5 + 2,33
 =( 5.73, 7.27 )
9
9

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
14
Intervalos de Confianza
b) Para un nivel de confianza del 95%
X −µ
Tenemos
=
≡ N(0,1)
Z
σ n
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.05 =
0.95 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.975
DERIVE:
#1:
#2:
NSOLVE(NORMAL(z) = 0.975, z, Real)
z = 1.959963962
EXCEL: =DISTR.NORM.INV(0,975;0;1)
1,9599628
SPSS: IDF. NORMAL(0.975, 0,1)
1,96
Con un error del 0,5: 0,5= z α /2
σ
1
1,96
= 1,96
⇒ n=
= 3,92 ⇒ n= 15,3
0,5
n
n
Debemos tomar una muestra de tamaño n=16
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
15
Intervalos de Confianza
8.- Se ha tomado una muestra de tamaño 10 del tiempo T, en minutos, entre el paso
de dos autobuses en una parada, con los siguientes resultados 9, 10, 6, 4, 15, 6, 1, 5,
4, 10.
Si la función de distribución del tiempo es: F(t) = 1 − e −λt
a) Estimar, por máxima verosimilitud el valor de λ.
b) Calcular la probabilidad estimada de esperar al autobús más de 10 minutos.
Solución:
a)
La función de densidad de la distribución de T es: f (t) = F '(t) = λe −λt
La función de verosimilitud será:
n
L(t1...t n / λ) =f (t1...t n / λ) =Π f (t i ) =λe −λt1 .... λe −λt n =λ n e −λ (t1 +...+ t n )
i =1
Tomando logaritmos neperianos
ln ( L(t1...t n / λ
=
) ) n ln ( λ ) − λ ( t1 + ... + t n )
Buscamos el máximo
∧
∂ ln ( L(t1...t n / λ) ) n
n
= − ( t1 + ... + t n ) = 0 ⇒ λ =
∂λ
λ
t1 + ... + t n
∧
1
10
Así para nuestra muestra es: λ
=
=
9 + 10 + 6 + 4 + 15 + 6 + 1 + 5 + 4 + 10 7
b)
Para nuestros datos la función de distribución será: F(t) =
1− e

P(T > 10) =
1 − P(T < 10) =
1 − F(10) =
1 − 1 − e

1
− 10
7
−λt
=
1− e
1
− t
7

1
 =10/7 ≈ 0.2396510364
 e
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
16
Intervalos de Confianza
9.- Se han escogido al azar 15 probetas de un determinado acero, cuya resistencia a
la compresión se supone que se distribuye normalmente, y se ha medido ésta en las
unidades adecuadas, habiéndose observado los siguientes resultados:
40,15
65,1
49,5
22,4
38,2
60,4
43,4
26,35 31,2
55,6
47,25
73,2
35,9
49,25 52,4
a) Estimar la resistencia media del acero y su varianza, utilizando estimadores
centrados.
b) Hallar un intervalo de confianza del 99% para la resistencia media.
c) Hallar un intervalo de confianza del 99% para la varianza.
Solución:
a)
El estimador de máxima verosimilitud de la media, es la media muestral, que es un
∧
estimador centrado, luego µ= X= 46, 02 . Pero para la varianza utilizaremos la
∑(x
n
∧
2
S
=
cuasivarianza muestral, ya que es centrado,
)
2
−X
i =1
= 202,532429
n −1
i
b)
Se trata de una población que sigue una distribución Normal de varianza desconocida, y
muestras pequeñas, por lo que el intervalo de confianza es:
S
X ± tα/ 2
n
X= 46.02;S= 14, 2313888; n= 15; α= 0, 01
Buscaremos en la tabla un valor t α / 2 tal que P ( − t α / 2 < t n −1 < t α / 2 ) = 1 − α .
P ( t n −1 < t α / 2 ) =
1 − α ⇔ P ( t n −1 > t α / 2 ) =
α ⇒ P ( t14 > t α / 2=
0, 01 ⇒ t =
2,98
0,005 ) =
DERIVE:
#1:
#2:
NSOLVE(STUDENT(t, 14) = 0.995, t)
t = 2.976842746
EXCEL: =INV.T.2C(0,01;14)
2,9768427
SPSS: IDF.T(0.995,14)
2,98
S
60.2 ± 10.9500958
=
n
14.2313888
14, 2313888 

⇒ Iα=0.01 =  46.02 − 2.98
, 46.02 + 2.98
=
15
15


X ± tα/ 2
( 35.0699042,56.9700958)
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
17
Intervalos de Confianza
c)
Sabiendo que
(n − 1). S 2
≡ χ n2 −1 si la población de partida es N(µ, σ)
2
σ
 (n − 1).S2
(n − 1).S2 
< σ2 <
P
 = 1− α
k1
 k2

2
P ( χ14 < k1 ) =
0.005
Buscaremos los valores de k1 y k2 tales que:
2
P ( χ14
< k2 ) =
0.995
EXCEL:
=INV.CHICUAD (0,005;14)
4,074675
=INV.CHICUAD (0,995;14)
31,31935
en la prueba de la chi se utiliza la cola de la derecha
SPSS: IDF. CHISQ(0.995,14)
31,32
: IDF. CHISQ(0.005,14)
4,07
14 ⋅ 202,532429 
 14 ⋅ 202,532429
P
0,99 ⇒ 90,5317369 < σ2 < 696, 671744
< σ2 <
=

31,32
4, 07


Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
18
Intervalos de Confianza
10.- La altura de los individuos de una población sigue una distribución normal, de
media µ y desviación típica 0,075. Si en una muestra aleatoria simple de tamaño 12
de dicha población se obtuvo una media muestral de 1,75. Se pide:
a) Determinar un intervalo de confianza para µ con un nivel de confianza del 95%.
b) ¿Qué tamaño muestral sería necesario para que el intervalo de confianza del
mismo nivel tuviese longitud menor que 0,01?
Solución:
a)
Se trata de una población que sigue una distribución Normal de varianza conocida, y
muestras pequeñas, por lo que el intervalo de confianza es:
σ
X ± z α /2
n
X= 1.75;S= 0.075; n= 12; α= 0, 05
X −µ
≡ N(0,1)
σ n
Tenemos
=
Z
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.05 =
0.95 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.975
DERIVE:
#1:
#2:
NSOLVE(NORMAL(z) = 0.975, z, Real)
z = 1.959963962
EXCEL: =DISTR.NORM.INV(0,975;0;1)
1,9599628
SPSS: IDF. NORMAL(0.975, 0,1)
1,96
0.075
0.075 

,1.75 + 1.96
⇒ Iα=0.05 =1.75 − 1.96
 = (1.707564755,1.792435244 )
12
12 

O directamente com EXCEL
=INTERVALO.CONFIANZA(0,05;0,075;12)
X ± z α /2
0,0424345
σ
=
1, 75 ± 0, 0424345
n
b)
σ
σ 

El intervalo de confianza en general es Iα =
, X − z α /2
 X − z α /2
 , en nuestro
n
n

caso
0.075
0.075 

,1.75 + 1.96
⇒ Iα=0.05 =1.75 − 1.96
 para n desconocido, cuya longitud es
n
n 

⇒ 1.96
0.075
0.075
0.075
+ 1.96
=⋅
2 1.96
< 0.01 ⇒ n > 29.4
n
n
n
Debemos tomar una muestra de tamaño n=865
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
19
Intervalos de Confianza
11.- Supuesto que una población se compone de cinco valores: 2, 3, 6, 8, 11.
Considérense todas las muestras posibles de tamaño dos que puedan extraerse con
reemplazamiento de esta población. Se pide: a) La media y desviación típica de la
población. b) La distribución de la media muestral. c) La media y la desviación
típica de la distribución de la media muestral. d) Calcular un intervalo de
confianza al 80% para la media de la población si se obtienen muestras de tamaño
3.
Solución:
La población está formada por {2,3, 6,8,11}
2 + 3 + 6 + 8 + 11
= 6
5
4
+
9
+
36
+ 64 + 121
54
⇒σ
10.8 ≈ 3.29
σ2=
− 36=
= 10.8 =
5
5
b) Calculemos las medias de todas las posibles muestras de tamaño 2
2
3
6
8
11
2
2
2.5
4
5
6.5
3
2.5 3
4.5
5.5 7
6
4
4.5
6
7
8.5
8
5
5.5
7
8
9.5
11 6.5 7
8.5
9.5 11
c)
2
xi ni ni xi ni xi
a) µ
=
2
4
1
5
12,5
2
3
9
1
8
32
2
9
40,5
2
50
2 10
60,5
2 11
6
36
1
84,5
2 13
196
4 28
8
64
1
144,5
2 17
180,5
2 19
121
1 11
25 150
1035
x1 + x 2 + ... + x n 150
Media:=
x
= = 6
N
25
2
2
2
x 1 + x 2 + ... + x n
1035
2
2
− x=
− 36
= 5.4
Varianza: σ=
x
N
25
σ 2 10.8
2
Obsérvese que X = µ = 6 y que σ x=
=
= 5.4 ⇒=
σx
n
2
2
2,5
3
4
4,5
5
5,5
6
6,5
7
8
8,5
9,5
11
5.4 ≈ 2.32
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
20
Intervalos de Confianza
d) Sabemos que el estadístico
de libertad. Así pues:
X −µ
sigue una distribución t de Student con n-1 grados
S
n
X−6
16.2
= t 3−1 , ya que =
S2
N 2 5
10.8
=
σ
= 13.5 .
N −1
4
3
S
S 

Buscaremos el intervalo Iα =
, X + t α /2
 X − t α /2
 , es decir,
n
n

S
S 

P  X − t α /2
< µ < X + t α /2
 = 1 − α . En nuestro caso, queda:
n
n


13.5
13.5 
Iα=0.2 =
, 6 + 1.88561812
( 2,10 )
 6 − 1.88561812
 =
3
3


DERIVE: NSOLVE(STUDENT(t, 2) = 0.8)
EXCEL: =INV.T.2C(0,2;2)
t = 1.885618120
1,8856
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
21
Intervalos de Confianza
12.- Las edades en que se produce la muerte, para una muestra aleatoria de 19
individuos fallecidos por una determinada edad dan una media de 50 años.
Suponiendo normal la distribución, hallar un intervalo de confianza para la media
al 99% suponiendo conocido el valor de la varianza de la población σ 2 =38 .
Solución:
Tenemos una distribución normal y varianza conocida:
σ
σ 

Iα =
, X + z α /2
 X − z α /2

n
n

Datos:=
n 19;=
X 50 ; =
σ2 38;1 −=
α 0.99 y en la distribución normal
=
Z
F(Z < z α /2 )=
X −µ
≡ N(0,1)
σ n
α
+ 1 − α= 0.995 ⇒ z α /2= 2.575
2

38
38 
,50 + 2.575
⇒ Iα=0.01 =
 50 − 2.575
 =( 46.3584,53.6416 )
19
19


DERIVE:
#1:
NSOLVE(NORMAL(z) = 0.995, z, Real)
#2:
z = 2.575829327
EXCEL: =DISTR.NORM.INV(0,995;0;1)
2,5758313
SPSS: IDF. NORMAL(0.995, 0,1)
2,58
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
22
Intervalos de Confianza
13.- Se quieren estudiar la vida útil de unas baterías para móviles. Si admitimos
que la varianza de la distribución normal de la vida de las baterías es igual a 1.44,
¿qué tamaño muestral deberíamos utilizar para que la semiamplitud del intervalo
de confianza para la media del 95% no sea superior al 0,2?
Solución:
Supongamos que el error máximo que queremos admitir es ε . El intervalo será
(µ − ε, µ + ε)
y con nivel de significación α , comparando con el intervalo obtenido,
z σ
σ
 z σ   1.96 ⋅1.2 
= ε ⇔ n = α /2 ⇔ n =  α /2  = 
 = 138.2976
ε
n
 ε   0.2 
2
tenemos que: z α /2
2
Luego necesitamos que n sea igual a 139
Tenemos
=
Z
X −µ
≡ N(0,1)
σ n
P ( −z α < Z < z α ) =
1− α =
1 − 0.05 =
0.95 ⇒ F(z α ) =
P ( Z < zα ) =
0.975
DERIVE:
#1:
#2:
NSOLVE(NORMAL(z) = 0.975, z, Real)
z = 1.959963962
EXCEL: =DISTR.NORM.INV(0,975;0;1)
1,9599628
SPSS: IDF. NORMAL(0.975, 0,1)
1,96
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
23
Intervalos de Confianza
14.- Suponiendo que la producción de trigo por hectárea es una variable aleatoria
con distribución normal, sabiendo que en 25 fincas elegidas al azar se produjeron
de media 3200 kg por ha, y la desviación típica fue de 40 kg por ha, calcular:
a) Intervalo de confianza al 95% de la producción media de trigo por ha.
b) Intervalo de confianza al 95% de la varianza.
Solución:
La producción de trigo por hectárea sigue una distribución N ( µ, 40 )
El intervalo de confianza para una población normal de varianza conocida es:
σ
X ± z α /2
n
a) Para nuestros datos:
X
= 3200; σ
= 40; =
n 25; α
= 0.05
Tenemos
=
Z
X −µ
≡ N(0,1)
σ n
P ( −z α /2 < Z < z α /2 ) =
1− α =
1 − 0.05 =
0.95 ⇒ F(z α /2 ) =
P ( Z < z α /2 ) =
0.975
DERIVE:
#1: NSOLVE(NORMAL(z) = 0.975, z, Real)
#2:
z = 1.959963962
EXCEL: =DISTR.NORM.INV(0,975;0;1)
1,95996279
O directamente
=INTERVALO.CONFIANZA(0,05;6,2;40)
X ± z α /2
SPSS: IDF. NORMAL(0.975, 0,1)
1,92136343
σ
=
3200 ± 15, 6797119
n
1,96
40
40 

⇒ Iα=0.05 =  3200 − 1.96
,3200 + 1.96
=
25
25 

( 3184.320,3215.68)
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
24
Intervalos de Confianza
 (n − 1).S2
(n − 1).S2 
< σ2 <
b) P 
 = 1− α
k1
 k2

Buscaremos los valores de k1 y k2 tales que:
P ( χ 224 < k1 ) =
0.025
P ( χ 224 < k 2 ) =
0.975
, obtenemos
k1=12,4011503y k2= 39,3640771.
 24 ⋅ 402
24 ⋅ 402 
2
< σ2 <
=
P
 0,95 ⇒ 975,508709 < σ < 3096, 48695
12, 4011503 
 39,3640771
DERIVE:
#1:
#2:
NSOLVE(CHI_SQUARE(k, 24) = 0.025, k, 0, 40)
k = 12.40115026
#3:
#4:
NSOLVE(CHI_SQUARE(k, 24) = 0.975, k, 0, 40)
k = 39.98770495
EXCEL:
=INV.CHICUAD (0,025;24)
12,4011503
=INV.CHICUAD (0,975;24)
39,3640771
SPSS: IDF. CHISQ(0.975,24)
IDF. CHISQ(0.025,24)
12,4
39,36
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
25
Intervalos de Confianza
15.- Se han recogido firmas para una petición, en cada hoja caben 42 firmas, pero
existen hojas que no están firmadas totalmente. Para una muestra de 50 hojas se
tienen los resultados
=
x
1471
=
y S2 229 . Se pide dar un intervalo de confianza
50
para la media al 80%.
Solución:
Tenemos una muestra de tamaño grande (n=50) y varianza desconocida de una
distribución normal:
S
S 

Iα =
, X + zα / 2
 X − zα / 2

n
n

Datos:
=
X
1471
=
; S2 229; =
1 − α 0.8
50
y en la distribución normal F(z α / 2 )=
α
+ 1 − α= 0.9 ⇒ z α / 2= 1.28
2
DERIVE:
#1:
NSOLVE(NORMAL(z, 0, 1) = 0.9, z, Real)
#2:
z = 1.281551569
EXCEL: =DISTR.NORM.INV(0,9;0;1)
1,281552
O directamente
=INTERVALO.CONFIANZA(0,2;raiz(229);50)
X ± zα / 2
SPSS: IDF. NORMAL(0.9, 0,1)
2,742640919
S 1471
= ± 2, 742640919
50
n
1,2815515655
WOLFRAMALPHA: normal distribution, mean=0,sd=1 1.28155 (Percentil 90)
 1471
229 1471
229 
,
⇒ Iα=0.2 = 
− 1.28
+ 1.28
 = ( 26.68,32.16 )
50
50
50
50


Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
26
Intervalos de Confianza
16.- Sea X la v. a. número de errores al realizar una nivelación. Se estudian 40
nivelaciones escogidas al azar. Los resultados son: X = 18.5 y S = 4. Se pide:
a) Intervalo de confianza del 95% para la media.
b) Intervalo de confianza para la varianza con un nivel de significación de α =0.01
Solución:
a)
Tenemos una muestra de tamaño grande (n=40) y varianza desconocida de una
distribución normal:
S
S 

Iα =
, X + z α /2
 X − z α /2

n
n

Datos: X= 18.5 ; S= 4; α= 0.05 y en la distribución normal
α
+ 1 − α= 0.975 ⇒ λ α /2= 1.96
F(Z < z α /2 )=
2
4
4 

,18.5 + 1.96
⇒ Iα=0.05 =18.5 − 1.96
 = (17.867545,19.132455 )
40
40 

 (n − 1).S2
(n − 1).S2 
< σ2 <
P
 = 1− α
k
k


2
1
Datos: S= 4; α= 0.01 y en la distribución Chi-cuadrado
b)
Buscaremos los valores de k1 y k2 tales que:
2
P ( χ39
< k1 ) =
0.005
2
P ( χ39
< k2 ) =
0.995
, obtenemos k1=
19,9958679 y k2= 65,4755709
 39 ⋅ 42

39 ⋅ 42
2
< σ2 <
=
P
 0,99 ⇒ 9,53 < σ < 31, 21
19,99586787 
 65,4755709
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
27
Intervalos de Confianza
17.- Se han realizado 15 mediciones de una misma magnitud, se supone que se
distribuye normalmente, habiéndose observado los siguientes resultados:
40,15
40,10
40,5
40,4
40,2
40,4
40,4
40,35 40,2
40,6
40,25
40,2
40,9
40,25 40,4
c) Hallar un Intervalo de confianza del 99% para la varianza.
d) ¿Cuántas mediciones deberían haberse utilizado si se requiere una precisión
en la media de ±0,1 y una confianza del 95%?
Solución:
2
X= 40,353;S=
0, 04195238; n= 15; α= 0, 01
(n − 1). S 2
a) Sabiendo que
≡ χ n2 −1 si la población de partida es N(µ, σ)
2
σ
 (n − 1).S2
(n − 1).S2 
< σ2 <
P
 = 1− α
k1
 k2

Buscaremos los valores de k1 y k2 tales que:
2
P ( χ14
< k1 ) =
0.005
2
P ( χ14
< k2 ) =
0.995
k2 =31,3193496; k1 = 4,07467497
14 ⋅ 0, 04195238 
 14 ⋅ 0, 04195238
P
0,99 ⇒ 0, 01875305 < σ2 < 0,14414238
< σ2 <
=

4, 07467497 
 31,3193496
S
b) X ± t α / 2
n
Buscaremos en la tabla un valor t α / 2 tal que P ( − t α / 2 < t n −1 < t α / 2 ) = 1 − α .
P ( t n −1 < t α / 2 ) =
1 − α ⇔ P ( t n −1 > t α / 2 ) =
α ⇒ P ( t14 > t α / 2=
0, 05 ⇒ t 0,025 =
2,14478669
0,025 ) =
Para que la precisión en la media sea de 0,1, se tiene que:
2
t α /2
2
2
S
 t ⋅S   t 
 2,14478669 
= 0,1 ⇒ n =  α /2  =  α /2  ⋅ S2 = 
 0, 04195238 = 19,29855577
0,1
n
 0,1   0,1 


Por lo que el tamaño de la muestra será de 20.
Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.
28
Intervalos de confianza para la media
a) Población normal con varianza conocida.
  

Sabemos que   N ,  , luego  
 N(0,1) . Queremos calcular un intervalo   de

n
 n
forma que la P      1   .
A 1  se le llama nivel de confianza
A  se le llama nivel de significación y es la probabilidad de que el parámetro no esté
en el intervalo.
Buscaremos en la N(0,1) un valor  de forma que P         1   como ,  y n


 
,  
son conocidos, tenemos el intervalo       
.

n
n

El intervalo de confianza sería: x  
n
b) Población cualquiera de varianza finita y muestras grandes.

Sabemos que   N(,
) . Razonando igual que antes, si la varianza es conocida el
n


 
intervalo será P   

  1   para n>30.

n
n
Si la varianza es desconocida la estimamos por la cuasivarianza, y queda:

S
S
S
P   

.
  1   para n>100 y el intervalo es x  

n
n
n
c) Población normal con varianza desconocida.
Buscaremos en un valor t  tal que P  t   t n1  t    1   y el correspondiente intervalo
S
S 

de confianza será: P    t 
     t
  1 
n
n

S
y si queremos determinar el tamaño muestral n, resulta
Para una muestra concreta: x  t 
n
2
t
S
 t .S 
  de donde n     .
n
  
Intervalos de confianza para la varianza
(n  1). S 2
  n2 1 si la población de partida es N(,  ) . Por tanto, para tomar el
2

intervalo de confianza de nivel de significación  , buscamos los valores k 1 y k 2 , tal que:
Se sabe que


(n  1). S 2
 k2  1  .
P k 1 
2



Se nos plantea el problema de que la distribución  n21 no es simétrica (como ocurría con
la Normal y la t de Student) por lo que no es posible determinar con exactitud los valores k 1 y k 2
para que el intervalo esté centrado en S2.
Una solución aproximada y generalmente buena es determinar k 1 y k 2 con las


condiciones: P  n21  k 1  y P  n21  k 2 
2
2




Método de máxima verosimilitud
Método de inferencia estadística que consiste en elegir el valor del parámetro que hace más
probables (más verosímiles) los valores obtenidos en la muestra.
Este método fue usado por Gauss en el caso especial de la distribución Normal para
justificar el método de los mínimos cuadrados y posteriormente desarrollado por R. A.
Fisher en sus aspectos esenciales.
Si tomamos una muestra  1,  2 ,...,  n de una población que depende de unos
parámetros  1,  2 ,...,  n , sabemos que cada  i tiene la misma distribución que la población:
f  xi ,  1,  2 ,...,  n  .
La probabilidad de que salga una muestra  1,  2 ,...,  n viene dada por:
n
f  x1,  1,  2 ,...,  n ... f  xn ,  1,  2 ,...,  n    f  xi ,  1,  2 ,...,  n   L x1,..., xn , 1,  2 ,...,  n 
i 1
que es la llamada función de verosimilitud.
La idea de este método es coger como estimadores los valores que hacen máxima
esta función, basándose en el principio lógico de suponer que los parámetros toman los
valores que hacen máxima la probabilidad de obtener cada muestra.
Es más cómodo manejar log L, y lo podemos hacer ya que los valores que
maximicen L, maximizan log L (por ser el logaritmo una función monótona creciente). En la
 logL
 0 . Estas
mayoría de los casos, basta con hallar los valores que anulan su derivada:
 i
ecuaciones que deben satisfacer los parámetros son las ecuaciones de máxima verosimilitud.
Observación: El método de máxima verosimilitud no siempre produce estimadores
insesgados.
Descargar