Intervalos de Confianza y Contrastes de Hipótesis

Anuncio
Estadı́stica
Tema 4: Estadı́stica Inferencial
Unidad 1: Intervalos de Confianza y Contrastes de Hipótesis
Área de Estadı́stica e Investigación Operativa
Licesio J. Rodrı́guez-Aragón
Diciembre 2010
Contenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Estimación por Intervalos
3
Intervalos de Confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Estimación de Proporciones
Puntual vs. Intervalo . . . . . . .
Estimación de una Proporción
Ejemplo 1 . . . . . . . . . . . . . . .
Ejemplo 2 . . . . . . . . . . . . . . .
Ejercicio 1 . . . . . . . . . . . . . . .
Intervalos para Medias
Intervalo para µ cuando
Ejemplo 3 . . . . . . . . . .
Ejemplo 4 . . . . . . . . . .
Ejercicio 2 . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
. 6
. 7
. 8
10
12
σ es Desconocida
.............
.............
.............
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
14
15
18
19
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Contrastes de Hipótesis
20
Contrastes de Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Pruebas relacionadas con la Media de una Población
Prueba para µ = µ0 cuando σ es Desconocida . . . . . . . .
Ejemplo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p−valor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ejercicio 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Prueba para µ ≤ µ0 cuando σ es Desconocida . . . . . . . .
Ejemplo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ejercicio 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Pruebas relacionadas
Ejemplo 7 . . . . . . . .
Ejemplo 8 . . . . . . . .
Ejercicio 5 . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
23
24
25
26
27
28
29
31
con Proporciones
32
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1
Contenidos
Estimación por Intervalos.
Estimación de Proporciones.
Estimación de Medias.
Pruebas relacionadas con la Media de una Población.
Pruebas para Proporciones.
Aún el estimador centrado más eficiente es improbable que estime con exactitud el
valor del parámetro de la población, de ahı́ nace la necesidad de obtener un intervalo
dentro del cual se espera hallar el valor del parámetro.
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 2 / 37
3 / 37
Estimación por Intervalos
Intervalos de Confianza
Una estimación por intervalos, de un parámetro θ, es un intervalo de la forma θ̂I < θ < θ̂S tal que
se verifique,
P(θ̂I < θ < θ̂S ) = γ
con γ suficientemente próximo a 1.
Los valores θ̂I y θ̂S se denominan Lı́mites de Confianza.
Mientras que γ es el Coeficiente de Confianza.
En ocasiones, en lugar de fijar γ se fija su valor complementario, α = 1 − γ, que normalmente será
un valor pequeño.
Este α, es el Coeficiente de Significación, y representa la probabilidad de fallar en la
estimación.
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 4 / 37
2
5 / 37
Estimación de Proporciones
Puntual vs. Intervalo
La estimación de la probabilidad real, p, de éxito/fracaso o bien aceptación/rechazo de una
población es inabordable. Hemos de conformarnos con una estimación de esa probabilidad p̂.
Para ello observamos una muestra de tamaño n y cuantificamos X, casos favorables, y estimamos
p mediante p̂ = X/n.
Más que una estimación puntal del parámetro p, nos puede interesar un intervalo de la forma
p̂I < p < p̂S tal que se verifique,
P(p̂I < p < p̂S ) = γ
con γ suficientemente próximo a 1.
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 6 / 37
Estimación de una Proporción
Muestreamos una población binomial B(n, p), de la que desconocemos p, tomando una
observación X ≡ B(n, p) y buscamos estimar un intervalo de confianza para p ∈ (0, 1).
Sabemos que E(X) = np, con lo que tomaremos como estimador p̂ = X/n.
Para n suficientemente grande p̂ ≡ N (µ = p, σ 2 = pq/n), luego
P(qnorm(
1−γ
1+γ
,p,sqrt(pq/n)) < p < qnorm(
,p,sqrt(pq/n)) < γ
2
2
Los valores p y q en los lı́mites de confianza del intervalo son desconocidos, los estimamos por p̂ y
q̂ = 1 − p̂. Con lo que el intervalo para un valor γ de confianza vendrá dado por:
1−γ
1+γ
I = qnorm(
,p̂,sqrt(p̂q̂/n)), qnorm(
,p̂,sqrt(p̂q̂/n))
2
2
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 7 / 37
3
Ejemplo 1
Una empresa desea saber con un 95% de confianza el porcentaje de equipos defectuosos que
produce.
Para ello toma una muestra al azar de 250 = n equipos y comprueba que 7 = X de ellos resultan
ser defectuosos.
>
>
>
>
>
+
n<-250;
x<-7;
p<-x/n;
q<-1-p;
c(qnorm(0.025,mean=p,sd=sqrt(p*q/n)),
qnorm(0.975,mean=p,sd=sqrt(p*q/n)))
[1] 0.007550145 0.048449855
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 8 / 37
Ejemplo 1
> prop.test(x = 7, n = 250, conf.level = 0.95)
1-sample proportions test with continuity correction
data: 7 out of 250, null probability 0.5
X-squared = 220.9, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.01232396 0.05927047
sample estimates:
p
0.028
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 9 / 37
4
Ejemplo 2
Mediante una encuesta efectuada a 1000 clientes se ha estimado que 823 están satisfechos o muy
satisfechos del trato recibido. Establecer un intervalo de confianza al 95% del porcentaje de
clientes satisfechos:
>
>
>
>
>
+
n<-1000;
x<-823;
p<-x/n;
q<-1-p;
c(qnorm(0.025,mean=p,sd=sqrt(p*q/n)),
qnorm(0.975,mean=p,sd=sqrt(p*q/n)))
[1] 0.7993444 0.8466556
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 10 / 37
Ejemplo 2
> prop.test(x = 823, n = 1000, conf.level = 0.95)
1-sample proportions test with continuity correction
data: 823 out of 1000, null probability 0.5
X-squared = 416.025, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.7975972 0.8458786
sample estimates:
p
0.823
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 11 / 37
5
Ejercicio 1
Si la proporcion p permanece constante: ¿Influye en el intervalo de confianza el tamaño de la
muestra?
> prop.test(x=10,n=100,conf.level=0.95)$conf.int
[1] 0.0516301 0.1803577
attr(,"conf.level")
[1] 0.95
> prop.test(x=100,n=1000,conf.level=0.95)$conf.int
[1] 0.08245237 0.12069092
attr(,"conf.level")
[1] 0.95
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 12 / 37
6
13 / 37
Intervalos para Medias
Intervalo para µ cuando σ es Desconocida
Sea X1 , X2 , . . . , Xn una m.a.s. procedente de una N (µ, σ), con µ y σ desconocidas.
Queremos estimar µ con un nivel de confianza γ.
Estimaremos la media poblacional µ a partir de la media muestral µ̂ = X y la varianza
poblacional σ 2 a partir de la cuasivarianza muestral σ̂ 2 = Sc2 .
Buscamos µ̂I = a y µ̂S = b, extremos del intervalo de confianza, tales que:
P(a ≤ X ≤ b) = γ = 1 − α
√
√
√
P(a ≤ X ≤ b) = P((a − µ)/(Sc / n)/ ≤ (X − µ)/(Sc / n) ≤ (b − µ)/(Sc / n))
√
√
P(a ≤ X ≤ b) = P((a − µ)/(Sc / n)/ ≤ T ≤ (b − µ)/(Sc / n)) = γ
Con T ≡ tn−1 .
entonces:
√
√
(a − µ)/(Sc / n) = tn−1, 1−γ ⇒ a = µ + (Sc / n)tn−1, 1−γ
2
2
√
√
(b − µ)/(Sc / n) = tn−1, 1+γ ⇒ b = µ + (Sc / n)tn−1, 1+γ
2
0.2
Densidad
0.3
0.4
2
0.1
γ
0.0
t(n − 1, (1 − γ) 2)
−3
−2
t(n − 1, (1 + γ) 2)
−1
0
1
2
3
T
Teniendo en cuenta que para la tn−1 , tn−1, 1+γ = −tn−1, 1−γ .
2
2
√
√
P(a ≤ X ≤ b) = P(µ − (Sc / n)tn−1, 1+γ ≤ X ≤ µ + (Sc / n)tn−1, 1+γ ) =
2
2
√
√
= P(X − (Sc / n)tn−1, 1+γ ≤ µ ≤ X + (Sc / n)tn−1, 1+γ ) = γ
2
2
Luego tenemos que el intervalo de confianza para el nivel γ será,
√
√
I = [X − (Sc / n)tn−1, 1+γ , X + (Sc / n)tn−1, 1+γ ]
2
Recordemos que tn−1, 1+γ son los cuantiles
2
1+γ
2
2
de una distribución tn−1 :
qt( 1+γ
2 ,df=n-1)
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 14 / 37
7
Ejemplo 3
Crear un intervalo de confianza al 95% para la cantidad de información descargada que figura en
el fichero Webs.Rdata.
>
>
>
>
>
>
load("Webs.Rdata")
attach(Webs)
xb<-mean(Informacion);
Sc<-sd(Informacion);
n<-length(Informacion);
xb
[1] 1.343283
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 15 / 37
Ejemplo 3
√
√
I = [X − (Sc / n)tn−1, 1+γ , X + (Sc / n)tn−1, 1+γ ]
2
2
> c(xb+(Sc/sqrt(n))*qt(0.025,df=n-1),
+ xb+(Sc/sqrt(n))*qt(0.975,df=n-1))
[1] 1.234069 1.452498
> xb-(Sc/sqrt(n))*qt(0.975,df=n-1)
[1] 1.234069
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 16 / 37
8
Ejemplo 3
√
√
I = [X − (Sc / n)tn−1, 1+γ , X + (Sc / n)tn−1, 1+γ ]
2
2
> t.test(Informacion,conf.level=0.95)
One Sample t-test
data: Informacion
t = 24.5073, df = 74, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
1.234069 1.452498
sample estimates:
mean of x
1.343283
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 17 / 37
Ejemplo 4
Crear intervalos de confianza para la información media descargada para cada Portal.
> t.test(Informacion[Portal=="Compras"],
+ conf.level=0.95)$conf.int
[1] 1.134820 1.566096
attr(,"conf.level")
[1] 0.95
> t.test(Informacion[Portal=="Compras"],
+ conf.level=0.95)$estimate
mean of x
1.350458
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 18 / 37
9
Ejercicio 2
Qué ocurre al aumentar o disminuir el nivel de confianza, γ.
> t.test(Informacion,conf.level=0.99)$conf.int
[1] 1.198366 1.488200
attr(,"conf.level")
[1] 0.99
> t.test(Informacion,conf.level=0.95)$conf.int
[1] 1.234069 1.452498
attr(,"conf.level")
[1] 0.95
> t.test(Informacion,conf.level=0.80)$conf.int
[1] 1.272407 1.414160
attr(,"conf.level")
[1] 0.8
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 19 / 37
10
20 / 37
Contrastes de Hipótesis
Contrastes de Hipótesis
Los contrastes de hipótesis permitirán decidirnos entre dos hipótesis formuladas
previamente con un determinado nivel de error.
Los contrastes de hipótesis se basan en la información proporcionada por una muestra.
La terminologı́a estadı́stica habla de Aceptar o Rechazar una hipótesis:
Rechazar, significa que la hipótesis es falsa.
Aceptar, solamente implica que no se tiene suficiente información para rechazarla.
En el contraste, se plantea dos Hipótesis excluyentes y complementarias:
Hipótesis Nula, H0 : Suele ser la más concreta, la que deberı́a ser cierta por defecto.
Hipótesis Alternativa, H1 : Complementaria a la Nula.
El planteamiento de H0 permite elaborar un modelo probabilı́stico a partir del cual podemos
llegar a la decisión final.
γ
0.2
Densidad
0.3
0.4
El Contraste de Hipótesis conlleva establecer dos zonas disjuntas y complementarias, Zona de
Rechazo de H0 (Región Crı́tica) y la Zona de Aceptación de H0 .
1−α
α 2
0.1
α 2
0.0
Z((1 − γ) 2)
−3
−2
Z((1 + γ) 2)
−1
0
1
2
3
Z
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 21 / 37
11
Contrastes de Hipótesis
La decisión de aceptar o rechazar H0 se basa en probabilidades, no en certezas, al tomar la
decisión podemos cometer dos tipo de errores.
Error Tipo I: Rechazar la Hipótesis Nula, H0 siendo verdadera.
Error Tipo II: Aceptar la Hipótesis Nula, H0 siendo falsa.
Aceptar H0
Rechazar H0
H0 Verdadera
Decisión Correcta
1−α
Error Tipo I
α
H0 Falsa
Error Tipo II
β
Decisión Correcta
1−β
Las probabilidades de los Errores de tipo I y II son probabilidades condicionadas:
Nivel de Significación, α:
α = P(Error I) = P(Rechazar H0 |H0 Verdadera)
Nivel de Confianza, 1 − α = γ:
γ = 1 − P(Error I) = P(Aceptar H0 |H0 Verdadera)
Error Tipo II, β:
β = P(Error II) = P(Aceptar H0 |H0 Falsa)
Potencia del Contraste, 1 − β
1 − β = P(Rechazar H0 |H0 Falsa)
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 22 / 37
12
Pruebas relacionadas con la Media de una Población
23 / 37
Prueba para µ = µ0 cuando σ es Desconocida
Consideremos el problema de probar la hipótesis de que la media de una población, con varianza
σ 2 desconocida, sea igual a un valor concreto µ0 , en contra de una hipótesis alternativa bilateral
de que la media sea diferente.
H 0 : µ = µ0
H1 : µ 6= µ0
Sea X1 , X2 , . . . , Xn una m.a.s., el estadı́stico apropiado para este caso está basado en la media
muestral X.
Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el
intervalo a < X < b defina la Región de Aceptación y la Región Crı́tica.
Definamos,
√
T = (X − µ0 )/(Sc / n) ≡ tn−1 bajo H0 .
Los valores crı́ticos se obtienen,
γ
0.2
Densidad
0.3
0.4
√
a = µ0 + (Sc / n)tn−1, α2
√
b = µ0 + (Sc / n)tn−1,1− α2
α 2
t(α 2)
0.0
0.1
1−α
α 2
−3
−2
t(1 − α 2)
−1
0
1
2
3
T
Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X.
√
Si X cae en la Región de Aceptación, a < X < b, entonces, el estadı́stico T = (X − µ0 )/(Sc / n)
caerá en la Región de Aceptación,
|T | < tn−1,1− α2 , y se aceptará H0 .
En caso contrario, Región de Rechazo,
|T | ≥ tn−1,1− α2 , se rechazará H0 .
Recordemos que tn−1, 1+γ = tn−1,1− α2 son los cuantiles de una distribución tn−1 :
2
α
qt( 1+γ
2 ,df=n-1) = qt(1 − 2 ,df=n-1)
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 24 / 37
13
Ejemplo 5
El desarrollador del sito web afirma que por termino medio, cada conexión se descarga 1.4Mb de
información. Las conexiones que difieran de ese valor han de ser analizadas.
> t.test(Informacion,mu=1.4,
+ alt="two.sided",conf.level=0.95)
One Sample t-test
data: Informacion
t = -1.0348, df = 74, p-value = 0.3042
alternative hypothesis: true mean is not equal to 1.4
95 percent confidence interval:
1.234069 1.452498
sample estimates:
mean of x
1.343283
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 25 / 37
p−valor
Una herramienta muy útil en los contrastes de hipótesis es el p−valor.
Se define como la probabilidad de obtener un resultado al menos tan extremo como el que
realmente se ha obtenido, suponiendo que la hipótesis nula es cierta.
> pt(-1.0348,df=74)+(1-pt(1.0348,df=74))
[1] 0.3041322
Si el p−valor < α = 1 − γ, Region de Rechazo.
Si el p−valor > α = 1 − γ, Region de Aceptación.
Para un nivel de confianza γ = 0.95 la significación α = 0.05.
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 26 / 37
14
Ejercicio 3
¿Y si se afirmase que cada conexión se descarga 1.5Mb de información?
> t.test(Informacion,mu=1.5,
+ alt="two.sided",conf.level=0.95)
One Sample t-test
data: Informacion
t = -2.8592, df = 74, p-value = 0.005515
alternative hypothesis: true mean is not equal to 1.5
95 percent confidence interval:
1.234069 1.452498
sample estimates:
mean of x
1.343283
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 27 / 37
15
Prueba para µ ≤ µ0 cuando σ es Desconocida
En este caso consideremos la hipótesis de que la media de una población, con varianza σ 2
desconocida, sea menor o igual a un valor concreto µ0 , en contra de una hipótesis alternativa
unilateral de que la media sea mayor.
H 0 : µ ≤ µ0
H 1 : µ > µ0
Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo
X < a defina la Región de Aceptación y la Región Crı́tica.
Definamos,
√
T = (X − µ0 )/(Sc / n) ≡ tn−1 bajo H0 .
El valor crı́tico se obtiene,
γ
0.2
Densidad
0.3
0.4
√
√
(a − µ0 )/(Sc / n) = tn−1,1−α = tn−1,γ ⇒ a = µ0 + (Sc / n)tn−1,1−α
1−α
0.1
α
0.0
t(1 − α)
−3
−2
−1
0
1
2
3
T
Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X.
√
Si X cae en la Región de Aceptación, X < a, entonces, el estadı́stico T = (X − µ0 )/(Sc / n)
caerá en la Región de Aceptación,
T < tn−1,1−α ,
y se aceptará H0 ; en caso contrario, Región de Rechazo,
T ≥ tn−1,1−α ,
se rechazará H0 .
Recordemos que tn−1,γ = tn−1,1−α son los cuantiles de una distribución tn−1 :
qt(γ,df=n-1) = qt(1 − α,df=n-1).
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 28 / 37
16
Ejemplo 6
El desarrollador afirma que cada conexión se ha de descargar, como mucho, 1.4Mb de información.
H0 : µ ≤ 1.4
H1 : µ > 1.4
Si el p−valor < α = 1 − γ, Region de Rechazo.
Si el p−valor > α = 1 − γ, Region de Aceptación.
Para un nivel de confianza γ = 0.95 la significación α = 0.05.
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 29 / 37
Ejemplo 6
> t.test(Informacion,mu=1.4,
+ alt="greater",conf.level=0.95)
One Sample t-test
data: Informacion
t = -1.0348, df = 74, p-value = 0.848
alternative hypothesis: true mean is greater than 1.4
95 percent confidence interval:
1.251983
Inf
sample estimates:
mean of x
1.343283
> 1-pt(-1.0348,df=74)
[1] 0.8479339
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 30 / 37
17
Ejercicio 4
Y si el desarrollador afirmase que el lı́mite medio de descarga no deberı́a superar 1.2Mb.
> t.test(Informacion,mu=1.2,
+ alt="greater",conf.level=0.95)
One Sample t-test
data: Informacion
t = 2.6141, df = 74, p-value = 0.005417
alternative hypothesis: true mean is greater than 1.2
95 percent confidence interval:
1.251983
Inf
sample estimates:
mean of x
1.343283
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 31 / 37
Pruebas relacionadas con Proporciones
32 / 37
Ejemplo 7
Una fabricante de antivirus nos asegura que su producto detecta el nuevo y peligroso Virus
“VELO” por lo menos en un 90% de las ocasiones. Hemos infectado 15 ordenadores y hemos
comprobado que el antivirus ha dado positivo en 12. ¿Hay evidencias significativas para
desconfiar del fabricante?
H0 : p ≥ .9
H1 : p < .9
Si el p−valor < α = 1 − γ, Region de Rechazo.
Si el p−valor > α = 1 − γ, Region de Aceptación.
Para un nivel de confianza γ = 0.95 la significación α = 0.05.
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 33 / 37
18
Ejemplo 7
> prop.test(x=12,n=15,p=0.9,
+ alt="less",conf.level=0.95)
1-sample proportions test with continuity correction
data: 12 out of 15, null probability 0.9
X-squared = 0.7407, df = 1, p-value = 0.1947
alternative hypothesis: true p is less than 0.9
95 percent confidence interval:
0.0000000 0.9367275
sample estimates:
p
0.8
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 34 / 37
Ejemplo 8
Nuestra compañı́a telefónica propone visitar los hogares de núcleos rurales de Ciudad Real para
proporcionar y vender acceso a internet mediante 3G. Se cree que este mercado es muy atractivo
ya que, al parecer, sólo en el 25% de los hogares hay conexión a internet.
Antes de lanzar el proyecto comercial se ha efectuado un estudio piloto. Se han visitado un total
de 50 hogares y ha resultado que 18 de ellos ya poseı́an conexión a internet. A vista de estos
resultados, se puede continuar suponiendo ciertas las hipótesis de partida.
H0 : p ≤ 0.25
H1 : p > 0.25
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 35 / 37
19
Ejemplo 8
> prop.test(x=18,n=50,p=0.25,
+ alt="greater",conf.level=0.95)
1-sample proportions test with continuity correction
data: 18 out of 50, null probability 0.25
X-squared = 2.6667, df = 1, p-value = 0.05124
alternative hypothesis: true p is greater than 0.25
95 percent confidence interval:
0.2493598 1.0000000
sample estimates:
p
0.36
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 36 / 37
Ejercicio 5
Por propia experiencia, sabemos que nuestro filtro anti spam detecta el 80% de mensajes basura
que llegan a nuestra cuenta. El proveedor nos asegura que su tecnologı́a es similar a la que hay en
el mercado.
Hemos abierto una cuenta en Google y hemos reenviado 1564 mensajes de spam que estaban en
nuestra papelera. De ellos sólo han burlado el filtro 186. ¿Existen evidencias significativas para
desconfiar de nuestro proveedor actual?
H0 : p = 0.8
H1 : p 6= 0.8
> prop.test(x=1378,n=1564,p=0.8,
+ alt="two.sided",conf.level=0.95)
Licesio J. Rodrı́guez-Aragón
Tema 4, Unidad 1 – 37 / 37
20
Descargar