Práctica III

Anuncio
R PRÁCTICA
III
Bondad de Ajuste
Sección III.1
Contraste χ2
29.
Se lanza un dado 1200 veces y se obtienen los siguientes resultados:
Xi
Oi : frecuencia
1
175
2
215
3
220
4
190
5
170
6
230
a) Calcular el estadı́stico de contraste χ2 .
b)
χ2
Hallar el nivel de significación (P-valor) de la prueba y decidir si se acepta que el dado es
regular.
χ2g.l.
p − value
30.
El fichero pi.digitos.txt contiene los 1000 primeros decimales del número. Contrasta la hipótesis de
que todos los dı́gitos aparecen con la misma probabilidad.
χ2
p − value
31.
Durante la Segunda Guerra Mundial se dividió el mapa de Londres en cuadrı́culas de 1/4 km y se
contó el número de bombas caı́das en cada cuadrı́cula durante un bombardeo alemán. Los resultados
fueron:
x: Impactos en cuadrı́cula
Oi : frecuencia
0
229
1
211
2
93
3
35
4
7
5
1
Se quiere contrastar la hipótesis de que los datos siguen una distribución de Poisson. Se pide:
a) Abrir un nuevo conjunto de datos o data.frame de nombre londres.
13
CAPÍTULO III. BONDAD DE AJUSTE
b)
Diseñar las columnas adecuadas que registren las frecuencias observadas y las esperadas.
c) Calcular el estadı́stico de contraste χ2 .
d)
Hallar el nivel de significación (P-value) de la prueba y decidir si se acepta que los datos de la
muestra se ajustan a la distribución teórica.
p − valor
32.
El tiempo de vida de 70 motores se registra en la siguiente tabla:
Años de funcionamiento
Oi : frecuencia
(0, 1)
30
(1, 2)
23
(2, 3)
6
(3, 4)
5
≥4
6
Contrastar la hipótesis de que los datos siguen una distribución exponencial con el estadı́stico de
contraste χ2 .
Sección III.2
Contraste de Shapiro-Wilk
33.
Con Datos - Conjunto de datos en paquetes Leer conjunto de datos.. del paquete datasets cargar el
fichero de nombre trees.
a) Efectuar el contraste de normalidad para la variable volumen de madera Volumen.
W
b)
Efectuar el contraste de normalidad para la variable logaritmo del volumen de madera Volumen.
W
Sección III.3
Contraste de Kolmogorov-Smirnov
34.
Vamos a realizar el contraste de normalidad de la variable PESO del fichero pesoaltura.rdat. Dado
que el número de individuos es grande, n = 100, se utilizará el test de Kolmogorov-Smirnov.
a) Con Datos - Importar datos - desde archivo... incorporamos el fichero pesoaltura.rdat en Rcommander con el nombre de peso.altura.
b)
Calculamos los estimadores de µ y σ,resultando
x=
sb =
c) A continuación se contrastan las diferencias entre la función de distribución empı́rica muestral
y la distribución teórica normal de parámetros, N (b
µ; σ
b). Para ello se empleará el procedimiento
ks.test, y
Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz
14
III.3. CONTRASTE DE KOLMOGOROV-SMIRNOV
35.
1)
resulta una distancia de Kolmogorov.
D
2)
3)
un p-valor de
Concluir si los datos se ajustan a la distribución normal.
p − value
En el fichero Pulso Se pide:
a) Contrastar si la variable aleatoria peso de los hombres PesoH se ajusta a una distribución
normal.
36.
b)
Contrastar si la variable aleatoria peso de las mujeres PesoM se ajusta a una distribución
normal.
c)
Contrastar si la variable aleatoria altura de los hombres AlturaH se ajusta a una distribución
normal.
d)
Contrastar si la variable aleatoria altura de las mujeres AlturaM se ajusta a una distribución
normal.
Los siguientes datos corresponden a la duración de diez pilas de cierta marca en cientos de horas.
i
xi
1
0.023
2
0.406
3
0.538
4
1.267
5
2.343
6
2.563
7
3.334
8
3.491
9
5.088
10
5.587
Se quiere contrastar si la variable aleatoria duración de vida de las pilas se ajusta a una distribución
de tipo exponencial. Se pide:
a) Sabiendo que la función de distribución exponencial es FX (x) = 1 − e−α x , determinar su
expresión si α se estima con α̂ = x̄−1 .
α̂
37.
b)
Determinar la distancia de Kolmogorov.
D
c)
Concluir si los datos se ajustan a la distribución exponencial dada.
Los siguientes datos corresponden a la presión de rotura de determinado tipo de vidrio en unidades
de lb/pulg 2 .
i
xi
i
xi
1
4.90
7
40.29
2
8.60
8
41.19
3
11.42
9
43.55
4
15.46
10
44.62
5
19.19
11
53.56
6
20.69
12
77.61
Se quiere contrastar si la variable aleatoria presión de rotura del vidrio se ajusta a una distribución
de tipo Weibull con parámetro de forma β = 2 y parámetro θ desconocida. Se pide:
β
a) Sabiendo que la función de distribución de tipo Weibull es FX (x) = 1 − e−(x/θ) , determinar
su expresión si θ se estima con
n
1X β
θ̂β =
x .
n i=1 i
θ̂
Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz
15
CAPÍTULO III. BONDAD DE AJUSTE
b)
Determinar la distancia de Kolmogorov
D
c) Decidir si los datos se ajustan a la distribución de Weibull dada.
d)
38.
Para realizar este contraste, ¿con qué método deben estimarse los parámetros?
Losa siguientes datos corresponden al peso de unos gránulos de cobre en unidades de 10−4 gramos.
i
xi
i
xi
1
2
11
6.1
2
3
12
6.6
3
3.1
13
7.3
4
4.3
14
7.6
5
4.4
15
8.3
6
4.8
16
9.1
7
4.9
17
11.2
8
5.1
18
14.4
9
5.4
19
16.7
10
5.7
20
19.8
Se quiere contrastar si la variable aleatoria peso de los gránulos de cobre se ajusta a una distribución
de tipo logarı́tmico normal, es decir si los logaritmos de los pesos se ajustan a una distribución
normal. Se pide:
a) Diseñar las columnas apropiadas en R para efectuar el contraste.
b)
Sea Y = Ln X, siendo X el peso. Hallar
Ȳ
SY
c) Determinar la distancia de Kolmogorov.
d)
D
Concluir si los datos se ajustan a la distribución supuesta.
Soluciones
29. a) 15.75 b) 0.007595
30. X-squared = 4.74, df = 9, p-value = 0.8564
31. c) 1.0118
d ) 0.908
33. a) 0.8876
b) 0.9643
34. b) x = 73, 37 sb = 12, 69
c) D = 0.136, p-value = 0.04939
36. a) α
b = 0.4058442 b) D = 0.2136, p-value = 0.677
37. a) θb = 38.03854 b) D = 0.2439, p-value = 0.4075
Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz
16
Descargar