R PRÁCTICA III Bondad de Ajuste Sección III.1 Contraste χ2 29. Se lanza un dado 1200 veces y se obtienen los siguientes resultados: Xi Oi : frecuencia 1 175 2 215 3 220 4 190 5 170 6 230 a) Calcular el estadı́stico de contraste χ2 . b) χ2 Hallar el nivel de significación (P-valor) de la prueba y decidir si se acepta que el dado es regular. χ2g.l. p − value 30. El fichero pi.digitos.txt contiene los 1000 primeros decimales del número. Contrasta la hipótesis de que todos los dı́gitos aparecen con la misma probabilidad. χ2 p − value 31. Durante la Segunda Guerra Mundial se dividió el mapa de Londres en cuadrı́culas de 1/4 km y se contó el número de bombas caı́das en cada cuadrı́cula durante un bombardeo alemán. Los resultados fueron: x: Impactos en cuadrı́cula Oi : frecuencia 0 229 1 211 2 93 3 35 4 7 5 1 Se quiere contrastar la hipótesis de que los datos siguen una distribución de Poisson. Se pide: a) Abrir un nuevo conjunto de datos o data.frame de nombre londres. 13 CAPÍTULO III. BONDAD DE AJUSTE b) Diseñar las columnas adecuadas que registren las frecuencias observadas y las esperadas. c) Calcular el estadı́stico de contraste χ2 . d) Hallar el nivel de significación (P-value) de la prueba y decidir si se acepta que los datos de la muestra se ajustan a la distribución teórica. p − valor 32. El tiempo de vida de 70 motores se registra en la siguiente tabla: Años de funcionamiento Oi : frecuencia (0, 1) 30 (1, 2) 23 (2, 3) 6 (3, 4) 5 ≥4 6 Contrastar la hipótesis de que los datos siguen una distribución exponencial con el estadı́stico de contraste χ2 . Sección III.2 Contraste de Shapiro-Wilk 33. Con Datos - Conjunto de datos en paquetes Leer conjunto de datos.. del paquete datasets cargar el fichero de nombre trees. a) Efectuar el contraste de normalidad para la variable volumen de madera Volumen. W b) Efectuar el contraste de normalidad para la variable logaritmo del volumen de madera Volumen. W Sección III.3 Contraste de Kolmogorov-Smirnov 34. Vamos a realizar el contraste de normalidad de la variable PESO del fichero pesoaltura.rdat. Dado que el número de individuos es grande, n = 100, se utilizará el test de Kolmogorov-Smirnov. a) Con Datos - Importar datos - desde archivo... incorporamos el fichero pesoaltura.rdat en Rcommander con el nombre de peso.altura. b) Calculamos los estimadores de µ y σ,resultando x= sb = c) A continuación se contrastan las diferencias entre la función de distribución empı́rica muestral y la distribución teórica normal de parámetros, N (b µ; σ b). Para ello se empleará el procedimiento ks.test, y Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz 14 III.3. CONTRASTE DE KOLMOGOROV-SMIRNOV 35. 1) resulta una distancia de Kolmogorov. D 2) 3) un p-valor de Concluir si los datos se ajustan a la distribución normal. p − value En el fichero Pulso Se pide: a) Contrastar si la variable aleatoria peso de los hombres PesoH se ajusta a una distribución normal. 36. b) Contrastar si la variable aleatoria peso de las mujeres PesoM se ajusta a una distribución normal. c) Contrastar si la variable aleatoria altura de los hombres AlturaH se ajusta a una distribución normal. d) Contrastar si la variable aleatoria altura de las mujeres AlturaM se ajusta a una distribución normal. Los siguientes datos corresponden a la duración de diez pilas de cierta marca en cientos de horas. i xi 1 0.023 2 0.406 3 0.538 4 1.267 5 2.343 6 2.563 7 3.334 8 3.491 9 5.088 10 5.587 Se quiere contrastar si la variable aleatoria duración de vida de las pilas se ajusta a una distribución de tipo exponencial. Se pide: a) Sabiendo que la función de distribución exponencial es FX (x) = 1 − e−α x , determinar su expresión si α se estima con α̂ = x̄−1 . α̂ 37. b) Determinar la distancia de Kolmogorov. D c) Concluir si los datos se ajustan a la distribución exponencial dada. Los siguientes datos corresponden a la presión de rotura de determinado tipo de vidrio en unidades de lb/pulg 2 . i xi i xi 1 4.90 7 40.29 2 8.60 8 41.19 3 11.42 9 43.55 4 15.46 10 44.62 5 19.19 11 53.56 6 20.69 12 77.61 Se quiere contrastar si la variable aleatoria presión de rotura del vidrio se ajusta a una distribución de tipo Weibull con parámetro de forma β = 2 y parámetro θ desconocida. Se pide: β a) Sabiendo que la función de distribución de tipo Weibull es FX (x) = 1 − e−(x/θ) , determinar su expresión si θ se estima con n 1X β θ̂β = x . n i=1 i θ̂ Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz 15 CAPÍTULO III. BONDAD DE AJUSTE b) Determinar la distancia de Kolmogorov D c) Decidir si los datos se ajustan a la distribución de Weibull dada. d) 38. Para realizar este contraste, ¿con qué método deben estimarse los parámetros? Losa siguientes datos corresponden al peso de unos gránulos de cobre en unidades de 10−4 gramos. i xi i xi 1 2 11 6.1 2 3 12 6.6 3 3.1 13 7.3 4 4.3 14 7.6 5 4.4 15 8.3 6 4.8 16 9.1 7 4.9 17 11.2 8 5.1 18 14.4 9 5.4 19 16.7 10 5.7 20 19.8 Se quiere contrastar si la variable aleatoria peso de los gránulos de cobre se ajusta a una distribución de tipo logarı́tmico normal, es decir si los logaritmos de los pesos se ajustan a una distribución normal. Se pide: a) Diseñar las columnas apropiadas en R para efectuar el contraste. b) Sea Y = Ln X, siendo X el peso. Hallar Ȳ SY c) Determinar la distancia de Kolmogorov. d) D Concluir si los datos se ajustan a la distribución supuesta. Soluciones 29. a) 15.75 b) 0.007595 30. X-squared = 4.74, df = 9, p-value = 0.8564 31. c) 1.0118 d ) 0.908 33. a) 0.8876 b) 0.9643 34. b) x = 73, 37 sb = 12, 69 c) D = 0.136, p-value = 0.04939 36. a) α b = 0.4058442 b) D = 0.2136, p-value = 0.677 37. a) θb = 38.03854 b) D = 0.2439, p-value = 0.4075 Universidad de Cantabria. Alberto Luceño y Fco. Javier Glez Ortiz 16