Estadı́stica II Curso 2010/2011 Licenciatura en Matemáticas Relación 1 de problemas 1. El fichero primitiva.RData contiene los números extraı́dos en los sorteos de la loterı́a primitiva española durante varias semanas. Contrasta la hipótesis de que todos los números aparecen con la misma probabilidad a nivel α = 0,01. 2. El fichero goles0809.RData contiene tres variables correspondientes a los goles marcados por el equipo de casa, el equipo de fuera y el número total de goles en cada uno de los 380 partidos de la liga española de fútbol de primera división (año 2008-09). Aplica un contraste χ2 de bondad de ajuste para contrastar (a nivel α = 0,05) si el número de goles marcados por equipo y partido sigue una distribución de Poisson. Repite el ejercicio para la diferencia de goles entre los dos equipos que juegan un partido. 3. El número de asesinatos cometidos en Nueva Jersey cada dı́a de la semana durante el año 2003 se muestra en la tabla siguiente: Dı́a Lunes Martes Miércoles Jueves Viernes Sábado Domingo Frecuencia 42 51 45 36 37 65 53 (a) Contrasta a nivel α = 0,05, mediante un test χ2 , la hipótesis nula de que la probabilidad de que se cometa un asesinato es la misma todos los dı́as de la semana. (b) ¿Podrı́a utilizarse el test de Kolmogorov-Smirnov para contrastar la misma hipótesis? Si tu respuesta es afirmativa, explica cómo. Si es negativa, explica la razón. (c) Contrasta la hipótesis nula de que la probabilidad de que se cometa un asesinato es la misma desde el lunes hasta el viernes, y también es la misma los dos dı́as del fin de semana (pero no es necesariamente igual en fin de semana que de lunes a viernes). 4. Se clasificaron 1000 individuos de una población según el sexo y según fueran normales o daltónicos. Masculino Femenino Normal 442 514 Daltónicos 38 6 1 Según un modelo genético las probabilidades deberı́an ser: 1 2 p 1 2 q 1 2 p2 + pq 1 2 q2 donde q = 1 − p = proporción de genes defectuosos en la población. A partir de la muestra se ha estimado que q = 0,087. ¿Concuerdan los datos con el modelo? Dar una respuesta con nivel de significación 0,05. 5. (a) Aplica el test de Kolmogorov-Smirnov, al nivel 0.05, para contrastar si la muestra (3.5, 4, 5, 5.2, 6) procede de la U (3, 8). (b) Aplica el test de Kolmogorov-Smirnov, al nivel 0.05, para contrastar la hipótesis de que la muestra (0, 1.2, 3.6) procede de la distribución N(µ = 1; σ = 5). 6. A finales del siglo XIX el fı́sico norteamericano Newbold descubrió que la proporción de datos que empiezan por una cifra d, p(d), en listas de datos correspondientes a muchos fenómenos naturales y demográficos es aproximadamente: d+1 , d = 1, 2, . . . , 9. p(d) = log10 d Por ejemplo, p(1) = log10 2 ≈ 0,301030 es la frecuencia relativa de datos que empiezan por 1. A raı́z de un artı́culo publicado en 1938 por Benford, la fórmula anterior se conoce como ley de Benford. El fichero poblacion.RData incluye la población total de los municipios españoles, ası́ como su población de hombres y de mujeres. (a) Contrasta a nivel α = 0,05 la hipótesis nula de que la población total se ajusta a la ley de Benford. (b) Repite el ejercicio pero considerando sólo los municipios de más de 1000 habitantes. (c) Considera las poblaciones totales (de los municipios con 10 o más habitantes) y contrasta a nivel α = 0,05 la hipótesis nula de que el primer dı́gito es independiente del segundo. (Indicación: Puedes utilizar, si te sirven de ayuda, las funciones del fichero benford.R). 7. En 1990 se publicó un estudio sobre la asociación entre tipo de hospital y mortalidad después de una operación de alto riesgo durante el mes de julio [Blumberg (1990) Journal of the American Medical Association]. Se seleccionaron 139 pacientes de operaciones de alto riesgo en hospitales universitarios y 528 en otros tipos de hospitales. De los pacientes tratados en hospitales universitarios murieron 32. De la muestra extraı́da de otros hospitales murieron 62. Contrasta la hipótesis nula de que el tipo de hospital es independiente de la mortalidad. 2 8. Demuestra que en el caso k = 2, la distribución del estadı́stico del contraste χ2 de bondad de ajuste converge a una distribución χ21 , es decir, T = (O1 − E1 )2 (O2 − E2 )2 + →d χ21 , si n → ∞. E1 E2 [Indicación: Hay que demostrar que T = Xn2 , donde Xn →d N(0, 1)]. 3