Relación 1 de problemas

Anuncio
Estadı́stica II
Curso 2010/2011
Licenciatura en Matemáticas
Relación 1 de problemas
1. El fichero primitiva.RData contiene los números extraı́dos en los sorteos de la loterı́a
primitiva española durante varias semanas. Contrasta la hipótesis de que todos los números
aparecen con la misma probabilidad a nivel α = 0,01.
2. El fichero goles0809.RData contiene tres variables correspondientes a los goles marcados
por el equipo de casa, el equipo de fuera y el número total de goles en cada uno de los 380
partidos de la liga española de fútbol de primera división (año 2008-09). Aplica un contraste
χ2 de bondad de ajuste para contrastar (a nivel α = 0,05) si el número de goles marcados
por equipo y partido sigue una distribución de Poisson. Repite el ejercicio para la diferencia
de goles entre los dos equipos que juegan un partido.
3. El número de asesinatos cometidos en Nueva Jersey cada dı́a de la semana durante el año
2003 se muestra en la tabla siguiente:
Dı́a
Lunes
Martes
Miércoles
Jueves
Viernes
Sábado
Domingo
Frecuencia
42
51
45
36
37
65
53
(a) Contrasta a nivel α = 0,05, mediante un test χ2 , la hipótesis nula de que la probabilidad
de que se cometa un asesinato es la misma todos los dı́as de la semana.
(b) ¿Podrı́a utilizarse el test de Kolmogorov-Smirnov para contrastar la misma hipótesis? Si
tu respuesta es afirmativa, explica cómo. Si es negativa, explica la razón.
(c) Contrasta la hipótesis nula de que la probabilidad de que se cometa un asesinato es la
misma desde el lunes hasta el viernes, y también es la misma los dos dı́as del fin de semana
(pero no es necesariamente igual en fin de semana que de lunes a viernes).
4. Se clasificaron 1000 individuos de una población según el sexo y según fueran normales o
daltónicos.
Masculino Femenino
Normal
442
514
Daltónicos
38
6
1
Según un modelo genético las probabilidades deberı́an ser:
1
2
p
1
2
q
1
2
p2 + pq
1
2
q2
donde q = 1 − p = proporción de genes defectuosos en la población. A partir de la muestra
se ha estimado que q = 0,087. ¿Concuerdan los datos con el modelo? Dar una respuesta con
nivel de significación 0,05.
5. (a) Aplica el test de Kolmogorov-Smirnov, al nivel 0.05, para contrastar si la muestra (3.5,
4, 5, 5.2, 6) procede de la U (3, 8).
(b) Aplica el test de Kolmogorov-Smirnov, al nivel 0.05, para contrastar la hipótesis de que
la muestra (0, 1.2, 3.6) procede de la distribución N(µ = 1; σ = 5).
6. A finales del siglo XIX el fı́sico norteamericano Newbold descubrió que la proporción
de datos que empiezan por una cifra d, p(d), en listas de datos correspondientes a muchos
fenómenos naturales y demográficos es aproximadamente:
d+1
, d = 1, 2, . . . , 9.
p(d) = log10
d
Por ejemplo, p(1) = log10 2 ≈ 0,301030 es la frecuencia relativa de datos que empiezan por 1.
A raı́z de un artı́culo publicado en 1938 por Benford, la fórmula anterior se conoce como ley de
Benford. El fichero poblacion.RData incluye la población total de los municipios españoles,
ası́ como su población de hombres y de mujeres.
(a) Contrasta a nivel α = 0,05 la hipótesis nula de que la población total se ajusta a la ley
de Benford.
(b) Repite el ejercicio pero considerando sólo los municipios de más de 1000 habitantes.
(c) Considera las poblaciones totales (de los municipios con 10 o más habitantes) y contrasta
a nivel α = 0,05 la hipótesis nula de que el primer dı́gito es independiente del segundo.
(Indicación: Puedes utilizar, si te sirven de ayuda, las funciones del fichero benford.R).
7. En 1990 se publicó un estudio sobre la asociación entre tipo de hospital y mortalidad
después de una operación de alto riesgo durante el mes de julio [Blumberg (1990) Journal of the
American Medical Association]. Se seleccionaron 139 pacientes de operaciones de alto riesgo
en hospitales universitarios y 528 en otros tipos de hospitales. De los pacientes tratados en
hospitales universitarios murieron 32. De la muestra extraı́da de otros hospitales murieron 62.
Contrasta la hipótesis nula de que el tipo de hospital es independiente de la mortalidad.
2
8. Demuestra que en el caso k = 2, la distribución del estadı́stico del contraste χ2 de bondad
de ajuste converge a una distribución χ21 , es decir,
T =
(O1 − E1 )2 (O2 − E2 )2
+
→d χ21 , si n → ∞.
E1
E2
[Indicación: Hay que demostrar que T = Xn2 , donde Xn →d N(0, 1)].
3
Descargar