Capítulo 8: Inferencia Hipótesis nula Hipótesis alternativa Formula una teoría Inferencia Recoge datos para probar la teoría Interpreta y toma una decisión Distribuciones muestrales Modelos Probabilidades Obtiene resultados Estadística Descriptiva Muestreo Diseño estudio Capítulo 8: Inferencia simple para proporciones y medias 8.1 Tomando decisiones acerca proporción de una población de la Lo que nos interesa es investigar sobre una proporción de una población. Hipótesis Escriba las hipótesis nula y alternativa que usaría para probar las siguientes aseveraciones. Las hipótesis deben ser expresadas en términos de P, la proporción de interés en la población. a) En Chile más de la mitad de los embarazos no son planeados. b) Menos del 3% de niños vacunados contra la rubéola adquieren la enfermedad. c) En Chile la proporción de personas con intolerancia a la lactosa es diferente a 0,25. Mejora el proceso? Un estudiante en su tesis asegura que su recién creado proceso para empastar libros tiene menor tasa de fallas que un antiguo proceso usado por la imprenta local. La tasa de fallas del antiguo proceso era de 30%. Use un 5% de nivel de significancia. Datos: Se saca una muestra de 80 artículos producto del nuevo proceso y 16 tienen fallas. a) ¿Las hipótesis nula y alternativa apropiadas son? b) Encuentre el valor p del test. c) ¿Es el nuevo proceso mejor? Hipótesis: H 0 : P = 0,3 versus H 1 : P < 0,3 α=0.05 16 p = = 0,2 Datos: ˆ 80 ˆ < 0,2 | H 0 El valor p= P( p : P = 0,3 cierta) Si Ho es cierta entonces: 0,3 × 0,7 pˆ ~& N 0,3, 80 Valor p= P(Z < − 0,1 0,2 − 0,3 ) = P(Z < ) = P(Z < −1,95) 0,0512348 0,3 × 0,7 80 valor p = P(Z > 1,95) = 1 − P(Z < 1,95) valor p = 1 − 0,9744 = 0,0256 valor p=0,0256 < α=0,05 Decisión: rechazar Ho Conclusión: Los datos son estadísticamente significativos. El estudiante tiene suficiente evidencia para concluir que su proceso disminuye significativamente la tasa de fallas, con un nivel de significación del 5%. Pasos en una prueba de hipótesis: 1. Establecer la hipótesis 2. Definir el nivel de significación 3. Obtener los datos 4. Definir el test estadístico y verificar los supuestos 5. Calcular el test estadístico observado bajo H0 6. Calcular el valor p 7. Tomar la decisión con respecto a H 0 8. Conclusión del investigador Distribución muestral de p$ , la proporción muestral Si p representa la proporción de elementos en una población con alguna característica de interés. Tomamos una muestra aleatoria simple tamaño n de esa población y n es “suficientemente” grande, entonces la distribución de p$ es aproximadamente normal: P (1 - P ) pˆ ~& N P, n entonces podemos construir la proporción muestral estandarizada: Z= pˆ - P ~& N(0, 1) P(1 − P ) n Test Z para una proporción en la población • Queremos docimar una hipótesis acerca del parámetro en la población P. La hipótesis nula es H 0 : P = p0 , donde p0 es un valor hipotético de P. • Supuestos: Se recomienda usar este test cuando los datos provienen de una muestra aleatoria de tamaño n, donde n satisface que np 0 y n(1 − p0 ) es mayor o igual a 10. • Nuestra decisión acerca de P estará basada en el valor de la proporción muestral estandarizada p̂ , la cual es: Z= p$ − p0 p0 (1 − p0 ) n • Este “score” o puntaje z es el test estadístico, y su distribución bajo H0 es aproximadamente N ( 0,1) . Notar que el test estadístico es el mismo, y no depende de la hipótesis alternativa. • Calculamos el valor-p del test, el cuál depende de la hipótesis alternativa: Test Unilateral, cola superior H1 : p > p0 , entonces el valor-p es P( Z > z obs ) es el área a la derecha del test estadístico observado bajo H 0 . Si N(0,1) p-value Z OBS Z Test Unilateral, cola inferior Si H1 : p < p0 , entonces el valor-p es P( Z < z obs ) es el área a la izquierda del test estadístico observado bajo H 0 N(0,1) p-value Z Z OBS Test Bilateral Si H1 : p ≠ p0 , entonces el valor-p es 2 P ( Z > z obs ) es el área afuera de las dos colas del test estadístico observado bajo H 0 . N(0,1) p-value 2 p-value 2 -ZOBS +ZOBS Z • Decisión: Si el valor-p es menor o igual al nivel de significación rechazamos H0. PES Se diseña un experimento para averiguar si una persona tiene poderes extrasensoriales (PES). De un mazo corriente bien barajado, se eligen 96 cartas, una por una, con reemplazo. A la persona en cuestión se le pide que adivine la pinta de la carta. Tiene 4 posibilidades para cada carta, trebol, corazones, diamante o piques. Queremos docimar la hipótesis de que el sujeto esta solo adivinando y no tiene poderes extrasensoriales, contra la alternativa de que el sujeto tiene poder extrasensorial. Hipótesis: Nivel de significancia: α = 0.05 Verificación de supuestos: Datos: La persona tiene 35 correctas de las 96 cartas. Test Estadístico Observado: z= valor-p: Decisión: Rechazo Conclusión: H0 Acepto H0 porque.... Respuesta: Hipótesis: H 0 : P = 0,25 versus H 1 : P > 0, 25 α = 0,05 Verificación de supuestos: np 0 = 24 y n (1 − p 0 ) = 72 35 pˆ = = 0,364583 Datos: 96 Test Estadístico Observado: 35 / 96 − 0,25 0,114583 = = 2,59 Z= 0,25 × 0,75 0,044194 96 valor-p: P(Z > 2,59) = 1 − P(Z < 2,59) = 1 − 0,9952 = 0,0048 Decisión: Con un nivel de significancia de 0,05, rechazo H 0 porque el valor p es menor que α Conclusión: Tenemos suficiente evidencia para concluir que el sujeto es adivino con un nivel de significación del 5%