Estadística Inferencial UNIDAD III. PRUEBAS DE HIPÓTESIS 3.4 Pruebas de hipótesis para proporciones En el caso de proporciones se mostrara mediante un ejemplo como realizar pruebas de hipótesis para muestras grandes (mayores a 30 elementos). 3.4. Pruebas de hipótesis para la proporción Gráficamente el nivel de significancia se distribuye en la curva de distribución normal tal como se muestra en la figura, nótese que en el caso de pruebas de hipótesis de medias, ésta se ubica en la parte media de la distribución de probabilidad: Ejemplo 1. El dueño de un café desea saber si la proporción de mujeres que entran a su negocio es igual al 60%. Para hacer lo anterior se realiza un muestreo aleatorio de 40 personas, dando un promedio de la muestra de 58%. Paso 1. Determinar la hipótesis Nula “Ho” y Alternativa “Ha”. Ho: La cantidad de mujeres que entra al negocio es del 60%. Ha: La cantidad de mujeres que entran al negocio NO ES del 60% (El estudiante debe describir la Ha) Nótese que la hipótesis nula considera IGUAL al 60% por lo tanto es una prueba de hipótesis de dos colas. Paso 2. Determinar el nivel de significancia. Este nivel representa la probabilidad de rechazar una hipótesis nula verdadera, matemáticamente se puede considerar cualquier valor entre cero y uno; pero para estudios de pruebas de hipótesis normalmente está entre 0.05 y 0.1. Este nivel está determinado por el analista y debe basarse en las características del estudio y el riesgo que se considere aceptable de cometer el error tipo I. Nivel de significancia del estudio para el ejemplo: α = 0.1 Ho: p = 60% Paso 3. Calcular los intervalos que implican ese nivel de significancia. Para dicho nivel de significancia (equivale a un nivel de confianza del 90%) los valores de Z son: Z = +/- 1.6448 Gráficamente queda de la siguiente manera: Ho: p = 60% Z = - 1.6448 Elaboró: MC. Marcel Ruiz Martínez Z = 1.6448 1 Estadística Inferencial 3.4. Pruebas de hipótesis para la proporción Paso 4. Calcular el “estadístico” de la prueba. Paso 5. Determinar si el estadístico cae dentro de la región que hace la Hipótesis nula verdadera. El estadístico Z se calcula de la siguiente manera: En el caso de pruebas de hipótesis para proporciones la ecuación que se usa es la siguiente: z= p̂ - p pq n Donde: p̂ Proporción muestral p Proporción poblacional (considerado en la hipótesis nula) q 1- p Inverso de “p”. n Número de elementos muestreados. z Valor de Z tipificado Para el caso del presente ejemplo: z= Z = 0.2562 p̂ - p = pq n 0.6 - 0.58 ( 0.58 )(1 − 0.58 ) = 0.2562 40 Ho: µ = 20 años Z = - 1.6448 Z = 1.6448 Como podrá notarse, el estadístico esta dentro de la región que hace verdadera la hipótesis nula. Paso 6. Aceptar o rechazar la hipótesis nula. En este caso como el estadístico de la prueba cae dentro de la región que hace verdadera la hipótesis nula, ésta se ACEPTA y se toma como falsa la hipótesis alternativa: Ho: La cantidad de mujeres que entra al negocio es del 60%. (VERDADERO) Ha: La cantidad de mujeres que entra al negocio NO es del 60%. (FALSO) Elaboró: MC. Marcel Ruiz Martínez 2 Estadística Inferencial Prueba de una cola. El procedimiento es equivalente a pruebas de una cola para medias, se considera todo el nivel de significancia en una sola cola; dependiendo de la redacción de la prueba de hipótesis nula del problema. Por ejemplo: si la hipótesis nula indica que la proporción de la población es MAYOR O IGUAL (Ho >=), la región de aceptación es a partir de una “z” hacia el infinito positivo tal como se muestra en la figura: 3.4. Pruebas de hipótesis para la proporción Proveedor de focos. Una empresa de fabricación de focos desea venderle al gobierno del estado; y para concursar con el resto de las compañías asegura que la proporción de focos que dura más de 6000 horas es de 90%; se toma una muestra de 50 focos de forma aleatoria y representativa de la población y se determina una proporción muestral de 85% ¿será cierta la afirmación del proveedor dados los datos indicados en la prueba? determine lo siguiente: a) Defina la hipótesis nula y alternativa b) Realice la prueba de hipótesis con un nivel de significancia de alfa = 0.1 Como puede notarse todo el nivel de significancia se queda en una sola cola, la cual está en los valores negativos de “z” (una cola en la izquierda) y no se divide entre dos. De manera similar cuando la hipótesis nula se indica como MENOR O IGUAL (Ho <=) a una proporción; todo el nivel de significancia se queda en una cola que está en los valores positivos de “z” (una cola a la derecha). A continuación realice los siguientes ejercicios: Dueño de un café. El dueño de un café desea saber si la proporción de mujeres que entran a su negocio es igual O MAYOR al 60%. Para hacer lo anterior se realiza un muestreo aleatorio de 40 personas, dando un promedio de la muestra de 58%; con un nivel de significancia de 0.1. Elaboró: MC. Marcel Ruiz Martínez 3 Estadística Inferencial Actividad 3.3. Problemas de hipótesis para la proporción. Problema 1. Se está estudiando colocar un negocio en una zona turística, dicho local tendrá éxito si la proporción de días en los cuales las ventas son adecuadas1 es mínimo del 80%. Se decide abrir el negocio en un periodo de prueba por 40 días2, en los cuales el 75% de los mismos las ventas son adecuadas. Se pide lo siguiente: a) Redacte la hipótesis nula y alternativa; además ¿Será correcto analizar el problema como una o como dos colas? b) Con un nivel de significancia de 0.1 determine la veracidad para la hipótesis nula Ho. 3.4. Pruebas de hipótesis para la proporción Elabore una PRÁCTICA DE EJERCICIOS de este trabajo (INDIVIDUAL), las rúbricas se indican en la liga siguiente: http://marcelrzm.comxa.com/Rubricas/Rubricas.htm SIN EL PROCEDIMIENTO LA ACTIVIDAD NO ES VÁLIDA Puede enviar el documento final por correo electrónico a las siguientes direcciones: [email protected]; [email protected]; [email protected] y [email protected] No olvide enviarse copia a sí mismo del correo que envía, si usa Outlook solicite confirmación de entrega y de lectura. NOTAS: 1. No se define cuanto sería una cantidad de ventas adecuadas para no introducir más datos o números al problema que no se requieren para su solución. 2. En un problema real los 40 días seguidos difícilmente serán representativos de todo el año ya que las ventas de los negocios varían de acuerdo a la época del año, debería ser un giro que la gente siempre consuma lo mismo independientemente del año. Problema 2. La cantidad de habitaciones ocupadas que debe a un hotel para que éste sea rentable debe ser en promedio de 85% al mes (o más). Se estudiaron hoteles similares en la zona, registrando los 365 días del año se detectó que tienen una ocupación demanda promedio de 78%. Se pide lo siguiente: a) Redacte la hipótesis nula y alternativa ¿Será correcto analizar el problema como una o como dos colas? b) Con un nivel de significancia de 0.02 determine la veracidad para la hipótesis nula. Problema 3. Una empresa contratista asegura que la proporción promedio de los indicadores luminosos en la carretera que siguen funcionando después de 5 años es del 90%; si una prueba previa de 100 indicadores demostró que la proporción que sigue funcionando después de 5 años es del 83% determine: a) Como deben proponerse las hipótesis nula y alternativa. b) Con la información estadística indicada y un nivel de significancia de alfa = 0.05 ¿la empresa estará diciendo la verdad? Elaboró: MC. Marcel Ruiz Martínez 4