Prueba para diferencia de medias muestras grandes y pequeñas

Anuncio
Estadística Inferencial
UNIDAD III. PRUEBAS DE HIPÓTESIS
3.5 Prueba para diferencia de medias, muestras grandes y
pequeñas
En algunos diseños de investigación, el plan muestral requiere
seleccionar dos muestras independientes, calcular las medias
muestrales y usar la diferencia de las dos medias para estimar o probar
una diferencia entre dos medias poblacionales.
Por ejemplo si dos empresas en Tabasco que ofrecen servicios de
encuestas y análisis estadístico indica que la calificación promedio que
le asigna la población al gobierno es de 6 y la otra empresa dice que es
de 5.5; podemos notar que hay una diferencia ¿estarán bien tomadas
las muestras de las dos empresas? Si creemos que si la hipótesis nula
será que la diferencia entre las dos medias poblacionales es igual a
cero ya que estamos hablando de la misma población.
El estadístico Z para estos casos se calcula de la siguiente manera:
x1 − x 2 − ( µ1 − µ 2 )
z=
(
)
σ 12
n1
+
σ 22
n2
Donde:
x1 Promedio de la muestra 1
x 2 Promedio de la muestra 2
µ1 Media de la población 1
µ 2 Media de la población 2
σ 1 Varianza de la población 1
σ 2 Varianza de la población 2
n1 Número de elementos de la muestra 1
n 2 Número de elementos de la muestra 2
3.5. Prueba para diferencia de medias muestras grandes y pequeñas
muestras pequeñas (es decir, menor a 30 elementos) en cambio si no se
conocen las varianzas poblacionales se pueden aproximar con las
varianzas muestrales; pero en dicho caso no es posible usar muestras
pequeñas, solo para estudios de 30 o más elementos muestreados.
Aunque el tema en el plan de estudios abarca muestras grandes y
pequeñas, dado que las varianzas poblacionales raramente se conocen
en estudios sociales y políticos, este tema solo desarrollará mediante
ejemplos las aplicaciones para muestras grandes con varianzas
poblacionales desconocidas; solo conoceremos las varianzas
muestrales.
Solo se insiste en que el procedimiento para muestras pequeñas
(menores a 30 elementos) es exactamente el mismo pero debe
conocerse la varianza poblacional.
Ejemplo 1. Una muestra de 87 mujeres trabajadoras profesionales
mostró que la cantidad promedio que pagan a un fondo de pensión
privado es de $3,352 con una desviación estándar muestral de $1,100.
Una muestra de 76 hombres trabajadores profesionales muestra que la
cantidad que paga a un fondo de pensión privado es de $5,727 con una
desviación estándar de $1,700. Un grupo activista de mujeres desea
demostrar que las mujeres no pagan tanto como los hombres en fondos
de pensión privados. Si se usa alfa = 0.01 ¿Se confirma lo que el grupo
activista de mujeres desea demostrar o no?
Paso 1. Determinar la hipótesis Nula “Ho” y Alternativa “Ha”.
Nótese que este problema es de una cola.
Ho: Lo que pagan las mujeres en el fondo de pensión es igual o mayor
a lo que pagan los hombres.
Ha: _______________________________________
(El estudiante debe describir la Ha)
La hipótesis alternativa es lo que las mujeres del grupo activista desea
demostrar.
Es importante mencionar que en caso de que las varianzas de la
población sean conocidas, es posible usar el estadístico de prueba para
Elaboró: MC. Marcel Ruiz Martínez
1
Estadística Inferencial
3.5. Prueba para diferencia de medias muestras grandes y pequeñas
Paso 2. Determinar el nivel de significancia. Definido por el analista,
en este caso se desea usar α = 0.01
Gráficamente el nivel de significancia se distribuye en la curva de
distribución normal tal como se muestra en la figura:
Paso 3. Calcular los intervalos que implican ese nivel de significancia.
Para dicho nivel de significancia el valor de Z es: Z=-2.326
Gráficamente queda de la siguiente manera:
Z = -2.326
Región
de
rechazo
de Ho
Región de
aceptación
de Ho
Región
de
rechazo
de Ho
Región de
aceptación
de Ho
Ho: µ mujeres - µ hombres = 0
Ho: µ mujeres ≥ µ hombres
Despejando:
Ho: µ mujeres - µ hombres ≥ 0
Paso 4. Calcular el “estadístico” de la prueba.
Para volverlo ecuación algunos
autores toman:
Ho: µ mujeres - µ hombres = 0
El estadístico Z se calcula de la siguiente manera:
x1 − x 2 − ( µ1 − µ 2 )
z=
(
)
σ 12
n1
+
σ 22
n2
Donde:
x1 Promedio de la muestra 1
x 2 Promedio de la muestra 2
µ1 Media de la población 1
µ 2 Media de la población 2
σ 1 Varianza de la población 1
σ 2 Varianza de la población 2
n1 Número de elementos de la muestra 1
n 2 Número de elementos de la muestra 2
Elaboró: MC. Marcel Ruiz Martínez
2
Estadística Inferencial
3.5. Prueba para diferencia de medias muestras grandes y pequeñas
Para el caso del presente ejemplo: considerando la población de
mujeres como 1 y la de hombres como 2 tenemos la siguiente
sustitución:
z=
( x − x ) − (µ
1
2
σ 12
n1
+
1
− µ2 )
σ 22
n2
=
( $3,352 − $5, 727 ) − 0 = −10.42
$1,1002 $1, 7002
+
87
76
Paso 6. Aceptar o rechazar la hipótesis nula.
En este caso como el estadístico de la prueba cae FUERA de la región
que hace verdadera la hipótesis nula, por lo cual dicha hipótesis se
RECHAZA y se toma como verdadera la hipótesis alternativa:
Ho: Lo que pagan las mujeres en el fondo de pensión es igual o mayor
a lo que pagan los hombres. (FALSO)
Ha: Lo que pagan las mujeres en el fondo de pensión privado es menor
a lo que pagan los hombres. (VERDADERO)
Paso 5. Determinar si el estadístico cae dentro de la región que hace la
Hipótesis nula verdadera.
Z = -2.326
Región
de
rechazo
de Ho
Región de
aceptación
de Ho
Ho: µ mujeres - µ hombres = 0
Estadístico de prueba z = -10.42
Como podrá notarse, el estadístico esta FUERA de la región que hace
verdadera la hipótesis nula.
Elaboró: MC. Marcel Ruiz Martínez
A continuación realice los siguientes ejercicios, tenga en cuenta que
puede considerarse de una o dos colas de acuerdo a la naturaleza del
problema:
Dueño de un café. El dueño de un café realizó un estudio estadístico
por cuenta propia y otro usando los servicios de dos practicantes
universitarios que cursan la materia de estadística inferencial. Según
los datos de muestreo del dueño para 30 personas su edad fue de 21
años con una desviación estándar de 0.5 años; en cambio en el
muestreo realizado por los estudiantes para 40 personas encontraron
que la media es de 19 años con una desviación estándar de 0.3 años.
La pregunta del dueño ahora es si se requiere invertir en un nuevo
estudio dado que alguno de los dos realizados hasta ahora está mal
hecho. Si ambos estudios analizaron una muestra representativa de la
misma población las medias poblacionales son iguales y no se requiere
un estudio adicional. Determine:
a) Hipótesis nula y alternativa
b) Concluya si se requiere un estudio estadístico adicional
basándose en la prueba de hipótesis para medias, use un nivel
de significancia de alfa = 0.05.
3
Estadística Inferencial
3.5. Prueba para diferencia de medias muestras grandes y pequeñas
Proveedor de focos. Una empresa de fabricación de focos desea
venderle al gobierno del estado; y para concursar con el resto de las
compañías asegura que la vida media de sus focos es de 3000 horas, un
estudio previo de 50 focos de forma aleatoria obtuvo un promedio de
2980 horas de vida media con una desviación estándar de 10 horas;
como el dueño de la empresa no desea quedarse con ese estudio (ya
que a simple vista la media es menor a la que él asegura) se contrata
otro estudio independiente y éste indica una media de 3005 horas de
vida promedio con una desviación estándar de 15 horas.
¿El primer estudio estuvo mal realizado? Si mediante la prueba de
hipótesis se confirma que las medias poblacionales son iguales:
µ estudio 1 - µ estudio2 = 0 Entonces ambos estudios son estadísticamente
equivalentes. Determine lo siguiente:
a) Defina la hipótesis nula y alternativa
b) Realice la prueba de hipótesis con un nivel de significancia de
alfa = 0.1
Debate político. El gobierno del estado ha obtenido una calificación
de 7.1 por parte de la población con una desviación estándar de 1.2
puntos tomando como base una muestra de 1000 personas; estos datos
según la empresa consultora A; un partido opositor contrata a la
empresa consultora B y la calificación promedio que reporta es de 5.1
con una desviación estándar de 1.3 puntos tomando como base una
muestra de 1200 personas.
El partido de oposición acusa al gobierno del estado de subirse 2
puntos arriba, siendo que su calificación real es de 5.1 y no de 7.1.
¿Será verdad lo que afirma la oposición? Con un nivel de significancia
de 0.05 realice lo siguiente:
a) Planté como hipótesis nula que en efecto la oposición tiene
razón es decir, la diferencia de µ estudio B - µ estudio A = 2 y
confirme si es verdad mediante la prueba de hipótesis.
b) Planté como hipótesis nula que ambos estudios son
estadísticamente independientes es decir, la diferencia de
µ estudio B - µ estudio A = 0 y confirme si es verdad mediante la
prueba de hipótesis.
Elaboró: MC. Marcel Ruiz Martínez
4
Estadística Inferencial
Actividad 3.4. Pruebas de hipótesis para diferencia de medias.
Problema 1. Un contratista “A” ha ganado el contrato del gobierno
para colocar los adornos luminosos de navidad; un competidor “B”
acusa de fraude en dicho proceso ya que sus focos técnicamente son
mejores que los del ganador; asegurando que duran 100 horas más de
uso.
Para verificar lo anterior cada contratista ofrece un estudio de duración
realizado de forma independiente, en resumen se ofrecen los siguientes
datos:
Tiempo de vida focos de la empresa A: 3050 horas
Tiempo de vida focos de la empresa B: 3150 horas
Cantidad de elementos muestreados empresa A: 400
Cantidad de elementos muestreados empresa B: 400
Desviación estándar focos de la empresa A: 50 horas
Desviación estándar focos de la empresa B: 50 horas
Con un nivel de significancia de 0.05 realice lo siguiente:
a) Redacte la hipótesis nula y alternativa; además ¿Será correcto
analizar el problema como una o como dos colas?
b) Con un nivel de significancia de 0.1 determine la veracidad
para la hipótesis nula Ho.
3.5. Prueba para diferencia de medias muestras grandes y pequeñas
Problema 2. La cantidad de habitaciones ocupadas que debe a un hotel
en el 2008 fue de 200 personas en promedio con una desviación
estándar de 15 personas; para los datos anteriores se usaron los 365
días del año.
En el 2009 en el mismo hotel la ocupación promedio fue de 220
personas con una desviación estándar de 12 personas; de la misma
forma se muestrearon todos los días del año.
Hay un aumento en la cantidad de personas que demandan el servicio
hotelero ¿pero será una diferencia estadísticamente significativa? ¿se
está recuperando y reactivando el turismo? Para comprender lo anterior
realice con un nivel de significancia del 0.005 lo siguiente:
Considere como hipótesis nula que la media en ambos años en realidad
es igual y realice la prueba de hipótesis.
Elabore una PRÁCTICA DE EJERCICIOS de este trabajo (INDIVIDUAL),
las
rúbricas
se
indican
en
la
liga
siguiente:
http://marcelrzm.comxa.com/Rubricas/Rubricas.htm
SIN EL PROCEDIMIENTO LA ACTIVIDAD NO ES VÁLIDA
Puede enviar el documento final por correo electrónico a las siguientes
direcciones:
[email protected];
[email protected];
[email protected] y [email protected]
No olvide enviarse copia a sí mismo del correo que envía, si usa Outlook
solicite confirmación de entrega y de lectura.
Elaboró: MC. Marcel Ruiz Martínez
5
Descargar