Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán PRUEBA DE HIPÓTESIS El proceso de estimación de parámetros, analizado en el fascículo anterior y las pruebas de hipótesis son los temas medulares de la estadística inferencial. Una prueba de hipótesis inicia con una suposición, denominada hipótesis, que hacemos en torno a un parámetro de la población, por ejemplo: • El costo de una computadora portátil es de $12,000 • El salario de los profesores de una secundaria es de por lo menos $ 6,000 • El porcentaje de votantes que apoyan a un candidato es de 37%. • Las pastillas Halls tienen un contenido neto de 34gr. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Después reunimos estadísticos de la datos muestra muestrales, y nos calculamos servimos de los esta información para decidir la probabilidad de que el supuesto parámetro de la población sea correcto. Pongamos el caso del ejemplo de las pastillas Alls, “suponemos” que el contenido neto es correcto porque es lo que marca la etiqueta de ese producto y por lo tanto el valor de la media de la población de todo un lote de la producción. Para verificar la validez de nuestra suposición, obtenemos datos de una muestra representativa del lote de producción y determinamos la diferencia entre el valor supuesto y el valor real de la media muestral. A continuación juzgamos si la diferencia es significativa. Cuanto menor sea la diferencia, mayores probabilidades habrá de que sea correcto el valor supuesto de la media poblacional. Y a una diferencia más amplia corresponderá una probabilidad menor, figura 1 Figura 1. Diferencias entre el supuesto parámetro poblacional y sus estadísticos Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Desgraciadamente no sabemos qué tan grande debe ser la diferencia entre el supuesto parámetro de la población y el estadístico muestral para que automáticamente rechacemos la hipótesis, ni que tan pequeña debe ser esa diferencia para que de inmediato la aceptemos. Por esta razón debemos hacer una prueba de hipótesis que nos ayude en la toma de decisiones. “Un método sistemático de evaluar creencias tentativas sobre la realidad se llama prueba de hipótesis; requiere de la confrontación de creencias con evidencia y decidir, en vista de esta evidencia, si dichas creencias se pueden conservar como razonables o deben desecharse por insostenibles”. 1 Supongamos que el salario de los docentes de una secundaria es de $6000 pesos mensuales. ¿Cómo podremos probar la validez de esta hipótesis? Al aplicar los métodos de muestreo anteriormente estudiados, calculamos el salario de una muestra de los profesores. Si encontramos que el estadístico muestral resultó ser de $ 5 880 pesos, seguramente aceptaremos la suposición anterior. Pero si el estadístico muestral fuera de $ 4 600 pesos, rechazaríamos la suposición por considerada falsa. Los dos resultados podemos interpretados recurriendo al sentido común. 1 Kohler, Heinz. Estadística para Negocios y Economía, ed.CECSA, Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Por otro lado si el estadístico muestral revela un salario de $5900 pesos, este valor es relativamente cercano a $6000 pesos. Pero, ¿está lo suficientemente cerca como para que aceptemos la suposición? Si la aceptemos o rechacemos, no podemos tener la seguridad absoluta de que nuestra decisión sea correcta; por tanto, tenemos que aprender a afrontar la incertidumbre en la toma de decisiones. No podemos aceptar ni rechazar una hipótesis referente a un parámetro de la población por sentido común, debemos decidir con objetividad, basándonos en la información de la muestra, si aceptamos o rechazamos una suposición. TIPOS DE HIPOTESIS Hipótesis nula Al ser un supuesto se habla de una Hipótesis estadística, y al comprobarla, estamos hablando de una prueba de hipótesis. Por lo tanto una proposición adelantada tentativamente como una verdad posible es llamada hipótesis. En una prueba de hipótesis, debemos de formular el supuesto valor del parámetro de la población antes de hacer el muestreo. La suposición que deseamos probar recibe el nombre de hipótesis nula y se representa con el símbolo "Ho:” y se interpreta como: la hipótesis nula establece. Y podemos decir que es una declaración tentativa de que el parámetro de la población es igual a un valor específico e implica la idea de que no hay diferencia entre el supuesto valor del parámetro poblacional y el estadístico muestral de prueba. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Supongamos que queremos probar la hipótesis de que la media de la población de las pastillas Halls tienen un contenido neto de 34gr. Podríamos representarla del modo siguiente: H 0 : µ = 34 gr y leerla así: "La hipótesis nula establece que la media de la población es igual a 34 gr" La expresión hipótesis nula proviene de antiguas aplicaciones de la estadística a la agricultura y la medicina. A fin de probar la eficacia de un nuevo fertilizante o medicamento, la hipótesis probada (nula) era que no producían efecto alguno; es decir, no existía diferencia entre las muestras tratadas y las no tratadas. La hipótesis nula H0 es la primera de dos opuestas en una prueba de hipótesis. Es una descripción del estado de las cosas en un momento dado, es decir de lo que las personas han pensado durante mucho tiempo que es cierto. Si H0 se corrobora en una prueba de hipótesis, no es necesario realizar una acción. Si los resultados de la muestra no apoyan la hipótesis nula, debemos concluir que no son verdaderos. Hipótesis alternativa Cada vez que rechazamos la hipótesis nula, la conclusión que aceptamos se llama hipótesis alternativa y se representa mediante H1: en el caso de la hipótesis nula: H 0 : µ = 34 gr : Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán “La hipótesis nula establece que la media de la población es igual a 34 gr.” Se pueden considerar únicamente tres hipótesis alternativas: H1 : µ ≠ 34 gr : “La hipótesis alternativa establece que la media de la población no es igual a 34 gr.” H1 : µ > 34 gr : “La hipótesis alternativa establece que la media de la población es mayor a 34 gr.” H1 : µ < 34 gr : “La hipótesis alternativa establece que la media de la población es menor a 34 gr.” La hipótesis alternativa H1 es la segunda de dos opuestas en una prueba de hipótesis. Es un medio para hacer aseveraciones trascendentes que contradicen las creencias de las personas. Si H0 no se puede corroborar en una prueba de hipótesis, H1 se acepta tentativamente y esto requiere iniciar una acción, Por lo tanto se puede considerar a H1 como la hipótesis de acción. Y podemos decir que es una declaración tentativa de que el parámetro poblacional tiene un valor diferente del especificado en la hipótesis nula, es decir, contradice a H0 y constituye la hipótesis de trabajo. Al formular la hipótesis nula y alternativa, se le llama planteamiento de las hipótesis y son mutuamente excluyentes, al aceptar H0.se debe rechazar H1 y al rechazar H0 se debe aceptar H1, no se pueden aceptar ni rechazar ambas, forzosamente tenemos que aceptar una de las hipótesis. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Supongamos que se tienen sospechas de que el contenido de producto neto de las pastillas Halls es menor al indicado en la etiqueta que es de 34 gr. El planteamiento de las hipótesis, lo podemos ejemplificar de la siguiente forma: H 0 : µ = 34 grs H1 : µ < 34 grs Errores Tipo I y Tipo II Las hipótesis nula y alternativa son aseveraciones sobre la población que compiten entre sí, es decir o la hipótesis nula es verdadera, o lo es la hipótesis alternativa, pero no ambas. En el caso ideal, el procedimiento de prueba de hipótesis debe conducir a la aceptación de H0 cuando sea verdadera y al rechazo de H0 cuando H1 sea verdadera. Desafortunadamente no siempre son posibles las conclusiones correctas. Como las pruebas de hipótesis se basan en información de muestras, debemos considerar la posibilidad de errores. La tabla 1 muestra los dos tipos de errores que se pueden cometer en la prueba hipótesis. Conclusión Condición de la población H0 H1 verdadera verdadera Aceptar H0 Conclusión correcta Error Tipo II Rechazar H0 Error Tipo I Conclusión correcta Tabla 1. Tipos de errores que se pueden cometer en una prueba de hipótesis Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Se puede observar lo que puede suceder cuando la conclusión es aceptar H0. Si H0 es verdadera, esta conclusión es correcta. Sin embargo, si H1 es verdadera, hemos cometido un error tipo II, esto es, hemos aceptado H0 siendo falsa. Ahora bien, si la conclusión es rechazar H0 Si H0 es verdadera, hemos cometido un error tipo I, esto es, hemos rechazado H0 siendo verdadera. Sin embargo, si H1 es verdadera, es correcto rechazar H0. Nivel de significancia La finalidad de una prueba de hipótesis no es poner en duda el valor calculado del estadístico muestral, sino emitir un juicio sobre la diferencia existente entre el supuesto parámetro de la población y estadístico. El siguiente paso, después de formular la hipótesis nula y la hipótesis alternativa, será decidir qué criterio aplicar para decidir si se acepta o rechaza H0 En la práctica, la persona que efectúa la prueba de hipótesis debe especificar la máxima probabilidad permisible, llamada nivel de significancia α, de cometer un error de tipo I. Comúnmente se utilizan los valores de 0.10, 0.05 y 0.01 como niveles de significancia. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Supongamos que deseamos probar una hipótesis con un nivel de significancia de 5% o 0.05. Lo anterior significa que rechazaremos la hipótesis nula si en promedio la diferencia entre el estadístico muestral y el supuesto parámetro de la población es tan grande que ella o una diferencia mayor podría ocurrir, en promedio, apenas cinco o menos veces en cada 100 muestras, cuando sea correcto el parámetro de la población. Así pues, suponiendo que la hipótesis es correcta, el nivel de significancia indica el porcentaje de medias muestrales que se encuentra fuera de ciertos límites. (recuerde que al hacer la estimación, no olvide que el nivel de confianza indica el porcentaje de las medias muestrales que caían dentro de los límites definidos de confianza). En la tabla 1, la conclusión de rechazar Ho indica que hay un error de tipo I o que la conclusión es correcta. Así, si se controla la probabilidad de cometer un error tipo I seleccionando un pequeño valor del nivel de significancia, tendremos un alto grado de confianza en que sea correcta la conclusión de rechazar Ho. En esos casos contamos con respaldo estadístico para concluir que Ho es falsa y que H1 es verdadera. La figura 2 muestra cómo interpretar un nivel de significancia de 5%. Nótese que 2.5% del área bajo la curva está situado en cada extremo. Si consultamos la tabla de la distribución normal del apéndice, podremos determinar que 95% del área bajo la curva queda incluida en un intervalo que se extiende 1.96 σ x a ambos lados de la supuesta media. En 95% del área, no existe diferencia de significancia entre el estadístico muestral y el supuesto parámetro de la población. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán En el restante 5% (las regiones sombreadas), sí hay una diferencia significativa. Figura 2. Regiones de diferencia significativa y no significativa con un nivel del 5% En la figura 2 se examina la misma interpretación, en ella 95% del área bajo la curva se halla donde aceptaríamos la hipótesis nula. Las dos partes sombreadas bajo la curva, que representan un total de 5% del área, se encuentran donde rechazaríamos la hipótesis nula. Aquí conviene hacer una advertencia. Aun cuando los estadísticos muestrales en la figura 3 caigan en la región no sombreada (que abarca 95% del área bajo la curva), ello no prueba que nuestra hipótesis nula (H0) sea verdadera; simplemente el estadístico no ofrece evidencia estadística para rechazarla. ¿Por qué? Porque la única manera de aceptarla con certidumbre consiste en que conozcamos el parámetro de la población. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Por lo tanto, cada vez que decimos que la aceptamos, en realidad queremos decir que no se cuenta con suficiente evidencia estadística para rechazarla. Se ha generalizado el uso del verbo aceptar, en lugar de no rechazar. Significa sencillamente que, cuando los datos de la muestra no nos llevan a rechazar una hipótesis nula, la consideramos como si ésta fuera verdadera. Figura 3. Regiones de aceptación y rechazo de Ho con un nivel de significancia de 5% Al seleccionar la significancia no existe un nivel como norma con el cual se deben probar las hipótesis, regularmente se utiliza el del 5%, pero es común que en los resultados publicados de investigaciones hayan recurrido al 1% de significancia. Es posible probar una hipótesis en cualquier nivel de significancia. Pero recuérdese que nuestra elección del nivel, es asimismo el riesgo que corremos de rechazar una hipótesis nula aunque sea verdadera. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Cuanto más alto sea el nivel de significancia que utilizamos al probar una hipótesis, mayores probabilidades habrán de rechazar una hipótesis nula que sea verdadera. El concepto anterior lo podemos ilustrar con la figura 5, se observa una prueba de hipótesis con tres niveles de significancia: 1, 10 y 50%. Hemos indicado la ubicación de la media muestral en cada distribución. En las partes a y b, podríamos aceptar la hipótesis nula de que la media de la población es igual al valor supuesto. Pero obsérvese que en la parte c, rechazaríamos esta misma hipótesis nula. ¿Por qué? Porque allí nuestro nivel de significancia de 0.50 es tan alto que rara vez la aceptaremos, cuando no sea verdadera; pero, al mismo tiempo, frecuentemente la rechazaremos aunque sea verdadera. Figura 4. Una prueba de hipótesis con tres distintos niveles de significancia Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Distribución adecuada de probabilidad Después de decidir qué nivel de significancia utilizar, el siguiente paso en la prueba de hipótesis consiste en determinar la distribución adecuada de probabilidad. Tenemos que seleccionar entre la distribución normal y la distribución t de estudent (ver apéndice de tablas). Las reglas para elegir la distribución de probabilidad apropiada se parecen a las descritas en el fascículo I, tema II Estimación de parámetros. En la tabla 2 se resume cuándo usar la distribución normal y la distribución t al efectuar pruebas para las medias. Más adelante en este capítulo, examinaremos la distribución idónea para probar las hipótesis relativas a proporciones. No se olvide otra regla más al probar el supuesto valor de una media. Como en la estimación, se utiliza el multiplicador de población finita cuando ésta es de tamaño finito, el muestreo se realiza sin reemplazamiento y la muestra constituye más de 5% de la población. Desviación estándar de la población conocida Desviación estándar de la población no conocida El tamaño de la muestra es mayor que 30 (n>30) Distribución normal Tabla z Distribución normal Tabla z El tamaño de la muestra es 30 o menos y suponemos que la que la población es normal o aproximadamente normal ( n≤30) Distribución normal Tabla z Distribución t de student Tabla t Tabla 2. Condiciones para usar la distribución normal y la distribución t en la prueba de hipótesis para las medias Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán TIPOS DE PRUEBAS DE HIPOTESIS Prueba de hipótesis de dos extremos A esta prueba también se le llama de dos colas o bilateral, se utiliza cuando se desea encontrar evidencia estadística de que el verdadero valor del parámetro poblacional es diferente del especificado en la H0., es decir rechazará la hipótesis nula si la media muestral es significativamente más alta o más baja que la supuesta media de la población. Por consiguiente, en una prueba de dos extremos, existen dos regiones de rechazo. Esto se puede apreciar en la figura 5. Figura 5. Regiones de aceptación y rechazo de Ho para una prueba de hipótesis bilateral Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Supongamos que se sospecha que una maquina envasadora de azúcar está llenando mal las bolsas en la presentación de 2.0 kg. Si el contenido neto es menor, posiblemente perderá clientes; si es mayor el contenido de azúcar, se tendrá una pérdida de producto, disminuyendo la plusvalía de la empresa. Con la finalidad de observar si el proceso de envasado de la azúcar está funcionando bien, tomamos una muestra de las bolsas llenadas por la máquina para probar la hipótesis: H 0 : µ = 2.0kg Puesto que no se desea desviar significativamente de 2.0 kg. En ninguna de las dos direcciones (más o menos) la hipótesis alternativa apropiada será: H 0 : µ ≠ 2.0kg Por lo tanto se utilizara una prueba de dos colas. Es decir rechaza la hipótesis nula si el contenido neto de azúcar promedio de las bolsas de la muestra está muy por arriba o muy por debajo de 2.0 kg. Prueba de hipótesis de un extremo (izquierdo) Se utiliza cuando se desea encontrar evidencia estadística de que el parámetro poblacional especificado en H0 es menor. Por ejemplo un mayorista que compra grandes cantidades de azúcar a la compañía antes mencionada, en bolsas de 2.0 kg. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán El mayorista no quiere aceptar un embarque de azúcar a menos que el contenido neto promedio sea de dos kilogramos. Al llegar cada pedido, el mayorista prueba una muestra para decidir si debe aceptar el embarque. Éste rechazará el envió sólo si descubre que el contenido neto no llega a 2.0 kg. Así las hipótesis del mayorista son: H 0 : µ = 2.0kg H1 : µ < 2.0kg Se rechaza H0 sólo si el contenido neto de azúcar promedio de las bolsas que conformaron la muestra está significativamente por debajo de dos kilogramos. En la figura 6 se ilustra este tipo de prueba. En ella vemos por qué a esta prueba se también se le llama prueba de una cola a la izquierda (o una prueba de extremo inferior). Figura 6. Regiones de aceptación y rechazo de Ho de una prueba de un extremo izquierdo Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán En general, se aplica una prueba de un extremo izquierdo si el planteamiento de las hipótesis es: H0 : µ = 0 H1 : µ < 0 H0 : µ ≥ 0 H1 : µ < 0 caso 1 caso 2 donde cero es el valor especifico del supuesto parámetro poblacional. En tales situaciones, es la evidencia del estadístico muestral que esta significativamente por debajo de la supuesta media de la población la que nos hace rechazar la hipótesis nula y por ende aceptamos la hipótesis alternativa. Dicho con otras palabras, la región de rechazo se halla en el extremo inferior (extremo izquierdo) de la distribución de la media muestral; y por eso a esta prueba la llamamos prueba de extremo inferior. El caso 1 se le llama hipótesis simple porque únicamente se utiliza un solo valor como el supuesto parámetro poblacional y al caso 2 se le conoce como hipótesis compuestas, porque se utilizan una gama de valores como el supuesto valor del parámetro poblacional. Prueba de hipótesis de un extremo (derecho) Se utiliza cuando se desea encontrar evidencia estadística de que el parámetro poblacional especificado en H0 es mayor, también se le llama prueba unilateral por la derecha o prueba de extremo superior. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Esta prueba se aplica cuando las hipótesis son: H0 : µ = 0 H1 : µ > 0 H0 : µ ≥ 0 H1 : µ > 0 Si el estadístico muestral se encuentra significativamente por arriba de la supuesta media poblacional, rechazaremos la hipótesis nula en favor de la hipótesis alternativa. A esto se le llama prueba de extremo superior, porque la región de rechazo está en el extremo superior de la distribución de la media muestral. La Prueba unilateral a la derecha se ilustra en la figura 7; por ejemplo, el gerente de ventas de la envasadora de azúcar ha pedido a sus vendedores ajustarse a un límite en los viáticos por concepto de gasolina. El gerente confía mantener los gastos en un promedio de $100 pesos por vendedor al día. Un mes después de fijado el límite, se extrae una muestra de los gastos por gasolina presentados diariamente para comprobar si están observando el límite los vendedores. La hipótesis nula establece que: H 0 : µ = 100.00 pesos Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Pero al gerente le interesa observar si los vendedores se están ajustando al límite en gastos por concepto de gasolina. Por lo tanto, la hipótesis alternativa apropiada será: H1 : µ > 100.00 pesos Se aplica una prueba de extremo superior. Si se rechaza la hipótesis nula se encontró evidencia estadística de que la media muestral es significativamente mayor que $100.00. Esta evidencia muestra que los vendedores no están acatando el límite y se deben tomar las medidas correctivas. Figura 7. Regiones de acepación y rechazo de Ho de una prueba de un extremo derecho Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Debemos tener en cuenta siempre que en una prueba de hipótesis, cuando aceptamos una hipótesis nula basándonos en la información de la muestra, realmente estamos afirmando que se carece de datos estadísticos para rechazarla. No estamos diciendo con ello que la hipótesis nula sea verdadera. La única manera de probar una hipótesis nula consiste en saber cuál es el parámetro de la población, y como sabemos eso no es posible en el muestreo. Así pues, aceptamos la hipótesis nula y actuamos como si fuera verdadera simplemente porque no encontramos evidencia para rechazarla. PROCEDIMIENTO PARA ELABORAR UN PRUEBA DE HIPOTESIS • Determinar el supuesto valor del parámetro poblacional • Obtener los datos correspondientes. • Determinar el nivel de α. • Llevar a cabo el planteamiento de las hipótesis. • Construir las áreas de aceptación y rechazo de H0 • Realizar la prueba estadística adecuada. • Tomar una decisión para aceptar H0 o no rechazar H0. • Emitir una conclusión en términos del problema. Prueba de Hipótesis muestrales y calcular los estadísticos http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán PRUEBAS DE HIPOTESIS Para una media Para elaborar una prueba de hipótesis para la media se sigue el procedimiento antes mencionado y se utilizan las siguientes formulas o estadístico de prueba (según el caso). El estadístico de prueba es el que se calcula en una sola muestra aleatoria simple, tomada de la población de interés, para establecer la verdad o falsedad de la hipótesis nula. Cuando σ es conocida, se utiliza la distribución normal ( “z” ) como se mostró en la tabla 2 x −µ Ζc = σx Cuando σ no es conocida, y la muestra es grande (n > 30), se utiliza la distribución de probabilidad “z “. x −µ Ζc = Sˆx Cuando σ no es conocida, y la muestra es pequeña ≤ (n 30), se utiliza la distribución de probabilidad “ t “ student. tc = Prueba de Hipótesis x −µ Sˆx http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Para una mejor comprensión, lo anterior se muestra en la figura 8. Figura 8. Diagrama de flujo para seleccionar la prueba estadística adecuada para una media Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán EJEMPLOS PRUEBA DE HIPÓTESIS 1. Un Ingeniero de control de calidad debe comprobar que una maquina envasadora de café está vertiendo en promedio la cantidad de producto por sobre de 30 gramos, además sabe que la desviación estándar del proceso es de 1 gramo. Toma una muestra de 36 sobres con café y encontró una media de 2.92 gramos. ¿Con la evidencia obtenida en la muestra se podría concluir que la maquina no está envasando correctamente el producto con un nivel α = 0.01? SOLUCION Observaciones: Se conoce la desviación estándar poblacional por lo tanto se utiliza la distribución Z y puesto que se va a verificar si la maquina envasadora está trabajando correctamente se debe aplicar una prueba de dos extremos. 1. µ = 3º gramos 3. Determinar el valor de α: α = 0.01/2 = 0.005 2. DATOS n = 36 4. Plantear las hipótesis x = 29.2 gramos H0: µ = 30 gramos σ = 1 gramo H1: µ ≠ 30 gramos Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 5. Construir las áreas de aceptación y rechazo de H0 ∴ 0.5 − 0.005 = 0.4950 Ζ =2.58 6. Aplicar la prueba estadística adecuada. Zc = 2.92 − 3.0 = −2.67 0.18 36 7. Tomar una decisión El valor de Z c cae en zona de Rechazo, Por lo tanto la decisión es rechazar H0. 8. Conclusión: Se encontró evidencia estadística con un nivel de significancia del 1% que la maquina envasadora no esta vertiendo en promedio 3 libras de café, por lo que se recomienda llevar a cabo las acciones correctivas. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 2. Un comprador de camisas para una tienda departamental desea probar si las camisas con etiqueta de manga 33 pulgadas en realidad satisfacen esa especificación en promedio. Se toma una muestra aleatoria de 36 camisas que entran al almacén, la muestra indica un largo medio de 34 pulgadas son una desviación estándar de 2 pulgadas con un α = 0.05 Realice la prueba. SOLUCION Observaciones: No se conoce la desviación estándar poblacional, pero el tamaño de la muestra es “grande” n > 30, por lo tanto se utiliza la distribución Z y puesto que se va a probar que un producto cumpla con las especificaciones de diseño, largo 33 pulgadas (ni mas grande ni mas pequeño) se debe aplicar una prueba de dos extremos. 1. µ = 33 pulgadas 2. DATOS n = 36 x = 34 pulgadas S = 2 pulgadas 3. Determinar el valor de α: α = 0.05/2 = 0.025 4. Plantear las hipótesis H0: µ = 33 pulgadas H1: µ ≠ 33 pulgadas Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 5. Construir las áreas de aceptación y rechazo de H0 ∴ 0.5 − 0.025 = 0.4750 Ζ =1.96 6. Aplicar la prueba estadística adecuada. Zc = 34.0 − 33.0 = −3.0 2.0 36 7. Tomar una decisión El valor de Z c cae en zona de rechazo, Por lo tanto la decisión es rechazar H0. 8. Conclusión: Se encontró evidencia estadística con un nivel de significancia del 5% que las camisas no cumplen con la especificación de “largo 33 pulgadas”, se sugiere regresar el pedido que entro al almacén Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 3. Un gerente desea probar la resistencia de la tensión del hilo que ha de usarse en las nuevas máquinas de la empresa, el cual debe ser de por lo menos 25 libras. Se toma una muestra aleatoria de 16 carretes y se encontró una resistencia de promedio de 23 libras, con una desviación estándar 0.2 libras. Realicé la prueba con un nivel de significancia del 5% y determine si el hilo es apropiado. SOLUCION Observaciones: No se conoce la desviación estándar poblacional, y el tamaño de la muestra es “pequeño” n≤ 30, por lo tanto se utiliza la distribución t de estudent. Puesto que se desea probar si un hilo es adecuado a las necesidades de la empresa que son de que tenga una resistencia a la tensión de por lo menos 25 libras, se debe aplicar una prueba de un extremo a la izquierda. 1.µ ≥ 25 libras 3. Determinar el valor de: α = 0.05 2. DATOS 4. Plantear las hipótesis n = 16 x = 24.9 libras H0: µ ≥ 25 libras s = 0.2 libras H1: µ < 25 libras Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 5. Realizar la prueba g .l = 16 − 1 = 15 t = 1.75 tc = 24.9 − 25 = −2.0 0.2 16 6. Tomar una decisión: El valor calculado de tc cae en zona de rechazo por lo que se rechaza H0. 7. Conclusión: Se encontró evidencia estadística con un nivel de significancia del 5% que la resistencia del hilo no satisface la especificación de 25 libras de resistencia. Se recomienda que ese hilo no se utilice. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN Para elaborar una prueba de hipótesis para la proporción, se sigue el mismo procedimiento que para la prueba de hipótesis de la media. Debemos recordar que la distribución binomial, es la distribución teóricamente correcta que debe usarse para las proporciones, pues los datos son discretos. A medida que aumenta el tamaño de la muestra, la distribución binomial se acerca a la distribución normal en sus características y podemos aplicar esta ultima para aproximar la distribución de muestreo. En resumen, np y nq necesitan cada una ser por lo menos 5 para que se pueda utilizar la distribución normal de probabilidad en sustitución de la binomial. En este caso se utiliza la siguiente prueba estadística adecuada Ζc = p −π σp Para una mejor comprensión lo anterior se muestra en la figura 9 Figura 9. Diagrama de flujo para seleccionar la prueba estadística adecuada para una proporción Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán EJEMPLOS PRUEBA DE HIPÓTESIS PROPORCIÓN 1. Un fabricante de blusas para dama cree que su marca se vende en 19% de las tiendas de ropa para mujer del centro de la ciudad de México. Recientemente tomo una muestra de 85 de esas tiendas y encontró que únicamente el 14.12% venden su marca. Con un nivel de significancia del 4% ¿Se podría concluir que ha disminuido la presencia de su marca en esa parte de la ciudad? SOLUCION Observaciones: Se desea probar una proporción poblacional y np es mayor a 5, por lo tanto se puede utilizar la distribución normal, la hipótesis de trabajo es demostrar si ha disminuido la presencia de la marca en una región, se debe aplicar una prueba de un extremo a la izquierda. 1. 𝜋 = 19% de las tiendas venden la marca 2. DATOS n = 85 p = .1412 Prueba de Hipótesis 3. Determinar el valor de α: α = 0.04 4. Plantear las hipótesis H 0 : π = 0.19 H1 : π < 0.19 http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 5 Realizar la prueba ∴ 0.5 − 0.04 = 0.4600 Ζ =1.75 0.1412 − 0.19 Ζc = =−1.15 0.19 × 0.81 85 6. Tomar una decisión: El valor de Z c se encuentra en área de aceptación, por lo tanto la decisión es aceptar H0. 7. Emitir una conclusión: Se encontró evidencia estadística con un α = 0.04 que el 19% de las tiendas de ropa para Dama en el centro de Ciudad de México venden la marca del fabricante, por lo que se puede concluir que no ha disminuido su presencia en la zona. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 2. Un vendedor profesional, asegura que al menos a 1 de cada dos clientes les vende un reloj. Para probar la afirmación del vendedor se tomo una muestra aleatoria de 25 clientes que tuvieron contacto con el vendedor y se encuentra que diez de ellas compararon un reloj. Realice la prueba con un nivel se significancia del 5%. SOLUCION Observaciones: Se desea probar una proporción poblacional y np es mayor a 5, por lo tanto se puede utilizar la distribución normal, dado que se esta afirmando que se logra al menos un 50% de las ventas, se debe aplicar una prueba de un extremo a la izquierda. 1. 𝜋 ≤ 0.5 de las familias 3. Determinar el valor de: α = 0.05 2. DATOS n = 25 10 = 0.40 25 15 q= = 0.60 25 p= Prueba de Hipótesis 4. Plantear las hipótesis H 0 : π ≤ 0.5 H1 : π > 0.5 http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 5. Realizar la prueba ∴ 0.5 − 0.05 = 0.4500 Ζ = 1.65 Ζc = 6. Toma runa decisión: El valor de Z c 0.4 − 0.5 = −1.02 0.4 × 0.6 25 se encuentra en área de aceptación, por lo tanto la decisión es aceptar H0. 7. Emitir una conclusión: Se encontró evidencia estadística con un α = 0.05 que el vendedor logra una venta en al menos el 50% de las veces Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán PRUEBA DE HIPÓTESIS PARA DOS MEDIAS Los responsables de la de toma de decisiones, necesitan determinar en muchas ocasiones si los parámetros de dos poblaciones son semejantes o son diferentes, es decir si la diferencia entre ellos es estadísticamente significativa. Una empresa quizá quiera probar, por ejemplo, si las empleadas reciben sueldos más bajos que los varones por realizar el mismo trabajo. Es posible que un fabricante de pantalones de mezclilla desee probar si dos tipos de tela semejantes tienen la misma durabilidad. Un nutriólogo quiere determinar si dos dietas son igual de efectivas para el control de peso. Un profesor quiera demostrar que una nueva técnica didáctica es mejor que la tradicional para impartir matemáticas a nivel bachillerato. En todas las situaciones anteriores, nos debemos de preocupar de los parámetros de dos poblaciones, a diferencia de la prueba de hipótesis para una media o una proporción, no es de gran importancia el verdadero valor de los parámetros. Lo relevante es observar la relación existente entre los valores de los parámetros, o sea en qué difieren estos últimos. ¿Ganan menos las empleadas que los empleados por el mismo trabajo? ¿Las telas muestran una durabilidad diferente? Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán ¿Una dieta es mejor que la otra para el control de peso? ¿Las nuevas técnicas didácticas mejoran sensiblemente el aprovechamiento de los alumnos en matemáticas? En esta sección, introduciremos métodos que nos permiten contestar las preguntas anteriores, mediante procedimientos de la prueba de hipótesis. Los supuestos para este tipo de pruebas, es que las varianzas de las poblaciones sean iguales σ 12 = σ 22 , y que las poblaciones tengan una distribución normal o aproximadamente normal. Al estudiar dos poblaciones, la distribución de muestreo que nos interesa ahora es la distribución de muestreo de /a diferencia entre dos medias muestrales. La figura, 10 puede ayudamos a conceptualizar esta distribución. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán En la parte superior de la figura, se indican dos distribuciones muestrales x1 y x2 de dos poblaciones, con medias µ1 y µ2 , así como sus errores estándar, y en la parte inferior se señala la distribución de muestreo de la diferencia entre las medias muestrales. En las dos distribuciones teóricas de muestreo de la media están integradas todas las muestras posibles que pueden extraerse de la correspondiente distribución de la población. Ahora bien, supongamos que tomamos una muestra aleatoria de la distribución de la población 1 y otra de la distribución de la población 2. Si restamos las "dos medias muestrales”, obtendremos: x1 − x2 diferencia entre medias muestrales Figura 10. Distribución muestral de la diferencia de medias x1 − x2 y su relación con las distribuciones muestrales x1 y x2 Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Esta diferencia será positiva si x1 es mayor que x2 y negativa si x2 es mayor que x1 Al construir una distribución de todas las diferencias posibles del muestreo de x1 − x2 , obtenemos la distribución de muestreo de la diferencia entre las medias muestrales, como se indica en la figura 10. La desviación estándar de la distribución de la diferencia entre las medias muestrales recibe el nombre de error estándar de la diferencia entre dos medias y se calcula aplicando esta fórmula: σ= x −x 1 2 σ 12 n1 + σ 22 n2 Si se conocen las desviaciones estándar de las poblaciones, si estas no se conocen, es posible estimar el error estándar de la diferencia entre dos medias de la siguiente forma: σˆ = S Recordemos que la desviación estándar de la muestra se representa con S, por lo tanto, la fórmula del error estándar estimado de la diferencia entre medias se expresa así: σˆ= x −x 1 Prueba de Hipótesis 2 σˆ12 n1 + σˆ 22 n2 http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Procedimiento para elaborar una prueba de hipótesis para dos medias El procedimiento para elaborar una prueba de hipótesis para dos medias es similar al que se utilizo para sola media y se muestra a continuación: 1. Obtención de los datos 2. Determinar el valor de α 3. Plantear las hipótesis según el tipo de prueba: • Bilateral o de dos extremos H 0 : µ1 = µ2 H1 : µ1 ≠ µ2 • • • Prueba de Hipótesis Unilateral a la izquierda = H 0 : µ1 µ2 H 0 : µ1 ≥ µ2 H1 : µ1 < µ2 H1 : µ1 < µ2 Unilateral a la derecha = H 0 : µ1 µ2 H 0 : µ1 ≤ µ2 H1 : µ1 > µ2 H1 : µ1 > µ2 http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 4. Establecer las áreas de aceptación y rechazo de la hipótesis nula. 2 5. Realizar la prueba estadística 6. Tomar una decisión. 7. Emitir una conclusión en términos del problema. Prueba estadística adecuada: La prueba estadística adecuada depende de la información obtenida en el paso 1 del procedimiento. 1. Cuando σ1 y σ2 son conocidas, se utiliza la distribución “ Z “ de probabilidad. Ζc = x1 − x2 σ 12 n1 + σ 22 n2 2. Cuando σ1 y σ2 no son conocidas. Si n1 y n2 son > 30, se utiliza la distribución “ z” de probabilidad. Ζc = x1 − x 2 S12 S 22 + n1 n2 2 Se establecen de igual manera como en la prueba de hipótesis para una media, o una proporción, antes mencionada. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Si n1 y n2 son ≤ 30y el muestreo es independiente, se utiliza la distribución “ t “ de student, de la siguiente forma: tc = x1 − x 2 ( n1 − 1) S12 + ( n2 − 1) S22 n1 + n2 − 2 • 1 1 + n1 n2 Si n1 y n2 son ≤ 30 y el muestreo es dependiente, se utiliza la distribución “ t “ student de la siguiente forma: tc = d Sd n Las muestras independientes son aquellas que poseen elementos tales que los que conforman la muestra tomada de la población A, se escogen de modo independiente de los elementos que conforman la muestra tomada de la población B. “Muestras independientes: muestras tomadas de dos poblaciones en tal forma que los elementos que forman una muestra se eligen en forma independiente de los que forman la otra muestra.” 3 Para calcular lo grados de libertad cando se presentan este tipo de muestreo se calculan con la formula que sigue: g .l. = n1 + n2 − 2 3 Anderson, Sweeney, Williams, Estadística para administración y economía. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Las muestras apareadas, dependientes ó acopladas, son aquellas que una vez seleccionados los elementos de la muestra de la población A, se acoplan con una “gemela” de la muestra de la población B. “Muestras apareadas: muestras en las que con cada dato de una muestra se forman parejas con el dato correspondiente de la otra muestra.” El uso de muestras dependientes nos permite realizar un análisis más preciso, porque nos permite controlar factores extraños. ¿Cómo tratar las muestras: como independientes o dependientes? Para contestar esta pregunta podríamos citar los ejemplos siguientes: 1. El INIFAP desea determinar si una nueva semilla de maíz híbrido da un mayor rendimiento que una antigua variedad normal. Si INIFAP pide a 10 agricultores registrar el rendimiento de una hectárea sembrada con la nueva variedad y pide a otros 10 registrar el rendimiento utilizando la misma superficie, sembrada con la antigua variedad, las dos muestras serán independientes. Pero si pide a 10 agricultores sembrar una hectárea con cada variedad y registrar los rendimientos, las muestras serán dependientes y entonces conviene aplicar la prueba de diferencia para muestras pareadas. En el segundo caso, las diferencias debidas a fertilizantes, plaguicidas, riego y otros factores se controlan porque cada agricultor da el mismo tratamiento a sus dos parcelas. Por tanto, las, diferencias en el rendimiento pueden ser atribuidas exclusivamente a la variedad de maíz sembrada. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 2. El director del grupo de secretarias en un gran bufete legal quiere determinar si la velocidad del mecanografiado depende de la clase de máquina de escribir que usan ellas. Si somete a prueba siete secretarias que utilizan máquinas eléctricas y siete que utilizan máquinas mecánicas, deberá tratar como independiente a cada muestra. Si prueba dos veces a las mismas siete secretarias (una vez en cada tipo de máquina de escribir), las dos muestras serán dependientes. En la prueba de diferencia para muestras pareadas, las diferencias entre las secretarias se eliminan como factor influyente, y entonces las diferencias en la velocidad del mecanografiado pueden ser atribuidas a las dos clases de máquina. Para calcular lo grados de libertad en, muestras apareadas: g .l. = n − 1 A continuación se presentan ejemplos que ilustran los casos anteriores: Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán EJEMPLOS PRUEBA DE HIPÓTESIS PARA DOS MEDIAS 1. Una empresa estudia los tiempos de entrega de dos proveedores de materia prima. En general, está satisfecha con el proveedor A, y lo conservará si la media de su tiempo de entrega es igual o menor que la del proveedor B. Suponga que unas muestras independientes dan las siguientes características de tiempo de entrega para los dos proveedores: Proveedor A n = 50 x = 14 días S = 3 días Proveedor B n = 50 x = 12.5 días S = 2 días ¿Qué acción recomendaría respecto a la elección del proveedor, con α = 0.05? SOLUCION Observaciones: Se desea comparar los tiempos de entrega de dos proveedores, por lo tanto se debe aplicar una prueba de hipótesis para dos medias. Las desviaciones estándar de las poblaciones no se conocen, pero los tamaños de muestra son “grandes” n > 30, los que nos permite utilizar la distribución “Z”. Por otra parte la empresa está de acuerdo con su actual proveedor(A) y lo cambiara si encuentra evidencia de que los tiempos de entrega son mayores con respecto a un proveedor B, la prueba indicada es de un extremo a la derecha. 1. Datos µ1 Proveedor A n = 50 x = 14 días S = 3 días Prueba de Hipótesis µ2 Proveedor B n = 50 x = 12.5 días S = 2 días http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 2. Determinar el nivel de significancia : α = 0.05 3. Planteamiento de hipótesis H 0 : µ1 ≤ µ2 H1 : µ1 > µ2 4. Áreas de aceptación y rechazo de la hipótesis nula. 5. Realizar la prueba estadística adecuada: = Ζc Prueba de Hipótesis x1 − x 2 = S12 S 22 + n1 n2 14 − 12.5 = 2.94 32 22 + 50 50 http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 6. Tomar una decisión: Rechazar H0 7. Conclusión: Se encontró evidencia estadística con α = 0.05, de que el tiempo de entrega del proveedor A es mayor que la del proveedor B, se recomienda cambiar de proveedor o comprometer al actual proveedor que disminuya sus tiempos de entrega. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 2. Una compañía constructora está preocupada por el tiempo que se pierde debido a accidentes de trabajo. Por ello, dispuso montar un programa de seguridad para reducir el tiempo perdido debido a dichos accidentes. El programa duró 36 meses y, al finalizar, el tiempo perdido por accidentes tuvo un promedio de 96 h mensuales, con una desviación típica de 15h. En los 36 meses anteriores al programa de seguridad, el tiempo perdido por accidentes promedió 110h mensuales con una desviación estándar de 18h. Determine si fue efectivo el programa de seguridad para disminuir el tiempo perdido por accidentes de trabajo. se un nivel de significación de 5%. SOLUCION Observaciones: Se desea probar si la implementación de un programa de seguridad industrial disminuye el tiempo perdido por accidentes de trabajo, se van a comparar los tiempos perdidos que se tenían anteriormente con los obtenidos después de cierto período de implantación del programa, por lo tanto se debe aplicar una prueba de hipótesis para dos medias. Las desviaciones estándar de las poblaciones no se conocen, pero los tamaños de muestra son “grandes” n > 30, los que nos permite utilizar la distribución “Z”. 1. Datos µ1 Después del programa n = 36 x = 96 horas S = 15 horas µ2 Antes del programa n = 36 x = 110 horas S = 18 horas 2. Determinar el nivel de significancia : α = 0.05 Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 3. Planteamiento de hipótesis H 0 : µ1 = µ2 H1 : µ1 < µ2 4. Áreas de aceptación y rechazo de la hipótesis nula. 5. Realizar la prueba estadística adecuada: Ζc = x1 − x 2 S12 S 22 + n1 n2 = 96 − 110 152 182 + 36 36 =−3.59 6. Tomar una decisión: Rechazar H0 7. Conclusión: Se encontró evidencia estadística con α = 0.05, de que los tiempos perdidos debido a los accidentes de trabajo ha disminuido después de implementar el programa de seguridad. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 3. El director de una escuela cree que si se introduce equipo multimedia a los distintos temas de conversación en la enseñanza del idioma inglés, el estudiante adquiere mayor dominio de dicho idioma. Para poner a prueba tal hipótesis, en la escuela se implemento un laboratorio equipado con multimedia, se impartieron clases durante un periodo de 10 semanas (una hora diaria de lunes a viernes) a un grupo de 36 estudiantes; y utilizando los métodos actuales, a un grupo similar de 40 se le impartieron los mismos temas, pero sin utilizar la multimedia. Al finalizar el curso se obtuvieron los siguientes resultados: Grupo experimental Grupo de control (con multimedia) (sin multimedia) n = 36 alumnos n = 40 alumnos ∑Χ= 2340 ∑Χ=2400 S=9 S = 12 Pruebe si los recursos de multimedia mejoraron el aprendizaje del idioma inglés. Use α= 0.02. SOLUCION Observaciones: Se desea demostrar que la tecnología multimedia aumenta la comprensión del idioma ingles al comparar los resultados obtenidos con los que comúnmente se obtenían sin utilizar esta técnica, se debe aplicar una prueba de hipótesis para dos medias. Las desviaciones estándar de las poblaciones no se conocen, pero los tamaños de muestra son “grandes” n > 30, los que nos permite utilizar la distribución “Z 1. Datos µ1 (con multimedia) Prueba de Hipótesis µ2 (sin multimedia) n = 36 alumnos n = 40 alumnos x = 65 x = 60 S=9 S = 12 http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 2. Determinar el nivel de significancia: α = 0.02 3. Planteamiento de hipótesis H 0 : µ1 = µ2 H1 : µ1 > µ2 4. Áreas de aceptación y rechazo de la hipótesis nula. 5. Realizar la prueba estadística adecuada: = Ζc x1 − x 2 = S12 S 22 + n1 n2 65 − 60 = 2.07 92 122 + 36 40 6. Tomar una decisión: Rechazar H0 7. Conclusión: Se encontró evidencia estadística con α = 0.02, de que la tecnología multimedia incrementa la comprensión del idioma ingles. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 4. Suponga que se toman muestras aleatorias independientes de 15 obreras sindicalizadas y 20 no sindicalizadas, todas ellas trabajaban a destajo y se obtuvieron los siguientes salarios por día en pesos. Obreras sindicalizadas 122.4 118.9 116.7 114.05 116.2 120.0 116.1 119.1 116.5 118.5 119.8 117.0 114.3 117.2 116.3 Obreras no sindicalizadas 117.6 114.4 116.6 115.0 117.65 115.0 117.55 111.2 115.9 119.2 111.85 116.65 115.2 115.3 113.3 ¿Parece haber alguna diferencia en el salario promedio entre los dos grupos? SOLUCION Observaciones: Se van a comparar los salarios de dos grupos de mujeres trabajadoras, se debe aplicar una prueba de hipótesis para dos medias. Las desviaciones estándar de las poblaciones no se conocen, y los tamaños de muestra son “pequeñas” n ≤ 30, los que nos indica que la distribución apropiada es la “t” de estudent con sus grados de libertad correspondientes, al utilizar a dos grupos de mujeres trabajadoras diferentes las muestras son independientes. 1. Datos Prueba de Hipótesis µ1 µ2 (obreras sindicalizadas) (obreras sindicalizadas) n = 15 obreras n = 15 obreras x = 117.54 x = 115.49 S = 2.24 S = 2.21 no http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 2. Determinar el nivel de significancia : α = 0.05 3. Planteamiento de hipótesis H 0 : µ1 = µ2 H1 : µ1 ≠ µ2 4. Áreas de aceptación y rechazo de la hipótesis nula. g .l. = 15 + 15 − 2 g .l. = 28 2.05 ∴ tt = 5. Realizar la prueba estadística adecuada: tc 117.54 − 115.49 = 2.52 (15 − 1) 2.242 + (15 − 1) 2.212 • 1 + 1 15 + 15 − 2 15 15 6. Tomar una decisión: Rechazar H0 7. Conclusión: Se encontró evidencia estadística con α = 0.05, de que existe una diferencia significativa en los salarios de ambos grupos de mujeres trabajadoras. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 5. Juan Díaz es un supervisor de producción en una línea de montaje de las unidades de disco de una empresa ensambladora de computadoras. Esta compañía contrató un sistema de música ambiental, con la esperanza de que los trabajadores se relajen y aumenten su productividad. El señor Díaz se muestra escéptico ante esa hipótesis y teme que la música los distraiga y haga disminuir su productividad. Muestreo la producción semanal de seis trabajadores antes que la música fuera instalada y después de la instalación, a continuación se muestran los datos que obtuvo: Empleado Semana sin música 1 137 2 140 3 148 4 147 5 143 6 140 Semana con música 142 136 158 145 150 148 ¿Ha aumentado producción promedio? Utilice α = 0.025. SOLUCION Observaciones: Se va a compara la productividad de una muestra de empleados con dos ambientes de trabajo, sin y con música, Además a cada persona se le cuenta su productividad en cada ambiente de trabajo, por lo tanto se trata de un muestreo apareado, la distribución apropiada es la “t” de estudent con sus grados de libertad correspondientes 1. Datos Empleado 1 2 3 4 5 6 µ1 Semana con música µ2 137 140 148 147 143 140 142 136 158 145 150 148 Diferencia (d) -5 4 -10 2 -7 ∑= d -8 -24 Semana sin música d= Prueba de Hipótesis −24 = −4.0 6 S d = 5.69 http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 2. Determinar el nivel de significancia: α = 0.02 3. Planteamiento de hipótesis H 0 : µ1 = µ2 H1 : µ1 < µ2 4. Áreas de aceptación y rechazo de la hipótesis nula. g .l.= 6 − 1 g .l. = 5 ∴ tt = 2.57 5. Realizar la prueba estadística adecuada: tc = −4 d = = −1.72 S d 5.69 6 n 6. Tomar una decisión: Aceptar H0 7. Conclusión: Se encontró evidencia estadística con α = 0.025, que la productividad de los trabajadores es igual en los dos ambientes de trabajo, o bien no se encontró una diferencia significativa, es decir un ambiente de trabajo con música no incrementa la productividad. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán PRUEBA DE HIPÓTESIS PARA DOS PROPORCIONES Se pueden determinar pruebas de hipótesis donde intervienen dos poblaciones, cuando la diferencia entre sus respectivas proporciones es de mayor importancia. Al igual que en la prueba de hipótesis para la diferencia entre dos medias, en este caso, también se utiliza para comparar dos situaciones, que sean similares entre sí. Procedimiento para elaborar una prueba de hipótesis para dos proporciones. 1. Obtención de los datos 2. Determinar el valor de α 3. Plantear las hipótesis. Bilateral H 0 : π1 = π 2 H1 : π 1 ≠ π 2 Unilateral a la izquierda = H 0 : π1 π 2 H 0 : π1 ≥ π 2 H1 : π 1 < π 2 H1 : π 1 < π 2 Unilateral ala derecha H 0 : π1 π 2 H 0 : π1 ≤ π 2 = H1 : π 1 > π 2 H1 : π 1 > π 2 Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 4. Establecer las áreas de aceptación y rechazo. 4 5. Realizar la prueba estadística y tomar una decisión. 6. Emitir una conclusión en términos del problema. Prueba estadística adecuada: Recordemos que la distribución binomial es la distribución correcta de muestreo, únicamente tenemos que asegurarnos de que np y nq sean mayores que cinco, para poder utilizar la distribución “Z”. Para calcular la prueba estadística adecuada se utiliza la siguiente formula. Ζc = p1 − p2 σ p1 − p 2 Para calcular el error estándar estimado de la diferencia entre dos proporciones: σ 4 p1 − p 2 = p1 • q1 p2 • q2 + n1 n2 De igual manera se establecen, como en la prueba de hipótesis para una proporción. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán EJEMPLO: 1. El gerente de un restaurante de pizzas desea saber si los pedidos por teléfono recibidos durante el día (A) y durante la noche (B) se entregan a tiempo en la misma proporción. En una prueba de tres meses, tomo una muestra de 250 de dichos pedidos (de día y de noche) y encontró que 240 de día y solo 220 de noche son entregados a tiempo. Haga la prueba con un nivel de significancia de 0.05. 1. DATOS * Pedidos de día n = 250 pedidos de los cuales p = 240 / 250= 0.96 q = 1 – 0.96 = 0.04 * Pedidos de noche n = 250 pedidos de los cuales p = 220 / 250= 0.88 q = 1 – 0.88 = 0.12 2. Determinar el valor de α α = 0.05 3. Plantear la hipótesis H 0 : π1 = π 2 H1 : π 1 ≠ π 2 Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 4. Áreas de aceptación y rechazo ∴0.5 − .025 = 0.475 z = 1.96 Zc = 0.96 − 0.88 = 3.33 0.96 × 0.04 0.88 × 0.12 + 250 250 5. Decisión: Rechazar H0 6. Conclusión Se encontró evidencia estadística con un nivel de significancia del 5% que los pedidos recibidos por teléfono durante el día y noche no se entregan en la misma proporción. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán EVALUACIÓN DE CONOCIMIENTOS BÁSICOS Relacione las dos columnas y determine la letra que le corresponde a cada uno de los enunciados de la izquierda: Probabilidad de un error de tipo II. ( ) Conclusión que aceptamos cuando los datos no apoyan la hipótesis nula. ( ) Hipótesis, o suposición, acerca de un parámetro de la población que deseamos probar, generalmente una suposición del status quo (situación actual). ( ) Rechazo de una hipótesis nula cuando es verdadera ( ) Aquellas que se extraen de dos poblaciones de modo que los elementos no sean seleccionados independientemente entre sí, a fin de permitir un análisis más preciso o controlar algunos factores extraños. ( ) Probabilidad de un error de tipo I. ( ) Suposición, o conjetura, que hacemos sobre un parámetro de la población ( ) Prueba de hipótesis, en la cual hay sólo una región de rechazo; es decir, únicamente nos interesa saber si el valor observado se desvía del supuesto valor en una dirección ( ) Aceptación de una hipótesis nula cuando es falsa ( ) Prueba de Hipótesis A. ERROR DE TIPO I B. HIPOTESIS C. ALFA α D. HIPOTESIS ALTERNATIVA E. HIPOTESIS NULA F. BETA β G. MUESTRAS DEPENDIENTES H. NIVEL DE SIGNIFICANCIA I. ERROR DE TIPO II http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Continuación Relacione las dos columnas y determine la letra que le corresponde a cada uno de los enunciados de la izquierda: Prueba de hipótesis de un extremo, en la cual un valor muestral que está significativamente por encima del supuesto valor de la población llevará a rechazar la hipótesis nula. ( ) Valor que indica el porcentaje de los valores muestrales que se halla fuera de ciertos límites, suponiendo que la hipótesis nula sea correcta, esto es, la probabilidad de rechazarla cuando es verdadera. ( ) Prueba de hipótesis en la cual se rechaza la hipótesis nula, si el valor muestral es significativamente mayor o menor que el supuesto valor del parámetro de la población; prueba que incluye dos regiones de rechazo. ( ) Prueba de hipótesis de un extremo, en la cual un valor muestral que está significativamente por debajo del supuesto valor de la población nos llevará a rechazar la hipótesis nula. ( ) Prueba de hipótesis de la diferencia entre las medias muestrales de dos muestras dependientes. ( ) Prueba de Hipótesis J. PRUEBA DE DIFERENCIAS PAREADAS K. PRUEBA DE DOS EXTREMOS L. PRUEBA DE EXTREMO (COLA) SUPERIOR M. PRUEBA DE EXTREMO INFERIOR N. PRUEBA DE UN EXTREMO (COLA) http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán EJERCICIOS PROPUESTOS 1. La cadena de tiendas MARTI de artículos deportivos ha iniciado una promoción especial para su horno de propano y piensa que la promoción deberá culminar en un cambio de precio. Sabe que, antes de comenzar la promoción, el precio promedio al menudeo del horno era de $419.5 pesos, con una varianza de $2872.96 pesos. La tienda muestrea 16 de sus detallistas una vez iniciada la promoción y descubre que el precio medio de los hornos ahora es de $389.5 pesos. En un nivel de significancia de .02, ¿tiene motivos para pensar que el precio promedio al menudeo ha disminuido? Solución: a) Zc = - 2.24 Se rechaza H0. 2. De año 2000 al 2005, la razón media de precio/ganancias de de las acciones que cotizan en la Bolsa de Mexicana de Valores fue de 14.35%, con una desviación estándar de 9.73. En una muestra de 30 acciones elegidas al azar, la razón media de precio/ganancias fue de 11.77% en 2006. ¿Esta muestra ofrece suficiente evidencia para afirmar (en un nivel de significancia de .05) que en el presente año la razón media de la Bolsa Mexicana de Valores ha disminuido con respecto a su valor anterior? Solución: a) Zc = -1.45 Se acepta H0. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 3. Una fábrica de focos supone que la vida de su producto es de 145 horas, con una desviación estándar de 21 horas. De una muestra de 25 focos se obtiene una media muestral de 130 horas. En un nivel de significancia de .01, ¿debe la compañía concluir que la vida media de los focos es menor que las 145 horas supuestas? Solución: a) Zc = - 3.57 Se rechaza H0. 4.Cinepolis sabe que una película de gran éxito se exhibirá un promedio de 84 días con una desviación estándar de 10 días, en cada sala donde se pase la cinta, El gerente de Cinepolis ubicado en plaza San Marcos en Cuautitlan Izcalli desea comparar la popularidad de la película de éxito en su región con la que alcanzó en otras sucursales del país. Seleccionó aleatoriamente 75 Cinepolis del país y descubrió que exhibieron la película un promedio de 81.5 días. Con un nivel de significancia de 1 %, pruebe esta hipótesis. Solución: a) Zc = - 2.17 Se acepta H0. 5. Un gerente afirma que la comisión promedio que cobra ESTAFETA por los servicios de paquetería con 500 gramos o menos de peso es de $144 pesos, con una desviación estándar de $52 pesos. Un contador tomo una muestra aleatoria de 121 órdenes de los clientes y determinó que pagaron un promedio de $151 pesos por los servicios de paquetería. Con un nivel de significancia de .10, ¿podemos afirmar que los costos de mensajería de Estafeta son superiores? Solución: a) Zc = 1.48 Se rechaza H0. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 6. Todos los días la PFP, descubre aproximadamente 28 millones de pesos en artículos introducidos ilegalmente al país, (aduanas, aeropuertos, puertos, puntos de venta, comercio informal etc.) con una desviación estándar de $16 millones al día. En una muestra de 64 días, este organismo interceptó un promedio de 30.3 millones de dólares en artículos de contrabando. ¿Indica esa muestra que a las autoridades responsables les debe preocupar el hecho de que el contrabando haya rebasado su nivel histórico? Solución: a) Zc = - 1.15 Se acepta H0. 7. El consumo de gasolina en México había crecido a una tasa mensual de .57%, con una desviación estándar de .10% al mes. En 15 meses escogidos aleatoriamente, el consumo de gasolina aumentó a un porcentaje promedio de apenas .43% por mes. En un nivel de significancia de .01, ¿puede afirmar usted que el consumo de gasolina ha disminuido? Solución: a) Zc = -5.42 Se rechaza H0. 8. Un jugador consiguió un promedio de bateo de .343, con una desviación estándar de .018. y encabezó la liga en el promedio de bateo durante muchos años. Sin embargo, en el 2006 su promedio es apenas de .306. El jugador está renegociando su contrato de la próxima temporada, y el sueldo que obtendrá depende mucho de su capacidad para convencer al dueño del equipo de que su promedio de bateo anterior y el de la temporada 2006 no difiere significativamente. Si el dueño está dispuesto a usar un nivel de significancia de .02, ¿reducirá el sueldo del jugador en el próximo año? Solución: a) Zc = Prueba de Hipótesis -2.06 Se rechaza H0. http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 9. El 19% de las amas de casa prefiere la marca “Colgate” según lo publicado por una revista el año pasado. Se hizo un estudio y se muestreó 85 amas de casa y se encontró que 14.12% de ellas prefieren la marca. Con un nivel α de 0.04, ¿hay pruebas de que la marca ha disminuido en las preferencias de las amas de casa? Solución: Zc = -1.14 Se acepta H0. 10. Crédito Familiar sucursal Cuautitlan I en el último año otorgo más de 9500 prestamos, 350 fueron muestreados para determinar qué proporción fue concedida a las mujeres. La muestra reveló que 41 % de los préstamos se otorgaba a las mujeres. Un estudio similar, efectuado hace 5 años, mostró que 35% de los prestatarios eran mujeres. En un nivel de slgnificancia de .02, ¿puede usted afirmar que la proporción de préstamos otorgados a las mujeres ha cambiado significativamente durante los últimos 5 años? Solución: Zc = -2.35 Se rechaza H0. 11. Algunos teóricos de las finanzas piensan que los precios diarios del mercado de valores, constituyen una "fluctuación aleatoria con tendencia positiva". Si tienen razón, entonces el promedio industrial Dow Jones habrá de mostrar una ganancia en más del 50% los días de actividad bursátil. Si el promedio aumentará en 101 de 175 días seleccionados aleatoriamente, ¿qué pensaría usted de la teoría anterior? Use un nivel de significancia de .01. Solución: Prueba de Hipótesis Zc = -2.03 Se acepta H0. http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 12. La “Costeña” está a punto de decidir si producir una marca nueva de tomate con mucho condimento. El departamento de investigación de la compañía aplicó una encuesta telefónica a nivel nacional en 6,000 familias y averiguó que la salsa sería comprada por 335 de ellas. Un estudio mucho más exhaustivo hecho 2 años antes reveló que 5% de las familias comprarían la marca entonces. En un nivel de significancia de 2%, ¿deberá la compañía concluir que hay un mayor interés en el sabor más condimentado? Zc = Solución: 13. Un fabricante de cortadoras de pasto -2.06 Se rechaza H0. quiere comparar la confiabilidad de los aparatos que él produce con la de otra marca que se expende a nivel nacional. Sabe que 15% de las cortadoras de su competidor requieren reparación durante él primer año de uso. Una muestra de 120 de sus clientes reveló que, 22 de ellos, necesitaban reparaciones el primer año de uso. En el nivel de significancia de .02, ¿hay evidencia de que las cortadoras del comerciante difieren en su confiabilidad de las de su competidor? Solución: Zc = 1.02 Se acepta H0. 14. Si tenemos una media muestral de 15.7, una desviación están dar de la muestra de 6 y un tamaño de la muestra de 16, pruebe la hipótesis de que el valor de la media de la población es 17 contra la alternativa de que éste sea menor que 17. Use un nivel de significancia de .025. Solución: tc = -0.87 Se acepta H0. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 15. Si una muestra de 20 exámenes revela una media muestral de 16 aciertos y una variancia muestral de 2.25 aciertos pruebe la hipótesis de que la media de la población es de 15 aciertos, contra la alternativa de que sea algún otro valor. Use el nivel de significancia de .01. Solución: tc = 2.98 Se rechaza H0. 16. Un vendedor de bienes raíces tomó una muestra aleatoria de 7 casas en una zona del municipio de Atizapan de Zaragoza en el estado de México y encontró que el valor promedio estimado del mercado era de $560,000 pesos, con una desviación estándar de $49,000 pesos. Pruebe la hipótesis de que, para todas las casas de la zona, el valor medio estimado es inferior de $600,000 pesos. Use el nivel de significancia de .05. Solución: tc = -2.16 Se rechaza H0. 17. El departamento de procesamiento de datos de la compañía de seguros de vida MetLife México ha instalado nuevas terminales de video a colores para reemplazar las unidades monocromáticas usadas anteriormente. Los 95 operadores capacitados para emplear las nuevas máquinas necesitaban un promedio de 7.2 horas antes de alcanzar un nivel satisfactorio de rendimiento. Su variancia muestral fue de 16.2 horas al cuadrado. La larga experiencia con operadores en las antiguas terminales monocromáticas revela que tenía un promedio de 8.1 horas en las máquinas antes de dar un rendimiento satisfactorio. En un nivel de significancia de .01, ¿debe el supervisor del departamento llegar a la conclusión de que es más fácil aprender a operar las nuevas máquinas? Solución: Prueba de Hipótesis Zc = -2.17 Se acepta H0. http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 18. Un documental de televisión dedicado a la comida chatarra afirmó que, en promedio, los norteamericanos tienen un exceso de peso de 10 libras aproximadamente. Para probar esta hipótesis, se tomó una muestra de 18 personas seleccionados aleatoriamente, y se descubrió que su exceso promedio de pesó era de 12.4 libras, con una desviación están dar de la muestra de 2.7 libras. En un nivel de significancia de .01, ¿hay razones para dudar de lo mostrado en el documental? Solución: tc = 3.77 19. Un distribuidor, de software para sistemas Se rechaza H0. operativos de computadoras personales está planeando la oferta inicial de sus existencias al público, a fin de reunir suficiente capital de trabajo y financiar el desarrolló de un sistema integrado de la séptima generación. Con las actuales ganancias de $1.61 por acción, el distribuidor y sus suscriptores estaban considerando un precio de oferta de $21, o sea 13 veces las ganancias. A fin de verificar si el precio es adecuado, escogieron en forma aleatoria 7 firmas de software cotizadas en la bolsa de valores y descubrieron que su razón promedio de precio/ganancias era de 11.6, con una desviación estándar de la muestra de 1.3. Cuando α = .02, ¿puede el distribuidor afirmar que las acciones de las empresas de software cotizadas en la bolsa de valores tienen una razón promedio de precio/ganancias que es significativamente diferente de 13? Solución: tc = -2.85 Prueba de Hipótesis Se acepta H0. http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 20. Se reunieron dos muestras independientes de observaciones. En la primera muestra de 40 elementos, la media fue de 198 y la desviación estándar de 15. La segunda muestra de 55 elementos tenía una media de 204 y una desviación estándar de 11. Usando α = .01, pruebe si puede considerarse razonablemente que las dos muestras provienen de poblaciones que tengan la misma media. Solución: Zc = -2.14 Se acepta H0. 21. Para celebrar su primer aniversario, Raúl Pérez decidió comprarle a su esposa unos aretes de diamantes. Le mostraron 9 pares con gemas de marquesa que pesaban aproximadamente 2 quilates cada par. Debido a las diferencias de color y calidad de las piedras, los precios variaban de un juego a otro. El precio promedio era de $2,990 pesos con una desviación estándar de $370 pesos. Raúl también examinó 6 pares con piedras en forma de pera, que tenían aproximadamente el mismo peso de dos quilates. Estos aretes costaban un precio promedio de $3,065 pesos, con una desviación estándar de $805 pesos. Basándose en esta evidencia, ¿puede Raúl concluir (en un nivel de significancia de .05) que, los diamantes en forma de pera cuestan más en promedio que los diamantes de marquesa? Solución: tc = -0.25 Prueba de Hipótesis Se acepta H0. http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 22. Los datos que muestra a continuación son una muestra escogidas de aleatoria de 9 la revista The empresas Wall Street Journal del 5 de febrero de 2006. ¿Fueron en promedio diferentes las ganancias por acción en 2004 y 2005? Realice la hipótesis con α = .02. Empresa Ganancias en 1984 Ganancias en 1985 1 1.38 2.48 2 1.26 1.50 3 3.64 4.59 4 3.50 3.06 5 2.47 2.11 6 3.21 2.80 Solución: tc = -0.54 7 1.05 1.59 8 1.98 0.92 9 2.72 0.47 Se acepta H0. 23. En las negociaciones de la revisión del contrato colectivo de las AAPAUNAM, el sindicato realizó entrevistas entre sus agremiados, para averiguar si preferían un incremento considerable en primas para la jubilación o un aumento más pequeño al salario. En una muestra de 1000 hombres, 743 se pronunciaron en favor del incremento en las primas para la jubilación. De 500 mujeres entrevistadas, 405 estuvieron en favor del aumento a las primas de jubilación. Pruebe la hipótesis según la cual proporciones iguales de hombres y mujeres favorecen el incremento de las prestaciones de la jubilación. Use un nivel de slgnificancia de .05. Solución: Prueba de Hipótesis Zc = -0.67 Se acepta H0. http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 24. Una muestra de 32 fondos de inversión que ofrecen los bancos a los ahorradores; mostró que su tasa anual promedio de rendimiento durante el año de 2006 fue de 7.23%, con una desviación estándar de la muestra de .51 %. Un año antes, una muestra de 38 fondos de inversión tuvo una tasa promedio de rendimiento de 8.36%, con una desviación estándar de la muestra de .84%. ¿Es razonable concluir que las tasas de interés de este instrumento de inversión han disminuido durante 2006? Solución: Zc = -6.92 Se rechaza H0. 25. Dos laboratorios de investigación han producido independientemente medicamentos que dan alivio a los que sufren artritis. El primer fármaco fue probado en un grupo de 90 víctimas de artritis, dando un promedio de 8.5 horas de alivio, con una desviación estándar de 1.8 horas. El segundo fármaco fue probado en 80 víctimas de artritis y produjo un promedio de 7.9 horas de alivio, con una desviación estándar de 2.1 horas. En un nivel de significancia de .05, ¿ofrece el segundo medicamento un periodo significativamente más corto de alivio? Solución: Prueba de Hipótesis Zc = 1.8 Se rechaza H0. http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 26. Dos secciones de una gran ciudad están siendo consideradas como sede de centros de atención diurna. De 200 familias entrevistadas en una sección, la proporción en que la madre trabajaba de tiempo completo fue de 0.52. En la otra sección, 40% de las 150 familias entrevistadas tenían madres que trabajaban en empleos de tiempo completo. En un nivel de significancia de .04, ¿existe una diferencia significativa en la proporción de madres que trabajan en las 2 áreas de la ciudad? Solución: Zc = 2.25 Se rechaza H0. 27. Una planta eléctrica alimentada con carbón está estudiando la posibilidad de instalar 2 sistemas diferentes de anticontaminación. El primero ha reducido la emisión de contaminantes a niveles aceptables 68% de las veces, determinados con 200 muestras de aire. El segundo sistema, más costoso, ha disminuido las emisiones a niveles aceptables en 76% de las veces, determinados con 250 muestras de aire. Con un nivel α = 0.02 determine si el segundo sistema es más eficiente para disminuir la contaminación. Solución: Prueba de Hipótesis Zc = -1.76 Se acepta H0. http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 28. Banca Serfin quiere determinar la eficiencia ejecutivos de de sus cuenta nuevos en la obtención de clientes. Luego de terminar su capacitación, los nuevos ejecutivos dedican varias semanas a conseguir clientes para que abran cuentas en el banco. Los datos que se muestran a continuación representan el número de nuevas cuentas abiertas en sus dos primeras semanas por 10 ejecutivas y 8 ejecutivos de cuenta seleccionadas al azar. ¿Podría concluirse que las mujeres son más eficaces en obtención de nuevas cuentas que los hombres? Número de cuentas nuevas Ejecutivas de cuenta 12 11 14 13 13 14 13 12 Ejecutivos de cuenta 13 10 11 12 13 12 10 12 Solución: tc =2.25 14 12 Se rechaza H0. 29. La PROFECO selecciona varios modelos de automóvil y evalúa su ahorro de combustible. En el estudio de este año sobre 2 modelos subcompactos de 2 fabricantes, el Kilometraje promedio de 12 automóviles de marca A fue de 10.94 kilómetros por litro, con una desviación están dar de 1.53 kilómetros por litro. Las 9 unidades de la marca B que fueron probadas arrojaron un promedio de 12.9 kilómetros por litro con una desviación estándar de 1.73 kilómetros por litro. Con alfa al 2%, ¿debe llegarse a la conclusión de que los automóviles de ambas marcas tienen el mismo rendimiento de kilometraje por litro de gasolina consumido? Solución: tc = -2.75 Prueba de Hipótesis Se rechaza H0. http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 30. A nueve proveedores de la FESC de equipo de cómputo se les solicito una cotización de 2 impresoras semejantes tipo láser. Los resultados de estas cotizaciones se muestran a continuación. ¿Es razonable afirmar que, en promedio, la impresora marca HP cuesta menos que la impresora Xerox? Distribuidor 1 2 3 4 5 6 7 8 9 Precio de HP 3500 4190 3850 3600 4050 3950 3890 4090 3750 Precio de Xerox 3700 4250 3690 3750 3890 3850 3950 4250 4000 Solución: tc = -0.98 Se acepta H0. 31. Un fabricante de auto partes acaba de desarrollar dos nuevos limpiaparabrisas de dos materiales sintéticos, desea investigar si los limpiaparabrisas tienen la misma durabilidad. Equipa 12 automóviles, pertenecientes a empleados de la empresa, con limpiaparabrisas fabricados de los dos materiales sintéticos. En 6 de los vehículos el limpiaparabrisas derecho fue fabricado con el material A y el de la izquierda con el material B; en otros 6 automóviles, el material A se utilizó en el limpiaparabrisas izquierdo. Los automóviles fueron conducidos en condiciones normales de manejo hasta que los limpiaparabrisas empezaron a deteriorarse y ya no limpiaban bien. Los datos anexos proporcionan la vida útil (en días) de los limpiaparabrisas. ¿Tienen la misma durabilidad los limpiaparabrisas fabricados con los dos materiales sintéticos? Automóvil 1 2 3 4 5 6 7 8 9 10 11 12 Limpiaparabrisas Izquierdo 162 323 220 274 165 271 233 156 238 211 241 154 Limpiaparabrisas Derecho 183 347 247 269 189 257 224 178 263 199 263 148 Solución: tc = -0.51 Se acepta H0. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 32. Una fábrica de pastillas de RAM (memoria de acceso aleatorio) para computadoras está en vías de decidir si sustituirá su actual línea de montaje semi automatizada por una línea totalmente automatizada. Esta empresa ha reunido algunos datos de pruebas preliminares sobre la producción de pastillas por hora, datos que se presentan a continuación, y quisiera saber si debe mejorar su línea de montaje. Formule (y pruebe con α = .02) las hipótesis correspondientes para ayudarle a llegar a una decisión. x Línea semiautomática Línea automática 198 206 Solución: s 32 29 n 150 200 Zc = -2.40 Se rechaza H0. 33. Un club de salud ha estado anunciando un riguroso programa de acondicionamiento físico. El club sostiene que, al cabo de 1 mes en el programa, el participante promedio será capaz de hacer en dos minutos 8 planchas más de las que podía hacer al inicio del programa. Se tomo una muestra de 10 participantes que están en el programa ¿Qué opina de la afirmación del club? Use el nivel de significancia de .025. Participante 1 2 3 4 5 6 7 8 9 10 Antes Después 38 45 11 24 34 41 25 39 17 30 38 44 12 30 27 39 32 40 29 41 Solución: tc = -9.01 Se rechaza H0. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 34. Un grupo de médicos clínicos está efectuando pruebas con algunos pacientes para determinar la eficiencia de un nuevo antihipertensivo. Un grupo de enfermos con hipertensión fueron elegidos al azar y luego fueron asignados aleatoriamente al grupo de control (que recibía un antihipertensivo bien probado) o al grupo experimental (que recibía el nuevo fármaco). Los médicos anotaron el porcentaje de pacientes cuya presión sanguínea se redujo a un nivel normal en el lapso de un año. En un nivel de significancia de 0.01, pruebe las hipótesis apropiadas para comprobar si el nuevo medicamento es significativamente más eficaz que el anterior para reducir la hipertensión. GRUPO PROPORCIÓN QUE MEJORÓ NUMERO DE PACIENTES Experimental 0.45 120 Control 0.36 150 Solución: Zc = 1.50 Se acepta H0. 35. Un armador de automóviles piensa que es exagerada la afirmación del fabricante de llantas pues asegura que la vida de sus productos es de 40,000 millas. El distribuidor registra cuidadosamente el millaje obtenido con una muestra de 64 de esas llantas. La media resulta ser 38,500 millas. La desviación estándar de la vida de todas las llantas de este tipo fue calculada antes por el fabricante en 7,600 millas. Suponiendo que el millaje tiene una distribución normal, determine el máximo nivel de significancia en el cual aceptaremos la afirmación del fabricante respecto a la vida de sus llantas. Solución: Prueba de Hipótesis α = 0.0571 http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 36. Recientes investigaciones han mostrado que al menos 40% de los adultos toman regularmente una taza de café durante el desayuno. Una muestra aleatoria de 450 individuos reveló que 200 de ellos solían tomar café en el desayuno. ¿Cuál es el valor probable de α en una prueba de hipótesis que pretende demostrar que la afirmación de las investigaciones era correcta? (Sugerencia: pruebe H0:π=0.4 frente a H1: π>0.4) Solución: α = 0.0274 37. Un taller usa una sierra controlada por una máquina para cortar secciones de los tubos que se emplean en los aparatos de medición de la presión. La longitud de las secciones está normalmente distribuida, con una desviación estándar de .06 pulg. Se han cortado 25 piezas con la máquina calibrada para cortar secciones de 5. Pulgadas de largo. Cuando se las midió, su longitud media fue de 4.97 pulgadas. Use valores probables de α para determinar si la máquina debería ser recalibrada porque la longitud media es significativamente diferente de 5 pulgadas. Solución: Prueba de Hipótesis α = 0.0062 http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 38. Una empresa de servicios educativos anuncia que 80% de las veces su curso de preparatoria aumentará la puntuación de un individuo en los exámenes de admisión a la universidad. El director de mercadotecnia de la empresa, desea averiguar si se trata de una afirmación razonable. Ha examinado los registros de 125 estudiantes que se inscribieron en el curso y descubrió que 94 de ellos efectivamente aumentaron su puntuación. Use valores probables de α para determinar si los anuncios de la empresa de servicios educativos deben cambiarse porque el porcentaje de los estudiantes cuyas calificaciones aumentan es significativamente diferente de 80%. Solución: α = 0.0901 39. La biblioteca de la FESC sospecha que el número promedio de libros prestados a cada alumno por semana ha cambiado en los últimos Anteriormente, años. un promedio de 3.4 libros se prestaban a los alumnos por semana. Sin embargo, una muestra reciente de 23 estudiantes dio un promedio de 4.3 libros por semana, con una desviación estándar de 1.5 libros. En un nivel de significancia de .01, ¿ha aumentado el promedio de libros prestados? Solución: tc = 2.87 Se rechaza H0. Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 40. La PROFECO investiga las acusaciones contra una embotelladora que recientemente inicio operaciones en el país BIGCOLA, porque no llena los refrescos correctamente, ha muestreado 200 botellas y ha descubierto que el contenido promedio es de 31.7 onzas de líquido. En la etiqueta de las botellas se imprimió un contenido neto de 32 onzas de líquido. Se sabe que la desviación están dar del proceso es de 1.5 onzas de líquido. ¿Deben los inspectores llegar a la conclusión de que, las botellas no están siendo llenadas correctamente? Use un α=0.02. Solución: Zc = -2.82 Se rechaza H0. 41. El grupo Steren vende todo lo relacionado a la electrónica y sus componentes. Ha tenido mucho éxito en muchas ciudades donde hay universidades, pero también ha sufrido algunos fracasos. Un análisis de estos últimos la ha llevado a adoptar una política de no abrir una tienda a menos que tenga una seguridad razonable de que por lo menos 15% de los estudiantes de la ciudad compren sus productos. Una encuesta de 300 de los 2,400 estudiantes realizada en un pequeño colegio de humanidades, ha revelado que 57 de ellos comprarían sus productos. Si la empresa está dispuesta a correr un riesgo de 5%, ¿debe abrir una tienda en esta localidad? Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 42. En 1982, una encuesta de 50 hospitales municipales de Estados Unidos reveló una tasa promedio de ocupación de 73.6%, con una desviación estándar de 18.2%. Otra encuesta de 75 hospitales municipales, realizada en 1985, descubrió una tasa promedio de ocupación de 68.9%, con una desviación estándar de 19.7%. ¿Podemos afirmar que la tasa promedio de ocupación ha aumentado significativamente durante los 3 años transcurridos entre las encuestas? 43. En respuesta a las críticas concernientes al extravío de correspondencia, SEPOMEX implantó nuevos procedimientos para resolver el problema. Al jefe de correos se le ha asegurado que con este cambio se reducirán las pérdidas por debajo del porcentaje tradicional de 0.3%. Después de que los nuevos procedimientos llevaban 2 meses en vigor, SEPOMEX patrocinó una investigación en la cual un total de 8,000 cartas fueron enviadas desde varias partes del país. Dieciocho de ellas no llegaron a su destino. En un nivel de significancia de .10, ¿puede el jefe de correos afirmar que los nuevos procedimientos cumplieron su cometido? 44. Si queremos aceptar la hipótesis nula 75% de las veces cuando es correcta, ¿dentro de cuántos errores estándar alrededor de la supuesta media debe caer la media muestral para que se halle en la región de aceptación? ¿Y dentro de cuántos debe caer si queremos tener una seguridad de 96% de aceptar la hipótesis nula cuando sea verdadera? Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán 45. Una compañía está tratando de mejorar la distribución de su producto estrella Yacult. Para lograrlo ha ampliado su fuerza de ventas pues quiere introducir el producto en nuevos locales. Antes del incremento de la fuerza de ventas, la compañía muestreó 150 tiendas de abarrotes y averiguó que 44% de ellas expendían el producto. Luego de contratar a más vendedores, una muestra de 200 tiendas de abarrotes indicó que 52% de ellas vendían Yacult. Con α = 0.04, ¿puede la compañía concluir que la distribución del Yacult ha mejorado? Prueba de Hipótesis http://www.cuautitlan.unam.mx Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Prueba de Hipótesis http://www.cuautitlan.unam.mx