Intervalos de Confianza y Prueba de Hipótesis Antes de iniciar estudiaremos lo relacionado a probar diferentes tipos de hipótesis, empezando por definir que es una hipótesis y una prueba de hipótesis, enlistaremos los pasos para probar una hipótesis, y realizaremos pruebas de hipótesis relativas a la media de una población y a las medias de dos poblaciones. Aunque se pueden establecer pruebas de hipótesis para la proporción, para la varianza de una población o para dos poblaciones. Esto último ya se presentó en clase. En lo que respecta a Intervalos de confianza ya se presentó un documento similar ¿Qué es una hipótesis? Hipótesis es una afirmación o suposición respecto al valor de un parámetro poblacional Son ejemplos de hipótesis, o afirmaciones hechas sobre un parámetro poblacional las siguientes: El ingreso mensual promedio de los trabajadores de la Ciudad de Puebla es $4500.00 El rendimiento de una reacción es del 80% El 20% de los delincuentes capturados son sentenciados a prisión El consumo de gasolina promedio por auto es de 10 litros diarios Todas estas hipótesis tienen algo en común, las poblaciones de interés son tan grandes que no es factible estudiar todos sus elementos. Como ya sabemos, una alternativa a estudiar la población entera es tomar una muestra de la población de interés. De esta manera podemos probar una afirmación para determinar si la evidencia soporta o no la afirmación. ¿Qué es una prueba de hipótesis? Una prueba de hipótesis comienza con una afirmación o suposición acerca de un parámetro poblacional, tal como la media poblacional. Una hipótesis podría ser que la colegiatura que pagan los estudiantes universitarios de la República Mexicana es en promedio de 3000 pesos. Para comprobar esta hipótesis no podríamos contactar a todos los estudiantes universitarios de la república, el costo sería exorbitante. Para probar la validez de esta afirmación podríamos seleccionar una muestra de la población de estudiantes y basados en ciertas reglas de decisión, aceptar o rechazar la hipótesis. Si la media muestral fuera de 1000 pesos ciertamente tendríamos que rechazar la hipótesis, pero si la media muestral fuera 2990 pesos ¿podríamos asumir que la media poblacional si es de 3000 pesos?, ¿podemos atribuir al error de muestreo la diferencia de 10 pesos entre las dos medias, o es una diferencia significativa? Prueba de hipótesis es un procedimiento basado en una evidencia muestral (es decir en el estudio de una muestra) y la teoría de la probabilidad. Este procedimiento se usa para determinar si la hipótesis es una afirmación razonable para no ser rechazada, o es una afirmación poco razonable y ser rechazada. Procedimiento de 4 pasos para probar una hipótesis Hay un procedimiento de cuatro pasos que sistematizan la prueba de hipótesis. Para ilustrar el procedimiento, completemos el ejemplo anterior. Supongamos que la muestra es de 20 estudiantes y el nivel de significancia es de .05. Los cuatro pasos son los siguientes: Paso 1. Establecer las hipótesis nula y alternativa El primer paso es establecer la hipótesis a ser probada. Esta es llamada la hipótesis nula, simbolizada por H0, el subíndice cero implica “cero diferencia”. Usualmente el término “no” es encontrado en la hipótesis nula significando “no cambio”. La hipótesis nula de la introducción podría ser “la colegiatura mensual promedio de los estudiantes universitarios no es diferente de 3000 pesos”. Esto es lo mismo que decir “…es igual a 3000 pesos”. La hipótesis nula se puede simbolizar H0: µ = 3000. La hipótesis nula es una afirmación que será aceptada si los datos de la muestra no nos proveen de evidencia convincente de que es falsa, es decir, si se acepta la hipótesis nula decimos que la evidencia no es suficiente para rechazarla pero no podemos afirmar que es verdadera. La hipótesis alterna es la afirmación que se acepta si se rechaza la hipótesis nula. Esta hipótesis, también llamada hipótesis de investigación, se simboliza con Ha. La hipótesis alterna es aceptada si la evidencia proporcionada por la muestra es suficiente para afirmar que la Ho es falsa. En este ejemplo las hipótesis serían las siguientes: Ho: La colegiatura promedio de los estudiantes no es diferente de 3000 pesos Ho: µ = 3000 Ha: La colegiatura promedio de los estudiantes es diferente de 3000 pesos Ha: µ ≠ 3000 Paso 2. Determinar el criterio de decisión o de contraste Determinar el criterio de decisión o de contraste consiste en especificar el nivel de significancia, el tipo de distribución, y los valores críticos. Existen cuatro posibilidades al tomar una decisión respecto a una hipótesis: Aceptar Ho Ho verdadera Decisión correcta Error Ho falsa Tipo II Rechazar Ho Error Tipo I Decisión correcta Nivel de significancia es la probabilidad de rechazar una hipótesis nula verdadera El nivel de significancia es simbolizado por α, y también es conocido como nivel de riesgo. Este último término es más apropiado porque es el riesgo que se toma de rechazar una hipótesis verdadera. No hay un nivel de significancia para todos los estudios, se puede utilizar cualquier valor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de .05 es aplicado a proyectos de investigación, el nivel .01 a control de calidad, y .10 a sondeos políticos. Tú como investigador debes decidir el nivel de significancia antes de colectar la muestra de datos. El tipo de distribución se determinará dependiendo de la naturaleza de la hipótesis y del tamaño de la muestra. Cuando la hipótesis es relativa a medias poblacionales o proporciones y las muestras son grandes (n>30) se utiliza la distribución normal. Cuando es relativa a la media y la muestra es pequeña (n≤30) se utiliza la distribución t de student. Cuanto se trata de hipótesis sobre la varianza se usa la distribución Chi2 y cuando se trata de hipótesis entre varianzas de dos poblaciones se usa la distribución F. Los valores críticos se determinan con el nivel de significancia y la distribución correspondiente. Estos son los valores de la variable de la distribución que limitan el área crítica, que es la parte de la curva que corresponde al nivel de significancia. En este ejemplo de la colegiatura el nivel de significancia es de .05, se utiliza la distribución t de student porque la muestra es pequeña, los valores críticos se encontraron de la siguiente manera El área crítica cuando la hipótesis alterna tiene el símbolo ( ≠ ) se divide en dos y se dice que el problema es de dos colas, y cada cola vale α/2. Si la Ha tiene el signo (<) el problema es de la cola izquierda, si tiene el signo(>) es de la cola derecha, y en ambos casos la cola vale α. Este problema es de dos colas: Paso 3. Calcular el estadístico de prueba El estadístico de prueba es un valor obtenido de la información de la muestra para compararlo con el criterio de contraste y rechazar o aceptar la hipótesis. El estadístico de prueba cambia de acuerdo a la distribución que se utilice. En este problema el estadístico de prueba es t y se simboliza t* Supongamos que en una muestra las colegiaturas de los estudiantes universitarios entrevistados son las siguientes: 2821 2329 3822 3054 3102 3109 3044 3281 2398 2725 3125 2292 2511 3627 2650 2952 3222 2933 2741 2462 La media y la desviación estándar de la muestra son 2910 y 411.95 respectivamente, se procede enseguida a calcular el error estándar y la t* Paso 4. Tomar decisión y conclusión Una regla de decisión es establecer las condiciones sobre las cuales la hipótesis nula es rechazada o no rechazada. Si el estadístico de prueba queda dentro de la zona crítica la hipótesis nula deberá ser rechazada. Si el estadístico de prueba queda fuera de la zona crítica la hipótesis nula no deberá ser rechazada. En el ejemplo de las colegiaturas, como el estadístico de prueba quedó fuera de la zona crítica la hipótesis nula no puede ser rechazada. La conclusión podría ser la siguiente: “No hay evidencia suficiente para afirmar que la colegiatura que pagan en promedio los estudiantes universitarios es diferente de 3000 pesos, en un nivel de significancia de .05” Sin embargo en la clase se presentó otra forma de tomar la conclusión usando el valor p o p value. En este ejemplo se trata de una hipótesis bilateral y el valor de referencia es alfa = 0.05. A partir del resultado del estadístico de prueba t = -0.097 (menos cero punto noventa y siete) se obtiene en R el p value correspondiente con la instrucción pt(-0.097,19) de donde resulta un p value de 0.4618711 (observe que esta es un area bajo la curva hacia la derecha) Dado que le valor p es mayor que el valor de referencia, entonces se dice que no existe evidencia para rechazar la Hipótesis nula. Es decir que “No hay evidencia suficiente para afirmar que la colegiatura que pagan en promedio los estudiantes universitarios es diferente de 3000 pesos, en un nivel de significancia de .05” Prueba de hipótesis relativas a dos medias El siguiente ejemplo nos muestra el procedimiento de prueba de hipótesis relativas a la media de dos poblaciones. Ejemplo Se realizó un estudio con un nivel de significancia de .05 para investigar si el número de u.e.a´s que se dan de baja en la quinta semana es diferente entre los estudiantes de ingeniería de la UAM iztapalapa y los estudiantes de ingeniería de la UAM Azcapotzalco. Se obtuvieron dos muestras representativas de 40 estudiantes. La muestra 1 (UAM I) tuvo un puntaje medio de 3.5 (es decir dan de baja en promedio 3.5 u.e.a´s) con una desviación estándar de 2, mientras que la muestra 2 (UAM A) tuvo una media de 3 con una desviación de 2.2. 1.- Establecer las hipótesis Ho: µ1 ≤ µ2 Ho: « El número de u.e.aás que dan de baja no es mayor en la UAM I que en la UAM A » Ha: µ1 > µ2 Ha: « El número de u.e.a´s que dan de baja en la UAM I es mayor que en la UAM A ». 2.- Establecer el criterio de ecisión o contraste Como en este problema, la hipótesis alternativa o alterna contiene el signo (>) el problema es de una cola, es decir, la región crítica se ubica en el extremo derecho de la curva. Para determinar que tipo de distribución se utilizará primero deberiamos estudiar si la muestra es pequeña o grande, vamos a suponer que 30 es el limite: Si n1 + n2 - 2 > 30 entonces se busca en la tabla el valor de z correspondiente a α/2. Si n1 + n2 - 2 ≤ 30 se busca en la tabla el valor t correspondiente a Φ = n1+n2-2 y a α/2. En este ejemplo, Φ = n1 + n2 - 2 = 40 + 40 - 2 = 78 distribución normal con α = .05 entonces Φ > 30 y por lo tanto se utiliza la El valor .05 no está en la tabla, pero debería encontrarse entre estas dos cantidades Z 1.6 4 .05050 ? .05 5 .04947 Se procede entonces con un procedimiento llamado interpolación, identificando la primera z como z1 y la segunda como z2. Las áreas como A1 y A2 respectivamente. Z 1.6 Z1 4 .05050 Α1 Z ? .05 A Z2 5 .04947 Α2 Luego se aplica la fórmula de interpolación: Z= Z1 + ( Z2 – Z1) (A1 - A) (.05050-.05) = 1.64 + (1.65 -1.64) = 1.6448 (A1 – A2) (.05050-.04947) Pero usted tiene suerte pues con R puede obtener el valor exacto con la instrucción qnorm(0.05, lower.tail = F) ide donde resulta1.644854 3.- Calcular el valor del estadístico de prueba En este ejemplo vamos a suponer que las varianzas de las dos poblaciones son iguales (aunque en el examen usted deberá probar si esta hipótesis es plausible o valida). Entonces si esta hipótesis de igualdad de varianzas es válida, se calcula el error estándar de la diferencia de las medias Se calcula el valor del estadístico de prueba, en este caso Z* Usted tiene las formulas que quizas no corresponden a la anterior, pero puede verificar si dan resultados semejantes o no 4.- Tomar una decisión e interpretar El estadístico de prueba queda localizado fuera de la zona crítica, entonces no podemos rechazar la hipótesis nula ( Ho), de tal suerte que se concluye lo siguiente: No hay evidencia suficiente, con un nivel de significancia de .05, de que la prensa popular tenga una mayor orientación al tema sexual que la prensa de clase media Pero pues a nosotros nos interesa aprender a tomar una decisión mediante el valor p o p value. > pnorm(1.063, lower.tail = F) [1] 0.1438910 Es decir el p value = 0.1438, como es de una cola se compara con 0.05 y como 0.1438n entonces No hay evidencia suficiente, con un nivel de significancia de .05, de que los estudiantes de la UAM I den de baj más u.e.aás que los estudiantes de la UAM A Tambien podriamos presentar ejemplos sobre pruebas de hipótesis sobre varianzas, proporciones o radio de varianzas. Pero esto ye lo vimos en clase Para el examen usted deberá entregar el lunes al inicio de la clase es decir a las 8:30 hrs las soluciones a los siguientes problemas Como en la sección anterior presentar con claridad cada paso y dar una explicación Según el tipo de problema presentar la formula correspondiente, los resultados intermedios más importantes y el resultado finl del cálculo (usted puede usar una calculadora, las tablas o R) no deje nada suponiendo que yo lo se, no es mi examen es el suyo. Usted es responsable de comprobar y presentar claramente sus razonamientos. Por supuesto usted deberá tomar sus decisiones usando los dos procedimientos de decisión, es decir comparando la estadística de prueba con los límites de la region crítica (una si es unilateral o dos si es bilateral) y usando el p value. Problemas 1.- Una compañía de transportes desconfía de la afirmación de que la vida útil de ciertos neumáticos es al menos 28,000 km. Para verificar la afirmación se prueba una muestra de estas llantas en los camiones de la compañía, obteniéndose los siguientes resultados en miles de kilómetros: 25.6 27.4 27.1 29.7 31.1 29.5 26.5 27.7 26.5 27.1 28.3 31.2 29.4 29.5 27.3 29.6 23.4 25.8 26.4 28.0 26.5 26.4 29.0 27.3 25.8 28.8 31.2 27.5 27.3 28.0 27.9 27.5 26.0 26.9 27.8 a) ¿Es correcta la sospecha de la compañía de transportes en base a estos datos y a un nivel de significancia de .01 ? b) ¿Cual sería la conclusión si el nivel de significancia fuera .05? c) Se sospecha que la varianza poblacional es superior a 3,000 ¿es correcta esta sospecha a un nivel de significancia del 0.05 ? d) Obtener el intervalo de confianza a un nivel del 95% para la varianza y el promedio de la vida útil a un nivel de significancia del 0.05. e) Obtener el intervalo de confianza a un nivel del 95% para la proporción de pneumáticos inferior a 28,000 km. 2.- usted realiza un experimento con dos grupos de estudiantes. A un grupo le aplica un examen y no les permite usar formulario y al segundo grupo le aplica el mismo examen y les deja usar formulario. Los tiempos que tardan en responder el examen son los siguientes: 52 46 51 60 72 66 53 62 Grupo 1 73 64 48 61 46 65 49 47 73 43 46 75 52 62 61 64 57 47 53 68 42 61 28 37 58 31 14 43 Grupo 2 35 51 51 32 47 60 64 37 65 45 58 18 47 29 60 39 35 35 48 41 a) ¿Existe evidencia de que las desviaciones estándar de los tiempos entre los dos grupos sean diferentes a un nivel de 0.05? b) ¿Existe evidencia suficiente de que el promedio de tiempo que tardan los estudiantes en resolver el examen es diferente entre los dos grupos con un nivel de significancia de .05 ? c) ¿Existe evidencia suficiente de que el tiempo que tardan los estudiantes del primer grupo es mayor que el tiempo que tardan los del segundo grupo, con un nivel de significancia de .05 ? d) ¿obtener el intervalo de confianza a un nivel del 95% para la diferencia de los promedios o medias poblacionales de ambos grupos y para el radio de varianzas? Que relación observa con los resultados de los incisos anteriores. 3.- La compañía “X” que fabrica lámparas incandescentes, asegura que su producto es superior al de su principal competidor, la compañía “Y”. En un estudio, en una muestra de 24 de las lámparas “X” y una muestra de 20 lámparas “Y” se obtuvieron las siguientes duraciones en horas: 643 667 624 636 636 626 662 656 Lámparas “X” 630 645 635 652 633 645 610 645 630 622 691 621 624 629 690 630 611 665 641 652 655 696 673 641 Lámparas “Y” 630 639 622 665 573 639 649 597 629 688 585 648 a) En base a esta información, y usando el metodo de intervalos de confianza al 99%, ¿se debe aceptar la afirmación de la compañía “X”? b) La compañía “Y” afirma que las lámparas “X” duran menos de 650 horas, si el nivel de significancia es .01, ¿se debe aceptar la afirmación de la compañía “Y”? 4.- En un laboratorio, se experimenta con dos drogas que reducen el tiempo de respuesta a cierto estímulo. Se administra a 30 ratas la droga 1 y a 35 la droga 2. La reducción del tiempo de reacción al estímulo de cada rata fue registrada como sigue: Reducción del tiempo con la droga 1 28 31 33 23 20 30 22 34 32 35 30 33 36 34 43 26 28 27 23 29 28 33 33 29 38 27 26 21 24 24 Reducción del tiempo con la droga 2 11 21 7 21 23 23 24 27 23 30 17 17 16 16 25 37 29 22 12 26 27 15 23 29 19 16 17 33 36 14 27 15 28 19 27 a) Si el nivel de significancia es .05, y las desviaciones estándar poblacionales no se conocen (usted deberá establecer y probar las hipótesis para decidir si son o no iguales) ¿es posible decir que no existe diferencia entre la reducción del tiempo de respuesta con la droga 1 que con la droga 2? b) Si el nivel de significancia es .05, ¿es posible decir que es mayor la reducción del tiempo de respuesta de las ratas del grupo 1 que la de las del grupo 2? c) Si el nivel de significancia es .05, y la desviación estándar de ambas muestras es 10 mseg, ¿es posible decir que no existe diferencia entre el tiempo de respuesta con la droga 1 y el tiempo de respuesta con la droga 2? c) Si el nivel de significancia es .05, y la desviación estándar poblacionales se desconocen y se supone son diferentes, ¿es posible decir que no existe diferencia entre el tiempo de respuesta con la droga 1 y el tiempo de respuesta con la droga 2? 5.- La concentración promedio de albúmina (un tipo de proteína) en el suero de una población de individuos es de 4.1 g/100 ml. A una muestra aleatoria de 25 individuos de esta población se les aplicó una dosis diaria de esteroide ”A” y a otra muestra de 20 individuos se les aplico el esteroide “B”, las concentraciones de albúmina de ambas muestras son las siguientes: Concentraciones de albúmina con Esteroide “A” (g/100ml) 4.1 3.7 4.1 4.0 4.3 3.7 4.4 3.8 3.5 3.4 4.0 4.3 4.5 4.0 3.5 4.3 3.4 3.3 4.3 2.9 3.8 3.8 4.1 4.4 4.1 Concentraciones de albúmina con Esteroide “B” (g/100ml) 4.0 3.9 3.8 3.7 3.7 3.5 3.6 3.6 3.5 3.8 3.5 3.8 4.0 3.4 3.9 3.5 3.5 4.0 3.4 3.9 a) Si el nivel de significancia es .05, ¿podemos decir que en base a estos datos, que el esteroide “A” disminuye el nivel de albúmina en el suero? b) Si el nivel de significancia es .01, ¿podemos decir que en base a estos datos, que el esteroide “A” disminuye el nivel de albúmina en el suero? c) Si el nivel de significancia es .005, ¿podemos decir que en base a estos datos, que el esteroide “A” disminuye el nivel de albúmina en el suero igual que el esteroide “B”? d) Si su hubiese tratado de los mismos pacientes podriamos suponer que se trata de un experimento apareado que concluye para la pregunta a. PRACTICA 4 ANÁLISIS DE LA VARIANZA Además de probar hipótesis relativas a dos varianzas, un segundo uso de la distribución F involucra la técnica de Análisis de la Varianza, abreviado ANOVA (Analysis of variance). Básicamente, el análisis de la varianza utiliza información proveniente de muestras para determinar si tres o más tratamientos producen diferentes resultados. El uso de la palabra tratamiento tiene su origen en la investigación agrícola. Las tierras se trataron con diferentes fertilizantes, para determinar si habría una diferencia significativa en las producciones. Nosotros podríamos probar la hipótesis de que cinco diferentes aditivos de gasolina (tratamientos) resultan en un diferente kilometraje por litro. También podríamos contestar la pregunta, ¿son cuatro métodos de capacitación y entrenamiento (tratamientos) igualmente efectivos? Procedimiento del análisis de la varianza El procedimiento ANOVA puede ser ilustrado usando un ejemplo. Se quiere probar la hipótesis, en el nivel de significancia de .05, de que la cantidad de tabletas de alimento que un grupo de ratas consume está en relación con el tiempo transcurrido desde su última comida. Para comprobar esta hipótesis, selecciona al azar tres grupos de ratas con seis ratas en cada grupo. Después de someter a cada grupo a un entrenamiento preliminar, prueba al grupo A, tres horas después de comer; el grupo B, doce horas después de comer y al grupo C, veinticuatro horas después de comer. La cantidad de tabletas consumidas por cada animal en un periodo de diez minutos fueron las siguientes: Grupo A 0 7 2 1 1 7 Σx = 18 Σx2 =104 Grupo B 5 2 3 9 6 5 Σx = 30 Σx2 =180 Grupo C 5 11 9 9 4 10 Σx = 48 Σx2 =424 1.- Establecer las hipótesis La hipótesis nula establece que no hay diferencia entre las medias de los tratamientos, mientras que la hipótesis alterna establece que por lo menos una media es diferente. Ho: μ1 = μ2 = μ3 “La cantidad promedio de tabletas que comen las ratas es igual en cualquiera de los grupos, o sea, no está en relación directa con el tiempo transcurrido desde su última comida” Ha: la media de los tratamientos no es la misma “La cantidad promedio de tabletas que comen las ratas no es igual en los tres grupos, o sea, si tiene relación directa con el tiempo transcurrido desde su última comida” 2.- Establecer el criterio de contraste (valores críticos) Como queremos determinar si la variación por los tratamientos es significativamente más grande que la variación por el error, entonces la prueba estadística adecuada es la distribución F. La distribución F es la razón entre dos varianzas: F= La estimación de la varianza de la población basada en la variación por tratamientos La estimación de la varianza de la población basada en la variación por el error La varianza por tratamientos, que es el numerador, tiene grados de libertad igual a ν = k – 1, donde k es el numero de tratamientos. La varianza por error, que es denominador, tiene grados de libertad igual a ν = n – k, donde n es el número total de observaciones. En el ejemplo de las ratas los grados de libertad por tratamientos son ν = 3 – 1 = 2, y los grados de libertad del error son ν = 18 – 3 = 15. Entonces el criterio de contraste será el valor encontrado en la tabla de F para α = .05 de la siguiente manera: F para 2 α = .05 15 3.68 Si localizamos este valor en la curva de la distribución F, la regla de decisión será aceptar la hipótesis nula si el estadístico de prueba ( F* ) es menor de 3.68, y aceptar la hipótesis alterna si el estadístico de prueba es mayor de 3.68. 3.- Calcular el estadístico de Prueba ( F* ) Para facilitar el cálculo del estadístico de prueba ( F* ) se elabora una tabla para registrar todos los cálculos. El formato general de una tabla de un análisis de varianza es el siguiente: Fuente de la variación Suma de cuadrados Grados de libertad SCT k–1 Tratamientos n – k Error SCE Total SCtotal Media cuadrada SCT k–1 SCE MCE = n – k Estadístico de prueba MCT = F* = MCT MCE Para encontrar las sumas de cuadrados se realizan los siguientes cálculos: a) Encontrar el Factor de Corrección FC= ( 18 + 30 + 48 )2 ( X )2 = = 512 6+6+6 n b) Encontrar la Suma Total de Cuadrados SCTotal = X 2 - FC = ( 104+ 180 + 424 ) - 512 = 196 c) Encontrar la Suma de Cuadrados por tratamientos SCT = ( X )² - FC = n ( 18 )² ( 30 )² (48)² + + - 512 = 76 6 6 6 d) Encontrar la Suma de Cuadrados del error SCE= SCTotal - SCT = 196.0 - 76.0 = 120.0 Una vez calculado las sumas de cuadrados se procede a completar la tabla Fuente de la variación Tratamientos Error Total Suma de cuadrados SCT = 76 SCE = 120.0 Grados de libertad Media Estadístico de cuadrada prueba 76 k – 1= 3 – 1 = 2 MCT= =38 2 38 F*= = 4.75 120 8 =8 n – k= 18 - 3 = 15 MCE= 15 SCTotal = 196 4.- Tomar Decisión y Conclusión Como el Estadístico de Prueba (F* = 4.75) es más grande que el valor crítico del Criterio de Contraste (F = 3.68), entonces F* queda dentro de la zona crítica y por lo tanto aceptamos la hipótesis alterna en el nivel de significancia de 0.05, y la conclusión podrá ser como la siguiente: “Hay evidencia suficiente, en un nivel de significancia de .05, de que la cantidad de tabletas que comen las ratas no es igual en los tres grupos, es decir está en relación con el periodo de tiempo que ha transcurrido desde su última comida”. Ejercicios 1.- Un inspector de un distrito escolar quiere estudiar el ausentismo de los profesores de diversos grados escolares. Se seleccionaron muestras aleatorias de profesores en escuelas primarias, secundarias, y preparatorias, y el número de días de ausencia el año anterior fue como sigue: Primaria 7 4 10 6 5 Secundaria 13 14 9 8 7 10 Preparatoria 7 2 6 9 9 Con un nivel de significancia de .025, determine si hay una diferencia en el ausentismo entre los diversos grados. 2.- El propietario de una distribuidora de combustible pretende investigar la rapidez con la cual le pagan sus facturas en tres áreas suburbanas. Se seleccionaron muestras de clientes en cada zona y se registró el número de días entre la entrega y el pago de la factura, con los siguientes resultados: Área 1 8 18 14 20 12 14 15 16 Área 2 10 16 28 25 7 17 Área 3 32 8 16 27 17 20 19 21 20 Con un nivel de significancia de .025, determine si hay una diferencia en la rapidez con que pagan las facturas en estas tres áreas. 3.- Un agrónomo desea estudiar el rendimiento (en libras) de cuatro variedades diferentes de calabacitas. Se dividió una parcela en 16 lotes y se asignaron cuatro lotes al azar a cada variedad. Los resultados del experimento (en libras) fueron Calabacita redonda 86 74 88 76 Calabacita común 40 48 54 46 Calabaza alargada 30 36 42 34 Calabacita rayada 48 54 42 56 Con un nivel de significancia de .01, determine si hay una diferencia en el rendimiento de las diferentes variedades de calabacitas. 4.- Un distribuidor de automóviles nuevos quiere estudiar la cantidad de dinero aplicado a la compra de equipo opcional en automóviles de tamaño grande. Se seleccionó una muestra de 20 compras. Los sujetos se dividieron en las siguientes clasificaciones por edades: 18-24, 25-29, 30-39, 40-59, 60 y más. La cantidad de equipo opcional comprado (en miles de pesos) se organizó en grupos de edad como sigue: 18-24 6.31 4.27 5.75 25-29 7.64 5.36 3.85 6.24 Edad 30-39 8.37 9.26 10.16 6.48 7.86 40-59 11.23 10.64 8.32 9.00 7.53 60 y más 6.74 7.36 5.12 Con un nivel de significancia de .05, determine si hay una diferencia en la cantidad de dinero aplicado a la compra de equipo opcional en automóviles nuevos entre los diferentes grupos de edad. 5.- Los alumnos de la clase de mercadotecnia calificaron el desempeño del profesor como excelente, bueno, malo y pésimo. Las calificaciones que dieron los estudiantes al profesor fueron comparadas con sus calificaciones finales del curso de mercadotecnia. Lógicamente, se pensaría que en general, los estudiantes que calificaron al profesor con excelente tendrían una calificación final mucho más alta que los que lo calificaron como bueno, malo o pésimo. Esto supondría también que quienes calificaron al docente como pésimo obtendrían las calificaciones mas bajas. Se seleccionaron muestras de calificaciones finales de los alumnos por cada tipo de calificación dada al maestro. Excelente 94 90 85 80 Calificaciones finales de la clase de Mercadotecnia Bueno Malo 75 70 68 73 77 76 83 78 88 80 68 65 Pésimo 68 70 72 65 74 65 Se pretende determinar si hay una diferencia estadística entre la calificación promedio obtenida por los estudiantes de acuerdo a la calificación otorgada al maestro. Utilice un nivel de significancia de .01 6.- En un esfuerzo por determinar la más efectiva manera de enseñar principios de seguridad a un grupo de empleados de una compañía, cuatro diferentes métodos fueron tratados. Veinte empleados fueron asignados aleatoriamente a cuatro grupos. El primer grupo recibió instrucción programada en folletos y trabajaron a lo largo del curso a su propio paso. El segundo grupo atendió lecturas. El tercer grupo observó presentaciones en televisión, y el cuarto fue dividido en pequeños grupos de discusión. Al final de las sesiones, una prueba fue aplicada a los cuatro grupos. Los resultados fueron: Calificaciones Instrucción programada 6 7 6 5 6 Lecturas Televisión 8 5 8 6 8 7 9 6 8 5 Grupos de discusión 8 5 6 6 5 Pruebe en el nivel de significancia de .05 si hay o no diferencia entre las cuatro medias. 7.- Una revista para consumidores esta interesada en saber si existe o no alguna diferencia en la duración promedio de cuatro marcas diferentes de pilas para radios de transistores. Se probó una muestra aleatoria de cuatro pilas de cada marca, con los siguientes resultados (en horas): Marca 1 12 15 18 10 Marca 2 14 17 12 19 Marca 3 21 19 20 23 Marca 4 14 21 25 20 Con un nivel de significancia de .05, pruebe si hay alguna diferencia en la duración promedio de estas cuatro marcas de pilas para radios de transistores