I. CONCEPTOS BASICOS Si se considera que un modelo de probabilidad puede representar adecuadamente una situación real dada, el paso a seguir es el de tratar de obtener conclusiones sobre la población a partir de la muestra que se obtenga. Una de las formas que se utiliza para hacer tales conclusiones, es mediante el empleo de una prueba de hipótesis. Tema central que se estudia de manera metodológica en este trabajo. I.1 Idea básica de una prueba de hipótesis La prueba de hipótesis comienza con una suposición, denominada hipótesis, que se hace en torno a un parámetro de la población. Posteriormente se reúnen los datos muestrales, se calculan las estadísticas de la muestra y en base a estos valores, con cierto grado de probabilidad, se dice si el parámetro supuesto de la población es razonablemente el aproximado. Póngase el caso de que se supone un cierto valor para una media de la población. Para verificar la validez de esta suposición, obtenemos los datos muestrales y se determina la diferencia entre el valor supuesto y el valor de la media muestral. A continuación se juzga si la diferencia es significativa: cuando menor sea la diferencia, mayores probabilidades habrá de que sea correcto el valor supuesto de la media. Y a una diferencia más amplia corresponderá una probabilidad menor. Por desgracia, la diferencia entre el parámetro supuesto de la población y el estadístico muestral no suele ser ni tan grande que automáticamente se rechace la hipótesis ni tan pequeño que de inmediato se “acepte”. Supongamos que el gerente de un gran centro comercial nos dice que la eficiencia promedio de los empleados es de 90%. ¿Cómo podemos probar la validez de su hipótesis?. Podríamos seleccionar una muestra y obtener por ejemplo un 1 estadístico igual a 93%, seguramente “aceptemos” la decisión del gerente. Pero si el estadístico muestral fuera de 46%, rechazaríamos la suposición por considerarla falsa. Estos dos resultados podemos interpretarlos recurriendo al sentido común. Supóngase ahora que el estadístico muestral revela una eficiencia de 81%. Este valor es relativamente cercano a 90%. Pero, ¿está lo suficientemente cerca como para que “aceptemos” la hipótesis del gerente?. Aunque la “aceptemos” o rechacemos, no podemos tener la seguridad absoluta de que nuestra decisión sea correcta; por tanto, habremos de aprender a afrontar la incertidumbre en la toma de decisiones. No podemos “aceptar” ni rechazar una hipótesis referente a un parámetro de la población por mera intuición. Por el contrario, necesitamos aprender a decidir con objetividad, basándonos en la información de la muestra. La prueba de hipótesis se realiza en todos los ámbitos, en los cuales puede contrastarse la teoría frente a la observación. Ø Un investigador en medicina puede proponer la hipótesis de que un nuevo medicamento es más efectivo que otro para curar cierta enfermedad. Ø Un gerente de una cadena de tiendas de autoservicio quiere probar que la eficiencia promedio de sus empleados es mayor del 70%. Ø Un candidato político puede afirmar que la mayoría de los votantes estarán de su parte en las próximas elecciones. Se someten todas estas hipótesis a una verificación estadística comparando las hipótesis con los datos muestrales observados. ¿Cuál es el papel de la estadística en las pruebas de hipótesis?. Es decir, ¿cuál es el valor de la estadística en este procedimiento de prueba de hipótesis?. 2 Nótese que probar una hipótesis implica tomar una decisión al comparar la muestra observada con respecto a la teoría. ¿Cómo se decide si una muestra no concuerda con la hipótesis del investigador?, ¿cuándo debe rechazarse la hipótesis, cuándo debe aceptarse y cuándo no debe emitirse la decisión?, ¿cuál es la probabilidad de tomar una decisión equivocada y en consecuencia sufrir una pérdida?. Y, en particular, ¿qué función de las mediciones muestrales debe utilizarse para tomar una decisión?. Las respuestas a estas preguntas las obtenemos del estudio de las pruebas de hipótesis estadísticas. I.2 Elementos de una prueba de hipótesis Formalmente en una prueba de hipótesis se tienen los siguientes cuatro elementos: 1. La hipótesis nula, que se denota por H 0 . 2. La hipótesis alterna, denotada como H 1 3. El estadístico de prueba. 4. La región de rechazo. Hipótesis nula, H 0 Hipótesis por probar. Generalmente una aseveración en el sentido de que un parámetro poblacional tiene un valor específico. Esta hipótesis nula recibe tal nombre debido a que es el “punto de partida” de la investigación. Comúnmente se utiliza en su interpretación la frase “no existe diferencia significativa para rechazar H 0 ”. 3 Hipótesis alterna, H 1 Esta hipótesis, sobre la cual se enfoca la atención, es una aseveración sobre el mismo parámetro poblacional que se utiliza en la hipótesis nula. Generalmente se especifica que el parámetro poblacional tiene un valor diferente, de alguna manera, al establecido en la hipótesis nula. El rechazo de la hipótesis nula implicará la “aceptación” de la hipótesis alterna. Estadístico de prueba Variable aleatoria utilizada para tomar la decisión “no se rechaza H 0 ” o bien “se rechaza H 0 ”. Región de rechazo Conjunto de valores de la estadística de prueba que causan el rechazo de la hipótesis nula. 1.3 Pruebas bilaterales y unilaterales Si se plantea la hipótesis nula de la forma θ = θˆ , donde θ es el parámetro de interés y θˆ es el valor que se supone tiene el parámetro, entonces la hipótesis alterna puede plantearse de acuerdo a alguna de las tres opciones siguientes: a) H 1 : θ ≠ θˆ b) H 1 : θ > θˆ c) H 1 : θ < θˆ 4 La opción a) origina una prueba bilateral (o de dos colas), a causa de que se rechazará H0 si la evidencia es demasiado pequeña o demasiado grande. Como se ilustra en la Figura 1.1, la región de rechazo está constituida por dos intervalos, razón por la cual se denomina esta prueba de dos colas. Este tipo de prueba es apropiado si tenemos presente que el valor de un parámetro puede ser demasiado pequeño o demasiado grande para algún fin especificado. Figura 1.1 Prueba bilateral. Las opciones b) y c), por razones obvias, producen lo que se llama pruebas unilaterales (o de una cola). En las Figuras 1.2 y 1.3 de muestran las regiones de “aceptación” y de rechazo para este tipo de prueba, note que el signo especificado en las hipótesis alternativa puede servir para recordar si la prueba es una prueba de cola izquierda o una prueba de cola derecha. Figura 1.2 Prueba de cola derecha. 5 Figura 1.3 Prueba de cola izquierda. I.4 Tipos de errores de una prueba de hipótesis El procedimiento que se emplea en una prueba de hipótesis estadística permite tomar alguna de dos decisiones: a) “aceptar” H 0 , b) rechazar H 0 y por lo tanto aceptar H 1 .En muchas ocasiones no se tiene la certeza de que la decisión tomada sea la correcta, de tal manera que es posible que sé este cometiendo algún tipo de error. Error tipo I El error que se comete al rechazar la hipótesis nula cuando esta es verdadera se conoce como error tipo I, la probabilidad de cometer el error tipo I, conocido también como nivel de significancia, se representa por la letra griega α, esto es: α = P (error tipo I) = P (rechazar H 0 / H 0 verdadera) Error tipo II 6 El error que se comete al “aceptar” la hipótesis nula cuando esta es falsa se conoce como error tipo II, la probabilidad de cometer el error de tipo II se representa por β , esto es: β = P (error tipo II) = P (“aceptar” H 0 / H 0 falsa) En general, al probar cualquier hipótesis estadística, se tiene cuatro posibles situaciones que determinan si la decisión es correcta o equivocada, estas cuatro situaciones se resumen en la Tabla 1.1. Decisión Rechazar H 0 No rechazar H 0 Hipótesis nula Verdadera Falsa Error tipo I Decisión correcta Decisión correcta Error tipo II Tabla 1.1 Situaciones posibles al probar una hipótesis estadística. ¿Qué probabilidad existe de cometer estos errores?, la prueba de hipótesis estadística permite al investigador tener cierto tipo de control sobre el error tipo I pero no sobre el error tipo II. El procedimiento para encontrar la región de rechazo se hace en función del valor máximo que se está dispuesto a asumir para la probabilidad de cometer error tipo I. Es claro que si se desea disminuir la probabilidad de cometer error de tipo I basta con disminuir el nivel de significancia α. ¿Por qué razón entonces no se hace el valor de α tan pequeño como sea posible?, la respuesta es que en la medida que α disminuye entonces aumenta la probabilidad de cometer error tipo II, esto es β. Esto se debe a que al disminuir la región de rechazo aumenta la región de “aceptación” y con ello la posibilidad de aceptar algo erróneo. La Figura 1.4 ilustra estos conceptos. 7 θ = θˆ θ > θˆ Figura 1.4 Relación entre α y β con H 0 : θ = θˆ y H 1 : θ > θˆ Existe una forma de disminuir los valores de α y β . Para ilustrar esto consideremos el estadístico y . Se sabe que al aumentar el tamaño de muestra trae como consecuencia una menor variabilidad de los valores de y debido a que 2 la varianza de y depende del valor de n, esto es V ( y ) = σ n . En la Figura 1.5 se ilustra que al aumentar el tamaño de muestra los valores correspondientes de α y β disminuyen, esto se debe a que la V ( y ) disminuye. 8 Figura 1.5 Valores de α y β al aumentar el tamaño de la muestra El único inconveniente es que se desconoce que tanto disminuye β , ya que para tener esta información se necesita conocer el valor verdadero de µ . Por esta razón es que se dijo anteriormente que se puede tener cierto control acerca del error tipo I, pero no del error tipo II. Aunque se dijo que el investigador normalmente plantea su hipótesis de trabajo en la hipótesis alterna, es conveniente que en el momento de definir la hipótesis nula y la hipótesis alterna se reflexione sobre los riesgos de cometer cada uno de los tipos de error. Considere el problema de probar si una persona es inocente o culpable de cierto delito; existen opiniones encontradas con respecto a que es más grave, si declarar culpable a una persona que es inocente o declarar inocente a una persona que es culpable. Dependiendo de como se indique la hipótesis nula y la hipótesis alterna los tipos de error I y II cambian, así tenemos como: H 0 : La persona es inocente H 1 : La persona es culpable entonces 9 Error tipo I = rechazar H 0 cuando H 0 es verdadera = declarar culpable cuando la persona es inocente = no rechazar H 0 cuando H 0 es falsa = declarar inocente cuando la persona es culpable En caso contrario, cuando indicamos como Error tipo II H 0 : La persona es culpable H 1 : La persona es inocente Se tiene como error tipo I y II a Error tipo I = rechazar H 0 cuando H 0 es verdadera = declarar inocente cuando la persona es culpable Error tipo II = no rechazar H 0 cuando H 0 es falsa = declarar culpable cuando la persona es inocente Si para nosotros es más grave declarar culpable a una persona inocente entonces, para reducir la probabilidad de cometer este error, la hipótesis nula debe indicar que la persona es inocente. I.5 El uso de los valores “ P ” en la toma de decisiones Durante mucho tiempo se había acostumbrado a seleccionar un α de 0.10, 0.05 o 0.01 y la región crítica de acuerdo con el α seleccionado. En aquel tiempo, por supuesto el rechazo o “aceptación” estrictos de H0 dependerían de esa región crítica. Por ejemplo, si la prueba es de dos colas α se establece con el nivel de significancia de 0.05 y el estadístico de la prueba implica, por ejemplo, a la distribución normal estándar, entonces el valor z que se observa a partir de los datos y la región crítica es: z > 1.96 ; z < −1.96 10 donde el valor 1.96 se encuentra como z 0.025 en la Tabla 2 de la distribución normal. Un valor de z en la región crítica sugiere el planteamiento: “El valor del estadístico de prueba es significativo”. Esto puede traducirse al lenguaje del usuario. Por ejemplo, si la hipótesis es: H 0 : µ = 10 H 1 : µ ≠ 10 podría decirse: “La media difiere significativamente del valor 10”. Esta preselección de un nivel de significancia α tiene sus raíces en la filosofía de que debe controlarse el riesgo máximo de cometer un error tipo I. Sin embargo, esta aproximación no es aplicable para valores estadísticos de prueba que están “cerca” de la región crítica. En realidad, el uso constante de α=0.10, 0.05 ó 0.01 es sólo un resultado de lo establecido durante generaciones. En estadística aplicada, los usuarios han adoptado extremamente la aproximación del uso del valor P . La aproximación está diseñada para dar al usuario una alternativa (en términos de una probabilidad) a una mera conclusión de “rechazo” o “aceptación”. El cálculo del valor P también proporciona al usuario información importante cuando el valor de z cae por completo dentro de la región crítica ordinaria. La aproximación del valor P como una ayuda en la toma de decisiones es bastante natural debido a que casi en todos los paquetes de computadora que proporciona el cálculo de prueba de hipótesis imprimen los valores P junto con los valores del estadístico de prueba apropiado. La siguiente es una definición formal de un valor P . Un valor P es el nivel más bajo (de significancia) en el cual el valor observado del estadístico de prueba es significativo. 11 II. PRUEBAS DE HIPÓTESIS PARA MUESTRAS PEQUEÑAS Con frecuencia el costo, el tiempo disponible y otros factores limitan el tamaño de muestra que se necesita para llevar acabo una prueba de hipótesis. En tal caso, los procedimientos para muestras grandes no son los más recomendados y entonces hay que utilizar otros procedimientos de prueba, estos procedimientos se llaman de inferencia para muestras pequeñas. Este tipo de procedimiento se utiliza cuando el tamaño de muestra es menor a 30 y con el supuesto de que la población de la cual se extrae la muestra se distribuye normalmente. La distribución muestral de la estadística de prueba t es simétrica y con forma monticular. La región de rechazo para este tipo de pruebas se determina como se indica a continuación: Para el juego de hipótesis H 0 : µ = µ 0 contra H 1 : µ ≠ µ 0 la región de rechazo se localiza en los extremos de la distribución t . Para el caso de la hipótesis H 0 : µ = µ 0 contra H 1 : µ > µ 0 , la región de rechazo se localiza en el extremo derecho y para la hipótesis H 0 : µ = µ 0 contra H 1 : µ < µ 0 se localiza en el extremo izquierda de la distribución. II.1 Prueba de hipótesis para una media Los pasos a seguir en una prueba de hipótesis en relación con una media poblacional se describen a continuación: 1. Se plantea el juego de hipótesis. Hipótesis nula: H 0 : µ = µ0 Hipótesis alterna: H1 : µ ≠ µ0 H1 : µ > µ0 H1 : µ < µ0 (Prueba bilateral) (Prueba unilateral) de dos colas de cola derecha de cola izquierda 12 2. El estadístico de prueba que se utiliza es el siguiente: t = n (x − µ ) s 3. Se fija el nivel de significancia α y se determina la región de rechazo donde: Ø t > tα 2 o bien t < −tα 2 representan la región de rechazo para una prueba de dos colas. Ø t > t α para una prueba de cola derecha Ø t < −t α para una prueba de cola izquierda Los valores de t , t α y t α 2 se basan en (n − 1) grados de libertad. 4. Decisión: Rechazar H 0 si el estadístico de prueba tiene un valor en la región de rechazo (o si el valor calculado de P es menor o igual que el nivel de significancia deseado α );de otra forma no se rechaza H 0 . Suposición: La muestra se selecciona de una población con distribución normal A continuación se presentan tres ejemplos de esta prueba, cada uno de ellos desarrollado de manera manual y con apoyo del paquete STATISTICA. Ejemplo 2.1. En una muestra aleatoria de nueve mujeres que van a comprar anteojos nuevos se probaron 12, 11, 14, 15, 10, 14, 11, 8 y 12 armazones diferentes. Pruebe la hipótesis nula a un nivel de significancía del 5% de que en promedio una mujer que va a comprar anteojos nuevos se prueba 10 diferentes armazones antes de decidirse contra la alternativa de que se prueba más de 10 armazones de anteojos. 13 Solución. 1. Hipótesis nula: H 0 :µ =10 2. Hipótesis alterna: H 1 : µ > 10 3. Nivel de significancia: α = 0.05 4. Estadístico de prueba: t = n (x − µ ) s De los datos se obtiene que x = 11.89 y s = 2.2 , por tanto t= 9 (11.89 − 10) = 2.5772 2.2 5. Región de rechazo. Se rechaza H 0 si t > tα , donde t 0.05 = 1.860 para v = 9 − 1 = 8 g.l. (Tabla 1 de la t de Student). 6. Decisión. Puesto que t = 2.5772 excede a t 0.05 = 1.860 , la hipótesis nula se rechaza al nivel de significancia de α = 0.05 , concluyéndose que el promedio de lentes que se prueban las mujeres es mayor a 10 armazones. El ejemplo anterior se presenta a continuación mediante el empleo del paquete STATISTICA, sin antes aclarar que este tipo de prueba no se obtiene de manera directa, es por ello, que se utiliza la prueba “t-test for dependent samples” para realizar este tipo de prueba. A continuación se describe el procedimiento a seguir en el paquete: Para la solución de esta prueba se accesa el modulo de “Basic statistics”. 1. La captura de los datos se realiza como se indica en la Figura 2.1. 2. Después de capturar los datos, en el menú principal se encuentra la opción de “Analysis” y dentro de ella “t-test for dependent samples”, como se puede ver en la Figura 2.2. 14 3. Luego damos un click en esta opción y nos aparecerá una ventana como la que se presenta en la Figura 2.3. Figura 2.2 Figura 2.1 Figura 2.3 4. Para seleccionar las variables damos un click en el icono de "Variables". 5. Finalmente, para obtener el resultado de este ejemplo se debe de seleccionar la opción de "Detailed table of results". 6. Luego damos un click en el icono de “t-test“ o "Ok" y nos aparecerá una tabla con los resultados que se presentan en la Figura 2.4. Con respecto al valor P = 0.033119 que proporciona el paquete se debe tener conocimiento que es un valor de probabilidad que corresponde a una prueba bilateral. Esto se debe tener presente debido a que si se quisiera obtener la 15 conclusión con respecto a una prueba unilateral, el valor P debe dividirse entre dos. Figura 2.4 Ejemplo 2.2. Pruebe la hipótesis de que el contenido promedio en recipientes de un lubricante en particular es de 10 litros si los contenidos de una muestra aleatoria de 10 recipientes son: 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que los contenidos del lubricante tienen distribución normal. Solución. 1. Hipótesis nula: H 0 : µ = 10 2. Hipótesis alterna: H 1 : µ ≠ 10 3. Nivel de significancia: α = 0.05 4. Estadístico de prueba: t = n (x − µ ) s De los datos se obtiene que x = 10.06 y s = 0.25 , por tanto t= 10 (10.06 10 ) = 0.7589 0.25 5. Región de rechazo. Se rechaza H 0 si t > tα 2 o t < −tα 2 , donde t 0.005 = 3.250 para v = 10 − 1 = 9 g.l. (Tabla 1 de t de Student). 16 Decisión. Puesto que t = 0.7589 no excede a t 0.005 = 3.250 , la hipótesis nula no se rechaza con un nivel de significancia de α = 0.01 , concluyendo que no existe evidencia suficiente para indicar que los contenidos de los recipientes del lubricante es diferente de 10 litros. La prueba de hipótesis correspondiente mediante el empleo del paquete STATISTICA proporciona los resultados que se presentan en la Figura 2.5. Este resultado se obtiene, de manera similar, al procedimiento descrito en el ejemplo 2.1. El valor de P = 0.460049 que se observa en la Figura 2.5, indica que la hipótesis nula planteada en el presente ejemplo no se rechaza. Figura 2.5 Ejemplo 2.3. El enorme crecimiento de la industria langostera de Florida en los últimos 20 años, la ha colocado en el segundo lugar de la industria pesquera del estado. Hace algunos años se supuso que una declaración por el gobierno de las bahamas que prohibía a los pescadores de langosta de los estados unidos operar en la parte de la plataforma continental perteneciente a ese país, reduciría notablemente la cantidad de langosta (en libras) obtenida por trampa. Según los registros, la captura promedio por trampa es de 31.31 libras. Una muestra aleatoria de 20 trampas para langosta, desde que la restricción por parte de las Bahamas entró en vigor, dio los siguientes resultados (en libras) 17.4 33.7 24.1 29.3 18.9 37.2 39.6 21.1 39.6 43.4 12.2 23.8 34.4 41.7 25.5 43.2 19.6 27.5 22.1 24.4 17 ¿Proporcionan estos datos evidencia suficiente que apoye la opción de que las capturas medias por trampa disminuyen después de la imposición de las restricciones por Bahamas?. Utilice un nivel de significancia del 5%. Solución. 1. Hipótesis nula: H 0 : µ = 31.31 2. Hipótesis alterna: H 1 : µ < 31.31 3. Nivel de significancia: α = 0.05 4. Estadístico de prueba: t = n (x − µ ) s De los datos se obtiene que x = 28.935 y s = 9.507 , por tanto t= 20 (28.935 − 31.31) = −1.117 9.507 5. Región de rechazo. Se rechaza H 0 si t < −t α , donde t 0.05 = −1.729 para v = 20 − 1 = 19 g.l. (Tabla 1 de t de Student). Decisión. Puesto que t = −1.117 no excede a t 0.05 = −1.729 , la hipótesis nula no se rechaza con un nivel de significancia de α = 0.05 , concluyendo que no existe evidencia suficiente para indicar que las capturas medias por trampa disminuyen después de la imposición de las restricciones por las Bahamas. La prueba de hipótesis correspondiente mediante el empleo del paquete STATISTICA proporciona los resultados que se presentan en la Figura 2.6. Este resultado se obtiene, de manera similar, al procedimiento descrito en el ejemplo 2.1. El valor de P = 0.277850 que se observa en la Figura 2.6, indica que la hipótesis nula planteada en el presente ejemplo no se rechaza. 18 Figura 2.6 II.2 PRUEBA DE HIPÓTESIS SOBRE LA VARIANZA Hay ocasiones en las que se necesitan pruebas relativas a la varianza o la desviación estándar de la población. Además, hay muchas situaciones prácticas donde σ 2 es el objetivo principal de una investigación experimental y así adquiere una posición de mayor importancia que la media de una población. Por ejemplo, se podría buscar probar la hipótesis de que la variabilidad del porcentaje de impurezas en una clase determinada de conservas de frutas no excede un valor especificado por la empresa. En general, se aplica una prueba relacionada con 2 varianzas antes de utilizar una prueba t para diferencia de dos medias con muestras pequeñas e independientes, con el objeto de obtener cierta comprensión respecto a la suposición de varianzas iguales o diferentes. II.2.1 Prueba de hipótesis acerca de dos varianzas Frecuentemente se desea comparar la precisión de un instrumento de medición con la de otro o la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro. Para llevar acabo este método, podríamos comparar las varianzas de dos poblaciones, utilizando la razón de las varianzas muestrales. Esto consiste en que si el cociente de las varianzas es igual a 1, tendremos evidencia para indicar que σ 12 y σ 22 son iguales. En caso contrario, un 19 valor grande o pequeño para el cociente de varianzas proporciona evidencia de que existe una diferencia entre las varianzas. El procedimiento para realizar este tipo de prueba se desarrollará a continuación: 1. Hipótesis nula: H 0 : σ 12 = σ 22 Hipótesis alterna: H 1 : σ 12 ≠ σ 22 (Prueba bilateral) De dos colas H 1 : σ 12 < σ 22 De cola izquierda H 1 : σ 12 > σ 22 (Prueba unilateral) De cola derecha 2. El estadístico de prueba que se utiliza es el siguiente: F = s12 s 22 (si las muestras aleatorias independientes de tamaño n1 y n 2 se extraen de poblaciones normales que tienen la misma varianza) Nota: La varianza más grande va en el numerador del estadístico de prueba. 3. Se fija el nivel de significancia α y se determina la región de rechazo donde: Ø F > Fα , donde Fα es una prueba de cola derecha. Ø F < F1−α , donde F1−α es una prueba de cola izquierda. Ø F > Fα 2 o bien F < F1−α 2 corresponden a una prueba bilateral. Nota: Algunas dificultades que se tienen es que los valores de la distribución corresponde a la cola derecha. Dado a la problemática que existe, el valor de F F1−α se consigue con el reciproco: F1−α(v1 , v2 ) = 1 Fα(v2 , v1 ) Los valores de F , Fα y F1−α se basan en v1 = n1 − 1 y v 2 = n 2 − 1 grados de libertad (Tabla 3 de la distribución F ). 20 4. Decisión: Rechazar H 0 si el estadístico de prueba tiene un valor en la región de rechazo (o si el valor calculado de p es menor o igual que el nivel de significancia deseado α ); de otra forma no se rechaza H 0 . Ejemplo 2.4. En un programa de capacitación industrial, algunos aprendices son instruidos con el método A, el cual consiste en instrucción mecanizada y otros son capacitados con el método B, que entraña también la atención personal de un instructor. Se toman 2 muestras aleatorias de tamaño 10 de grandes grupos de aprendices capacitados por cada uno de estos métodos, las calificaciones que se obtienen de los 2 grupos en el aprovechamiento son: Método A 71 75 65 69 73 66 68 71 74 68 Método B 72 77 84 78 69 70 77 73 65 75 Emplea un nivel de significancia del 2% para probar la hipótesis de que las dos poblaciones tienen varianzas iguales. Solución 1. Hipótesis nula: H 0 : σ 12 = σ 22 2. Hipótesis alterna: H 1 : σ 12 ≠ σ 22 3. Se fija un nivel de α = 0.02 4. El estadístico de prueba es: F = s12 s 22 De los datos se tiene que s12 = 29.11 y s 22 =11 .33 por lo tanto se tiene F= 29.11 = 2.57 11.33 21 5. Región de rechazo. Se rechaza H 0 si F > Fα 2 o bien F < F1−α 2 donde F0.01 = 5.35 y F0.99 = 0.187 con v = (10 − 1,10 − 1) = (9,9 ) grados de libertad libertad (Tabla 3 de la distribución F ). 6. Decisión. Puesto que F = 2.57 no se encuentra en la región de rechazo, la hipótesis nula no se rechaza al nivel de significancia del 2%, concluyendo que existe suficiente evidencia para indicar que la varianza de los dos grupos son iguales. Este ejemplo se desarrolla en el paquete con los siguientes pasos: Para la solución de esta prueba se accesa el modulo de “Basic statistics”. 1. La estructura de la base debe de quedar como se observa en la Figura 2.7. 2. Después de capturar los datos, en el menú principal se encuentra la opción de “Analysis” y dentro de ella “t-test for independent samples”, como se puede ver en la Figura 2.8. 3. Luego damos un click en esta opción y nos aparecerá una ventana como la que se presenta en la Figura 2.9. Figura 2.7 Figura 2.8 22 Figura 2.9 4. En la selección de variables damos un click en el icono de "Variables". 5. Finalmente, para obtener los resultados de este ejemplo se debe de seleccionar la opción de "Levene´s test (homogeneity of variances)". 6. Luego damos un click en el icono de “t-test“ o "Ok" y nos aparecerá una tabla con los resultados que se presentan en la Figura 2.10. Figura 2.10 23