Subido por erik croda

ParametricaZ 1

Anuncio
I. CONCEPTOS BASICOS
Si se considera que un modelo de probabilidad puede representar
adecuadamente una situación real dada, el paso a seguir es el de tratar de
obtener conclusiones sobre la población a partir de la muestra que se obtenga.
Una de las formas que se utiliza para hacer tales conclusiones, es mediante el
empleo de una prueba de hipótesis. Tema central que se estudia de manera
metodológica en este trabajo.
I.1 Idea básica de una prueba de hipótesis
La prueba de hipótesis comienza con una suposición, denominada hipótesis,
que se hace en torno a un parámetro de la población. Posteriormente se reúnen
los datos muestrales, se calculan las estadísticas de la muestra y en base a estos
valores, con cierto grado de probabilidad, se dice si el parámetro supuesto de la
población es razonablemente el aproximado. Póngase el caso de que se supone un
cierto valor para una media de la población. Para verificar la validez de esta
suposición, obtenemos los datos muestrales y se determina la diferencia entre el
valor supuesto y el valor de la media muestral. A continuación se juzga si la
diferencia
es
significativa:
cuando
menor
sea
la
diferencia,
mayores
probabilidades habrá de que sea correcto el valor supuesto de la media. Y a una
diferencia más amplia corresponderá una probabilidad menor.
Por desgracia, la diferencia entre el parámetro supuesto de la población y el
estadístico muestral no suele ser ni tan grande que automáticamente se rechace
la hipótesis ni tan pequeño que de inmediato se “acepte”.
Supongamos que el gerente de un gran centro comercial nos dice que la
eficiencia promedio de los empleados es de 90%. ¿Cómo podemos probar la validez
de su hipótesis?. Podríamos seleccionar una muestra y obtener por ejemplo un
1
estadístico igual a 93%, seguramente “aceptemos” la decisión del gerente. Pero si
el estadístico muestral fuera de 46%, rechazaríamos la suposición por
considerarla falsa. Estos dos resultados podemos interpretarlos recurriendo al
sentido común.
Supóngase ahora que el estadístico muestral revela una eficiencia de 81%.
Este valor es relativamente cercano a 90%. Pero, ¿está lo suficientemente cerca
como para que “aceptemos” la hipótesis del gerente?. Aunque la “aceptemos” o
rechacemos, no podemos tener la seguridad absoluta de que nuestra decisión sea
correcta; por tanto, habremos de aprender a afrontar la incertidumbre en la toma
de decisiones. No podemos “aceptar” ni rechazar una hipótesis referente a
un parámetro de la población por mera intuición. Por el contrario,
necesitamos aprender a decidir con objetividad, basándonos en la
información de la muestra.
La prueba de hipótesis se realiza en todos los ámbitos, en los cuales puede
contrastarse la teoría frente a la observación.
Ø
Un investigador en medicina puede proponer la hipótesis de que un nuevo
medicamento es más efectivo que otro para curar cierta enfermedad.
Ø
Un gerente de una cadena de tiendas de autoservicio quiere probar que la
eficiencia promedio de sus empleados es mayor del 70%.
Ø
Un candidato político puede afirmar que la mayoría de los votantes estarán
de su parte en las próximas elecciones.
Se someten todas estas hipótesis a una verificación estadística comparando
las hipótesis con los datos muestrales observados.
¿Cuál es el papel de la estadística en las pruebas de hipótesis?. Es decir,
¿cuál es el valor de la estadística en este procedimiento de prueba de hipótesis?.
2
Nótese que probar una hipótesis implica tomar una decisión al comparar la
muestra observada con respecto a la teoría. ¿Cómo se decide si una muestra no
concuerda con la hipótesis del investigador?, ¿cuándo debe rechazarse la
hipótesis, cuándo debe aceptarse y cuándo no debe emitirse la decisión?, ¿cuál es
la probabilidad de tomar una decisión equivocada y en consecuencia sufrir una
pérdida?. Y, en particular, ¿qué función de las mediciones muestrales debe
utilizarse para tomar una decisión?. Las respuestas a estas preguntas las
obtenemos del estudio de las pruebas de hipótesis estadísticas.
I.2 Elementos de una prueba de hipótesis
Formalmente en una prueba de hipótesis se tienen los siguientes cuatro
elementos:
1. La hipótesis nula, que se denota por H 0 .
2. La hipótesis alterna, denotada como H 1
3. El estadístico de prueba.
4. La región de rechazo.
Hipótesis nula, H 0
Hipótesis por probar. Generalmente una aseveración en el sentido de que
un parámetro poblacional tiene un valor específico. Esta hipótesis nula recibe tal
nombre debido a que es el “punto de partida” de la investigación. Comúnmente se
utiliza en su interpretación la frase “no existe diferencia significativa para
rechazar H 0 ”.
3
Hipótesis alterna, H 1
Esta hipótesis, sobre la cual se enfoca la atención, es una aseveración sobre
el mismo parámetro poblacional que se utiliza en la hipótesis nula. Generalmente
se especifica que el parámetro poblacional tiene un valor diferente, de alguna
manera, al establecido en la hipótesis nula. El rechazo de la hipótesis nula
implicará la “aceptación” de la hipótesis alterna.
Estadístico de prueba
Variable aleatoria utilizada para tomar la decisión “no se rechaza H 0 ” o
bien “se rechaza H 0 ”.
Región de rechazo
Conjunto de valores de la estadística de prueba que causan el rechazo de la
hipótesis nula.
1.3 Pruebas bilaterales y unilaterales
Si se plantea la hipótesis nula de la forma θ = θˆ , donde θ es el parámetro
de interés y θˆ es el valor que se supone tiene el parámetro, entonces la hipótesis
alterna puede plantearse de acuerdo a alguna de las tres opciones siguientes:
a) H 1 : θ ≠ θˆ
b) H 1 : θ > θˆ
c) H 1 : θ < θˆ
4
La opción a) origina una prueba bilateral (o de dos colas), a causa de que se
rechazará H0 si la evidencia es demasiado pequeña o demasiado grande. Como se
ilustra en la Figura 1.1, la región de rechazo está constituida por dos intervalos,
razón por la cual se denomina esta prueba de dos colas. Este tipo de prueba es
apropiado si tenemos presente que el valor de un parámetro puede ser demasiado
pequeño o demasiado grande para algún fin especificado.
Figura 1.1 Prueba bilateral.
Las opciones b) y c), por razones obvias, producen lo que se llama pruebas
unilaterales (o de una cola). En las Figuras 1.2 y 1.3 de muestran las regiones de
“aceptación” y de rechazo para este tipo de prueba, note que el signo especificado
en las hipótesis alternativa puede servir para recordar si la prueba es una prueba
de cola izquierda o una prueba de cola derecha.
Figura 1.2 Prueba de cola derecha.
5
Figura 1.3 Prueba de cola izquierda.
I.4 Tipos de errores de una prueba de hipótesis
El procedimiento que se emplea en una prueba de hipótesis estadística
permite tomar alguna de dos decisiones: a) “aceptar” H 0 , b) rechazar H 0 y por lo
tanto aceptar H 1 .En muchas ocasiones no se tiene la certeza de que la decisión
tomada sea la correcta, de tal manera que es posible que sé este cometiendo algún
tipo de error.
Error tipo I
El error que se comete al rechazar la hipótesis nula cuando esta es
verdadera se conoce como error tipo I, la probabilidad de cometer el error tipo I,
conocido también como nivel de significancia, se representa por la letra griega α,
esto es:
α = P (error tipo I) = P (rechazar H 0 / H 0 verdadera)
Error tipo II
6
El error que se comete al “aceptar” la hipótesis nula cuando esta es falsa se
conoce como error tipo II, la probabilidad de cometer el error de tipo II se
representa por β , esto es:
β = P (error tipo II) = P (“aceptar” H 0 / H 0 falsa)
En general, al probar cualquier hipótesis estadística, se tiene cuatro
posibles situaciones que determinan si la decisión es correcta o equivocada, estas
cuatro situaciones se resumen en la Tabla 1.1.
Decisión
Rechazar H 0
No rechazar H 0
Hipótesis nula
Verdadera
Falsa
Error tipo I
Decisión correcta
Decisión correcta
Error tipo II
Tabla 1.1 Situaciones posibles al probar una hipótesis estadística.
¿Qué probabilidad existe de cometer estos errores?, la prueba de hipótesis
estadística permite al investigador tener cierto tipo de control sobre el error tipo I
pero no sobre el error tipo II. El procedimiento para encontrar la región de
rechazo se hace en función del valor máximo que se está dispuesto a asumir para
la probabilidad de cometer error tipo I.
Es claro que si se desea disminuir la probabilidad de cometer error de tipo I
basta con disminuir el nivel de significancia α. ¿Por qué razón entonces no se hace
el valor de α tan pequeño como sea posible?, la respuesta es que en la medida que
α disminuye entonces aumenta la probabilidad de cometer error tipo II, esto es β.
Esto se debe a que al disminuir la región de rechazo aumenta la región de
“aceptación” y con ello la posibilidad de aceptar algo erróneo. La Figura 1.4 ilustra
estos conceptos.
7
θ = θˆ
θ > θˆ
Figura 1.4 Relación entre α y β con H 0 : θ = θˆ y H 1 : θ > θˆ
Existe una forma de disminuir los valores de α y β . Para ilustrar esto
consideremos el estadístico y . Se sabe que al aumentar el tamaño de muestra
trae como consecuencia una menor variabilidad de los valores de y debido a que
2
la varianza de y depende del valor de n, esto es V ( y ) = σ n . En la Figura 1.5 se
ilustra que al aumentar el tamaño de muestra los valores correspondientes de α y
β disminuyen, esto se debe a que la V ( y ) disminuye.
8
Figura 1.5 Valores de α y β al aumentar el tamaño de la muestra
El único inconveniente es que se desconoce que tanto disminuye β , ya que
para tener esta información se necesita conocer el valor verdadero de µ . Por esta
razón es que se dijo anteriormente que se puede tener cierto control acerca del
error tipo I, pero no del error tipo II.
Aunque se dijo que el investigador normalmente plantea su hipótesis de
trabajo en la hipótesis alterna, es conveniente que en el momento de definir la
hipótesis nula y la hipótesis alterna se reflexione sobre los riesgos de cometer
cada uno de los tipos de error. Considere el problema de probar si una persona es
inocente o culpable de cierto delito; existen opiniones encontradas con respecto a
que es más grave, si declarar culpable a una persona que es inocente o declarar
inocente a una persona que es culpable.
Dependiendo de como se indique la hipótesis nula y la hipótesis alterna los
tipos de error I y II cambian, así tenemos como:
H 0 : La persona es inocente
H 1 : La persona es culpable
entonces
9
Error tipo I
= rechazar H 0 cuando H 0 es verdadera
= declarar culpable cuando la persona es inocente
= no rechazar H 0 cuando H 0 es falsa
= declarar inocente cuando la persona es culpable
En caso contrario, cuando indicamos como
Error tipo II
H 0 : La persona es culpable
H 1 : La persona es inocente
Se tiene como error tipo I y II a
Error tipo I
= rechazar H 0 cuando H 0 es verdadera
= declarar inocente cuando la persona es culpable
Error tipo II
= no rechazar H 0 cuando H 0 es falsa
= declarar culpable cuando la persona es inocente
Si para nosotros es más grave declarar culpable a una persona inocente
entonces, para reducir la probabilidad de cometer este error, la hipótesis nula
debe indicar que la persona es inocente.
I.5 El uso de los valores “ P ” en la toma de decisiones
Durante mucho tiempo se había acostumbrado a seleccionar un α de 0.10,
0.05 o 0.01 y la región crítica de acuerdo con el α seleccionado. En aquel tiempo,
por supuesto el rechazo o “aceptación” estrictos de H0 dependerían de esa región
crítica. Por ejemplo, si la prueba es de dos colas α se establece con el nivel de
significancia de 0.05 y el estadístico de la prueba implica, por ejemplo, a la
distribución normal estándar, entonces el valor z que se observa a partir de los
datos y la región crítica es:
z > 1.96 ;
z < −1.96
10
donde el valor 1.96 se encuentra como z 0.025 en la Tabla 2 de la distribución
normal. Un valor de z en la región crítica sugiere el planteamiento: “El valor del
estadístico de prueba es significativo”. Esto puede traducirse al lenguaje del
usuario. Por ejemplo, si la hipótesis es:
H 0 : µ = 10
H 1 : µ ≠ 10
podría decirse: “La media difiere significativamente del valor 10”.
Esta preselección de un nivel de significancia α tiene sus raíces en la
filosofía de que debe controlarse el riesgo máximo de cometer un error tipo I. Sin
embargo, esta aproximación no es aplicable para valores estadísticos de prueba
que están “cerca” de la región crítica.
En realidad, el uso constante de α=0.10, 0.05 ó 0.01 es sólo un resultado de
lo establecido durante generaciones. En estadística aplicada, los usuarios han
adoptado extremamente la aproximación del uso del valor P . La aproximación
está diseñada para dar al usuario una alternativa (en términos de una
probabilidad) a una mera conclusión de “rechazo” o “aceptación”. El cálculo del
valor P también proporciona al usuario información importante cuando el valor
de z cae por completo dentro de la región crítica ordinaria.
La aproximación del valor P como una ayuda en la toma de decisiones es
bastante natural debido a que casi en todos los paquetes de computadora que
proporciona el cálculo de prueba de hipótesis imprimen los valores P junto con los
valores del estadístico de prueba apropiado. La siguiente es una definición formal
de un valor P . Un valor P es el nivel más bajo (de significancia) en el cual
el valor observado del estadístico de prueba es significativo.
11
II. PRUEBAS DE HIPÓTESIS PARA MUESTRAS PEQUEÑAS
Con frecuencia el costo, el tiempo disponible y otros factores limitan el
tamaño de muestra que se necesita para llevar acabo una prueba de hipótesis. En
tal caso, los procedimientos para muestras grandes no son los más recomendados
y entonces hay que utilizar otros procedimientos de prueba, estos procedimientos
se llaman de inferencia para muestras pequeñas. Este tipo de procedimiento se
utiliza cuando el tamaño de muestra es menor a 30 y con el supuesto de que la
población de la cual se extrae la muestra se distribuye normalmente.
La distribución muestral de la estadística de prueba t es simétrica y con
forma monticular. La región de rechazo para este tipo de pruebas se determina
como se indica a continuación: Para el juego de hipótesis H 0 : µ = µ 0 contra
H 1 : µ ≠ µ 0 la región de rechazo se localiza en los extremos de la distribución t .
Para el caso de la hipótesis H 0 : µ = µ 0 contra H 1 : µ > µ 0 , la región de rechazo se
localiza en el extremo derecho y para la hipótesis H 0 : µ = µ 0 contra H 1 : µ < µ 0 se
localiza en el extremo izquierda de la distribución.
II.1 Prueba de hipótesis para una media
Los pasos a seguir en una prueba de hipótesis en relación con una media
poblacional se describen a continuación:
1. Se plantea el juego de hipótesis.
Hipótesis nula:
H 0 : µ = µ0
Hipótesis alterna:
H1 : µ ≠ µ0
H1 : µ > µ0
H1 : µ < µ0
(Prueba bilateral)
(Prueba unilateral)
de dos colas
de cola derecha
de cola izquierda
12
2. El estadístico de prueba que se utiliza es el siguiente: t =
n (x − µ )
s
3. Se fija el nivel de significancia α y se determina la región de rechazo donde:
Ø t > tα 2 o bien t < −tα 2 representan la región de rechazo para una prueba de
dos colas.
Ø t > t α para una prueba de cola derecha
Ø t < −t α para una prueba de cola izquierda
Los valores de t , t α y t α 2 se basan en (n − 1) grados de libertad.
4. Decisión: Rechazar H 0 si el estadístico de prueba tiene un valor en la región
de rechazo (o si el valor calculado de P es menor o igual que el nivel de
significancia deseado α );de otra forma no se rechaza H 0 .
Suposición: La muestra se selecciona de una población con distribución normal
A continuación se presentan tres ejemplos de esta prueba, cada uno de ellos
desarrollado de manera manual y con apoyo del paquete STATISTICA.
Ejemplo 2.1. En una muestra aleatoria de nueve mujeres que van a comprar
anteojos nuevos se probaron 12, 11, 14, 15, 10, 14, 11, 8 y 12 armazones
diferentes. Pruebe la hipótesis nula a un nivel de significancía del 5% de que en
promedio una mujer que va a comprar anteojos nuevos se prueba 10 diferentes
armazones antes de decidirse contra la alternativa de que se prueba más de 10
armazones de anteojos.
13
Solución.
1. Hipótesis nula: H 0 :µ =10
2. Hipótesis alterna: H 1 : µ > 10
3. Nivel de significancia: α = 0.05
4. Estadístico de prueba: t =
n (x − µ )
s
De los datos se obtiene que x = 11.89 y s = 2.2 , por tanto
t=
9 (11.89 − 10)
= 2.5772
2.2
5. Región de rechazo. Se rechaza H 0 si t > tα , donde t 0.05 = 1.860 para v = 9 − 1 = 8
g.l. (Tabla 1 de la t de Student).
6. Decisión. Puesto que t = 2.5772 excede a t 0.05 = 1.860 , la hipótesis nula se
rechaza al nivel de significancia de α = 0.05 , concluyéndose que el promedio de
lentes que se prueban las mujeres es mayor a 10 armazones.
El ejemplo anterior se presenta a continuación mediante el empleo del
paquete STATISTICA, sin antes aclarar que este tipo de prueba no se obtiene de
manera directa, es por ello, que se utiliza la prueba “t-test for dependent
samples” para realizar este tipo de prueba.
A continuación se describe el procedimiento a seguir en el paquete:
Para la solución de esta prueba se accesa el modulo de “Basic statistics”.
1. La captura de los datos se realiza como se indica en la Figura 2.1.
2. Después de capturar los datos, en el menú principal se encuentra la opción de
“Analysis” y dentro de ella “t-test for dependent samples”, como se puede
ver en la Figura 2.2.
14
3. Luego damos un click en esta opción y nos aparecerá una ventana como la que
se presenta en la Figura 2.3.
Figura 2.2
Figura 2.1
Figura 2.3
4. Para seleccionar las variables damos un click en el icono de "Variables".
5. Finalmente, para obtener el resultado de este ejemplo se debe de seleccionar la
opción de "Detailed table of results".
6. Luego damos un click en el icono de “t-test“ o "Ok" y nos aparecerá una tabla
con los resultados que se presentan en la Figura 2.4.
Con respecto al valor P = 0.033119 que proporciona el paquete se debe tener
conocimiento que es un valor de probabilidad que corresponde a una prueba
bilateral. Esto se debe tener presente debido a que si se quisiera obtener la
15
conclusión con respecto a una prueba unilateral, el valor P debe dividirse entre
dos.
Figura 2.4
Ejemplo 2.2. Pruebe la hipótesis de que el contenido promedio en recipientes de
un lubricante en particular es de 10 litros si los contenidos de una muestra
aleatoria de 10 recipientes son: 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8
litros. Utilice un nivel de significancia de 0.01 y suponga que los contenidos del
lubricante tienen distribución normal.
Solución.
1. Hipótesis nula: H 0 : µ = 10
2. Hipótesis alterna: H 1 : µ ≠ 10
3. Nivel de significancia: α = 0.05
4. Estadístico de prueba: t =
n (x − µ )
s
De los datos se obtiene que x = 10.06 y s = 0.25 , por tanto
t=
10 (10.06 10 )
= 0.7589
0.25
5. Región de rechazo. Se rechaza H 0 si t > tα 2 o t < −tα 2 , donde t 0.005 = 3.250 para
v = 10 − 1 = 9 g.l. (Tabla 1 de t de Student).
16
Decisión. Puesto que t = 0.7589 no excede a t 0.005 = 3.250 , la hipótesis nula no se
rechaza con un nivel de significancia de α = 0.01 , concluyendo que no existe
evidencia suficiente para indicar que los contenidos de los recipientes del
lubricante es diferente de 10 litros.
La prueba de hipótesis correspondiente mediante el empleo del paquete
STATISTICA proporciona los resultados que se presentan en la Figura 2.5. Este
resultado se obtiene, de manera similar, al procedimiento descrito en el ejemplo
2.1. El valor de P = 0.460049 que se observa en la Figura 2.5, indica que la
hipótesis nula planteada en el presente ejemplo no se rechaza.
Figura 2.5
Ejemplo 2.3. El enorme crecimiento de la industria langostera de Florida en los
últimos 20 años, la ha colocado en el segundo lugar de la industria pesquera del
estado. Hace algunos años se supuso que una declaración por el gobierno de las
bahamas que prohibía a los pescadores de langosta de los estados unidos operar
en la parte de la plataforma continental perteneciente a ese país, reduciría
notablemente la cantidad de langosta (en libras) obtenida por trampa. Según los
registros, la captura promedio por trampa es de 31.31 libras. Una muestra
aleatoria de 20 trampas para langosta, desde que la restricción por parte de las
Bahamas entró en vigor, dio los siguientes resultados (en libras)
17.4
33.7
24.1
29.3
18.9
37.2
39.6
21.1
39.6
43.4
12.2
23.8
34.4
41.7
25.5
43.2
19.6
27.5
22.1
24.4
17
¿Proporcionan estos datos evidencia suficiente que apoye la opción de que las
capturas medias por trampa disminuyen después de la imposición de las
restricciones por Bahamas?. Utilice un nivel de significancia del 5%.
Solución.
1. Hipótesis nula: H 0 : µ = 31.31
2. Hipótesis alterna: H 1 : µ < 31.31
3. Nivel de significancia: α = 0.05
4. Estadístico de prueba: t =
n (x − µ )
s
De los datos se obtiene que x = 28.935 y s = 9.507 , por tanto
t=
20 (28.935 − 31.31)
= −1.117
9.507
5. Región de rechazo. Se rechaza H 0 si t < −t α , donde t 0.05 = −1.729 para
v = 20 − 1 = 19 g.l. (Tabla 1 de t de Student).
Decisión. Puesto que t = −1.117 no excede a t 0.05 = −1.729 , la hipótesis nula no se
rechaza con un nivel de significancia de α = 0.05 , concluyendo que no existe
evidencia suficiente para indicar que las capturas medias por trampa disminuyen
después de la imposición de las restricciones por las Bahamas.
La prueba de hipótesis correspondiente mediante el empleo del paquete
STATISTICA proporciona los resultados que se presentan en la Figura 2.6. Este
resultado se obtiene, de manera similar, al procedimiento descrito en el ejemplo
2.1. El valor de P = 0.277850 que se observa en la Figura 2.6, indica que la
hipótesis nula planteada en el presente ejemplo no se rechaza.
18
Figura 2.6
II.2 PRUEBA DE HIPÓTESIS SOBRE LA VARIANZA
Hay ocasiones en las que se necesitan pruebas relativas a la varianza o la
desviación estándar de la población. Además, hay muchas situaciones prácticas
donde σ 2 es el objetivo principal de una investigación experimental y así
adquiere una posición de mayor importancia que la media de una población. Por
ejemplo, se podría buscar probar la hipótesis de que la variabilidad del porcentaje
de impurezas en una clase determinada de conservas de frutas no excede un valor
especificado por la empresa.
En general, se aplica una prueba relacionada con 2 varianzas antes de
utilizar una prueba t para diferencia de dos medias con muestras pequeñas e
independientes, con el objeto de obtener cierta comprensión respecto a la
suposición de varianzas iguales o diferentes.
II.2.1 Prueba de hipótesis acerca de dos varianzas
Frecuentemente se desea comparar la precisión de un instrumento de
medición con la de otro o la forma en que varía el procedimiento para calificar de
un profesor universitario con la de otro. Para llevar acabo este método, podríamos
comparar las varianzas de dos poblaciones, utilizando la razón de las varianzas
muestrales. Esto consiste en que si el cociente de las varianzas es igual a 1,
tendremos evidencia para indicar que σ 12 y σ 22 son iguales. En caso contrario, un
19
valor grande o pequeño para el cociente de varianzas proporciona evidencia de
que existe una diferencia entre las varianzas.
El procedimiento para realizar este tipo de prueba se desarrollará a
continuación:
1. Hipótesis nula: H 0 : σ 12 = σ 22
Hipótesis alterna:
H 1 : σ 12 ≠ σ 22 (Prueba bilateral)
De dos colas
H 1 : σ 12 < σ 22
De cola izquierda
H 1 : σ 12 > σ 22
(Prueba unilateral)
De cola derecha
2. El estadístico de prueba que se utiliza es el siguiente: F =
s12
s 22
(si las muestras aleatorias independientes de tamaño n1 y n 2 se extraen de
poblaciones normales que tienen la misma varianza)
Nota: La varianza más grande va en el numerador del estadístico de prueba.
3. Se fija el nivel de significancia α y se determina la región de rechazo donde:
Ø
F > Fα , donde Fα es una prueba de cola derecha.
Ø
F < F1−α , donde F1−α es una prueba de cola izquierda.
Ø
F > Fα 2 o bien F < F1−α 2 corresponden a una prueba bilateral.
Nota: Algunas dificultades que se tienen es que los valores de la distribución
corresponde a la cola derecha. Dado a la problemática que existe, el valor de
F
F1−α
se consigue con el reciproco:
F1−α(v1 , v2 ) =
1
Fα(v2 , v1 )
Los valores de F , Fα y F1−α se basan en v1 = n1 − 1 y v 2 = n 2 − 1 grados de
libertad (Tabla 3 de la distribución F ).
20
4. Decisión: Rechazar H 0 si el estadístico de prueba tiene un valor en la región
de rechazo (o si el valor calculado de p es menor o igual que el nivel de
significancia deseado α ); de otra forma no se rechaza H 0 .
Ejemplo 2.4. En un programa de capacitación industrial, algunos aprendices son
instruidos con el método A, el cual consiste en instrucción mecanizada y otros son
capacitados con el método B, que entraña también la atención personal de un
instructor. Se toman 2 muestras aleatorias de tamaño 10 de grandes grupos de
aprendices capacitados por cada uno de estos métodos, las calificaciones que se
obtienen de los 2 grupos en el aprovechamiento son:
Método A
71
75
65
69
73
66
68
71
74
68
Método B
72
77
84
78
69
70
77
73
65
75
Emplea un nivel de significancia del 2% para probar la hipótesis de que las
dos poblaciones tienen varianzas iguales.
Solución
1. Hipótesis nula:
H 0 : σ 12 = σ 22
2. Hipótesis alterna:
H 1 : σ 12 ≠ σ 22
3. Se fija un nivel de α = 0.02
4. El estadístico de prueba es: F =
s12
s 22
De los datos se tiene que s12 = 29.11 y s 22 =11 .33 por lo tanto se tiene
F=
29.11
= 2.57
11.33
21
5. Región de rechazo. Se rechaza H 0 si F > Fα 2 o bien F < F1−α 2 donde F0.01 = 5.35
y F0.99 = 0.187 con v = (10 − 1,10 − 1) = (9,9 ) grados de libertad libertad (Tabla 3 de
la distribución F ).
6. Decisión. Puesto que F = 2.57 no se encuentra en la región de rechazo, la
hipótesis nula no se rechaza al nivel de significancia del 2%, concluyendo que
existe suficiente evidencia para indicar que la varianza de los dos grupos son
iguales.
Este ejemplo se desarrolla en el paquete con los siguientes pasos: Para la
solución de esta prueba se accesa el modulo de “Basic statistics”.
1. La estructura de la base debe de quedar como se observa en la Figura 2.7.
2. Después de capturar los datos, en el menú principal se encuentra la opción de
“Analysis” y dentro de ella “t-test for independent samples”, como se
puede ver en la Figura 2.8.
3. Luego damos un click en esta opción y nos aparecerá una ventana como la que
se presenta en la Figura 2.9.
Figura 2.7
Figura 2.8
22
Figura 2.9
4. En la selección de variables damos un click en el icono de "Variables".
5. Finalmente, para obtener los resultados de este ejemplo se debe de seleccionar
la opción de "Levene´s test (homogeneity of variances)".
6. Luego damos un click en el icono de “t-test“ o "Ok" y nos aparecerá una tabla
con los resultados que se presentan en la Figura 2.10.
Figura 2.10
23
Descargar