EstadInfer

Anuncio
ESTADISTICA INFERENCIAL
ESTADISTICA
DESCRIPTIVA
Son métodos empleados para recolectar, organizar, resumir y presentar datos de manera informativa.
ESTADISTICA
INFERENCIAL.
Son los métodos usados para determinar algo acerca de la población, basándose en el estudio de una
muestra.
POBLACION
Es el conjunto de todos los posibles individuos, objetos o mediciones de interés en el estudio
estadístico. Sus números representativos (media, mediana, moda, desviaciones media y estándar,
varianza, etc.) se llaman parámetros.
MUESTRA
Es un subconjunto o parte de la población de interés, que se emplea para hacer el estudio estadístico.
Sus números representativos (media, mediana, moda, desviaciones media y estándar, varianza, etc.) se
llaman estadísticos.
ERROR DE
MUESTREO
Es la diferencia que existe entre el estadístico de una muestra y el parámetro correspondiente de la
población.
INTERVALO DE
CONFIANZA
Es un rango de valores que se construye a partir de los datos de una muestra, de modo que el
parámetro ocurre dentro de dicho rango con una probabilidad específica, llamada nivel de confianza.
1
INTERVALOS CONFIANZA MEDIA (MUESTRAS GRANDES)
xE
DONDE:
E  Z
2

n
1
El gerente de una tienda de autoservicio de la zona suburbana desea determinar el importe del consumo promedio de
sus clientes. Con tal objeto tomó una muestra aleatoria de 60 clientes, obteniendo en ella un promedio de $ 128.00
con una desviación estándar de $ 97.50. Halla un intervalo de confianza 0.97 para estimar el consumo promedio de los
clientes de esa tienda.
2
Una muestra aleatoria de 75 alumnos de cierta universidad dio una calificación promedio de 7.3 con una desviación
estándar de 3.45. Halla un intervalo de confianza 0.93 para estimar la calificación promedio de los alumnos de esa
universidad.
3
Una tienda de departamentos tiene 5,000 clientes con cuenta corriente. Para estimar el total adeudado por estos
clientes, se tomó una muestra aleatoria de 80 cuentas la cual dio una media de $ 1,300.00 con una desviación estándar
de $750.00. Halla un intervalo de confianza 0.94 para estimar la cantidad total adeudada por todos los clientes de esa
tienda.
4
Una encuesta que se condujo en una ciudad grande en 1986 revelo que 200 familias gastaban en promedio $218.67 por
semana en alimentos con una desviación estándar de $14.93. Ya que se desea ajustar el gasto semanal en alimentos
promedio verdadero en esa ciudad a un intervalo bastante estrecho, elabore un intervalo de confianza de 90%.
5
Una distribuidora de maquinas vendedoras de refrescos planifica usar el numero medio de refrescos vendidos durante
una semana por 60 de sus maquinas para estimar el numero promedio vendido por cualquiera de las maquinas durante
una semana. Si 60 maquinas seleccionadas al azar tuvieron una media de 255.3 refrescos con una desviación estándar
de 48.2 refrescos, construya un intervalo de confianza del 95% para el numero promedio verdadero vendido por
cualquiera de sus maquinas durante una semana.
6
Para estimar el tiempo de servicio promedio en un restaurante de hamburguesas, un consultor de la gerencia anoto los
tiempos que requirieron 35 personas que forman una muestra aleatoria para tomar una orden estándar (consistente en
dos hamburguesas, dos paquetes de papas fritas y dos bebidas). En promedio estas personas requirieron 72.2
segundos con una desviación estándar de 12.8 segundos para tomar sus ordenes. Estructure un intervalo de confianza
del 96.4% para el tiempo promedio real que una persona necesita para tomar la orden estándar.
7
Un estudio del crecimiento anual de ciertos cactus reveló que 64 de estos, seleccionados al azar en una zona
desértica, crecieron en promedio 52.8 mm. con una desviación estándar de 4.5 mm. Elabore un intervalo de confianza
del 98.6% para el crecimiento anual promedio verdadero de dicha clase de cactus.
8
125 empleados de una fabrica seleccionados al azar promedian una edad de 38 años, con una desviación estándar de 4
años. Elabore un intervalo de confianza del 97% para el promedio de edad de todos los trabajadores de esa fabrica.
9
Una tienda vende a crédito escáner de una determinada característica a un precio de $1,300.00 cada unidad.
Para estimar el total adeudado por sus 425 acreditados, se selecciona aleatoriamente una muestra de 70 de ellos, y al
hacer el análisis estadístico se obtiene un adeudo medio de $644.00 con una desviación estándar de $289.00
Determine un intervalo del 91.5% de confianza para el importe total adeudado por todos sus acreditados.
10
Escriba y describa un intervalo de confianza del 93% para el promedio de duración de una canción. Se sabe de una
muestra de 70 canciones, que en promedio duran 3.5 minutos con una desviación estándar de 0.3 minutos.
2
INTERVALOS CONFIANZA MEDIA (MUESTRAS PEQUEÑAS)
xE
DONDE:
E  t
2
s
n
1
El gerente de una tienda de autoservicio de la zona suburbana desea determinar el importe del consumo promedio de
sus clientes. Con tal objeto tomó una muestra aleatoria de 25 clientes, obteniendo un promedio de ella de $ 128.00
con una desviación estándar de $ 97.50. Halla un intervalo de confianza 0.98 para estimar el consumo promedio de los
clientes de esa tienda.
2
Una muestra aleatoria de 28 alumnos de cierta universidad dio una calificación promedio de 7.3 con una desviación
estándar de 3.45. Halla un intervalo de confianza 0.99 para estimar la calificación promedio de los alumnos.
3
Para probar la durabilidad de una pintura nueva para las líneas divisorias, un departamento de carreteras pinto franjas
de prueba en carreteras muy transitadas en ocho sitios distintos y los contadores electrónicos demostraron que se
deterioraron después de que 142600, 167800, 136500, 108300, 126400, 133700, 162000 y 149400 automóviles cruzaron
por estas. Elabore un intervalo de confianza del 95% para la cantidad promedio de transito que esta pintura puede
soportar antes de deteriorarse.
4
El propietario de una estación de servicio para camiones ha llevado registros completos de varias transacciones con
sus clientes. Si una muestra aleatoria de 18 de estos registros revela ventas promedio de 58.22 galones de diesel con
una desviación estándar de 4.80 galones, elabore un intervalo de confianza del:
a) 95%.
b) 99%.
5
En 6 ocasiones, en una muestra que se presume aleatoria, fueron necesarios 21, 26, 24, 22, 23 y 22 minutos para
limpiar la cafetería de una escuela. Elabore un intervalo de confianza del 95% para el tiempo promedio necesario.
6
En una revisión de rutina, un dentista encuentra que seis internos de una prisión, en una muestra aleatoria requieren
de 2, 3, 6, 0, 4 y 3 curaciones. Elabore un intervalo de confianza del 99% para el numero promedio de curaciones que
requieren los internos de esa prisión.
7
Registro del numero de paginas de un grupo de libros de Estadística que se recomiendan en la bibliografía de un
curso:
416
1182
584
575
821
406
556
707
624
467
762
1140
Elabore un intervalo de confianza del 95% para el numero promedio de paginas que tiene un libro de Estadística.
Antigüedad en años de un grupo de profesores de una Universidad:
8
4
17
17
3
12
20
14
17
16
13
16
17
11
13
11
22
Elabore un intervalo de confianza del 99% para el numero promedio de años de antigüedad de todos los profesores de
esa Universidad.
9
El diámetro medio de una muestra de 12 varillas incluidas en un embarque, es de 2.35 mm., con una desviación
estándar de 0.050 mm. Se supone que la distribución de los diámetros de la totalidad de las varillas incluidas en el
embarque es aproximadamente normal. Determine un intervalo de confianza del 99% para la estimación del diámetro
medio de todas las varillas incluidas en el embarque.
3
10
Una muestra aleatoria de 26 barriles de una sustancia química (tomada al azar de entre 200 barriles) tiene un peso
medio de 240.8 libras con una desviación estándar de 10.2 libras. Elabore un intervalo de confianza del 85% para
estimar el peso promedio de los 200 barriles. Se permite un error máximo de 30 libras.
11
Una tienda vende a crédito scanner al precio de $1,300.00 cada unidad.
Para estimar el total adeudado por sus 425 acreditados, se selecciona aleatoriamente una muestra de 20 de ellos, y al
hacer el análisis estadístico se obtiene un adeudo medio de $ 644. 00 con una desviación estándar de $ 289. 00
Determine un intervalo del 90% de confianza para el importe total adeudado por todos sus acreditados.
INTERVALOS DE CONFIANZA PARA PROPORCIONES
pE
DONDE:
E  Z
2
pq
n
1
Anilú, gerente general de Alfa, S.A. fabricante de blusas para mujer, desea estimar la proporción de tiendas de ropa
para mujer de la zona metropolitana que venden su marca. Con tal objeto tomó una muestra aleatoria de 42 tiendas y
encontró que en 30 de ellas se vendían las blusas de Alfa, S.A. Halla un intervalo de confianza 0.96 para estimar la
proporción de tiendas de la zona metropolitana que venden las blusas de Alfa, S.A.
2
El rector de cierta universidad desea conocer el porcentaje de alumnos que están de acuerdo con el actual sistema de
becas. Con tal objeto entrevisto aleatoriamente a 184 alumnos, de los cuales 125 aceptaron el actual sistema de becas.
Halla un intervalo de confianza 0.98 para estimar el porcentaje de alumnos de esa universidad que esta de acuerdo con
el actual sistema de becas.
3
En una muestra aleatoria, 136 de 400 personas a quienes se les administró una vacuna contra la gripe experimentaron
alguna molestia. Elabore un intervalo de confianza del 95% para la proporción real de personas que experimentarán
esta molestia como resultado de la vacuna.
4
En una muestra aleatoria de 439 personas entrevistadas en una gran ciudad, 299 decían que se oponían a la
construcción de más vías rápidas. Elabore, para la proporción de las personas de la población que se oponen a dicha
construcción:
a) un intervalo de confianza del 97%.
b) un intervalo de confianza del 93%.
5
Entre 180 pescados de un lago grande, 24 no eran comestibles como resultado de la contaminación. Elabore un
intervalo de confianza del 99% para la proporción real correspondiente.
El siguiente registro muestra el tiempo en días que tarda un medicamento en quitar la gripe a un grupo de personas
seleccionadas al azar que integran una muestra:
6
6
3
3
3
6
2
6
2
9
1
2
8
5
5
8
4
1
9
9
4
4
8
3
1
5
4
5
8
9
1
Elabore un intervalo de confianza del:
1. 96.5% para la proporción real de personas a las que quita la gripe en menos de 4 días.
2. 98.3% para la proporción real de personas a las que les quita la gripe en un máximo de 4 días.
3. 94.1% para la proporción real de personas a las que quita la gripe en 4 días.
4. 90.6% para la proporción real de personas a las que quita la gripe en mas de 4 días.
5. 92.7% para la proporción real de personas a las que quita la gripe en un mínimo de 4 días.
4
7
En una muestra aleatoria de 140 supuestos contactos con OVNIS, 119 se podrían explicar fácilmente como fenómenos
naturales. Elabore un intervalo de confianza del 97.5% para la probabilidad de que un supuesto contacto con un OVNI
no se pueda explicar fácilmente como un fenómeno natural.
8
El departamento de MKT de una refresquera desea estimar la proporción de establecimientos de una ciudad que vende
su producto. Tomo una muestra aleatoria de 58 tiendas y encontró que en 35 de ellas si se vende su refresco. Halle un
intervalo de confianza del 97% para estimar la proporción de tiendas que venden su producto.
TAMAÑO MUESTRA PARA MEDIA DE UNA POBLACION
Z
n   2 
E


1
2
El gerente de un restaurante desea determinar el importe del consumo promedio de sus clientes. De registros
anteriores obtuvo que el consumo promedio era de $ 258.00 con una desviación estándar de $ 125.00. ¿De que tamaño
deber tomar la muestra para tener una confianza de 0.96 de que el error en la estimación no excederá de $ 40.00?
2
El gerente de una empresa desea determinar el tiempo promedio que necesitan los trabajadores en hacer cierta
actividad especializada. De registros anteriores sabe que el tiempo promedio era de 28 minutos con una desviación
estándar de 20 minutos. ¿De qué tamaño se debe tomar una muestra para tener una confianza de 0.97 de que el error
máximo en la estimación no excederá de 6 minutos?
3
Se desea estimar el numero medio de horas de uso continuo hasta que cierta clase de computadora necesite
reparaciones por vez primera. Si se puede suponer que la desviación estándar es de 48 horas, ¿Qué tan grande debe
ser la muestra a estudiar, de modo que se pueda afirmar con una probabilidad de 0.99 que el error de la media de la
muestra será como máximo de 10 horas?.
4
Antes de comprar un embarque grande de carne molida, un fabricante de salchichas quiere tener una confianza del
95% de que su error no sea mayor de 2.5 gramos al estimar el contenido de grasa (por cada 100 gramos de carne). Si se
supone que la desviación estándar del contenido de grasa (por 100 gramos) de carne es de 8 gramos, ¿Qué tan grande
debe de ser la muestra en que base su estimación?
5
Suponga que queremos estimar la calificación media de ciudadanos de edad avanzada en una prueba acerca del
conocimiento sobre sucesos actuales, y que deseamos poder afirmar con una probabilidad de 0.98 que el error de
nuestra estimación de la media de una muestra aleatoria, será a lo sumo de 2.5; ¿Qué tan grande debe ser la muestra,
si sabemos que la desviación estándar de la población es de 73?.
6
Antes de concursar por un contrato, un contratista quiere tener una confianza del 95% de que su error es como máximo
de 5 minutos al usar la media de una muestra aleatoria para estimar el tiempo promedio que cierta clase de ladrillo de
adobe necesita para endurecer. ¿Cuan grande será la muestra que necesita, si puede suponer que la desviación
estándar es de 24 minutos para la población de dichos ladrillos?.
7
Una empresa necesita saber edad promedio de los consumidores de su producto, y desea afirmar con una probabilidad
del 97% que el error de su estimación será a lo sumo de 3 años. ¿Qué tan grande debe ser la muestra a estudiar, si de
estudios similares de otras empresas de la competencia sabe que la desviación estándar de la población es de 9
años?
5
8
Un analista desea estimar el salario medio por hora de los trabajadores de una determinada fabrica de componentes
de PC’s, con un margen de error no mayor a $0.25 y confianza del 90%. La desviación estándar de los índices
salariales es estimada en $1.07. ¿Cuál es el número de expedientes de personal que deberán muestrearse como
mínimo para satisfacer este objetivo de investigación?
9
Se planea una investigación para determinar la cantidad media de tiempo que los ejecutivos de una corporación ven
televisión. Una encuesta piloto indico que el tiempo medio por semana es de 13.5 horas, con una desviación estándar
de 3.4 horas. Se desea estimar el tiempo medio con un error máximo de 15 minutos.
Si se emplea un nivel de significación de 0.942, ¿A cuantos ejecutivos se debe investigar?
10
¿De que tamaño debe ser la muestra a estudiar para determinar el peso promedio de los estudiantes de una
universidad, si se desea tener una confianza del 96.3% en que el error máximo sea del 2.4 Kg., si de estudios
anteriores se sabe que la desviación estándar es de 7.7 Kg?
11
Se seleccionan aleatoriamente 18 empleados de una fábrica de insumos para el ensamble de computadoras que tiene
un gran número de trabajadores. Un análisis estadístico revela que la edad promedio es de 26 años con una
desviación estándar de 2 años. En base a dicha información:
a) Construya un intervalo de confianza del 99% para la edad media de los trabajadores
b) ¿De que tamaño deberá ser la muestra a analizar estadísticamente si se requiere un nivel de confianza del
95%, en que diferencia máxima entre los promedios de la muestra y población sea de 2.5 años?.
1.
12
2.
¿De que tamaño debe ser la muestra a estudiar de los 5000 empleados de una gran fabrica para calcular el
sueldo promedio mensual, si se desea una confiabilidad del 91% en que la media de dicha muestra y la de la
población no diferirán en más de $200?. Estudios anteriores indican que la desviación estándar es de $1,600.
Si la muestra del inciso anterior da un sueldo promedio mensual de $8640 con una desviación estándar de
$1,425, escriba un intervalo de confianza del 96.3% para la media de esa población.
TAMAÑO MUESTRA PARA PROPORCION DE POBLACION
Z
n  pq  2
E

1
2
3




2
Anilú, gerente general de Alfa, S.A. fabricante de blusas para mujer, desea estimar la proporción de tiendas de ropa
para mujer de la zona metropolitana que venden su marca. ¿De cuántas tiendas debe Anilú recabar información para
tener una seguridad del 96% de que el error en la estimación no sobrepasará del 16%?
El rector de cierta universidad desea conocer el porcentaje de alumnos que están de acuerdo con el actual sistema de
becas. ¿A cuántos alumnos debe entrevistarse para tener una confianza del 97% de que el error en la estimación no
excederá del 8%, si:
a) en una encuesta anterior el 65% de los alumnos estaban de acuerdo con el actual sistema de becas?
b) no hay ninguna información anterior?.
Suponga que un departamento de carreteras estatales quiere estimar la proporción de todos los camiones que
operan entre dos ciudades transportando carga muy pesada y desea poder afirmar con una probabilidad de por lo
menos 0.95 que su error no será mayor que 0.04. ¿Qué tan grande necesitará ser la muestra sí:
1) Sabe que la proporción real cae en algún valor del intervalo de 0.10 a 0.25?
2) No tiene idea sobre cual puede ser el valor real?.
6
4
5
6
7
8
9
10
11
Una política lleva a cabo una encuesta de la opinión privada para estimar la proporción de sus votantes que
favorecen la despenalización de ciertos delitos relacionados con narcóticos.
1) Cuán grande necesitará ser la muestra que tome la encuesta para tener una seguridad como mínimo del 95%
de que la proporción de la muestra tenga un error a lo sumo de 0.02?.
2) ¿Qué tan grande necesitara ser la muestra que tome la encuesta si sabe que la proporción real que favorece
esta despenalización es de aproximadamente 0.35?.
Un político en desgracia lleva a cabo una encuesta para estimar la proporción de electores registrados en su distrito
que planean votar por él en las próximas elecciones. Encuentre el tamaño de la muestra necesario para tener una
confianza del 94% si quiere que dicha muestra tenga una precisión de:
1) 8 puntos porcentuales.
2) 4 puntos porcentuales.
3) 2 puntos porcentuales.
4) 1 punto porcentual.
Suponga que queremos estimar la proporción de todos los conductores que exceden el limite de velocidad máxima
en un estrechamiento de la carretera entre Los Ángeles y Bakersfield. ¿Cuán grande es la muestra que necesitaremos
de modo que el error de nuestra estimación sea a lo sumo 0.04 si el nivel de confianza deseado es del:
1) 90%?.
2) 95%?
3) 99%?
Un fabricante nacional quiere determinar el porcentaje de compras de navajas para afeitar para caballero que en
realidad son hechas por mujeres. ¿Qué tan grande es la muestra de hombres que el fabricante necesita para tener
una confianza del 98% como mínimo de que el porcentaje de la muestra no tiene un error de mas de 2.5 puntos
porcentuales si:
1) No sabe nada acerca de la proporción real?.
2) Tiene buenas razones para creer que la proporción real es a lo sumo 0.30?.
En estudios previos se determino que el 30% de los turistas que van a un casino a apostar durante un fin de semana,
gastaron mas de $ 10,000. La administración del casino desea actualizar ese porcentaje, con una confianza del 90% y
dentro de 1% de tolerancia en la estimación. ¿Qué tamaño de muestra deberá usarse?.
Una compañía financiera grande quiere estimar con base en una muestra la probabilidad de que cualquiera de sus
numerosos clientes haga una compra cuantiosa de aparatos eléctricos a crédito durante el año próximo. ¿Cuán
grande es la muestra que necesitará para tener una confianza de por lo menos el 95% de que la diferencia entre la
proporción de la muestra y la probabilidad real no es mayor de 0.03 si:
1) No se sabe nada acerca de la probabilidad real?.
2) Existen buenas razones para pensar que la probabilidad real es de entre 0.15 y 0.40?.
Un congresista que quiere reelegirse desea determinar su popularidad en cierta región de un estado. Desea que la
proporción de electores que le apoyaran debe calcularse dentro de un razonable + 2% de error, y quiere tener un 94%
de confianza que el resultado tendrá dicha precisión. Determine el tamaño que deberá tener la muestra a estudiar si:
1. En la elección anterior recibió el 40% de los votos de esos votantes.
2. No tiene idea de cuales son las preferencias de los votantes.
Un canal de TV desea una estimación de la proporción de la población que apoya la política actual del gobierno con
respecto a la situación en Irak. Es conveniente para su credibilidad que la estimación este dentro del 0.04 de la
proporción verdadera. Si se desea una confianza del 92%, determine el tamaño de la muestra de publico a entrevistar
si:
1. Un analista de política del canal estima que el 60% apoya a la política actual.
2. No se tienen estimaciones previas de la proporción de la gente que apoya la política actual.
7
12
La proporción de ejecutivos júnior que salen de grandes compañías manufactureras a los tres años, se debe de
estimar con un margen de error del 3%. Para tener una confianza del 95% en la estimación:
1. ¿Cuántos funcionarios júnior deben estudiarse, si no hay información preliminar al respecto?
2. ¿Cuántos funcionarios júnior deben estudiarse, si un estudio realizado hace varios años revelo que el
porcentaje de tales ejecutivos es el 21%?
La siguiente es una serie de números de un digito generados al azar por una computadora:
13
4
7
9
4
4
5
1.
2.
4
7
7
5
4
8
8
9
7
7
5
7
1
2
1
1
2
4
5
3
4
6
4
7
1
3
4
7
8
5
6
1
6
9
8
9
7
9
3
6
7
2
Determine el tamaño de la muestra (cantidad de números aleatorios que deben generarse) que con una
confianza del 94% y un margen de error del 2%, estime la verdadera proporción de números mayores de 6
generados por estas maquinas.
Determine el tamaño de la muestra (cantidad de números aleatorios que deben generarse) que con una
confianza del 93% y un margen de error del 4%, estime la verdadera proporción de números menores de 2
generados por estas maquinas.
14
Se desea investigar la proporción de estudiantes de la universidad que tiene una impresora, empleando un nivel de
significación de 0. 07 y deseando que la proporción detectada por la muestra no difiera en mas de un 5% de la
verdadera proporción de la población. Determine el tamaño que debe tener la muestra a estudiar, si:
a) no se dispone de información preliminar.
b) de estudios anteriores, se sabe que por lo regular 65 de cada 197 alumnos tienen una impresora.
15
Una fábrica desea conocer el porcentaje de trabajadores que piden alguna incapacidad por motivos de salud
anualmente. ¿A cuantos empleados debe de investigar para tener una confianza del 93 % de que el error en la
estimación no excederá del 7 %, si:
a) no se dispone de información previa?
b) estudios anteriores indican que el 23% de los trabajadores se incapacitan al año?
16
Se observa que de una muestra de 186 hogares de una conocida colonia de la ciudad, 51 poseen una computadora.
a) Escriba un intervalo de confianza del 92.7% para la proporción de hogares de esa colonia que posee una
computadora.
b) Si no se tuviera la información previa,¿De que tamaño deberá de ser una muestra estadística a analizar para
tener una confianza del 96.7% en que la proporción que se halle no diferirá de la verdadera proporción de la
población en mas de un 4%?.
17
Se desea investigar la proporción de estudiantes de la universidad que tiene un scanner, empleando un nivel de
significación de 0. 07 y deseando que la proporción detectada por la muestra no difiera en mas de un 5% de la
verdadera proporción de la población.
Determine el tamaño que debe tener la muestra a estudiar, si:
1. no se dispone de información preliminar.
2. de estudios anteriores, se sabe que por lo regular 4 de cada 25 alumnos tienen un scanner.
8
PRUEBAS DE HIPÓTESIS ESTADISTICAS
HIPÓTESIS
NULA
HIPÓTESIS
ALTERNATIVA
Afirmación que se hace acerca de algún parámetro de la población, sin estar respaldada por un estudio
estadístico. Son valores conocidos, declaraciones verbales o escritas, etiquetas, etc.
Es la negación de una hipótesis nula. Esta siempre respaldada por el análisis estadístico de una muestra.
PRUEBAS DE
HIPÓTESIS DE
UNA Y DOS
COLAS.
FORMA DE LA
HIPÓTESIS NULA
FORMA DE LA
HIPÓTESIS ALTERNATIVA
TIPO DE PRUEBA
DE HIPOTESIS
μ=5
μ>5
ó
μ<5
UNILATERAL O
DE UNA COLA.
P = 20
P ≠ 20
BILATERAL O
DE DOS COLAS.
1.
RESULTADOS
POSIBLES DE
UNA PRUEBA
DE HIPÓTESIS
Se reserva el juicio, cuando no existen evidencias estadísticas suficientes para rechazar la hipótesis
nula. En estos casos:
Ze < Zc
2. Se rechaza la hipótesis nula, cuando existen las evidencias estadísticas suficientes para decir que
es falsa. en estos casos:
Ze > Zc
En ambos casos:
Ze = es un valor efectivo obtenido con formulas estadísticas a partir de valores provenientes de la
muestra.
Zc = es un valor crítico o limite, obtenido de la función de distribución de probabilidades que mejor
represente el caso.
Al hacer una prueba estadística de hipótesis, puede incurrirse en cualquiera de los siguientes errores:
ERRORES,
NIVELES DE
SIGNIFICACIÓN
Y DE
CONFIANZA
DECISIÓN
TOMADA
RESERVAR JUICIO
RECHAZAR LA Ho
SI LA HIPÓTESIS NULA ES:
VERDADERA
FALSA
ACIERTO
ERROR
ERROR
ACIERTO
La probabilidad de cometer uno o los dos errores señalados, recibe el nombre de nivel de significación.
Dicho nivel de significación y el nivel o grado de confianza, deben sumar 1.
9
HIPOTESIS PARA LA MEDIA DE UNA
POBLACION (MUESTRA GRANDE: n > 30).
Z
1
2
3
4
5
6
7
x

n
Distribución Normal
Atlas S. A. ha puesto en marcha una promoción comercial especial para su estufa de propano y siente que la
promoción debe provocar un cambio en el precio para el consumidor. Atlas. S. A. sabe que antes de que comenzara la
promoción, el precio promedio al menudeo de la estufa era de $4,495.00. Atlas muestreo a 40 de sus minoristas
después de iniciada la promoción y encuentra que el precio promedio de las estufas es ahora de $4,295.00 con una
desviación estándar de $575.00. A un nivel de significación de 0.02, ¿Tiene Atlas razones para creer que ha disminuido
el precio promedio al menudeo para el consumidor?
De1990 a 1996, la tasa promedio precios/utilidades (P/U) de los aproximadamente 1,800 valores inscritos en la Bolsa de
Valores de una metrópoli fue de 14.35. En una muestra de 30 valores de la Bolsa aleatoria mente escogidos, la tasa p/u
promedio en 1997 fue de 11.77 con una desviación estándar de 9.73. ¿Esta muestra presenta evidencia suficiente para
concluir que en 1997 la tasa p/u promedio para los valores de la Bolsa tuvo una disminución? Usa un nivel de
significación de 0.045.
Una distribuidora de películas sabe que cierta película de éxito se exhibió un promedio de 84 días en cada ciudad de
un estado. El administrador de la región sur del estado, interesado en comparar la popularidad de la película en su
región con los demás cines del estado, eligió aleatoria mente 75 cines de su región y encontró que proyectaron la
película un promedio de 81.5 días con una desviación estándar de l0 días. Usando un nivel de significación de 0.035,
determina cuál es la conclusión a la que llegó el administrador de la región.
La comisión promedio que cargan las compañías de corretaje de tiempo completo en una venta de valores comunes es
de $144.00. Aleida tomó una muestra aleatoria de 120 compras por parte de sus clientes y halló que habían pagado una
comisión promedio de $151.00 con una desviación estándar de $ 52.00. A un nivel de significación de 0.045, ¿Puede
Aleida concluir que las comisiones de sus clientes son mayores que el promedio de la industria?
Diariamente el Servicio de Aduanas ha interceptado a lo largo de su historia alrededor de $28 millones al día en bienes
de contrabando introducidos al país. En 60 días de 1998, elegidos al azar, el Servicio de Aduanas interceptó un
promedio de $30.3 millones con una desviación estándar de $16 millones al día en bienes de contrabando. ¿Indica esta
muestra, a un nivel de significación de 0.055; que el Comisionado de Aduanas debería preocuparse por el incremento
del contrabando por encima de su nivel histórico?
Para una muestra de 60 mujeres, tomada de una población de 5,000 inscritas en un programa de reducción de peso en
una cadena nacional de balnearios de aguas termales, la presión sanguínea diastólica media es de 90 con una
desviación estándar de 42. A un nivel de significación de 0.015, determina si las mujeres inscritas en el programa
tienen una presión sanguínea diastólica que excede el valor de 75 recomendado por diversas sociedades médicas.
El departamento de procesamiento de datos de una gran compañía de seguros de vida instaló nuevas terminales de
vídeo en color para reemplazar las unidades monocromáticas que antes usaba. Los 95 operadores capacitados para
usar las nuevas máquinas promediaron 7.2 horas antes de lograr un nivel de rendimiento satisfactorio. Su varianza fue
de 16.2 horas al cuadrado. La larga experiencia con los operadores en las viejas terminales monocromáticas indicaba
que promediaban 8.1 horas en las máquinas, antes de que su rendimiento fuera satisfactorio. A un nivel de
significación de 0.03, ¿Puede el supervisor del departamento concluir que las nuevas terminales son más fáciles de
operar?
10
8
Un documental de televisión acerca de la alimentación excesiva afirmaba que los varones tienen un sobrepeso
aproximado de 5 Kg. en promedio. Para probar esta afirmación, se examinó a 48 individuos elegidos aleatoria mente y
se encontró que su sobrepeso promedio era de 5.6 Kg. con una desviación estándar de 1.3 Kg. A un nivel de
significación de 0.015, ¿Hay alguna razón para dudar de la validez de valor dado por el documental?
9
Los estatutos ambientales federales aplicables a una cierta planta nuclear especifican que el agua Reciclada no debe,
en promedio, exceder los 28.9°C antes de que pueda ser lanzada al río que corre junto a la planta. De 70 muestras, se
encontró que el promedio de temperatura del agua reciclada era de 30.2°C con una desviación estándar de 7.5°C.
Usando un nivel de significación de 0.04, determina si la planta debería ser multada por exceder los límites.
10
11
Los inspectores del gobierno, al investigar los cargos levantados contra una embotelladora de bebidas no alcohólicas
que no llenaba adecuadamente sus productos, han muestreado 200 botellas y encontraron que el promedio de llenado
es de 935 mI con una desviación estándar de 44.36 mI. Se anuncia en la etiqueta de las botellas un contenido de 946
mI. ¿Pueden los inspectores del gobierno, al nivel de significación de 0.015, concluir que las botellas están siendo
llenadas con menor contenido?
En 1996, la tarifa aérea promedio con dos semanas de anticipación en el vuelo entre las ciudades de Veracruz y Mérida
era de $1,034.00. En una encuesta hecha en 1997 a 90 viajeros elegidos al azar entre esas dos ciudades se encontró
que habían pagado en promedio $ 965.00 con una desviación estándar de $299.00. Usando un nivel de significación de
0.035, determina si la tarifa promedio de 1997 fue diferente a la tarifa de 1996.
12
Una compañía, recientemente criticada por no pagar lo mismo a hombres que a mujeres que trabajan en los mismos
puestos, declara que el sueldo promedio pagado a todos los empleados es de $ 2,350.00. De una muestra de 39
mujeres que laboran en la compañía, se obtuvo un salario promedio de $2,300.00 con una desviación estándar de $
125.00. Usando un nivel de significación de 0.035, determina si la crítica hecha a la compañía tiene fundamento.
13
Una cadena de restaurantes afirma que el tiempo medio de espera de clientes por atender esta distribuido
normalmente con una media de 3 min. Y una desviación estándar de 1 min. Su departamento de aseguramiento de la
calidad hallo en una muestra de 50 clientes en un cierto establecimiento que el tiempo medio de espera era de 2.75
min. Al nivel de significación de 0.05 ¿Es dicho tiempo menor a 3 min?
14
Cuando fue contratada como mesera de un restaurante, Bety se dijo a si misma “Puedes obtener en promedio mas de
$200 al día en propinas”. A los primeros 35 días de su trabajo en el restaurante, el importe promedio diario de sus
propinas fue de $248.50 con una desviación estándar de $32.40; Al nivel de significación de 0.01, ¿Puede Bety concluir
que esta ganando en propinas mas de lo que se propuso al inicio?
15
16
17
Supóngase que en cierto proceso para fabricar un cable que se emplea al ensamblar PCs, la resistencia a la ruptura
que se logra es una variable aleatoria normal con una media de 90.80 Kg./mm2. Intentando reducir los costos de
producción, se prueba un nuevo proceso de fabricación. Una muestra de 47 unidades fabricadas con el nuevo proceso
tiene una media de 93.32 Kg./mm2. con una desviación estándar de 2.94 Kg./mm2. ¿Puede decirse que el nuevo
proceso tiene un efecto positivo sobre la resistencia del cable?. Use un nivel de significación de 0.10 para contestar la
pregunta.
Una empresa transnacional ha observado en una muestra de 54 empleados, que en México la edad promedio de sus
trabajadores es de 45 años con una desviación estándar de 5 años. En otros países, los empleados de esta empresa
tienen una edad media de 44 años. Al nivel de significación de 0.072 determine si existen razones en la empresa para
pensar que la edad promedio de sus trabajadores en México es diferente a la del resto del mundo.
Una encuesta nacional reciente descubrió que los estudiantes de secundaria ven un promedio de 6.8 videos por mes.
Una muestra aleatoria de 36 estudiantes de secundaria revelo que el promedio de videos que vieron en un mes fue de
6.2 con una desviación estándar de 0.5; Con un nivel de significación de 0.044, ¿es posible concluir que los
estudiantes de secundaria ven menos videos que los que dice la encuesta?.
11
18
Una operación de línea de montaje automotriz debe tener una duración media de 2.2 minutos. Para no alterar tanto a
las actividades anteriores como las posteriores del ensamble. Una muestra aleatoria de 45 operaciones de ese tipo da
como resultado una duración media de 2.39 minutos con una desviación estándar de 0.2 minutos. Emplee un nivel de
significación de 0.028 para determinar si se esta cumpliendo con la norma.
19
Los distribuidores de accesorios de computo dicen que las memorias USB de 128 mb. las venden en promedio a $475;
se selecciona una muestra al azar de 42 establecimientos que las venden, y se obtiene un precio promedio de $560 con
una desviación estándar de $30. Determine al nivel de significación de 0.04 si en la realidad ese accesorio se vende
mas caro que lo que afirman los distribuidores.
PRUEBAS DE HIPOTESIS PARA LA MEDIA DE UNA
POBLACION (MUESTRA PEQUEÑA n < 30).
t
x
s
n
Distribución “t” de Student
1
Atlas S. A. ha puesto en marcha una promoción comercial especial para su estufa de propano y siente que la
promoción debe provocar un cambio en el precio para el consumidor. Atlas. S. A sabe que antes de que comenzara la
promoción, el precio promedio al menudeo de la estufa era de $4,495.00. Atlas muestreo a 22 de sus minoristas
después de iniciada la promoción y encuentra que el precio promedio de las estufas es ahora de $4,295.00 con una
desviación estándar de $575.00. A un nivel de significación de 0.025, ¿Tiene Atlas razones para creer que ha
disminuido el precio promedio al menudeo para el consumidor?
2
Una compañía editora supone que la vida de su prensa rotativa más grande es de 14,500 horas. De una muestra de 25
prensas, la compañía encuentra una media de 13,000 horas con una desviación estándar de 2,100 horas. ¿Debe la
compañía editora suponer que la vida promedio de las prensas es menor que la hipotética de 14,500 horas? Usa un
nivel de significación de 0.025.
3
Antes del embargo petrolero de 1973 y los subsecuentes incrementos en el precio del petróleo crudo, el consumo de
gasolina en un país había aumentado a una tasa de ajuste temporal del 0.57% mensual. En quince meses elegidos
aleatoria mente entre 1975 y 1985, el consumo de gasolina aumentó en una tasa promedio de 0.33% con una desviación
estándar de 0.10% mensual. A un nivel de significación de 0.005, ¿Puede concluirse que el incremento en el uso de la
gasolina se redujo como resultado del embargo y sus consecuencias?
4
La corredora de bienes raíces Clara Céspedes tomo una muestra aleatoria de 12 casas de una prestigiada colonia de la
ciudad y encontró que el valor de mercado promedio era de $780,000.00 con una desviación estándar de $49,000.00.
En el catastro se estima que el valor promedio de las casas es de $825,000.00. Usando un nivel de significación de 0.05,
determina si las casas de la muestra tomada por Clara tienen un valor promedio menor que el señalado por el catastro.
5
Un bibliotecario universitario sospecha que el número promedio de libros sacados a préstamo por cada estudiante por
visita ha aumentado últimamente. Anteriormente se sacaba un promedio de 3,4 libros, Sin embargo, una muestra
reciente de 23 estudiantes promedió 4,3 libros por visita con una desviación estándar de 1.5 libros. Usando un nivel de
significación dé 0.025 determina la validez de la sospecha del bibliotecario.
12
6
Rentacar, renta automóviles en buenas condiciones mecánicas, pero más antiguos que aquellos que rentan las
grandes cadenas nacionales. Como resultado, anuncia que sus tarifas son considerablemente más bajas que las de
sus grandes competidores. Una encuesta de la industria estableció que el cargo total promedio por renta en una de
las mayores compañías es de $773.80. Una muestra aleatoria de 18 transacciones realizadas por Rentacar mostró un
cargo total promedio de $ 876.10 con una desviación estándar de $194.80. Al nivel de significación 0.025, determina si
el cargo total promedio de Rentacar es significativamente más alto que el de las grandes compañías.
Una muestra de alumnos de una universidad, que compraron sus PC’s con las mismas características pero en
diferentes lugares, reportan los siguientes precios (en miles de pesos) que pagaron por ellas:
7
7. 4
8. 0
8. 8
7. 2
8. 0
8. 7
7. 3
8. 8
8. 1
7. 5
7. 6
8. 4
7. 9
9. 0
8. 6
7. 6
7. 2
7. 9
8. 9
7. 3
7. 0
7. 5
7. 1
7. 7
Los maestros de Informática aseguran que en promedio ese tipo de computadora vale de $8,200.00
Pruebe al nivel de significación de 0.05 la aseveración de los maestros de Informática.
8
9
10
Un laboratorio químico afirma que su pomada para golpes leves alivia el dolor en un promedio de 20 minutos
después de aplicada. Se le aplican golpes leves a 24 sujetos e inmediatamente se les unto la pomada, y se encontró
que en promedio el dolor desapareció en 22.5 minutos con una desviación estándar de 3 minutos. Use un nivel de
significación de 0.05 para determinar si el laboratorio exagera en su afirmación.
“Encuestas Hugger” asegura que un agente realiza 53 entrevistas caseras por semana. Se ha introducido un formato
de entrevistas más moderno y rápido y Hugger desea evaluar su eficiencia. El numero de entrevistas realizadas
durante una semana según una muestra aleatoria de agentes es:
53 – 57 – 50 – 55 –58 – 54 – 60 –52 – 59 – 62 – 60 – 60 – 51 – 59 y 56.
Con un nivel de significación de 0.05 ¿es posible concluir que cambió el número promedio de entrevistas realizadas
por agentes?
Los neumáticos nuevos fabricados por una empresa deben durar (según su publicidad) en promedio 28,000 millas.
Las pruebas hechas a 20 neumáticos dan una duración promedio de 27,500 millas con una desviación estándar de
1000 millas. Use un nivel de significación de 0.056 para determinar si la duración real de los reumáticos es menor
que la anunciada.
13
PRUEBAS DE HIPOTESIS PARA LA
PROPORCION DE UNA POBLACION
Z
pM  pP
Distribución Normal
(p P )(q P )
n
1
Un laboratorio que se especializa en el uso de técnicas de reproducción de genes para lograr compuestos
farmacéuticos, desarrollo un atomizador nasal que contiene interferón con el cual se cree habrá de limitarse la
transmisión del catarro común en las familias. En general, al 15.1% de todos los individuos les dará catarro
ocasionado por un rinovirus una vez que otro miembro de la familia ha contraído catarro. El atomizador de interferón
fue probado en 180 personas, en cuyas familias uno de los miembros contrajo posteriormente un catarro ocasionado
por un rinovirus. Solo 17 de los sujetos de la prueba desarrollo catarros similares. A un nivel de significación de
0.025, ¿Puede el laboratorio concluir que el nuevo atomizador efectivamente reduce la transmisión?
2
Un fabricante de salsa de tomate esta en proceso de decidir si produce una nueva marca extra-condimentada. El
departamento de investigación de mercado de la compañía empleo una encuesta telefónica de 6,000 hogares y
encontró que la salsa de tomate extra-condimentada seria comprada por 335 de ellos. Un estudio mucho más extenso
hecho hace dos años mostraba que el 5% de los hogares de ese entonces habrían comprado el producto. A un nivel
de significación de 0.035, ¿Debe la compañía concluir que ahora existe mayor interés en el sabor extracondimentado?.
3
Celeste vende cortadoras de césped “El Rayo” en su ferretería y esta interesada en comparar la calidad de las
cortadoras que vende con otra marca de cortadoras que se venden a nivel nacional. Celeste sabe que solo el 15% de
estas requieren reparaciones durante el primer año después de la compra. Una muestra de 120 clientes de Celeste
revela que 22 de ellos requirieron reparaciones para sus cortadoras en el primer año después de su compra. Al nivel
de significación de 0.045, ¿Existe evidencia de que las cortadoras “El Rayo” difieren en calidad de las que se venden
nacionalmente?.
4
5
6
7
Dora, Gerente General de Blusas S.A., fabricante de blusas para mujer, sabe que su marca se vende en 19% de las
tiendas de ropa para mujer. Dora sospecha que la distribución de las blusas en el Sur de la República es deficiente y
con tal motivo muestreo 85 tiendas y encontró que sólo en 12 se vendían las blusas de Blusas, S.A. A un nivel de
significación de 0.04, determina si la sospecha de Dora tiene fundamento.
En un día promedio, alrededor del 5% de los valores de la Bolsa de Nueva York muestran una nueva alza para ese
año. El viernes 18 de Septiembre de 1992, el promedio industrial Dow Jones cerró en 3,882 con un fuerte volumen de
aproximadamente 136 millones de títulos negociados. Una muestra aleatoria de 120 títulos determinó qué once de
ellos habían mostrado nuevas alzas anuales ese día. Usando un nivel de significación de 0.035, ¿Podríamos afirmar
que más títulos de los habituales tuvieron alzas anuales ese día?
Eloína, corredora de bolsa, afirma que ella puede predecir, con 85% de certeza, el ascenso o caída, durante el mes
siguiente, de un valor del mercado de valores. Para probarlo, predice el resultado de 60 valores y acierta en 45, de sus
predicciones. Al nivel de significación de 0.04, determina la validez de la afirmación de Eloína.
Audio-sonido maneja una cadena de tiendas que venden sistemas y componentes estéreo de audio. Ha tenido éxito
en muchas ciudades universitarias, pero también algunos fracasos. El análisis de estas fallas la ha llevado a adoptar
la política de no abrir una tienda a menos que estén razonablemente seguros de que al menos 15% de los estudiantes
de la ciudad posean sistema estéreo con un costo de $ 2,000.00 o más. En una encuesta hecha a 300 de los 4,500
estudiantes de una ciudad, descubrió que 43 de ellos poseen un sistema estéreo con un costo de al menos $
2,000.00. Si Audio-sonido desea correr el riesgo del 5% de fracasar, ¿Debería abrir una tienda en ese lugar?
14
8
9
10
11
12
En 1997, se estimó que alrededor de 52% de los hogares de una metrópoli eran suscriptores de televisión por cable.
Los editores de una revista estaban seguros de que sus lectores tenían suscripción por cable en un promedio más
alto que la población general y querían usar este hecho para ayudar a vender más espacio de publicidad para los
canales de estreno por cable. Para comprobar esto, tomaron una muestra de 250 de los suscriptores de la revista y
encontraron que 146 de ellos tenían suscripción a la televisión por cable. A un nivel de significación de 0.015,
determina si los datos de la encuesta apoyan el parecer de los editores.
De un total de 10,200 préstamos otorgados por una unión de crédito de empleados del Estado en el último período de
cinco años, se muestrearon 350 para determinar que proporción de los préstamos se otorgaron a las mujeres. Esta
muestra indicó que 133 créditos se otorgaron a las empleadas. Un censo completo de préstamos de hace cinco años
mostraba que 41% de los prestatarios eran mujeres. A un nivel de significación de 0.02, determina si la proporción de
los préstamos otorgados a las mujeres ha disminuido últimamente.
Un innovador de la industria automotriz pensó que su nuevo automotor eléctrico captaría 48% del mercado regional
en un año, debido al bajo precio y al rendimiento superior de su producto. Existen 5,000 usuarios de automotores en
la región. Después de muestrear 10% de estos usuarios un año después de lanzar al mercado su producto, la
compañía encontró que 43% de ellos usaban los nuevos motores. Con un nivel de significación de 0.01, determine si
la compañía fracasó en alcanzar su objetivo de participación en el mercado.
Un informe asegura que el 52% de los automovilistas que usan las carreteras de cuota en México son varones. Una
muestra de 300 autos que usaron la carretera Veracruz – Xalapa en cierto día revelo que 170 eran conducidos por
hombres. Al nivel de significación de 0.01,
1. ¿Se puede concluir que una proporción mayor de varones conducen autos por la carretera Veracruz –
Xalapa, que lo que indica el citado informe?
2. ¿Se puede concluir que una proporción diferente de varones conducen autos por la carretera Veracruz –
Xalapa, que lo que indica el citado informe?
Un articulo de USA TODAY reporto que hay un empleo disponible por cada tres egresados universitarios con grado.
Las principales razones aportadas fueron que existe una sobrepoblación de graduados universitarios, y un
debilitamiento de la economía nacional. Suponga que una encuesta con 200 graduados recientes de la Universidad
ABC revela que 80 ya tienen empleo. Al nivel de significación de 0.02:
1. ¿Se puede concluir que la proporción de recién egresados de la Universidad ABC que ya tienen empleo es
mayor que la señalada nacionalmente por USA TODAY?
2. ¿Se puede concluir que la proporción de recién egresados de la Universidad ABC que ya tienen empleo es
diferente que la señalada nacionalmente por USA TODAY?
El precio que tiene cierto tipo de memoria que se emplea en el ensamble de PCs es de 30 dólares. Una muestra de
precios en negocios seleccionados al azar que venden esa memoria en una ciudad, nos da la siguiente información:
13
30
33
30
30
31
30
30
30
30
30
30
31
30
29
30
30
30
30
30
30
29
30
28
30
28
30
30
30
28
30
30
32
30
31
30
30
Pruebe al nivel de significación de 0.053 la aseveración de que 1/3 de los negocios de esa ciudad no venden a 30
dólares dicha memoria.
14
Una empresa transnacional, ha observado en una muestra de 54 empleados de su filial en México, que 24 rebasan la
edad de 45 años. La política de la empresa, es que un máximo del 33% de los empleados rebase dicha edad.
Al nivel de significación de 0.072 determine si existen razones en la empresa para pensar que la proporción de los
trabajadores en México que rebasan los 45 años es mayor que la que dictan sus políticas.
15
El gerente de una fábrica que tiene mucho personal dice que en un día normal, el 18% de sus empleados sufren de
algún atraso en su hora de entrada a laborar. En una fecha cualquiera seleccionada al azar, se toma una muestra de
76 empleados, y 17 de ellos habían sufrido de algún atraso. Determine al nivel de significación del 0.083, si en dicha
fecha la proporción de trabajadores con atraso a la entrada es diferente a la estimada por el gerente de personal.
15
PRUEBAS DE HIPOTESIS PARA LA DIFERENCIA
DE LAS MEDIAS DE DOS MUESTRAS GRANDES
Z
1
x1  x 2
 12
2
 2
n1
n2
Distribución Normal
Una fábrica de plumas ha probado dos tipos de anuncios publicitarios para su llueva pluma de tinta borrable. Un
anuncio de mostrador fue colocado en una muestra aleatoria de 40 tiendas en el mercado de prueba y un anuncio de
piso se colocó en otras 40 tiendas del área. El número medio de plumas vendidas por tienda en un mes en los lugares
donde había anuncios de mostrador fue de 42 con una desviación estándar de 8. En cuanto a los anuncios de piso, el
número medio de plumas vendidas por tienda en el mismo mes fue de 45 con una desviación estándar de 7. Al nivel de
significación de 0.015, determina si hay diferencia significativa entre las ventas de los establecimientos donde hubo
distinto tipo de publicidad.
2
En 1994, una investigación de 50 hospitales de un país revelo una tasa de ocupación media de 73.6% con una
desviación estándar de 18.2%. En otra investigación efectuada en 75 hospitales del mismo país en 1997, se obtuvo una
tasa de ocupación promedio de 68.9% con una desviación estándar de 19.7%. Al nivel de significación de 0.015,
determina si la tasa de ocupación promedio cambio durante los tres años que hay entre las dos investigaciones.
3
Se efectuó un estudio del número de comidas de negocios que los ejecutivos reclaman como gastos deducibles por
mes. Si 40 ejecutivos de la industria de los seguros promediaron 9.4 de dichas deducciones con una desviación
estándar de 3.3 en un mes determinado; mientras que 50 ejecutivos bancarios promediaron 7.9 con una desviación
estándar de 2.9. Pruebe en el nivel de significación de 0.05 si existe diferencia entre estas dos medias de muestra.
En una investigación de los tiempos de reparación de dos clases de equipo de fotocopiado, se obtuvieron estos datos:
4
Tipo de
equipo
I
II
Numero de reparaciones
60
60
Media
84.2 min.
91.6 min.
Tiempos de reparación
Desviación estándar
19.4 min.
18.8 min.
Pruebe al nivel de significación de 0.01 si existe diferencia entre estas dos medias de muestras.
5
Encuestas muestrales conducidas en un condado grande en 1960 y de nuevo en 1990, demostraron que en 1960 la
altura promedio de 400 hombres del grupo de la edad entre 18 y 24 años era de 68.4 pulgadas con una desviación
estándar de 2.6 pulgadas; mientras que en 1990 la altura promedio de 400 hombres del mismo grupo de edad era de 69.8
pulgadas con una desviación estándar de 2.5 pulgadas. Use el nivel de significación de 0.06 para probar si hubo
incremento en el promedio de las alturas en esos 30 años.
Suponga que se desea verificar si es verdad que en promedio los hombres blancos ganan más que los de color en una
fábrica. Los datos de una muestra arrojan la siguiente información:
6
Color
de piel
Blanca
Morena
Numero de
trabajadores
75
60
Media
$ 422.18
$ 381.66
Salario semanal
Desviación estándar
$ 35.20
$ 32.65
Determine al nivel de significación de 0.042 si efectivamente se paga más a los hombres de piel blanca.
16
7
8
Se realiza un estudio comparando el costo de alquilar un departamento de una recamara en Xalapa, con el
correspondiente costo en Veracruz. Una muestra de 30 departamentos en Xalapa mostró que el valor medio de las
rentas es de $3,700 con una desviación estándar de $300. Una muestra de 40 departamentos en Veracruz señaló que la
renta media en Veracruz es de $3,800 con una desviación estándar de $260. Al nivel de significación de 0.064:
1. ¿Existe diferencia en las rentas medias entre Xalapa y Veracruz?
2. ¿Es mayor la renta media en Veracruz que en Xalapa?.
Una empresa de bienes raíces esta preparando un folleto que cree puede ser de interés para compradores de casa en
dos rumbos de la ciudad. Un elemento de interés es el tiempo que el propietario que vende ha ocupado el inmueble. Una
muestra de 40 casas vendidas recientemente en la zona Norte indica que el tiempo medio de propiedad fue de 7.6 años
con una desviación estándar de 2.3 años. Una muestra de 55 casas de la zona Sur señalo que el tiempo medio era de
8.1 años con una desviación estándar de 2.9 años. Usando un nivel de significación de 0.05, ¿Se puede concluir:
1. que los residentes del Norte tienen en propiedad sus casas por tiempo mas corto?
2. que los residentes del Norte tienen en propiedad sus casas por un tiempo diferente?
Se elaboro un estudio de los ingresos anuales (en dólares) de los funcionarios en ciudades con población menor a
100,000 habitantes, y en ciudades con población mayor a 500,000 habitantes. Algunos datos estadísticos de las
muestras son los siguientes:
9
Tamaño de la muestra
Media de la muestra
Desviación estándar muestral
Población menor de 100,000
45
$ 31,290
$ 1,060
Población mayor de 500,000
60
$ 31,330
$ 1,900
Usando un nivel de significación de 0.075, ¿Puede afirmarse que:
1. ganan mas los funcionarios de ciudades con mas de 500,000 habitantes?
2. son diferentes los sueldos de los funcionarios de los dos tipos de ciudades?
La fuerza aérea de un país adiestra al personal de computación en dos bases (Cass AFB y Kingston AFB). Se aplico un
examen final común. Los resultados obtenidos en dichos exámenes se resumen en la siguiente tabla:
10
Tamaño de la muestra
Promedio de la muestra
Desviación estándar muestral
Cass AFB
40
114.6
9.1
Kingston AFB
50
117.9
10.4
Al nivel de significación de 0.9:
1. ¿Son diferentes los promedios de las muestras?
2. ¿Es mayor el promedio de los capacitados en Kingston AFB?
11
Alumnos de una Universidad seleccionaron al azar 217 autos de estudiantes y hallaron que sus edades tenían una
media de 7.89 años con una desviación estándar de 3.67 años. También escogieron al azar 152 autos de profesores y
determinaron que sus edades tenían una media de 5.99 años con una desviación estándar de 3.65 años. Use un nivel de
significación de 0.075 para probar que los autos de los estudiantes son más viejos que los de los profesores.
12
En una muestra de 45 empleados de Publicidad, se detecto que el ultimo mes recibieron un promedio de 21 correos con
una desviación estándar de 2.6; por su parte, de una muestra de 36 empleados de Ventas de la misma empresa, durante
el ultimo mes recibieron en promedio 26 correos con una desviación estándar de 3.5 ¿Es mayor el promedio de correos
recibidos por Ventas que el de Publicidad? Use un nivel de significación de 0.044
13
En una fabrica se emplean dos maquinas de distinta marca para fabricar el mismo producto. Una muestra de 18 minutos
en la maquina General Electric nos indica que es capaz de producir 28 unidades por minuto con una desviación
estándar de 4 unidades; mientras que otra muestra de 14 minutos de la maquina Panasonic (que es mas nueva) nos
indica que produce 35 unidades por minuto con una varianza de 25 unidades cuadradas. Determine al nivel de
significación de 0.05 si la nueva maquina Panasonic tiene una mayor tasa de producción que la vieja maquina General
Electric.
17
PRUEBAS DE HIPOTESIS PARA LA DIFERENCIA
DE LAS MEDIAS DE DOS MUESTRAS PEQUEÑAS
t
1
2
x1  x 2
(n 1  1)s 12  (n 2  1)s 22
(n 1  n 2  2 )
Distribución “t” de Student
1
1
  
 n1 n 2 
Una organización de investigación de consumo selecciona de manera rutinaria varios modelos de automóvil cada año
y evalúa su eficiencia con respecto al combustible. En el estudio del presente año, de dos modelos compactos
fabricados por dos marcas distintas, el consumo promedio para doce automóviles de la marca Alfa fue de 13.6
kilómetros por litro (kpl), con una desviación estándar de 1.9 kpl. Los nueve automóviles de la marca Beta que fueron
probados, tuvieron un rendimiento promedio de 16.2 kpl, con una desviación estándar de 2.1 kpl. Al nivel de
significación 0.01, la organización puede concluir que los automóviles de la marca Beta tienen mayor rendimiento que
los automóviles de la marca Alfa.
Un banco quiere determinar la eficiencia de sus nuevos ejecutivos de cuenta en la obtención de clientes. Luego de
terminar su capacitación, los nuevos ejecutivos dedican varias semanas a visitar posibles clientes para que abran
cuentas en la institución. Los datos adjuntos contienen los números de cuentas nuevas abiertas en sus dos primeras
semanas por10 ejecutivas de cuenta seleccionadas al azar y por 8 ejecutivos también seleccionados al azar:
Ejecutivas
Ejecutivos
12
13
11
10
14
11
13
12
13
13
14
12
13
10
12
12
14
12
Usando un nivel de significación de 0.05, determina si las ejecutivas son más eficaces en la creación de nuevas
cuentas con respecto a los ejecutivos.
3
Para celebrar su primer aniversario, Felipe decidió comprar un par de aretes de diamante para su esposa Florencia. Le
enseñaron nueve pares de aretes con gemas que pesaban aproximadamente dos quilates por par. Debido a la
diferencia en color y calidad de las piedras, los precios variaban de una joya a la otra. El precio promedio fue de
$29,900.00, con una desviación estándar de $ 3,700.00. También le enseñaron seis pares con piedras en forma de gota,
con un peso aproximado de dos quilates por par. Estos pendientes tenían un precio promedio de $30,650.00 con una
desviación estándar de $8,050.00. Con la información anterior, ¿Puede Felipe llegar a la conclusión de que los
diamantes en forma de gota cuestan más, en promedio, que el otro tipo de diamante? Úsese un nivel de significación
de 0.05.
A nueve distribuidores de componentes para computadora que operan en el área metropolitana se les pidió los
precios de dos impresoras de matriz de puntos parecidas, con ancho estándar y fuentes de cierta calidad. Los
resultados de la investigación se consignan en pesos en la siguiente tabla:
4
Comercio
Apson
Okaydat
1
3500
3700
2
4190
4250
3
3850
3690
4
3600
3750
5
4050
3890
6
3890
3850
7
3890
3950
8
4090
4250
9
3750
4000
Usando un nivel de significación de 0.05, determina si en promedio la impresora Apson es más barata que la
impresora Okaydat.
5
A 13 vendedores se les aplica un incentivo “A”, y venden en promedio $50,000 semanales con una desviación
estándar de $12,000.
A 8 vendedores de la misma empresa se les aplica un incentivo “B” y venden en promedio $46,000 a la semana con
una desviación estándar de $ 10,000.
¿Existe diferencia entre los niveles de ventas? Use un nivel de significación de 0.05
18
6
Los módems son dispositivos que transmiten información mediante líneas telefónicas de una computadora a otra. La
velocidad de transmisión se mide en bauds, que se definen como el número de bits por segundo que pueden
transmitir. Debido a la intervención de varios factores técnicos, la rapidez de transmisión real varía de un archivo a
otro. Fernanda está en proceso de adquirir un módem nuevo de 14,400 bauds. Al probar dos de los dispositivos, con el
fin de decidir cuál comprar, transmitió siete archivos elegidos al azar utilizando ambos módems y registró las
siguientes velocidades de transmisión (en miles de bauds).
Archivo
Ultima 14.4Haynes
PerFAXtion 14.4 Extel
1
9.52
10.92
2
10.17
11.46
3
10.33
11.18
4
10.02
12.21
5
10.72
10.42
6
9.62
11.36
7
9.17
10.47
En un artículo aparecido en la revista PC Reports se afirma que en pruebas hechas por la misma revista se ha
encontrado que el módem PerFAXtion es más rápido que el Ultima Haynes. Usando un nivel de significación de 0.01,
determina si los resultados obtenidos por Fernanda confirman lo afirmado por la revista.
7
Una compañía de productos alimenticios acaba de concluir una campaña publicitaria para uno de sus productos, un
cereal natural para el desayuno que contiene nueces, cereales y fruta seca. Para probar la efectividad de la campaña,
la gerente de la marca, Helga Hernández, encuestó a once clientes antes de la campaña ya otros once después de
ésta. A continuación se da el consumo semanal (en gramos) de dicho producto por parte de los consumidores:
Antes
Después
140
230
50
140
180
130
180
290
300
330
100
110
80
20
260
250
130
210
290
260
240
340
Al nivel de significación 0.005, ¿Puede Helga concluir que la campaña ha tenido éxito?
8
Recientemente, un analgésico perdió algo de sus ventas ante un nuevo competidor. El competidor anunciaba que su
marca entra al torrente sanguíneo con más rapidez que el otro analgésico y, como resultado de ello, alivia el dolor más
pronto. Al laboratorio que fabrica el primer analgésico le gustaría probar que no existe diferencia significativa entre los
dos productos y, por consiguiente, que la afirmación de su competidor es falsa. A manera de prueba preliminar, a
nueve individuos se les suministró el analgésico del laboratorio una vez al día durante tres semanas. En las siguientes
tres semanas, a los mismos sujetos se les dio el producto de la competencia. Para cada medicamento se registró el
tiempo en minutos que le tomó aliviar el dolor:
Individuo
Analgésico
Competidor
1
16.5
12.0
2
25.5
20.5
3
23.0
25.0
4
14.5
16.5
5
28.0
24.0
6
10.0
11.5
7
21.5
17.0
8
18.5
15.0
9
15.5
13.0
Al nivel de significación 0.025, determina la conclusión a la que llegó el laboratorio que hizo la investigación.
9
Un químico que se encuentra desarrollando repelentes de insectos desea saber si una fórmula recientemente
desarrollada da mayor protección contra los piquetes de insectos que la que proporciona el producto líder del
mercado. En un experimento a 14 voluntarios se les roció uno de los brazos con el producto viejo y el otro brazo con
la nueva fórmula. Luego cada individuo metió los brazos en una cámara llena de mosquitos y otros insectos que
pican. El número de piquetes recibido en cada brazo Se registra en la tabla siguiente:
Individuo
Formula vieja
Formula nueva
1
5
3
2
2
1
3
5
5
4
4
1
5
3
1
6
6
4
7
2
4
8
4
2
9
2
5
10
6
2
11
5
3
12
7
3
13
1
1
14
3
2
Al nivel de significación 0.05, ¿Puede el químico concluir que la nueva fórmula es más efectiva?
Dos gemelos un poco flojos para estudiar, tienen los siguientes resultados de su evaluación parcial:
10
Ovonio
Inepticio
Contabilidad
5
6
Administración
8
5
Economía
5
6
Matemáticas
3
4
Derecho
6
5
Computación
4
5
Ética
6
3
¿Existe diferencia en los promedios del par de flojos?. Use un nivel de significación de 0.05
19
11
La duración en días de dos marcas distintas de discos duros de las mismas características, instalados en PC’s de un
cibercafe, se muestran en la siguiente relación:
ACME
INC
967
699
785
874
777
689
596
578
811
916
617
721
825
887
655
713
608
¿Puede afirmarse al nivel de significación de 0.05 que son diferentes las duraciones?
12
Se comparo el tiempo que pasan juntos los integrantes de parejas en las que solo trabaja uno y en las que ambos lo
hacen. De acuerdo con los registros llevados por las esposas durante el estudio, la cantidad de tiempo promedio que
pasan juntos viendo TV las parejas en que solo trabaja uno de sus integrantes fue de 61 minutos al día, con una
desviación estándar de 15.5 minutos. Para las parejas en las que ambos trabajan, el numero medio de minutos que
pasan juntos viendo la TV fue de 48.4 minutos con una desviación estándar de 18.1 minutos. En el nivel de
significancia de 0.01 ¿Es posible concluir que aquellas parejas en las que solo trabaja uno de los integrantes pasan
mas tiempo juntas viendo TV?. Se estudiaron quince parejas con un solo integrante trabajador y doce con ambos.
Una compañía del ramo de las telecomunicaciones hará próximamente una gran inversión en equipo de impresión,
razón por la cual se encuentran actualmente cotizando dos tipos de impresoras. Las siguientes tablas muestran los
precios (en miles de pesos) que tienen dichas impresoras en varias tiendas especializadas de la localidad:
13
2.6
2.9
2.0
2.1
Impresora AX – 2300
2.0
2.0
2.1
2.4
2.6
2.1
2.3
2.2
2.5
2.2
2.7
2.6
2.4
2.8
2.8
2.1
2.5
2.8
2.1
Impresora BZ – 1600
2.4
2.9
2.1
2.4
2.6
2.5
2.7
2.0
2.9
2.5
2.7
2.5
2.2
2.4
En base a dicha información, usando un nivel de significación de:
a) 0.05, determine si existe diferencia en los promedios de precios de dichas impresoras.
b) 0.067, determine si es mayor la proporción de tiendas que venden a mas de $2,600 la Impresora BZ – 1600
que la Impresora AX – 2300.
14
Un grupo de habitantes de la ciudad están preocupados por los altos cobros que realiza actualmente la CFE por el
uso de la energía eléctrica, y están haciendo un registro de los consumos bimestrales que tienen. De dicho registro
se obtuvieron las siguientes muestras aleatorias:
Muestra de la Calle Olmo
Consiste en 11 hogares, en los cuales el promedio de Kilowatts – Hora que se consumen por bimestre es de 450 con
una desviación estándar de 60. De dicha muestra, 3 hogares consumen más de 600 Kilowatts – Hora
bimestralmente.
Muestra de la Calle Pino
A continuación se citan las lecturas en Kilowatts – Hora por bimestre obtenidas en hogares de dicha calle:
380
510
432
609
421
539
671
429
648
531
462
721
422
634
542
592
680
512
En base a información brindada por las muestras:
a) Empleando un nivel de significación de 0.083, ¿Podemos afirmar que es mayor la proporción de hogares que
consumen menos de 600 Kilowatts – Hora bimestralmente en la calle Olmo que en la calle Pino?
b) Empleando un nivel de significación de 0.05, ¿Son diferentes los promedios bimestrales de consumo de energía
eléctrica en ambas calles?
Se desea comparar el índice de eficiencia en el manejo de PC en una empresa, y para ello se efectuó un examen
antes de la impartición de un curso de Microsoft Office, y otro después del mismo. Los exámenes se califican en
escala de 0 a 10, y los promedios obtenidos con sus desviaciones estándar son los siguientes:
15
Antes del curso
Después del curso
x
6
8
s
0.8
0.5
n
12
17
Determine al nivel de significación de 0.1 si puede considerarse exitoso el curso.
20
PRUEBAS DE HIPOTESIS PARA LA DIFERENCIA
DE LAS PROPORCIONES DE DOS MUESTRAS
Z
1
p1  p 2
 1
1 

p(q )

n
n
2 
 1
Donde
p
n 1p 1  n 2 p 2
n1  n 2
Distribución Normal
Una muestra de 400 marineros se ha dividido en dos grupos iguales por selección al azar. Un grupo ha tomado la
marca A de pastillas de Un preventivo contra el mareo y el otro grupo las pastillas de la marca B. El número de cada
grupo que no se ha mareado durante una tormenta intensa ha sido de 152 y 132, respectivamente. Usando un nivel de
significación de 0.02, ¿Podríamos afirmar que las pastillas de la marca A son más eficientes que las pastillas de la
marca B?
2
Una compañía que fabrica productos medicinales está probando dos nuevos compuestos destinados a reducir la
presión sanguínea. Los compuestos son suministrados a dos diferentes conjuntos de animales de laboratorio. En el
grupo uno, 71 de 98 animales probados respondieron a la droga 1 con niveles menores de presión arterial. En el
grupo dos, 58 de 90 animales probados respondieron a la droga 2 con menores niveles de presión sanguínea. La
compañía desea probar a un nivel de significación de 0.05, si existe una diferencia entre la eficiencia de las dos
medicinas.
3
El viernes, tuvieron avance 11 acciones de una muestra aleatoria de 40 tomada de las 2,500 acciones negociadas en
la Bolsa de Valores es decir, aumentó el precio de su valor. En una muestra de 60 acciones tomada el día anterior,
jueves, 24 acciones avanzaron. Al nivel de significación 0.035, determina si un porcentaje menor de las acciones de la
Bolsa de valores avanzaron el viernes con respecto al jueves.
4
Como parte de la preparación para las negociaciones sobre la renovación del contrato colectivo de trabajo, el
Sindicato de Manufactureros hizo una investigación entre sus afiliados para saber si hay preferencia por un aumento
grande en los beneficios de retiro o un pequeño incremento al salario. En un grupo de 997 miembros masculinos que
fueron entrevistados, 743 estaban a favor de un aumento en los beneficios del retiro. De 498 miembros femeninos del
sindicato, 405 estaban a favor de un aumento en los beneficios del retiro. Al nivel de significación 0.035, determina si
el porcentaje de hombres y de mujeres que están a favor de un aumento en los beneficios de retiro es el mismo.
5
Un grupo de fisiólogos clínicos está llevando al cabo pruebas en pacientes para determinar la efectividad de una
nueva medicina contra la hipertensión. Los pacientes con alta presión sanguínea fueron seleccionados al azar y luego
fueron asignados, aleatoria mente también, a un grupo de control (donde son tratados con un medicamento contra la
hipertensión bien conocido) o al grupo de tratamiento (en el cual recibieron tratamiento con la nueva medicina). Los
médicos registraron el porcentaje de pacientes cuya presión arterial se redujo a un nivel normal después de un año de
tratamiento. Los resultaron se dan en la siguiente tabla:
Grupo
Tratamiento
Control
Porcentaje que mejoró
45
36
Número de pacientes
120
150
Al nivel de significación de 0.015, se desea determinar si la nueva medicina es significativamente más efectiva en
reducir la presión sanguínea que la medicina ya conocida.
7
Un método de estimulación de lluvias artificiales por medio de generadores de vapores químicos en tierra tuvo éxito
en 58 de 146 intentos; mientras que otro de bombardeo de nubes con avionetas tuvo éxito en 32 de 104 intentos.
Determine al nivel de significación de 0.88 si existe diferencia entre la eficiencia de ambos métodos.
21
Una empresa de encuestas efectúa interrogatorios de puerta en puerta sobre gran diversidad de asuntos. Algunas
personas cooperan con el entrevistador y llenan el cuestionario, y otras no. Se dispone de los siguientes datos:
8
Encuestados
Hombres
Mujeres
Tamaño de la muestra
200
300
Numero de personas que cooperan
110
210
¿Puede concluirse al nivel de significación de 0.07 que cooperan mas las mujeres para contestar las encuestas?
En una oficina del Gobierno Federal, no todos los empleados emplean PC en sus trabajos. La siguiente tabla muestra
el ultimo informe que presento el departamento de Informática:
9
Hombres
Mujeres
Usan PC
129
61
No usan PC
37
23
¿Es menor la proporción de hombres que usan PC que la de mujeres? Use un nivel de significación de 0.092
Una empresa de publicidad estudia la proporción de egresados de universidades públicas y privadas que encuentran
trabajo antes de que se cumpla un año de su graduación. Los datos obtenidos son los siguientes:
10
Universidad
Publica
Privada
Tamaño de la muestra
325
160
Numero de éxitos
221
119
¿Puede concluirse al nivel de significación de 0.078 que son diferentes las proporciones de éxito en los dos tipos de
universidades?
22
PRUEBA DE HIPOTESIS PARA DIFERENCIA DE LAS MEDIAS
DE MAS DE DOS MUESTRAS (ANALISIS DE VARIANZA)
Distribución F (de Fisher - Snedecor)

Hipótesis nula: Las medias de las poblaciones a que pertenecen las muestras son iguales, es
decir, todas las muestras provienen de una misma población:
H0 : µ1 = µ2 = µ3 = …….. = µk

Hipótesis alternativa: Las medias de las poblaciones a que pertenecen las muestras son
diferentes, es decir, todas las muestras provienen de diferentes poblaciones:
H0 : µ1 ≠ µ2 ≠ µ3 ≠ …….. ≠ µk
Planteo

Valor
crítico
de F.
(Fc)


Grados de libertad verticales o del numerador: glv = k - 1 donde “k” es el número
de muestras.
Grados de libertad horizontales o del denominador: glh = k( n - 1) donde “n” es el
número de elementos de cada muestra (todas son del mismo tamaño) y “k” es el
número de muestras.
Varianza intra-muestras:
s 12 + s 22 + .....+ s k2
VD =
k
∑( x - x )
=
2
donde:
s
2
n -1
,
2
Siendo “ s ” la varianza de cada muestra, “k” el número de muestras y “n” el
número de elementos de cada muestra.
Análisis
Valor
efectivo
De F.
(Fe)

Varianza inter-muestras:
μ=
( x 1 - μ )2 +( x 2 - μ )2 + .....+( x k - μ )2
VE = n
k -1
donde:
x 1 + x 2 + . . ..+ x k
, siendo “xn” la media de cada muestra, y “n” el número de
k
elementos de cada muestra (todas son del mismo tamaño).
Conclusión
Fe =
VE
VD

Razón F efectiva:

Si Fe > Fc, entonces la diferencia es significativa y se rechaza la hipótesis nula.
Escribir una frase en la que se diga que se apoya con una confianza de: 1 – nivel de significación,
expresar en porcentaje:
 La hipótesis nula sí: Fe < Fc
 La hipótesis alternativa sí: Fe > Fc
23
Tabla de Distribución F (Nivel de significación de 0.05)
GRADOS DE LIBERTAD VERTICALES O DEL NUMERADOR
1
2
3
4
5
6
7
8
9
10
20
60
100
1
161.45
199.5
215.71
224.58
230.16
233.99
236.77
238.88
240.54
241.88
248.02
252.2
253.04
2
18.513
19
19.164
19.247
19.296
19.329
19.353
19.371
19.385
19.396
19.446
19.479
19.486
3
10.128
9.5521
9.2766
9.1172
9.0134
8.9407
8.8867
8.8452
8.8123
8.7855
8.6602
8.572
8.5539
4
7.7086
6.9443
6.5914
6.3882
6.2561
6.1631
6.0942
6.041
5.9988
5.9644
5.8025
5.6878
5.664
5
6.6079
5.7861
5.4094
5.1922
5.0503
4.9503
4.8759
4.8183
4.7725
4.7351
4.5581
4.4314
4.4051
6
5.9874
5.1432
4.7571
4.5337
4.3874
4.2839
4.2067
4.1468
4.099
4.06
3.8742
3.7398
3.7117
7
5.5915
4.7374
4.3468
4.1203
3.9715
3.866
3.7871
3.7257
3.6767
3.6365
3.4445
3.3043
3.2749
8
5.3176
4.459
4.0662
3.8379
3.6875
3.5806
3.5005
3.4381
3.3881
3.3472
3.1503
3.0053
2.9747
9
5.1174
4.2565
3.8625
3.6331
3.4817
3.3738
3.2927
3.2296
3.1789
3.1373
2.9365
2.7872
2.7556
10
4.9646
4.1028
3.7083
3.478
3.3258
3.2172
3.1355
3.0717
3.0204
2.9782
2.774
2.6211
2.5884
11
4.8443
3.9823
3.5874
3.3567
3.2039
3.0946
3.0123
2.948
2.8962
2.8536
2.6464
2.4901
2.4566
12
4.7472
3.8853
3.4903
3.2592
3.1059
2.9961
2.9134
2.8486
2.7964
2.7534
2.5436
2.3842
2.3498
13
4.6672
3.8056
3.4105
3.1791
3.0254
2.9153
2.8321
2.7669
2.7144
2.671
2.4589
2.2966
2.2614
14
4.6001
3.7389
3.3439
3.1122
2.9582
2.8477
2.7642
2.6987
2.6458
2.6022
2.3879
2.2229
2.187
15
4.5431
3.6823
3.2874
3.0556
2.9013
2.7905
2.7066
2.6408
2.5876
2.5437
2.3275
2.1601
2.1234
H
O
R
I
Z
O
N
T
A
L
E
S
16
4.494
3.6337
3.2389
3.0069
2.8524
2.7413
2.6572
2.5911
2.5377
2.4935
2.2756
2.1058
2.0685
17
4.4513
3.5915
3.1968
2.9647
2.81
2.6987
2.6143
2.548
2.4943
2.4499
2.2304
2.0584
2.0204
18
4.4139
3.5546
3.1599
2.9277
2.7729
2.6613
2.5767
2.5102
2.4563
2.4117
2.1906
2.0166
1.978
19
4.3808
3.5219
3.1274
2.8951
2.7401
2.6283
2.5435
2.4768
2.4227
2.3779
2.1555
1.9795
1.9403
20
4.3513
3.4928
3.0984
2.8661
2.7109
2.599
2.514
2.4471
2.3928
2.3479
2.1242
1.9464
1.9066
21
4.3248
3.4668
3.0725
2.8401
2.6848
2.5727
2.4876
2.4205
2.3661
2.321
2.096
1.9165
1.8761
22
4.3009
3.4434
3.0491
2.8167
2.6613
2.5491
2.4638
2.3965
2.3419
2.2967
2.0707
1.8894
1.8486
23
4.2793
3.4221
3.028
2.7955
2.64
2.5277
2.4422
2.3748
2.3201
2.2747
2.0476
1.8648
1.8234
0
24
4.2597
3.4028
3.0088
2.7763
2.6207
2.5082
2.4226
2.3551
2.3002
2.2547
2.0267
1.8424
1.8005
25
4.2417
3.3852
2.9912
2.7587
2.603
2.4904
2.4047
2.3371
2.2821
2.2365
2.0075
1.8217
1.7794
26
4.2252
3.369
2.9752
2.7426
2.5868
2.4741
2.3883
2.3205
2.2655
2.2197
1.9898
1.8027
1.7599
27
4.21
3.3541
2.9603
2.7278
2.5719
2.4591
2.3732
2.3053
2.2501
2.2043
1.9736
1.7851
1.7419
28
4.196
3.3404
2.9467
2.7141
2.5581
2.4453
2.3593
2.2913
2.236
2.19
1.9586
1.7689
1.7251
29
4.183
3.3277
2.934
2.7014
2.5454
2.4324
2.3463
2.2782
2.2229
2.1768
1.9446
1.7537
1.7096
30
4.1709
3.3158
2.9223
2.6896
2.5336
2.4205
2.3343
2.2662
2.2107
2.1646
1.9317
1.7396
1.695
40
4.0847
3.2317
2.8387
2.606
2.4495
2.3359
2.249
2.1802
2.124
2.0773
1.8389
1.6373
1.5892
50
4.0343
3.1826
2.79
2.5572
2.4004
2.2864
2.1992
2.1299
2.0733
2.0261
1.7841
1.5757
1.5249
60
4.0012
3.1504
2.7581
2.5252
2.3683
2.2541
2.1665
2.097
2.0401
1.9926
1.748
1.5343
1.4814
70
3.9778
3.1277
2.7355
2.5027
2.3456
2.2312
2.1435
2.0737
2.0166
1.9689
1.7223
1.5046
1.4498
80
3.9604
3.1108
2.7188
2.4859
2.3287
2.2142
2.1263
2.0564
1.9991
1.9512
1.7032
1.4821
1.4259
90
3.9469
3.0977
2.7058
2.4729
2.3157
2.2011
2.1131
2.043
1.9856
1.9376
1.6883
1.4645
1.407
100
3.9362
3.0873
2.6955
2.4626
2.3053
2.1906
2.1025
2.0323
1.9748
1.9267
1.6764
1.4504
1.3917
G
R
A
D
O
S
D
E
L
I
B
E
R
T
A
D
D
E
L
D
E
N
O
M
I
N
A
D
O
R
24
Tabla de Distribución F (Nivel de significación de 0.025)
GRADOS DE LIBERTAD VERTICALES O DEL NUMERADOR
7
8
9
10
20
937.11
948.2
956.64
963.28
968.63
993.08
1009.8 1013.2
39.331
39.356
39.373
39.387
39.398
39.448
39.481 39.488
14.885
14.735
14.624
14.54
14.473
14.419
14.167
13.992 13.956
9.6045
9.3645
9.1973
9.0741
8.9796
8.9046
8.8439
8.5599
8.3604 8.3195
7.7636
7.3879
7.1464
6.9777
6.853
6.7572
6.681
6.6192
6.3285
6.1225
7.2599
6.5988
6.2271
5.9875
5.8197
5.6955
5.5996
5.5234
5.4613
5.1684
4.9589 4.9154
6.5415
5.8898
5.5226
5.2852
5.1186
4.9949
4.8993
4.8232
4.7611
4.4668
4.2544 4.2101
7.5709
6.0595
5.416
5.0526
4.8173
4.6517
4.5285
4.4333
4.3572
4.2951
3.9994
3.7844 3.7393
9
7.2093
5.7147
5.0781
4.7181
4.4844
4.3197
4.197
4.102
4.026
3.9639
3.6669
3.4493 3.4034
10
6.9367
5.4564
4.8256
4.4683
4.2361
4.0721
3.9498
3.8549
3.779
3.7168
3.4185
3.1984 3.1517
11
6.7241
5.2559
4.63
4.2751
4.044
3.8806
3.7586
3.6638
3.5879
3.5257
3.2261
3.0035 2.9561
12
6.5538
5.0959
4.4742
4.1212
3.8911
3.7283
3.6065
3.5118
3.4358
3.3735
3.0728
2.8478 2.7996
13
6.4143
4.9653
4.3472
3.9959
3.7667
3.6043
3.4827
3.388
3.312
3.2497
2.9477
2.7204 2.6715
14
6.2979
4.8567
4.2417
3.8919
3.6634
3.5014
3.3799
3.2853
3.2093
3.1469
2.8437
2.6142 2.5646
15
6.1995
4.765
4.1528
3.8043
3.5764
3.4147
3.2934
3.1987
3.1227
3.0602
2.7559
2.5242 2.4739
16
6.1151
4.6867
4.0768
3.7294
3.5021
3.3406
3.2194
3.1248
3.0488
2.9862
2.6808
2.4471 2.3961
17
6.042
4.6189
4.0112
3.6648
3.4379
3.2767
3.1556
3.061
2.9849
2.9222
2.6158
2.3801 2.3285
18
5.9781
4.5597
3.9539
3.6083
3.382
3.2209
3.0999
3.0053
2.9291
2.8664
2.559
2.3214 2.2692
19
5.9216
4.5075
3.9034
3.5587
3.3327
3.1718
3.0509
2.9563
2.8801
2.8172
2.5089
2.2696 2.2167
20
5.8715
4.4612
3.8587
3.5147
3.2891
3.1283
3.0074
2.9128
2.8365
2.7737
2.4645
2.2234 2.1699
21
5.8266
4.4199
3.8188
3.4754
3.2501
3.0895
2.9686
2.874
2.7977
2.7348
2.4247
2.1819
22
5.7863
4.3828
3.7829
3.4401
3.2151
3.0546
2.9338
2.8392
2.7628
2.6998
2.389
2.1446 2.0901
23
5.7498
4.3492
3.7505
3.4083
3.1835
3.0232
2.9023
2.8077
2.7313
2.6682
2.3566
2.1107 2.0556
D
E
L
24
5.7166
4.3187
3.7211
3.3794
3.1548
2.9946
2.8738
2.7791
2.7027
2.6396
2.3273
2.0799 2.0243
25
5.6864
4.2909
3.6943
3.353
3.1287
2.9685
2.8478
2.7531
2.6766
2.6135
2.3005
2.0516 1.9955
D
E
N
O
M
I
N
A
D
O
R
26
5.6586
4.2655
3.6697
3.3289
3.1048
2.9447
2.824
2.7293
2.6528
2.5896
2.2759
2.0257 1.9691
27
5.6331
4.2421
3.6472
3.3067
3.0828
2.9228
2.8021
2.7074
2.6309
2.5676
2.2533
2.0018 1.9447
28
5.6096
4.2205
3.6264
3.2863
3.0626
2.9027
2.782
2.6872
2.6106
2.5473
2.2324
1.9797 1.9221
29
5.5878
4.2006
3.6072
3.2674
3.0438
2.884
2.7633
2.6686
2.5919
2.5286
2.2131
1.9591 1.9011
30
5.5675
4.1821
3.5893
3.2499
3.0265
2.8667
2.746
2.6513
2.5746
2.5112
2.1952
40
5.4239
4.051
3.4633
3.1261
2.9037
2.7444
2.6238
2.5289
2.4519
2.3882
2.0677
1.8028 1.7405
50
5.3403
3.9749
3.3902
3.0544
2.8326
2.6736
2.553
2.4579
2.3808
2.3168
1.9933
1.7211 1.6558
60
5.2856
3.9253
3.3425
3.0077
2.7863
2.6274
2.5068
2.4117
2.3344
2.2702
1.9445
1.6668
70
5.247
3.8903
3.309
2.9748
2.7537
2.5949
2.4743
2.3791
2.3017
2.2374
1.91
1.6279 1.5581
80
5.2183
3.8643
3.2841
2.9504
2.7295
2.5708
2.4502
2.3549
2.2775
2.213
1.8843
1.5987 1.5271
90
5.1962
3.8443
3.2649
2.9315
2.7109
2.5522
2.4316
2.3363
2.2588
2.1942
1.8644
1.5758 1.5028
100
5.1786
3.8284
3.2496
2.9166
2.6961
2.5374
2.4168
2.3215
2.2439
2.1793
1.8486
1.5575 1.4833
G
R
A
D
O
S
D
E
L
I
B
E
R
T
A
D
H
O
R
I
Z
O
N
T
A
L
E
S
0
1
2
3
4
5
6
1
647.79
799.48
2
38.506
39
864.15
899.6
921.83
39.166
39.248
39.298
3
17.443
16.044
15.439
15.101
4
12.218
10.649
9.9792
5
10.007
8.4336
6
8.8131
7
8.0727
8
60
1.94
100
6.08
2.128
1.8816
1.599
25
Tabla de Distribución F (Nivel de significación de 0.01)
GRADOS DE LIBERTAD VERTICALES O DEL NUMERADOR
1
2
3
4
5
6
7
8
9
10
20
60
100
1
4052.2
4999.3
5403.5
5624.3
5764
5859
5928.3
5981
6022.4
6055.9
6208.7
6313
6333.9
2
98.502
99
99.164
99.251
99.302
99.331
99.357
99.375
99.39
99.397
99.448
99.484
99.491
3
34.116
30.816
29.457
28.71
28.237
27.911
27.671
27.489
27.345
27.228
26.69
26.316
26.241
4
21.198
18
16.694
15.977
15.522
15.207
14.976
14.799
14.659
14.546
14.019
13.652
13.577
5
16.258
13.274
12.06
11.392
10.967
10.672
10.456
10.289
10.158
10.051
9.5527
9.202
9.13
6
13.745
10.925
9.7796
9.1484
8.7459
8.466
8.26
8.1017
7.976
7.8742
7.3958
7.0568
6.9867
7
12.246
9.5465
8.4513
7.8467
7.4604
7.1914
6.9929
6.8401
6.7188
6.6201
6.1555
5.8236
5.7546
8
11.259
8.6491
7.591
7.0061
6.6318
6.3707
6.1776
6.0288
5.9106
5.8143
5.3591
5.0316
4.9633
9
10.562
8.0215
6.992
6.4221
6.0569
5.8018
5.6128
5.4671
5.3511
5.2565
4.808
4.4831
4.415
10
10.044
7.5595
6.5523
5.9944
5.6364
5.3858
5.2001
5.0567
4.9424
4.8491
4.4054
4.0819
4.0137
11
9.6461
7.2057
6.2167
5.6683
5.316
5.0692
4.886
4.7445
4.6315
4.5393
4.099
3.7761
3.7077
12
9.3303
6.9266
5.9525
5.4119
5.0644
4.8205
4.6395
4.4994
4.3875
4.2961
3.8584
3.5355
3.4668
13
9.0738
6.7009
5.7394
5.2053
4.8616
4.6203
4.441
4.3021
4.1911
4.1003
3.6646
3.3413
3.2723
H
O
R
I
Z
O
N
T
A
L
E
S
14
8.8617
6.5149
5.5639
5.0354
4.695
4.4558
4.2779
4.14
4.0297
3.9394
3.5052
3.1813
3.1118
15
8.6832
6.3588
5.417
4.8932
4.5556
4.3183
4.1416
4.0044
3.8948
3.8049
3.3719
3.0471
2.9772
16
8.5309
6.2263
5.2922
4.7726
4.4374
4.2016
4.0259
3.8896
3.7804
3.6909
3.2587
2.933
2.8627
17
8.3998
6.1121
5.185
4.6689
4.336
4.1015
3.9267
3.7909
3.6823
3.5931
3.1615
2.8348
2.7639
18
8.2855
6.0129
5.0919
4.579
4.2479
4.0146
3.8406
3.7054
3.5971
3.5081
3.0771
2.7493
2.6779
19
8.185
5.9259
5.0103
4.5002
4.1708
3.9386
3.7653
3.6305
3.5225
3.4338
3.0031
2.6742
2.6023
20
8.096
5.849
4.9382
4.4307
4.1027
3.8714
3.6987
3.5644
3.4567
3.3682
2.9377
2.6077
2.5353
21
8.0166
5.7804
4.874
4.3688
4.0421
3.8117
3.6396
3.5056
3.3982
3.3098
2.8795
2.5484
2.4755
0
22
7.9453
5.719
4.8166
4.3134
3.988
3.7583
3.5866
3.453
3.3458
3.2576
2.8274
2.4951
2.4218
D
E
L
23
7.8811
5.6637
4.7648
4.2635
3.9392
3.7102
3.539
3.4057
3.2986
3.2106
2.7805
2.4471
2.3732
24
7.8229
5.6136
4.7181
4.2185
3.8951
3.6667
3.4959
3.3629
3.256
3.1681
2.738
2.4035
2.3291
25
7.7698
5.568
4.6755
4.1774
3.855
3.6272
3.4568
3.3239
3.2172
3.1294
2.6993
2.3637
2.2888
26
7.7213
5.5263
4.6365
4.14
3.8183
3.5911
3.421
3.2884
3.1818
3.0941
2.664
2.3273
2.2519
27
7.6767
5.4881
4.6009
4.1056
3.7847
3.558
3.3882
3.2558
3.1494
3.0618
2.6316
2.2938
2.218
28
7.6357
5.4529
4.5681
4.074
3.7539
3.5276
3.3581
3.2259
3.1195
3.032
2.6018
2.2629
2.1867
29
7.5977
5.4205
4.5378
4.0449
3.7254
3.4995
3.3303
3.1982
3.092
3.0045
2.5742
2.2344
2.1577
30
7.5624
5.3903
4.5097
4.0179
3.699
3.4735
3.3045
3.1726
3.0665
2.9791
2.5487
2.2079
2.1307
40
7.3142
5.1785
4.3126
3.8283
3.5138
3.291
3.1238
2.993
2.8876
2.8005
2.3689
2.0194
1.9383
50
7.1706
5.0566
4.1994
3.7195
3.4077
3.1864
3.0202
2.89
2.785
2.6981
2.2652
1.909
1.8248
60
7.0771
4.9774
4.1259
3.6491
3.3389
3.1187
2.953
2.8233
2.7185
2.6318
2.1978
1.8363
1.7493
70
7.0114
4.9218
4.0744
3.5997
3.2907
3.0712
2.906
2.7765
2.6719
2.5852
2.1504
1.7846
1.6954
80
6.9626
4.8807
4.0363
3.5631
3.2551
3.0361
2.8713
2.742
2.6374
2.5508
2.1153
1.7459
1.6548
90
6.9251
4.8491
4.0069
3.535
3.2276
3.0091
2.8445
2.7154
2.6109
2.5243
2.0882
1.7158
1.6231
100
6.8953
4.8239
3.9837
3.5127
3.2059
2.9877
2.8233
2.6943
2.5898
2.5033
2.0666
1.6918
1.5977
G
R
A
D
O
S
D
E
L
I
B
E
R
T
A
D
D
E
N
O
M
I
N
A
D
O
R
26
1
El director de capacitación de una compañía está tratando de evaluar tres métodos diferentes de entrenamiento para empleados
nuevos. El primer método consiste en asignar un empleado nuevo con un trabajador experimentado para que éste lo asista en la
fábrica. El segundo método consiste en ubicar a todos los empleados nuevos en un salón de entrenamiento separado de la fábrica, y
el tercer método consiste en utilizar películas de entrenamiento y materiales de aprendizaje programado. El director de capacitación
escoge al azar 18 nuevos empleados y aleatoria mente asigna 6 a cada uno de los métodos y registra su producción diaria ( en
unidades) después que terminaron los programas de capacitación, obteniendo los siguientes resultados:
Método 1
Método 2
Método 3
15
22
18
18
27
24
19
18
19
22
21
16
11
17
22
17
21
15
Usando un nivel de significación de 0.05, el director de capacitación desea estimar si existen diferencias en la efectividad de los tres
métodos.
Los datos de la siguiente tabla muestran el número de quejas procesadas diariamente de un grupo de cuatro empleados de
compañías de seguros observados durante seis días:
Empleado
Anabel
Aarón
Fabiola
Irán
2
15
12
11
13
17
10
14
12
14
13
13
12
Número de quejas
12
17
15
14
11
14
12
14
10
12
10
12
Al nivel de significación 0.05, determina si los promedios diarios de quejas de los empleados son iguales.
Una compañía de investigación ha diseñado tres sistemas distintos para limpiar manchas de aceite. La siguiente tabla contiene los
resultados de cada sistema, medido en qué tanta superficie (en metros cuadrados) es limpiada en una hora. Los datos se obtuvieron
probando cada método en varias sesiones:
3
Sistema
Superficie limpiada (en metros cuadrados)
A
B
C
55
57
66
60
53
52
63
64
61
56
49
57
59
62
60
La compañía necesita saber si los tres métodos tienen la misma efectividad. Usa un nivel de significación de 0.05.
Una compañía publicitaria de anuncios al aire libre desea saber si hay diferencias significativas en el tráfico automovilístico que pasa
por tres lugares distintos de una ciudad donde tiene anuncios panorámicos; debido a que la compañía cobra precios diferentes
dependiendo del número de automóviles que pasan frente al anuncio. Se mide el volumen del tráfico en los tres sitios durante
intervalos de cinco minutos elegidos aleatoria mente. La siguiente tabla muestra los datos obtenidos:
4
Lugar
A
B
30
29
45
38
C
32
44
Volumen de trafico
26
36
40
44
21
18
18
43
24
¿A qué conclusión llegaron en esa compañía? Usa un nivel de significación de 0.01.
Un ingeniero agrónomo plantó tres parcelas del mismo tamaño con cuatro variedades de trigo y obtuvo las siguientes producciones
en libras por parcela:
5
Variedad
Variedad
Variedad
Variedad
A
B
C
D
57
52
53
56
62
53
56
59
61
60
56
59
Pruebe al nivel de significación de 0.05 si las diferencias entre las medias de las cuatro medias puede atribuirse al azar.
27
Los siguientes son los rendimientos en millas que un conductor de pruebas obtuvo con cuatro galones de cinco marcas de gasolina:
Marca
Marca
Marca
Marca
Marca
6
A
B
C
D
E
30
29
32
29
32
25
26
32
34
26
27
29
35
32
31
26
28
37
33
27
Pruebe al nivel de significación de 0.01 si las diferencias entre las medias de las cinco muestras pueden atribuirse al azar.
Se hace un estudio para saber si diversas marcas de televisiones tienen la misma duración. La muestra es de 8 unidades de cada
marca, obteniéndose los siguientes datos estadísticos:
7
ABC
45 Meses
9 Meses
Duración promedio
Desviación estándar
KLM
40 Meses
11 Meses
Marcas
PQR
52 Meses
8 Meses
XYZ
48 Meses
10 Meses
Determine al nivel de significación de 0.01 si tienen igual duración las distintas marcas de televisores.
Se aplica el mismo examen de estadística a aspirantes a cursar carreras de tres áreas académicas diferentes. Los exámenes se
aplican a 10 aspirantes de cada área, obteniéndose los siguientes resultados:
8
Área técnica
6.5
2.55
Promedio
Desviación Estándar
Área Económica
5.7
2.11
Área de Sociales
4.7
2.06
Al nivel de significación de 0.01 ¿Influye el área a que pertenece el estudiante en los promedios?
Calificaciones de un examen de Microsoft Office aplicado a 8 alumnos de 5 licenciaturas:
9
Licenciatura
Administración
Contaduría
Ingeniería Industrial
Sistemas de Computo
Turismo
Promedio
8.0
7.5
8.2
8.9
7.2
Desviación estándar
1.7
1.2
1.4
1.0
1.5
Determine al nivel de significación de 0.01, si la licenciatura a que pertenecen los alumnos influye en la calificación promedio de los
mismos.
El siguiente registro muestra el numero de PCs vendidas en un negocio en sus tres sucursales durante una semana de 7 días
laborales:
10
Promedio
39
48
26
Sucursal Norte
Sucursal Centro
Sucursal Sur
Desviación Estándar
8
11
9
Determine al nivel de significación de 0.05 si influye la zona en que esta la sucursal en el promedio semanal de ventas de PCs.
Los siguientes datos se obtuvieron con muestras de ocho empleados de cada una de las cuatro empresas que se citan, con
referencia a su antigüedad en la misma:
11
Empresa
x
S2
Alfa
17
16
Beta
19
9
Delta
22
25
Gamma
17
4
Al nivel de significación de 0.05 ¿En algunas empresas la antigüedad es mayor que en otras?
28
PRUEBAS DE HIPOTESIS PARA LA DIFERENCIA DE LAS
PROPORCIONES DE MAS DE DOS MUESTRAS
Distribución Chi – cuadrada

Hipótesis nula: Las proporciones de las poblaciones a que pertenecen las muestras
son iguales, es decir, todas las muestras provienen de una misma población:
H0 : p1 = p2 = p3 = …….. = pk

Hipótesis alternativa: Las proporciones de las poblaciones a que pertenecen las
muestras son diferentes, es decir, todas las muestras provienen de diferentes
poblaciones:
H0 : p1 ≠ p2 ≠ p3 ≠ …….. ≠ pk
Planteo

Valor
crítico
de χ2


Para determinarlo, se emplea la Tabla de la Función de Distribución de
Probabilidades Chi – cuadrada (χ2 ).
Se calculan los grados de libertad: GL = (r – 1)(c – 1) donde “r” y “c” son
los números de renglones (filas) y columnas de la tabla de contingencia,
que es la que reúne la información del caso.
Se intersectan el renglón (fila) de los grados de libertad y la columna del
nivel de significación (área de extremo superior especificado de ) , para
obtener el valor crítico X 2c
Análisis
Valor
efectivo
de χ2
( Valor es O bs
er v ados Valor es Eser
p ados)2
X 2e  
Valor es Eser
p ados


Sí X 2e es mayor que X 2c , las diferencias entre las proporciones son
significativas, no se deben azar, y debe rechazarse la hipótesis nula, ya
que las muestras provienen de poblaciones diferentes.
Sí X 2e es menor que X 2c , las diferencias entre las proporciones no son
significativas, se deben azar, y no debe rechazarse la hipótesis nula, es
decir, hay que reservar el juicio, ya que las muestras provienen de la
misma población.
Escribir una frase en la que se diga que se apoya con una confianza de 1 – nivel de
significación, expresada en porcentaje:
Conclusión
 La hipótesis nula sí: X 2e es menor que X 2c

La hipótesis alternativa sí: X 2e es mayor que X 2c
29
TABLA DE LA DISTRIBUCION CHI- CUADRADO
Valores críticos de la Chi-cuadrado
Para una combinación particular de grados de libertad en el numerador y en el denominador, las
entradas representan los valores críticos de la Chi-cuadrado, correspondientes a un área de extremo
superior especificado de .
Grados de
Libertad
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0.25
1.323
2.773
4.108
5.385
6.626
7.841
9.037
10.219
11.389
12.549
13.701
14.845
15.984
17.117
18.245
19.369
20.489
21.605
22.718
23.828
24.935
26.039
27.141
28.241
29.339
30.435
31.528
32.620
33.711
34.800
AREAS DE EXTREMOS SUPERIOR ()
0.10
0.05
0.025
2.706
3.841
5.024
4.605
5.991
7.378
6.251
7.815
9.348
7.779
9.488
11.143
9.236
11.071
12.833
10.645
12.592
14.449
12.017
14.067
16.013
13.362
15507
17.535
14.684
16.919
19.023
15.987
18.307
20.483
17.275
19.675
21.920
18.549
21.026
23.337
19.812
22.362
24.736
21.064
23.685
26.119
22.307
24.996
27.488
23.542
26.296
28.845
24.769
27.587
30.191
25.989
28.869
31.526
27.204
30.144
32.852
28.412
31.410
34.170
29.615
32.671
35.479
30.813
33.924
36.781
32.007
35.172
38.076
33.196
36.415
39.364
34.382
37.652
40.646
35.563
38.885
41.923
36.741
40.113
43.194
37.916
41.337
44.461
39.087
42.557
45.722
40.256
43.773
46.979
0.01
6.635
9.210
11.345
13.277
15.086
16.812
18.475
20.090
21.666
23.209
24.725
26.217
27.688
29.141
30.578
32.000
33.409
34.805
36.191
37.566
38.832
40.289
41.638
42.980
44.314
45.642
46.963
48.278
49.588
50.892
0.005
7.879
10.597
12.838
14.860
16.750
18.548
20.278
21.955
23.589
25.188
26.757
28.299
29.819
31.319
32.801
34.267
35.718
37.156
38.582
39.997
41.401
42.796
44.181
45.559
46928
48.290
49.645
50.993
52.336
53.672
30
Un administrador de marca está preocupado porque su producto puede estar mal distribuido a lo largo de todo el país.
En una encuesta en que el país fue dividido en cuatro regiones geográficas, se investigó una muestra aleatoria de 100
consumidores de cada región, obteniéndose los siguientes resultados:
1
Región
Adquirieron la marca
No la adquirieron
Noreste
40
60
Noroeste
55
45
Sureste
45
55
Suroeste
50
50
Al nivel de significación 0.025, determina cuál es la conclusión a la que llegó el distribuidor de marca.
Un editor de periódicos, que trata de determinar con precisión las características de mercado de su periódico, se
pregunta si la costumbre de la gente de la comunidad de leer diarios está relacionada con el nivel educativo de los
lectores. Se aplica una encuesta a los adultos del área referente a su nivel educativo y la frecuencia con que leen
periódico. Los resultados se muestran en la tabla siguiente:
2
Frecuencia
con que lee
Nunca
Algunas veces
Mañana o tarde
Ambas ediciones
Nivel educativo
Licenciatura
Bachillerato
17
11
23
8
38
16
19
6
Postgrado
10
12
35
28
Otro
21
5
7
13
Al nivel de significación 0.025, ¿La frecuencia con que se lee el periódico depende del nivel educativo de los lectores?
En un estudio se compararon los efectos de cuatro promociones mensuales sobre las ventas de cierto producto.
Presentamos las ventas unitarias de cinco tiendas que utilizaron las cuatro promociones en meses diferentes:
3
Tipo de promoción
Muestra gratis
Regalo de un paquete
Descuento
Premio por sorteo
A
78
94
73
79
Tienda
C
81
87
69
78
B
87
91
78
83
D
89
90
83
69
E
85
88
76
81
Al nivel de significación de 0.01, determina si las promociones producen diferentes efectos sobre las ventas.
Información acerca del tipo de fabricas instaladas en un estado de la república:
4
Metalmecánica
Extractiva
Norte
7
13
Sur
4
5
Este
11
9
Oeste
7
2
Determine, al nivel de significación de 0.1, si las industrias están instaladas uniformemente.
En un estudio para determinar si existe una relación entre las costumbres de vestido de los empleados bancarios y su
progreso profesional, una muestra aleatoria dio los siguientes resultados:
5
Elegantes
Bien vestidos
Mal vestidos
Lenta
32
28
15
Velocidad de progreso
Promedio
56
69
33
Alta
32
22
13
Pruebe al nivel de significación de 0.05 si existe una relación entre las costumbres de vestido y la velocidad del
progreso personal en los empleados bancarios.
31
Datos de una encuesta diseñada para mostrar cómo se transportan los estudiantes de una universidad:
6
Ingeniería
104
22
46
28
Caminando
Automóvil
Bicicleta
Autobús
Informática
87
29
34
50
Contaduría
89
35
37
39
Derecho
72
43
32
53
Use un nivel de significación de 0.05 para probar la afirmación de que las proporciones de alumnos de las carreras
mencionadas que usan los diferentes medios de transporte son iguales.
Una fábrica de autos ha hecho una encuesta para identificar las características de seguridad más importantes
deseables por compradores de autos, por edades:
7
Jóvenes
Adultos
Frenos
de disco
29
11
Suspensión
modificada
11
9
Bolsas
de aire
48
22
Seguros
automáticos
12
38
Control de
crucero
7
23
Al nivel de significación de 0.025 ¿Son las mismas características las deseadas por jóvenes y adultos?
El administrador de una empresa estudia la relación entre el departamento a que pertenecen los empleados y su grado
de entrega al trabajo, y obtuvo la siguiente información:
8
Grado entrega / Dpto.
Excelente
bueno
regular
Administrativo
170
120
130
Mercadotecnia
124
112
90
Producción
90
100
88
¿Podemos concluir con un nivel de significancia de 0.05 que hay relación entre el departamento en que trabaja el
empleado y su nivel de entrega al mismo?
9
Se aplica el mismo examen de Estadística a aspirantes a cursar carreras de tres áreas académicas diferentes. Dichos
exámenes se aplican a 10 aspirantes de cada área, obteniéndose los siguientes resultados:
Aprobados
Reprobados
Área técnica
7
3
Área Económica
5
5
Área de Sociales
4
6
Determine al nivel de significación de 0.10 si influye el área a que pertenece el estudiante en la proporción de
aprobados.
32
PRUEBAS DE HIPOTESIS DE REGRESION LINEAL
En la práctica, es frecuente encontrar que existan relaciones entre dos o más variables, y a veces es posible expresarlas en forma matemática,
mediante una ecuación que conecte a dichas variables, de tal manera que podamos estimar (basados en los datos de una muestra) el valor de
una de las variables en función del valor de la otra. Por ejemplo, parece ser obvio que entre los siguientes pares de variables si existe alguna
relación que las conecta:
Promedio en Licenciatura...................................................................... Promedio en Maestría
Inteligencia de padres.............................................................................. Inteligencia de hijos
Nivel socio – económico......................................................................... Incidencia en delitos
Estatura …………………………………...................................................... Peso
Producto Nacional Bruto…………………………………..…………..…….. Esperanza de vida
Dosis de efedrina...................................................................................... Ritmo cardiaco
Etc.
Sin embargo, no parece tan obvio, y requeriríamos del análisis de una o varias muestras estadísticas para establecer sí existe alguna relación
de dependencia entre los siguientes pares de variables:
Tasa de crecimiento de los Ficus.................................................... Goles por temporada en la Liga Inglesa
Gastos en publicidad de una empresa........................................... Cometas avistados por año
Canales nuevos de TV por año........................................................ Numero de rinocerontes cazados ilegalmente
Edad ………………………………….................................................... Numero de pares de zapatos
Incremento de la inflación …………………………….…………..……Temperatura de una ciudad
Evolución de la resistencia de un pegamento............................... Tasa de mortandad de un país
Variables


Independiente: aquella que representa el dato conocido en un análisis de regresión.
Dependiente: es la que se trata de predecir en un análisis de regresión.

Grafica en un sistema de coordenadas, en la que en el eje horizontal (x) graduamos la variable independiente, y en
el vertical (y) la variable dependiente.
Cada dato u observación de la muestra, es un punto de coordenadas (x,y) en el sistema.
La forma en que se distribuyen los puntos en el sistema, determina el tipo de relación que existe entre las dos
variables (lineal o curvilínea).
Diagramas de
dispersión


Coeficiente de
correlación de
Pearson




Expresa cuantitativamente el grado en que dos variables están relacionadas.
Su valor varía desde -1 hasta +1.
Si es positiva, ambas variables crecen. La tendencia en el Diagrama de Dispersión es creciente hacia la derecha.
Si es negativa, una variable crece y la otra decrece. La tendencia en el Diagrama de Dispersión es decreciente hacia
la derecha.

Se calcula por medio de la siguiente fórmula:
rp 
Z
X
ZY
n
PRUEBAS DE HIPOTESIS DE REGRESIÓN LINEAL
Planteo
Hipótesis nula.- Ho: No existe relación lineal entre las variables.
Hipótesis alternativa.- H1: Si existe relación lineal entre las variables.


Análisis
re 

Conclusión
Se calcula por medio de tablas el valor crítico para el Coeficiente de Regresión Lineal de Pearson (rc)
Se calcula el valor efectivo para el Coeficiente de Regresión Lineal de Pearson por medio de la siguiente fórmula:
Z
X
ZY
n
Sí rc > re se reserva el juicio, en caso contrario se rechaza la hipótesis nula Ho.
Se hace una redacción en la que se expresa que se confía en un porcentaje de 100% menos el nivel de significación, en que si
exista o no relación lineal entre las variables (según sea el caso).
33
TABLA DE VALORES CRÍTICOS
PARA EL COEFICIENTE
DE CORRELACIÓN LINEAL DE
PEARSON (r)
ALGUNOS TIPOS
DE DIAGRAMAS
DE DISPERSIÓN
Y
Y
O
X
O
Correlación lineal positiva
Correlación lineal negativa
Y
Y
O
X
Correlación curvilínea positiva
Recta positiva con menor grado de
correlación que la de la grafica a).
O
X
Correlación curvilínea negativa
Y
O
X
Y
X
O
X
No existe correlación entre las variables
N
Nivel de
significación
de 0.05
Nivel de
significación
de 0.01
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
60
70
80
90
0.950
0.878
0.811
0.754
0.707
0.666
0.632
0.602
0.576
0.553
0.532
0.514
0.497
0.482
0.468
0.456
0.444
0.396
0.361
0.335
0.312
0.294
0.279
0.254
0.236
0.220
0.207
0.999
0.959
0.917
0.875
0.834
0.798
0.765
0.735
0.708
0.684
0.661
0.641
0.623
0.606
0.590
0.575
0.561
0.505
0.463
0.430
0.402
0.378
0.361
0.330
0.305
0.286
0.269
Para niveles de significación
comprendidos entre 0.01 y 0.05 se
pueden hacer interpolaciones.
34
El gerente de mercadotecnia de una cadena de tiendas de autoservicio desea determinar el efecto del espacio en las estanterías sobre
las ventas de alimentos para animales domésticos. Se seleccionó una muestra aleatoria de ocho tiendas cuyos resultados se presentan
en la tabla. Con un nivel de significación 0.01 determina si hay relación lineal entre las variables.
1
2
3
Tienda
Metros cuadrados de
estantería
Ventas semanales en miles
de pesos
Alameda
Buenavista
Centro
Bosque
Estancia
Américas
Garden
Poniente
1
1
2
2
3
4
5
6
16
18
30
25
50
65
75
90
Al inicio de un curso de Estadística, se somete a los estudiantes a un examen especial de Matemáticas. Se desea saber si hay o no una
relación entre la calificación de este examen especial y la calificación final en Estadística. Se selecciona una muestra aleatoria de once
estudiantes obteniéndose los siguientes resultados. Al nivel de significación 0.05 determina si hay relación lineal entre las variables.
Estudiante
Calificación examen especial
Calificación examen final
1
55
92
2
72
97
3
68
77
4
78
84
5
43
90
6
92
84
7
88
76
8
79
65
9
24
58
10
64
69
11
39
52
El administrador de una fábrica que produce cierto artículo de temporada desea estimar la función de costo total para la próxima
temporada. Con tal objeto de los archivos toma una muestra aleatoria de las últimas cinco temporadas, obteniendo la siguiente
información. Con un nivel de significación 0.02 determina si hay relación lineal entre las variables.
Temporada
Costo total anual (En miles de pesos)
Número de unidades producidas al año.
1993
1000
77
1994
2000
112
1995
3000
147
1996
2500
127
1997
2700
134
Los siguientes datos muestrales presentan la demanda de un producto (en miles de unidades) y su precio (en dólares) cobrado en seis
áreas de mercado distintas. Con un nivel de significación 0.03 determina si hay relación lineal entre las variables.
4
Precio
Demanda
18
9
10
125
14
57
11
90
16
22
13
79
Dada la información de un grupo de estudiantes, al nivel de significación 0.04 determina si hay relación lineal entre las variables.
5
6
Horas de estudio
Calificación examen
Anel
20
64
Beto
16
61
Cora
34
84
Dino
23
70
Emma
27
88
Fito
32
92
Gina
18
72
Hugo
22
77
El gerente de personal de una empresa considera que puede haber una relación entre el ausentismo al trabajo y la edad y desea usar la
edad de un empleado para predecir el número de días de ausencia durante un año. Selecciona una muestra aleatoria de diez
empleados, obteniéndose los siguientes resultados. Al nivel de significación 0.015 determina si hay relación lineal entre las variables.
Empleado
Edad en años
Días ausente al año
Anel
27
15
Beto
61
6
Claudia
37
10
Dionisio
23
18
Eufrasio
46
9
Guille
58
7
Hilario
29
14
Indalecio
36
11
Javier
64
5
Kent
40
8
El director de un programa de capacitación para supervisores en una compañía desea estudiar la relación entre la calificación de un
examen de aptitud efectuado al principio del programa y la calificación final otorgada al concluir el programa por un comité de
ejecutivos. Una muestra de ocho participantes reveló los resultados que se dan en la siguiente tabla. Con un nivel de significación
0.025 determina si hay relación lineal entre las variables.
7
8
Supervisor
A
B
C
D
E
F
G
H
Calificación examen de aptitud
63
49
72
58
78
61
59
58
Calificación en el examen final
81
65
91
78
99
74
80
77
La tabla siguiente muestra en (miles de dólares) los valores estimados y los precios de venta de ocho casas, que constituyen una
muestra aleatoria de todas las casas vendidas recientemente en un área suburbana. Con un nivel de significación 0.035 determina si
hay relación lineal entre las variables.
Valor estimado
Precio de venta
4.03
163.4
7.20
218.3
3.25
155.2
4.48
174.0
2.79
148.8
5.16
181.1
8.04
223.2
5.80
192.5
35
9
10
Los siguientes datos muestran los gastos de publicidad (expresados como un porcentaje de los gastos totales) y los beneficios
operativos netos (expresados como un porcentaje de las ventas totales) en una muestra aleatoria de 6 farmacias. Con un nivel de
significación 0.045 determina si hay relación lineal entre las variables.
Gastos en publicidad
Beneficios operativos netos
1.5
3.6
1.0
2.8
2.8
5.4
0.4
1.9
1.3
2.9
2.0
4.3
La tabla siguiente presenta el número de horas que una corredora corrió durante cada una de ocho semanas consecutivas y los
tiempos en minutos correspondientes en que corrió una milla al final de cada semana. Con un nivel de significación 0.012 determina si
hay relación lineal entre las variables.
Horas
Milla
13
5.2
15
5.1
18
4.9
20
4.6
19
4.7
17
4.8
21
4.6
16
4.9
Para los datos de la siguiente tabla de una fabrica ensambladora de automóviles, con un nivel de significación 0.022 determina si hay
relación lineal entre las variables.
11
12
13
Obrero
Meses de experiencia
Ensambles rechazados
A
7
26
B
9
20
C
6
28
D
14
16
E
8
23
F
12
18
G
10
24
H
4
26
I
2
38
J
11
22
K
1
32
L
8
25
En una universidad, se desea saber si existe alguna relación entre la calificación de los estudiantes en Matemáticas y su condición
física. Se tomo una muestra de 7 alumnos, y los datos obtenidos son los siguientes. Con un nivel de significación 0.032 determina si
hay relación lineal entre las variables.
Calificación de Matemáticas
Calificación en condición física
7. 5
6. 4
6. 7
7. 3
9. 6
8. 3
5. 6
5. 1
8. 2
9. 7
5. 2
6. 9
4.4
8.2
El coordinador de ventas de una empresa que ensambla y vende PC’s desea saber si existe alguna relación lineal entre la antigüedad
de cada vendedor y el número de PC’s que vende a la semana. El coordinador dispone de la siguiente información. Con un nivel de
significación 0.042 determina si hay relación lineal entre las variables.
Vendedor
Antigüedad en la empresa
PC’s vendidas a la semana
Ávila
4
5
Bolio
9
6
Cruz
1
2
Díaz
8
9
Elos
3
3
Fritz
6
7
Goya
6
3
Registro de la antigüedad (en años) de algunos de los trabajadores de una fabrica, y su sueldo mensual (en miles de pesos). Con un
nivel de significación 0.018 determina si hay relación lineal entre las variables.
14
15
16
Antigüedad
Sueldo
1
3
3
5
4
4
6
9
8
8
9
8
11
9
12
7
14
9
15
7
De una investigación para averiguar si existe alguna relación entre el sobrepeso en kilos de jóvenes y las horas que dedican a la
semana a ver TV y/o estar en la PC, se obtuvo la siguiente información. Con un nivel de significación 0.028 determina si hay relación
lineal entre las variables.
Nombre
Kilos sobrepeso
Horas en TV/PC
Alan
2
15
Bety
6
20
Caro
9
32
Dany
3
18
Ema
7
30
Fito
10
30
Gori
5
18
Hugo
9
24
Iris
12
31
Juan
5
22
El Depto. de Producción de NBD Electronics quiere ver la relación entre el número de empleados ensambladores y el número de
unidades ensambladas. Se seleccionaron al azar varios turnos, y se obtuvieron los siguientes resultados. Con un nivel de significación
0.038 determina si hay relación lineal entre las variables.
Empleados ensambladores en el turno
Unidades ensambladas en el turno
2
15
4
25
5
30
1
10
3
30
2
12
4
32
La tabla muestra la Temperatura en grados centígrados en una ciudad, y el número de gaseosas que se venden en un expendio cada
día. Con un nivel de significación 0.048 determina si hay relación lineal entre las variables.
17
Temperatura
Gaseosas
24°C
47
28°C
40
32°C
54
36°C
45
40°C
66
26°C
42
30°C
48
36
Descargar