Subido por Adrian Sedano

Estadistica

Anuncio
EJERCICIOS
1. ¿Qué tipo de datos se usan para la prueba con tablas de contingencia?
Los datos necesarios para la prueba con tablas de contingencia consisten en
medidas muestrales sobre dos variables categóricas (con escala nominal u
ordinal)
2. ¿Porque la prueba con tablas de contingencia es útil en las aplicaciones de
negocios?
La prueba con tablas de contingencia se usa ampliamente en los negocios porque
las investigaciones de mercado con frecuencia incluyen la recopilación de datos
categóricos.
3. ¿Cuál es el objetivo de la prueba con tablas de contingencia?
La prueba con tablas de contingencia determina si dos variables categóricas se
relacionan entre si
4. Establezca la hipótesis nula y alternativa
alternativa para la prueba con tablas de
contingencia.
H0: Las variables en las filas y las columnas son independientes
H1: Las variables en las filas y las columnas son dependientes
5. ¿Cómo se calculan
calculan las frecuencias esperadas para la prueba con tablas de
contingencia?
 
(   )
 )(   )
   
6. Si una tabla de contingencia tiene 4 columnas y tres filas, ¿Cuántos
¿Cuántos grados de
libertad se tienen para la prueba con tablas de contingencia ji cuadrada?
gl = (r – 1)(c – 1)
r = número de filas
c = número de columnas
Para nuestro caso:
gl = (3 – 1)(4 – 1) = 6
7. Los distribuidores Core- Mark clasifican sus cuentas por cobrar como pagadas
a tiempo o retrasadas. Core- Mark también clasifica las cuentas como locales o
nacionales. Los datos de las últimas semanas son:
SITUACION DEL PAGO
PROXIMIDAD PAGADO RETRASADO total
LOCAL
75
95
NACIONAL
60
110
total
135
205
170
170
340
a) Establezca la hipótesis
hipótesis nula
nula y alternativa
H0: Situación del pago y proximidad son independientes
H1: Situación del pago y proximidad son dependientes
b) Calcule los grados de libertad
gl = (2 – 1)(2 – 1) = 1
c) Establezca la regla de decisión
decisión con un nivel de significancia
significancia de 0.02
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,02
aceptaremos nuestra hipótesis nula y concluiremos que la situación del
pago y proximidad son independientes, y en caso que esta área sea menor
que 0,02 rechazaremos nuestra hipótesis nula planteada
d) Prueba si la
la proximidad del deudor tiene alguna influencia
influencia en la situación
de sus pagos.
a) Establezca la hipótesis
hipótesis nula
nula y alternativa
H0: Situación del pago y proximidad son independientes
H1: Situación del pago y proximidad son dependientes
b) Calcule los grados de libertad
gl = (2 – 1)(2 – 1) = 1
c) Establezca la regla de decisión
decisión con un nivel de significancia
significancia de 0.02
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,02
aceptaremos nuestra hipótesis nula y concluiremos que la situación del
pago y proximidad son independientes, y en caso que esta área sea menor
que 0,02 rechazaremos nuestra hipótesis nula planteada
d) Prueba si la
la proximidad del deudor tiene alguna influencia
influencia en la situación
de sus pagos.
Por tanto concluimos que la situación del pago y proximidad son independientes, es decir
que la proximidad del deudor no influye en su situación de pago, aceptando así nuestra
hipótesis nula
8. Publicidad Pacific investiga la relación entre el tipo favorito el mensaje
comercial y el nivel de ingresos para una muestra de consumidores. Los datos
son:
INGRESO
BAJO
MEDIO
ALTO
total
COMERCIAL FAVORITO
A
B
C
25
40
70
30
30
30
45
20
10
100
90
135
90
75
110 300
a) Establezca las hipótesis nula y alternativa
H0: Ingreso y comercial favorito son independientes
H1: Ingreso y comercial favorito son dependientes
b) Calcule los grados de libertad
gl = (3 – 1)(3 – 1) = 4
c) Establezca le regla de decisión con un nivel de significancia de 0.05
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,05
aceptaremos nuestra hipótesis nula y concluiremos que el ingreso de las
personas con su comercial favorito son independientes, y en caso que esta
área sea menor que 0,05 rechazaremos nuestra hipótesis nula planteada
d) Pruebe si el nivel de ingreso se relaciona con la preferencia de
comerciales.
Por tanto concluimos que el nivel Ingreso y comercial favorito son dependientes, es decir
que el nivel de ingreso se relaciona con la preferencia de comerciales, rechazamos
nuestra hipótesis nula y aceptamos la hipótesis alternativa.
9. La corporación Computervision investiga si la calidad de las partes es
independiente del turno de producción. Los datos en número de partes no
defectuosas frente a defectuosas son:
CALIDAD DE LA PARTE
NO
TURNO
DEFECTUOSA DEFECTUOSA
MATUTINO
67
726
VESPERTINO
33
575
NOCTURNO
61
363
total
161
1664
793
608
424
1825
a) Establezca las hipótesis nula y alternativa
H0: calidad de la parte y turno de producción son independientes
H1: calidad de la parte y turno de producción son dependientes
b) Calcule los grados de libertad
gl = (3 – 1)(2 – 1) = 2
c) Establezca le regla de decisión con un nivel de significancia de 0.05
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,05
aceptaremos nuestra hipótesis nula y concluiremos que la calidad de la
parte y turno de producción son independientes , y en caso que esta área
sea menor que 0,05 rechazaremos nuestra hipótesis nula planteada
d) Pruebe si la calidad de la parte es independiente del turno de producción
Por tanto concluimos que calidad de la parte y turno de producción son dependientes,
rechazamos nuestra hipótesis nula y aceptamos la hipótesis alternativa.
10. Los grandes almacenes A.D.Nickel vende vales de regalo durante la
temporada de navidad. El gerente de ventas, Leo Henneman, quiere
determinar si el valor de un vale tiene alguna relación con lo que el cliente
compra con dicho vale. Los datos recogidos de una muestra de clientes son:
VALOR DEL VALE
DEPARTAMENTO
$ 10
$ 50
ELECTRODOMESTICOS
22
26
ROPA
33
31
HERRAMIENTAS
41
43
total
96
100
$ 100 +
54
22
19
95
102
86
103
291
a) Establezca las hipótesis nula y alternativa
H0: valor del vale y departamento son independientes
H1: valor del vale y departamento son dependientes
b) Calcule los grados de libertad
gl = (3 – 1)(2 – 1) = 2
c) Establezca le regla de decisión con un nivel de significancia de 0.01
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,0
aceptaremos nuestra hipótesis nula y concluiremos que el valor del vale y
departamento son independientes , y en caso que esta área sea menor que
0,01 rechazaremos nuestra hipótesis nula planteada
d) Pruebe si el valor del vale se relaciona con lo que el cliente compra
De donde podemos concluir que el valor del vale si se relaciona con lo que el cliente
compra es decir rechazamos nuestra hipótesis nula y aceptamos la hipótesis alternativa.
11. La Asociación Metropolitana está planeando construir un nuevo club deportivo
en Pueblo, Colorado. El grupo emprendió una investigación de mercado en el
sur de Colorado para determinar las preferencias deportivas de los hombres
de varias edades. Una muestra aleatoria de 680 hombres dio los siguientes
resultados:
DEPORTE
HOCKEY
BASKETBOL
FUTBOL
AMERICANO
FUTBOL
total
GRUPO DE EDAD
18-30
31-45
25
50
100
80
5
20
150
25
30
185
45-60
75
30
25
40
170
61+
100
10
total
250
220
30
35
175
85
125
680
a) Establezca las hipótesis nula y alternativa
H0: Grupo de edad y deporte son independientes
H1: Grupo de edad y deporte son dependientes
b) Calcule los grados de libertad
gl = (4 – 1)(4 – 1) = 9
c) Establezca le regla de decisión con un nivel de significancia de 0.10
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,1
aceptaremos nuestra hipótesis nula y concluiremos que el Grupo de edad y
deporte son independientes, y en caso que esta área sea menor que 0,1
rechazaremos nuestra hipótesis nula planteada
d) Se relaciona la edad con las preferencias deportivas.
Nuestra probabilidad p menor a o,10 nos da evidencia suficiente para rechazar la
hipótesis nula y aceptar la hipótesis alternativa y concluir que la edad si se
relaciona o es dependiente de la preferencias deportivas.
PRUEBAS DE BONDAD DE AJUSTE
12. ¿Qué tipo de datos se usan en la prueba de bondad de ajuste ji cuadrada?
Se utilizan datos cualitativos o categóricos
13. ¿Por qué la prueba de bondad de ajuste ji cuadrada es útil en los negocios?
Esta prueba se usa ampliamente en los negocios porque muchas situaciones requieren
medidas sobre personas en lugar de cosas
14. ¿Cuál es el objetivo de la prueba de bondad de ajuste?
El objetivo es medir el grado en el que las frecuencias observadas en cada categoría de
una sola variable se ajustan a las frecuencias que se esperan para una población
hipotética.
15. Establezca la hipótesis nula y alternativa para la prueba de bondad de ajuste.
H0: La muestra procede de la población especificada
H1: La muestra no procede de la población especificada
16. ¿Cómo se calcula las frecuencias esperadas en una prueba de bondad de
ajuste?
A través del valor que se espera que tome cada una de estas frecuencias y en caso de
que se quiera comprobar que la muestra proviene de alguna distribución en específica se
usará la función de distribución correspondiente para sacar el valor de las frecuencias
esperadas.
17. si una prueba de bondad de ajuste para investigar preferencias de marcas
iguales tiene cuatro categorías, ¿Cuántos grados de libertad tiene la prueba?
gl = k - 1 – c
gl = 4 – 1 – 0 = 3
18. Si una prueba de bondad de ajuste para investigar si una variable sigue una
distribución normal tiene ocho categorías, ¿Cuántos grados de libertad tiene la
prueba?
gl = k - 1 – c
gl = 8 – 1 – 2
gl = 5
19. ¿En que difieren la prueba con tablas de contingencia y la prueba de bondad
de ajuste?
La prueba de bondad de ajuste solo incluye una variable categórica mientras que con
tablas de contingencia se estudia la comparación de dos variables categóricas.
20. La compañía de refrescos Shaga está a punto de introducir en el mercado su
refresco de cola dietético y quiere saber si los consumidores prefieren una
marca determinada en una prueba de sabor a ciegas. Se ofrece 200
bebederos de refresco de cola dietético cuatro bebidas diferentes en
recipientes idénticos y se les pide que indiquen su favorito. Los resultados son.
Refresco de cola dietético favorito
A
B
C
D
Frec
observada
60
43
46
51
Frec esperada
50
50
50
50
a) Establezca la hipótesis nula y alternativa
H0: La gente prefiere cualquier marca por igual
H1: La gente prefiere una marca específica
b) Calcule los grados de libertad.
gl = k – 1 – c
gl = 4 – 1 – 0
gl = 3
c) Establezca la regla de decisión con un nivel de significancia de 0,01.
Si el área que tiene el punto crítico de nuestro estadístico de prueba ji cuadrado
que calcularemos es menor a 0,01 entonces se rechazará la hipótesis nula y se
concluirá que la gente prefiere cualquier marca de cola por igual caso contrario no
habrá evidencia para rechazar la hipótesis nula y se concluirá que la gente prefiere
una marca específica
d) Pruebe si la gente prefiere una marca a otra.
Nuestro estadístico de prueba ji cuadrado de 3,32 deja un área de 0,3449 que es
mayor que nuestro nivel de significancia 0,01 por lo que aceptamos nuestra
hipótesis nula y concluimos que la gente prefiere cualquiera de las cuatro marcas
por igual
21. Kay Brigth, supervisora de contabilidad en Westman Corporation, quiere saber
si el proceso contable de la compañía se puede simular usando una
distribución de Poisson para describir si la incidencia de error. Kay toma una
muestra aleatoria de 400 cuentas de los registros de contabilidad de la
empresa y resume el número de errores encontrados en cada cuenta. Los
resultados son:
Número de errores
0
1
2
3
4 ó mas
Número de cuentas
102
140
75
52
31
F. esperada (dist
poisson)
0,99239885
1 0,31238423 0,00055273 2,30533582
a) Establezca las hipótesis nulas y alternativas.
H0: la muestra procede de una distribución de Poisson
H1: la muestra no procede de una distribución de Poisson
b) Calcule los grados de libertad.
gl = k – 1 – c
gl = 5 – 1 – 1
gl = 3
c) Establezca la regla de decisión con un nivel de significancia de 0,05.
Al 95% de confianza probaremos si los datos obtenidos en la tabla dan evidencia
suficiente para decir que los mismos provienen de una distribución de Poissón
d) Pruebe si la distribución de Poisson describe la incidencia de error en los registros
contables de la compañía.
Nuestro valor chi cuadrado con un valor de 56551,63 deja un áre a menor al 0,05
por lo que rechazamos la hipótesis nula y concluimos que la muestra no procede
de una distribución de Poisson
22. El First Intercountry Bank investigó el número de operaciones comerciales
fallidas en los condados en los que tiene sucursales. El vicepresidente, Cal
Worship, intenta obtener datos que les sirven para decidir cómo distribuir a los
ejecutivos de préstamos comerciales del banco entrenados especialmente en
la gestión de bancarrotas. Los resultados del muestreo son:
Condado
Fracaso observado
Fracaso esperado
A
17
20
B
23
20
C
25
20
D
12
20
E
23
20
a. Establezca las hipótesis nula y alternativa.
H0: Los 5 condados tienen el mismo número de problemas
H1: Los 5 condados no tienen el mismo número de problemas
b. Calcule los grados de libertad.
gl = k – 1 – c
gl = 5 – 1 – 0
gl = 4
c. Establezca la regla de decisión con un nivel de significancia de 0.10.
Al 90% de confianza probaremos si los 5 condados tienen el mismo número de
problemas
d. Determine si es razonable o no que Cal asigne a los ejecutivos de préstamos bajo
la suposición de que los 5 condados tienen el mismo número de problemas.
Nuestro chi cuadrado de 5,8 deja un área de 0,2146 que es mayor que 0,10 por lo
que aceptamos la hipótesis nula y concluimos que los 5 condados tienen el mismo
número de problemas
23. Los registros históricos indican el número promedio de llamadas solicitando un
servicio que se reciben en las instalaciones se servicio Magna es de cuatro
llamadas a la hora. Se obtiene una muestra aleatoria de 200 intervalos de una
hora y se registran las frecuencias de llamadas de servicio. Los resultados son:
Número de Llamadas
Número de 200
intervalos de una hora
0
45
1
99
2
32
3
4 o más
19
5
Suma 200
Utilice un nivel de significancia de 0.05 para probar si la distribución de Poisson describe o
no el número de llamadas de servicio recibidas en las instalaciones de Magna.
H0: la muestra procede de una distribución de Poisson
H1: la muestra no procede de una distribución de Poisson
Como nos podemos dar cuenta la probabilidad de nuestro estadístico chi cuadrado es
menor a 0,05 que es nuestro nivel de significancia por lo que rechazamos nuestra
hipótesis nula y concluimos que la muestra no procede de una distribución de Poisson
EJERCICIOS
24. ¿Cuál es la regla general respecto a la frecuencia esperada necesaria para
realizar una prueba ji cuadrada válida?
Todas las frecuencias esperadas deben ser por la regla general mayores que 5
25. ¿Cómo puede usar el valor p el analista que lleva a cabo una prueba ji
cuadrado?
El analista puede tomar una decisión racional para rechazar o no la hipótesis nula basada
en el conocimiento del valor p
26. Después de rechazar la hipótesis nula en una prueba con tablas de
contingencia. ¿Qué debe hacer el analista?
Cuando se rechaza la hipótesis nula en la prueba de tablas de contingencia, la conclusión
es que existe dependencia entre las variables de las filas y las columnas
27. La compañía Aliance Pacific realizó una encuesta entre los electores para
conocer su opinión sobre una proposición para proteger un área acuífera. Se
les preguntó cuál sería su voto y se probó esta variable comparándola con el
nivel de ingresos, en miles de dólares. Los resultados son:
Preferencia de los electores
Nivel de ingresos
($1000)
Si
No
Indeciso
Menos de 15
155
55
35
De 15 a menos de 30
409
110
30
De 30 a menos de 50
269
45
26
50 ó más
84
11
9
a) Establezca las hipótesis nula y alternativa
H0: La preferencia de los electores con su nivel de ingreso son independientes
H1: La preferencia de los electores con su nivel de ingreso son dependientes
b) Calcule los grados de libertad
gl = (3 – 1)(4 – 1)
gl = 6
c) Establezca la regla de decisión con un nivel de significancia de 0.05
Al 95% de confianza probaremos si el nivel de ingresos de una persona influye con
su voto sobre la protección del área acuífera
d) Pruebe si el nivel de ingresos de una persona se relaciona con su voto sobre la
protección del área acuífera
Nuestro valor de chi cuadrado deja un área menor que 0,05 por lo q ue
rechazamos la hipótesis nula y concluimos que el nivel de ingreso de una persona
se relaciona con su voto
28. En la investigación del ejercicio 27, la variable escolaridad también se
probó comparándola con la forma en que las personas planeaban votar
en el plebiscito. Los resultados son:
Preferencia de los electores
Escolaridad
Si
No
Indeciso
Preparatoria
303
65
30
Parte de universidad
282
70
40
En posgrado
332
86
30
a) Establezca la hipótesis nula y alternativa
H0: La escolaridad de los electores no se relaciona con su voto
H1: La escolaridad de los electores se relaciona con su voto
b) Calcule los grados de libertad
gl = (3 – 1)(3 – 1)
gl = 4
c) Establezca la regla de decisión con un nivel de significancia de 0.01
Al 90% de confianza probaremos si la escolaridad se relaciona o no con el voto
positivo de una persona para el área acuífera
d) Pruebe si la escolaridad se relaciona con el voto positivo de una persona para la
protección del área acuífera
Y como nos podemos dar cuenta el área generada es mayor que 0.01 por lo que
aceptamos nuestra hipótesis nula y concluimos que la escolaridad de los electores no se
relaciona con su voto
29. La compañía Dayton trata de decidir sobre cómo debe distribuir su
presupuesto de publicidad. Harold Ellis, el analista de la compañía sugiere que
se haga un estudio para determinar la efectividad de los distintos tipos de
publicidad en otras empresas. Obtiene los siguientes datos
Número de tiendas
Tipos de
publicidad
Incremento Ventas
Disminución
en ventas
estables
en ventas
Periódico
18
12
4
Radio
12
16
3
TV
14
16
2
a) Establezca la hipótesis nula y alternativa
H0: El tipo de publicidad y las ventas son independientes
H1: El tipo de publicidad y las ventas son dependientes
b) Calcule los grados de libertad
gl = (3 -1)(3 – 1 )
gl = 4
c) Establezca la regla de decisión con un nivel de significancia de 0.1
Al 90% de confianza probaremos si el tipo de publicidad afecta o no a las ventas
d) Pruebe si el tipo de publicidad afecta a las ventas
Y como nos damos cuenta nuestro valor p mayor que 0,1 nos da evidencia
suficiente para aceptar la hipótesis nula y concluir que el tipo de publicidad no
afecta a las ventas
EJERCICIOS
30. Cuando se usa la prueba de la ji cuadrad, ¿es necesario supones que la
población sique una distribución normal?
No es necesario ya que la prueba ji cuadrada se usa solo para variables categóricas
31. ¿Cuáles son las similitudes entre la distribución ji cuadrada y la distribución t?
¿Cuáles son sus diferencias?
La distribución t y la distribución ji cuadrada se caracterizan por un solo parámetro los
grados de libertad, y la diferencia es que la distribución t se usa para trabajar en datos
numéricos y la ji cuadrada se utiliza para datos categóricos, además que la t también
necesita dos parámetros mas que son la media y la varianza
32. ¿Por qué la hipótesis alternativa de las pruebas de ji cuadrada es de una cola?
Esto se debe a que la distribución ji cuadrada tiene sesgo positivo y deja un área en la
cola derecha mucho más significativa que el área de la cola izquierda
33. Janis Yee, el director de mercadotecnia de la compañía Financial Fleet, lleva a
cabo un experimento para determinar si el tipo de timbres que se usa en los
sobres con cuestionarios influye en el hecho de que lo devuelvan. Janis manda
por correo 4000 cuestionarios; la mitad con un sello postal y la otra mitad con
una estampilla normal. Los resultados son:
Tipo de timbre
Sello
Estampilla
Respondió
No respondió
750
775
1250
1225
a) Establezca la hipótesis nula y alternativa.
H0: la tasa de respuesta no varía con el tipo de timbre postal, (son indep)
H1: la tasa de respuesta varía con el tipo de timbre postal
b) Calcule los grados de libertad.
gl = (r – 1)(c – 1)
gl = (2 – 1)(2 – 1)
gl = 1
c) Establezca la regla de decisión con un nivel de significancia de 0,01.
Si la probabilidad p de nuestro estadístico de prueba fuera mayor que 0,01
aceptaríamos la hipótesis nula y concluiríamos que la tasa de respuesta no varía
con el tipo de timbre postal. Y si este valor fuera menor que 0,01 rechazaríamos
H0 y concluiríamos que la tasa de respuesta varía con el tipo de timbre postal
d) Pruebe si la tasa de respuesta varía con el tipo de timbre postal.
Como podemos observar la probabilidad del estadístico de prueba es mayor que
0,01 por lo que aceptamos la hipótesis nula y concluimos que la tasa de respuesta
no varía con el tipo de timbre postal
34. Tony Greenwell, analista de la compañía de seguros Wise, piensa que los
conductores de automóviles jóvenes tienen más accidentes y deben pagar más
por el seguro de sus autos. Para probar esta hipótesis, Tony reúne evidencias
estadísticas sobre las tasas de siniestros para diferentes grupos de edad en un
promedio de cinco años:
Grupo de edad
Con siniestro
Sin siniestro
16 – 20
50
175
21 – 34
45
225
35 – 49
38
375
50 s más
34
225
a) Establezca la hipótesis nula y alternativa.
H0: El número de siniestros no depende de la edad
H1: El número de siniestros depende de la edad
b) Calcule los grados de libertad.
gl = (r – 1)(c – 1)
gl = (4 – 1)(3 – 1)
gl = 6
c) Establezca la regla de decisión con un nivel de significancia de 0,05.
Si la probabilidad p de nuestro estadístico de prueba fuera mayor que 0,05
aceptaríamos la hipótesis nula y concluiríamos que el número de siniestros no
depende de la edad. Y si este valor fuera menor que 0,01 rechazaríamos H0 y
concluiríamos que el número de siniestros depende de la edad
d) Pruebe si el número de siniestros depende de la edad.
Como podemos observar la probabilidad de nuestro estadístico de prueba es
mucho menor que nuestro nivel de significancia de 0,05 por lo que rechazamos la
hipótesis nula y concluimos que el número de siniestros depende de la edad
35. Holly Largent, vicepresidente de computación de la North ern University, ha
recogido datos sobre el número de veces que se interrumpió el servicio a los
usuarios por día, durante el último año. Holly quiere determinar la distribución
de probabilidad adecuada para estas variables de manera que pueda crear un
proceso de simulación. Los datos son:
Interrupciones por día
Número de días
0
117
1
128
2
63
3
30
4
13
5 o mas
14
¿A qué conclusión llegará Holly?
36. La compañía Bif Peanut Butter está preocupada por sus preferencias que
tienen los consumidores por otras marcas de crema de cacahuete. Contrata los
servicios de una empresa de investigación que realiza una encuesta telefónica
de 400 casas y obtiene las siguientes preferencias de marca:
Marca A
Bif
Marca C
Marca D
Marca E
75
65
90
82
88
Escriba un memorándum para la empresa de investigación resumiendo estos resultados.
Si no hubiera preferencias de marcas por parte de los consumidores se esesperaría las
siguientes frecuencias
Marca A
Bif
Marca C
Marca D
Marca E
75
65
90
82
88
frec observadas
frec esperadas
80
80
80
80
80
Por lo que entonces probaremos las siguientes hipótesis:
H0: Todas las marcas tienen igual demanda de crema de cacahuate
H1: no todas las marcas tienen igual demanda de crema de cacahuate
Por lo que con este valor aceptamos la hipótesis nula y concluimos que todas las marcas
tienen igual demanda de crema de cacahuate por lo que se puede hacer un informe a la
empresa en la cual se detalle que los resultados de la investigación nos dicen que no hay
preferencia de los consumidores por ningún tipo de marca por lo que la empresa puede
estar tranquila.
37. Diane Morton, directora de mercadotecnia para las Autoridades de Transito de
Spokane, contrató a Decision Science Associates para llevar a cabo un
estudio de mercado. Diane quiere determinar si los usuarios del transporte
viven más cerca de una parada de autobús que los que no lo usan. La decision
Science hace un estudio de 1201 residentes del condado de Spokane. Los
resultados son:
Proximidad a la parada Usuarios
No usuarios
Total
del autobus
Menos de una
manzana
1 o 2 manzanas
3 o 4 manzanas
200
234
434
170
55
221
112
391
167
5 manzanas o mas
52
117
169
No lo sabe
12
28
40
TOTALES
489
712
1201
Escriba un memorándum a Diane explicándole los resultados de este estudio.
Vamos a plantear las siguientes hipótesis:
H0: La proximidad a la parada del autobús no depende al momento de que una persona
use o no este transporte
H1: La proximidad a la parada del autobús influye al momento de que u na persona use o
no este transporte
Podemos observar de acuerdo a este estudio que la proximidad a la parada del autobús
con respecto al lugar donde viven los usuarios del mismo influye en el hecho de que sean
usuarios, es decir las personas que se encuentran más alejadas de la parada del autobús
suelen no ser usuarias de este medio de transporte
38. Berry Wise creó un programa de computadora para generar números
aleatorios de un digito y quiere estar seguro de que dicho programa funcione
correctamente. Su amigo, Michelle Conrath, está realizando un curso de
estadística y accede a probar el programa. Michelle usa el programa para
generar 1000 números aleatorios.
Números
Frecuencia
0
90
1
85
2
115
3
101
4
92
5
107
6
85
7
112
8
113
9
100
N
1000
¿Qué debe decir Michelle a Berry sobre el programa?
0
números
1
2
3
4
5
frec
90
85
115
101
92
107
observada
frec esperada 100
100
100
100 100
100
6
85
7
112
8
113
9
100
100
100
100
100
Para que este sea un buen programa debería generar una población de números
aleatorios iguales
H0: población de números aleatorios p = 100
H1: p ≠ 100
Por lo que concluimos que es un buen programa ya que genera una población de
números aleatorios iguales
39. Carla Parrish piensa que la demanda de buñuelos de mermelada los fines de
semana en Strick’s Doughnut sigue una distribución normal. Si esta en lo
cierto, podrá resolver el problema de inventario de cuantos buñuelos debe
hacer los viernes. Carla recoge los datos de los últimos 100 fines de semana.
40 39 33 43 45 39 44 36 39 36
45 42 45 42 33 43 42 42 45 37
42
41
34
35
47
37
31
45
39
36
43
40
37
42
34
38
40
40
38
48
40
35
37
33
40
44
50
41
40
42
34
30
38
45
37
37
39
40
31
39
36
35
38
38
47
44
31
42
37
39
35
37
37
35
42
40
37
49
36
37
39
41
39
38
41
40
39
40
36
38
43
45
42
36
31
37
45
39
44
42
Y como podemos observar estos datos claramente siguen una distribución normal
Si Carla usa un nivel de significancia de 0,05, ¿Cuál será sus conclusiones?
40. “Videophiles”, un articulo den el American Demographics (julio de 1992),
publica la demografía de los usuarios de kmedios de comunicación. Una vez al
año, Simmons Market Research Bureau solicita a cerca de 20000
estadounidenses que den una idea detallada sobre un comportamiento de
compras, uso de medios de comunicación, características demográficas y
actitudes. El estudio pregunta sobre la mayoría de las formas de comunicación,
incluso revistas y periódicos, películas, estaciones de radio, canales de
televisión, alquiler de videos, y la compra de libros, juegos de video y discos
compactos. Simmons identifica varios tipos de usuarios, cada uno con distintas
características demográficas. Entre las personas que contestaron, se identificó
un total de 3800, ya sea como videoadictos o compradores de discos
compactos; la siguiente tabla desglosa los resultados por categorías de
ingresos por casa.
Ingreso por casa
Videoadictos
Compradores de
Total
discos compactos
Menos de $15000
208
84
292
$15000 a menos de $35000
512
300
812
$35000 a menos de $60000
560
384
944
$60000 o más
320
432
752
1600
1200
2800
Todd Corlett está interesado en abrir una tienda para videoadictos (usuarios constantes
de videos, juegos y TV por cable) y quiere saber si los compradores de discos compactos
prevalecen en las mismas categorías de ingresos de los videoadictos. Esta información le
ayudará a determinar donde localizar su nueva tienda.
¿Debe concluir Todd que la clasificación de personas, ya sea como videoadictos o como
compradores de discos compactos, es independiente de las categorías de ingresos por
casa?
Lo que haremos es probar las siguientes hipótesis bajo el estadístico de prueba chi
cuadrado:
H0: La clasificación de las personas es independiente de las categorías de ingresos por
casa
H1: La clasificación de las personas depende de las categorías de ingreso por casa
A un nivel de significancia de 0,01 rechazamos nuestra hipótesis nula y concluimos que la
clasificación de las personas depende de las categorías de ingreso por casa
41. Investigaciones Robinson lleva a cabo un estudio de porcentajes de mercado
en el ares de Atlanta. Bill Robinson, el presidente de la compañía, identificó
siete tipos de usuarios de medios de comunicación, cada uno con
características demográficas distintas. Para determinar si sus resultados
pueden extrapolarse a toda la población, Bill los compara con los suministros
por Simmons Market Research Bureau (American Demographics, julio de
1992). Los porcentajes de Simmons para cad a grupo fueron: fanáticos de TV
(22%), radioyentes (22%), lectores de periódicos (20%), cinéfilos (12%),
compradores de libro (10%), video adictos (8%), y compradores de discos
compactos (6%). Cuando Robinson clasifico sus 500 personas d e la muestra,
los resultados fueron: fanáticos de TV (100), radioyentes ( 120), lectores de
periódicos (80), cinéfilos (80), compradores de libros (35), video adictos (60) y
compradores de discos compactos (25). ¿Son los resultados de Bill los mismos
que los que publica Simmons Market Research Bureau?
Para este problema los datos tomados por Bill se constituirán en frecuencias observadas
mientras que los datos que publica Simmons son los valores que Bill espera que tomen
sus datos (frecuencias esperadas)
H0: Los datos tomados por Bill son los mismos que los de la publicación de Simmons
H1: Los datos tomados por Bill son distintos a los de la publicación de Simmons
Con esta área mayor que 0,01 que deja nuestro estadístico de prueba aceptamos la
hipótesis nula y concluimos que los datos tomados por Bill son los mismos que los de la
publicación de Simmons
EJERCICIOS ADICIONALES:
1) BABBET ELECTRONICS
Joe Burt es el gerente de control de calidad de la planta de la compañía Babbet
Electronics que fabrica discos compactos (CD). Su jefe, el gerente de la planta, hace poco
explicó a la junta de ejecutivos que acababa de leer un artículo en la revista Gramophone
(agosto de 1989) sobre las ventas de CD en el mercado japonés. El administrador
estableció que la calidad de las unidades producidas por Babbet había disminuido
ligeramente en el último año, lo que afectaba a la efectividad de la compañía en este
mercado.
Joe contesto que la calidad no había bajado, pero no tenía datos que lo respaldaran.
Decidió buscar alguna evidencia que confirmara o contradijera la afirmación del gerente
de la planta.
Se obtuvieron los registros de la compañía anteriores al último año para tener una idea
del nivel de calidad en ese momento. Después e tomó una muestra aleatoria de los
informes de calidad de 224 CD a partir de los registros de los últimos seis meses. Se
establecieron cinco categorías para las condiciones de los CD (Tabla 11.17). Los
porcentajes históricos se multiplicaron por 224 (tamaño de la muestra) para producir las
frecuencias esperadas. Estas se compararon con las frecuencias observadas en cada
categoría para poder realizar una prueba de bondad de ajuste. La hipótesis nula es que
no hubo cambio en la calidad durante los últimos meses.
TABLA 11.17 Datos para el ejercicio adicional 45.
Calidad de producto
Adecuada
Pequeña
corrección
Volver a
procesar
Vender con Descartar
descuento
Entonces
163
37
10
8
6
Ahora
125
56
12
15
16
Con los datos de la tabla 11.17 Joe calcula un valor de p de 41,82 para la prueba de
bondad de ajuste. Considera que este es un valor de prueba muy grande y se da cuenta
que su jefe tiene razón: la calidad de la línea de CD se ha deteriorado en el último año,
por lo que deberán tomarse medidas.
a. ¿Calculó bien Joe el estadístico de prueba?
Las hipótesis a evaluarse son las siguientes:
H0: no hubo cambio en la calidad durante los últimos meses.
H1: hubo cambio en la calidad durante los últimos meses.
Si, el estadístico de prueba calculado por joe es correcto
b. ¿Cuáles son los valores críticos de la tabla para ji cuadrada, para varios niveles de
significancia?
Alfa
0,1
0,05
0,02
0,01
ji cuadrada 7,77944034 9,48772904 11,6678434 13,2767041
c. ¿Es correcto la conclusión final de Joe?
Es correcta en cuanto Joe da la razón al gerente de la Empresa al concluir que
hubo cambio en la calidad durante los últimos meses.
2) COMPAÑIA PETROLERA SHELTY
Durante muchos años, Shelty (un mayorista de gasolina y otros productos para automóvil,
a nivel nacional) ha ofrecido al publico su propia tarjeta de crédito. Es caro mantener este
servicio y la administración de Shelty se pregunta si debe eliminar las tarjetas. Se piensa
que las tarjetas de créditos generales, tan populares en estos tiempos, se prefieren a las
tarjetas que se pueden usar solo con una compañía.
Se contrata a un consultor para diseñar una encuesta que se mandará a una muestra
aleatoria de 1383 titulares de tarjetas de crédito. Una de preguntas demográficas pide a
los encuestados que clasifiquen el uso de su tarjtea Shelty como: Frecuente, regular o
nulo. Otra pregunta utiliza una escala de 1 a 7 para determinar la opinión de los
encuestados sobre la conveniencia de continuar con la tarjeta Shelty. La tabla 11,18
contiene los datos que se obtuvieron.
a. ¿Cuál es la hipótesis nula en esta situación?
H0: La conveniencia que tiene la tarjeta es independiente del uso que le da el
usuario
H1: La conveniencia de la tarjeta influye en el uso de la misma
b. ¿Cuál es el estadístico de prueba, el número de grados de libertad para la prueba
y el valor crítico para un nivel de significancia de 0,05?
El estadístico de prueba que utilizaremos es la prueba chi cuadrada con tablas de
contingencia
gl = (r – 1)(c – 1)
gl = (3 – 1)(7 – 1)
gl = 12
El valor crítico para un nivel de significancia de 0,05 es 21,03
c. Con un nivel de significancia de 0,05, establezca el resultado de esta prueba en
términos sencillos.
No conveniente
Bastante conveniente
Uso de
1
2
3
4
5
6
7
tarjeta
Frecuente 56
79
87
93
128
59
21
Regular
67
89
94
132
32
21
16
Nulo
87
128
90
64
21
10
9
Con este valor rechazamos la hipótesis nula y concluimos que la conveniencia de la
tarjeta influye en el uso de la misma
3) VELLEY HOSPITAL .
Lane Samson, jefe de la administración de un pequeño hospital en el oeste de Estado
Washington, contrató a un consultor para que lleve a cabo un estudio en el área de
servicio de su hospital. Se puso en marcha una serie de grupos de interés, además de
una encuesta de puerta en puerta. Entre los aspectos de interés para Lane se encuentra
la respuesta a la siguiente afirmación:
En lo que respecta a atención sanitaria, me sentiría mejor si me trataran en el Valley
Hospital.
Se preguntó a los encuestados su reacción a esta afirmación y se clasificó la información
según las siguientes respuestas:
Estoy en completo acuerdo, no estoy de acuerdo, neutral o sin opinión, estoy de acuerdo
o estoy completamente de acuerdo.
Lane ya vio la tabulación de las respuestas para toda la muestra, pero quiere compararlas
según dos aéreas geográficas clave. La primera (área 1) es el área de la vecindad
inmediata al hospital (cuadro millas alrededor).la segunda (área 2) es el condado en el
que se encuentra el hospital, fuera de las cuatro millas.
Los datos se ejecutaron en el programa de computadora SPSS, versión X. se presentan
aquí los comandos para generar una tabla cruzada en el área según la respuesta a la
afirmación:
CROSSTABS TABLES= VAR5 BY VAR 14
STATISTICS 1
Cuando se introducen los datos en la computadora, el número de área (1 o 2) es la quinta
variable, por lo que esta variable recibe el nombre de VAR5. La variable de la respuesta a
la afirmación de interés para LANE se introdujo como la variable 14, por lo que recibe el
nombre de VAR14. La segunda línea de comandos que se muestra pide al programa que
calcule el valor ji cuadrado y el valor p de los datos.
Una vez finalizada la ejecución del programa de computadora, se produjeron los
siguientes resultados:
VAR 14
VAR 5
SD
D
N
A
SA
1
9
30
53
65
17
2
21
45
42
15
11
CHI – SQUARE = 36,97
p = 0,0000
Lane interpreta estos resultados de la siguiente manera: la tabla cruzada indica el numero
de respuestas en cada una de las 10 categorías, y el número total de respuestas es de
308, el tamaño de la muestra puerta en puerta.
Se calculó el estadístico ji cuadrada, 36,97, mediante la ecuación 11,2. Lane calculó los
grados de libertad, 4, lo que llevo a la tabla de 13,277 a un nivel de significancia de 0,01.
Así, se rechaza la hipótesis de independencia entre filas y columnas y se concluye que las
dos áreas reaccionan de la forma distinta a la posibilidad de que se les trate en el Valley
Hospital. Al analizar la tabla cruzada, Lane encuentra que los residentes del área 1 (cerca
del hospital) se sienten más cómodos con la idea de recibir tratamiento en el Valley
Hospital que quienes viven más lejos. Lane decide que una campaña de publicidad puede
mejorar esta situación.
a. ¿Llegó Lane a la conclusión adecuada según los resultados de la computadora?
Descargar