Explicación de la tarea

Anuncio
Explicación de la tarea 5
Felipe Guerra
1. Se tomó una muestra aleatoria del tiempo (en minutos) en que se realiza un
trabajo artesanal. Los datos aparecen en la siguiente tabla.
91.228
99.989
105.971
109.102
113.373
116.302
119.868
125.016
131.813
137.021
92.221
100.985
105.991
109.302
113.411
116.346
120.199
125.396
132.018
138.687
92.635
101.103
105.998
110.154
113.580
116.858
120.464
125.424
132.180
138.787
93.486
101.601
106.378
110.646
113.700
116.982
122.278
126.812
132.182
140.052
94.569
102.437
106.920
110.946
114.116
117.685
123.027
127.614
133.045
140.911
94.931
102.727
107.542
111.072
114.848
118.158
123.378
127.911
133.088
141.320
95.168
103.505
107.991
111.380
114.985
118.280
123.682
129.479
133.581
141.472
97.145
104.288
108.563
111.949
115.141
118.422
123.888
130.147
135.173
147.406
98.669
104.429
108.739
112.707
115.192
118.534
124.153
130.493
135.351
152.191
99.884
104.993
109.041
113.248
116.302
119.638
124.332
131.069
135.546
155.512
Nota : Las mencionadas estimaciones puntuales corresponden a la estimación del
parámetro muestral solicitado. La lectura menciona:
Estimador Puntual. Es un estadístico utilizado para estimar el valor de un parámetro desconocido a
partir de una muestra aleatoria. Por ejemplo, el mejor estimador puntual de la media de una
población es X , el mejor estimador puntual de la varianza es S2, El mejor
estimador puntual de una proporción es
p=X
donde X es el número de “éxitos” en una muestra aleatoria de tamaño n.
n
a. Obtener una estimación puntual del tiempo promedio para hacer este trabajo.
En este punto nos piden el promedio, por lo tanto usamos la formula en Excel:
=PROMEDIO(número_1, número_2, …)
b. Obtener una estimación puntual de la varianza del tiempo para hacer el
trabajo.
Para la varianza usamos la formula en Excel:
=VAR(número_1, número_2, …)
c. Obtener una estimación puntual de la desviación estándar del tiempo para
hacer el trabajo.
Para la desviación estándar se usa la formula:
=DESVEST(número_1, número_2, …)
d. Obtener una estimación puntual de la proporción de trabajos que son
realizados en menos de 100 minutos.
Cuando se menciona una estimación puntual se hace referencia solo a los
datos presentados. Por lo tanto debemos de contar los elementos que son
menores a 100, y dividirla sobre el total de elementos para obtener la
proporción, usando la siguiente formula:
=CONTAR.SI(datos,"<100")/CONTAR(datos)
En donde datos corresponde al rango total de datos presentados.
2. Se tomó una muestra del tiempo (en minutos) que tardan los alumnos de una
escuela para trasladarse de su casa a la escuela.
2.794
0.653
13.579
5.214
19.503
52.480
9.760
6.711
1.798
34.568
45.307
0.991
7.108
57.713
11.238
5.166
9.477
33.235
22.772
35.407
4.624
33.328
20.761
33.797
0.620
14.991
1.366
4.811
2.900
9.072
4.300
28.378
9.575
24.125
31.133
19.295
30.535
32.212
12.136
8.458
44.482
1.042
28.102
7.453
23.564
4.923
24.124
0.257
32.850
4.950
91.704
4.545
38.310
102.743
0.653
45.307
26.419
17.033
34.809
33.732
44.091
64.917
67.909
36.595
28.415
41.307
57.713
20.761
24.153
31.625
70.480
5.092
9.760
6.711
10.495
5.508
8.633
32.763
14.991
31.133
7.340
3.400
3.321
50.110
22.772
35.407
17.534
69.852
20.813
7.954
32.212
24.124
19.846
74.361
2.935
25.123
4.300
28.378
9.272
38.392
60.122
10.806
4.950
34.809
7.347
12.178
37.514
0.341
28.102
7.453
20.358
5.561
2.973
30.599
64.917
70.480
10.667
36.801
8.100
41.860
a. Obtener una estimación puntual del tiempo promedio para trasladarse.
b. Obtener una estimación puntual de la varianza del tiempo para trasladarse.
c. Obtener una estimación puntual de la desviación estándar del tiempo para
trasladarse.
d. Obtener una estimación puntual de la proporción de alumnos que tardan más de
una hora en trasladarse.
Este problema se resuelve de forma similar al problema anterior
3. Estimar la media del tiempo que se menciona en el problema 1, mediante un
intervalo de confianza del 97%. Interpretar el resultado en el contexto del problema.
Para resolver este problema debemos primero interpretar lo que nos están pidiendo.
Se pide un intervalo de confianza dentro del cual se encuentre la media de la población,
dado que solo conocemos la media de la muestra y su desviación estándar. Lo que se
representa gráficamente de esta forma:
α/2
Valores de Z negativos
α/2
Valores de Z positivos
Conociendo los parámetros [Media y desviación estándar] de la muestra (zona roja),
sabemos que la población puede diferir de la muestra (Las líneas azul y verde
representan curvas poblacionales posibles).
Lo que nos piden es encontrar una “zona” (área anaranjada) en la que haya una
probabilidad del 97% de que se encuentre la media poblacional (Observe que tanto la
media verde como la media azul se encuentran en esta zona).
La lectura menciona:
IC para la media con varianza conocida. Suponer una muestra aleatoria de una v.a. X con
distribución normal y varianza conocida. El IC para la media con un nivel de confianza de
1-α está dado por:
La formula zα/2 corresponde al valor de z (cantidad de desviaciones estándar) que genera una
probabilidad de α/2 en una distribución normal estándar.
Se llama distribución normal estándar a aquella que tiene media igual a cero (μ = 0), y
desviación estándar igual a 1 (σ = 1)
α corresponde
a la posibilidad de error, y en este caso se divide entre 2, debido a que
repartimos la posibilidad de error entre las dos colas de la distribución normal
Aplicando lo anterior a fórmulas de Excel tenemos que:
X =PROMEDIO(número_1, número_2, …)
zα/2 =DISTR.NORM.ESTAND.INV(Probabilidad) =DISTR.NORM.ESTAND.INV(α/2)
Observe que Z toma valores negativos cuando el valor de α/2 es menor que 0.5 y toma
valores positivos cuando α/2 es mayor que 0.5 (ver gráfica en la página anterior); la causa de
esto es que la media es cero, y Z corresponde a la cantidad de desviaciones estándar para
una probabilidad dada por lo tanto para probabilidades dentro de la cola del lado izquierdo Z
toma valores negativos y para la cola del lado derecho positivos.
Ahora bien tomando esta consideración en Excel usaremos los siguientes valores
DISTR.NORM.ESTAND.INV(α/2) para la cola del lado izquierdo
DISTR.NORM.ESTAND.INV(1-α/2) para la cola del lado derecho
Quedando el intervalo total de la siguiente forma:
No se usa resta, por que el
valor de Z por formula ya
tiene signo negativo
Para el límite inferior:
=PROMEDIO(datos*) + DISTR.NORM.ESTAND.INV(α/2)*(DESVEST(datos*) / RAIZ(n))
Y para el límite superior
=PROMEDIO(datos*) + DISTR.NORM.ESTAND.INV(1-α/2)*(DESVEST(datos*) / RAIZ(n))
* Nota: Se indica datos* como abreviatura de los datos presentados en el problema en forma
de tabla.
Para σ podemos usar el valor de S(x) debido a que tenemos más de 30 datos, con lo cual se
asume que el valor de la desviación estándar poblacional es igual a la desviación estándar de
la muestra.
Nota: En caso de tener menos de 30 datos se debe hacer un ajuste a la desviación estándar
por
S / √n-1
substituyendo
σ / √n
Para el valor de α usamos la posibilidad de error, es decir (1 – 97%) ó (1 - 0.97)
El ejercicio solicita interpretar el resultado en el contexto del problema. Por lo que la
interpretación debe hacer referencia a los datos y unidades utilizados. No basta con poner los
valores obtenidos. Sino que se deben de interpretar en el contexto del problema indicando el
tipo de proceso y las unidades utilizadas.
4. Estimar la media del tiempo que se menciona en el problema 2, mediante un intervalo
de confianza del 90%. Interpretar el resultado en el contexto del problema.
Este ejercicio se resuelve igual que el anterior, utilizando (1 - 0.90) para el valor de
α
Descargar