Explicación de la tarea 5 Felipe Guerra 1. Se tomó una muestra aleatoria del tiempo (en minutos) en que se realiza un trabajo artesanal. Los datos aparecen en la siguiente tabla. 91.228 99.989 105.971 109.102 113.373 116.302 119.868 125.016 131.813 137.021 92.221 100.985 105.991 109.302 113.411 116.346 120.199 125.396 132.018 138.687 92.635 101.103 105.998 110.154 113.580 116.858 120.464 125.424 132.180 138.787 93.486 101.601 106.378 110.646 113.700 116.982 122.278 126.812 132.182 140.052 94.569 102.437 106.920 110.946 114.116 117.685 123.027 127.614 133.045 140.911 94.931 102.727 107.542 111.072 114.848 118.158 123.378 127.911 133.088 141.320 95.168 103.505 107.991 111.380 114.985 118.280 123.682 129.479 133.581 141.472 97.145 104.288 108.563 111.949 115.141 118.422 123.888 130.147 135.173 147.406 98.669 104.429 108.739 112.707 115.192 118.534 124.153 130.493 135.351 152.191 99.884 104.993 109.041 113.248 116.302 119.638 124.332 131.069 135.546 155.512 Nota : Las mencionadas estimaciones puntuales corresponden a la estimación del parámetro muestral solicitado. La lectura menciona: Estimador Puntual. Es un estadístico utilizado para estimar el valor de un parámetro desconocido a partir de una muestra aleatoria. Por ejemplo, el mejor estimador puntual de la media de una población es X , el mejor estimador puntual de la varianza es S2, El mejor estimador puntual de una proporción es p=X donde X es el número de “éxitos” en una muestra aleatoria de tamaño n. n a. Obtener una estimación puntual del tiempo promedio para hacer este trabajo. En este punto nos piden el promedio, por lo tanto usamos la formula en Excel: =PROMEDIO(número_1, número_2, …) b. Obtener una estimación puntual de la varianza del tiempo para hacer el trabajo. Para la varianza usamos la formula en Excel: =VAR(número_1, número_2, …) c. Obtener una estimación puntual de la desviación estándar del tiempo para hacer el trabajo. Para la desviación estándar se usa la formula: =DESVEST(número_1, número_2, …) d. Obtener una estimación puntual de la proporción de trabajos que son realizados en menos de 100 minutos. Cuando se menciona una estimación puntual se hace referencia solo a los datos presentados. Por lo tanto debemos de contar los elementos que son menores a 100, y dividirla sobre el total de elementos para obtener la proporción, usando la siguiente formula: =CONTAR.SI(datos,"<100")/CONTAR(datos) En donde datos corresponde al rango total de datos presentados. 2. Se tomó una muestra del tiempo (en minutos) que tardan los alumnos de una escuela para trasladarse de su casa a la escuela. 2.794 0.653 13.579 5.214 19.503 52.480 9.760 6.711 1.798 34.568 45.307 0.991 7.108 57.713 11.238 5.166 9.477 33.235 22.772 35.407 4.624 33.328 20.761 33.797 0.620 14.991 1.366 4.811 2.900 9.072 4.300 28.378 9.575 24.125 31.133 19.295 30.535 32.212 12.136 8.458 44.482 1.042 28.102 7.453 23.564 4.923 24.124 0.257 32.850 4.950 91.704 4.545 38.310 102.743 0.653 45.307 26.419 17.033 34.809 33.732 44.091 64.917 67.909 36.595 28.415 41.307 57.713 20.761 24.153 31.625 70.480 5.092 9.760 6.711 10.495 5.508 8.633 32.763 14.991 31.133 7.340 3.400 3.321 50.110 22.772 35.407 17.534 69.852 20.813 7.954 32.212 24.124 19.846 74.361 2.935 25.123 4.300 28.378 9.272 38.392 60.122 10.806 4.950 34.809 7.347 12.178 37.514 0.341 28.102 7.453 20.358 5.561 2.973 30.599 64.917 70.480 10.667 36.801 8.100 41.860 a. Obtener una estimación puntual del tiempo promedio para trasladarse. b. Obtener una estimación puntual de la varianza del tiempo para trasladarse. c. Obtener una estimación puntual de la desviación estándar del tiempo para trasladarse. d. Obtener una estimación puntual de la proporción de alumnos que tardan más de una hora en trasladarse. Este problema se resuelve de forma similar al problema anterior 3. Estimar la media del tiempo que se menciona en el problema 1, mediante un intervalo de confianza del 97%. Interpretar el resultado en el contexto del problema. Para resolver este problema debemos primero interpretar lo que nos están pidiendo. Se pide un intervalo de confianza dentro del cual se encuentre la media de la población, dado que solo conocemos la media de la muestra y su desviación estándar. Lo que se representa gráficamente de esta forma: α/2 Valores de Z negativos α/2 Valores de Z positivos Conociendo los parámetros [Media y desviación estándar] de la muestra (zona roja), sabemos que la población puede diferir de la muestra (Las líneas azul y verde representan curvas poblacionales posibles). Lo que nos piden es encontrar una “zona” (área anaranjada) en la que haya una probabilidad del 97% de que se encuentre la media poblacional (Observe que tanto la media verde como la media azul se encuentran en esta zona). La lectura menciona: IC para la media con varianza conocida. Suponer una muestra aleatoria de una v.a. X con distribución normal y varianza conocida. El IC para la media con un nivel de confianza de 1-α está dado por: La formula zα/2 corresponde al valor de z (cantidad de desviaciones estándar) que genera una probabilidad de α/2 en una distribución normal estándar. Se llama distribución normal estándar a aquella que tiene media igual a cero (μ = 0), y desviación estándar igual a 1 (σ = 1) α corresponde a la posibilidad de error, y en este caso se divide entre 2, debido a que repartimos la posibilidad de error entre las dos colas de la distribución normal Aplicando lo anterior a fórmulas de Excel tenemos que: X =PROMEDIO(número_1, número_2, …) zα/2 =DISTR.NORM.ESTAND.INV(Probabilidad) =DISTR.NORM.ESTAND.INV(α/2) Observe que Z toma valores negativos cuando el valor de α/2 es menor que 0.5 y toma valores positivos cuando α/2 es mayor que 0.5 (ver gráfica en la página anterior); la causa de esto es que la media es cero, y Z corresponde a la cantidad de desviaciones estándar para una probabilidad dada por lo tanto para probabilidades dentro de la cola del lado izquierdo Z toma valores negativos y para la cola del lado derecho positivos. Ahora bien tomando esta consideración en Excel usaremos los siguientes valores DISTR.NORM.ESTAND.INV(α/2) para la cola del lado izquierdo DISTR.NORM.ESTAND.INV(1-α/2) para la cola del lado derecho Quedando el intervalo total de la siguiente forma: No se usa resta, por que el valor de Z por formula ya tiene signo negativo Para el límite inferior: =PROMEDIO(datos*) + DISTR.NORM.ESTAND.INV(α/2)*(DESVEST(datos*) / RAIZ(n)) Y para el límite superior =PROMEDIO(datos*) + DISTR.NORM.ESTAND.INV(1-α/2)*(DESVEST(datos*) / RAIZ(n)) * Nota: Se indica datos* como abreviatura de los datos presentados en el problema en forma de tabla. Para σ podemos usar el valor de S(x) debido a que tenemos más de 30 datos, con lo cual se asume que el valor de la desviación estándar poblacional es igual a la desviación estándar de la muestra. Nota: En caso de tener menos de 30 datos se debe hacer un ajuste a la desviación estándar por S / √n-1 substituyendo σ / √n Para el valor de α usamos la posibilidad de error, es decir (1 – 97%) ó (1 - 0.97) El ejercicio solicita interpretar el resultado en el contexto del problema. Por lo que la interpretación debe hacer referencia a los datos y unidades utilizados. No basta con poner los valores obtenidos. Sino que se deben de interpretar en el contexto del problema indicando el tipo de proceso y las unidades utilizadas. 4. Estimar la media del tiempo que se menciona en el problema 2, mediante un intervalo de confianza del 90%. Interpretar el resultado en el contexto del problema. Este ejercicio se resuelve igual que el anterior, utilizando (1 - 0.90) para el valor de α