EL ERROR ESTÁNDAR Un mismo estimador ofrece distintos valores para distintas muestras del mismo tamaño extraídas de la misma población. Por lo tanto deberíamos tener una medida de la variabilidad del estimador respecto del parámetro que se trata de estimar. Esta variabilidad se mide en términos de la desviación estándar del estimador, la cual recibe el nombre de error estándar. El error estándar de un estimador T de un parámetro estándar del estimador. es la desviación Así por ejemplo, si tomamos X como estimador de , entonces el error estándar está dado por X n . Error de estimación es el valor absoluto de la diferencia entre una estimación particular y el valor del parámetro. En realidad por cada valor estimado del parámetro se tiene un error de estimación por lo general diferente. Sin embargo, es posible fijar un intervalo dentro del cual se encontrarán la mayoría de los valores de error de estimación para un estimador y parámetro dados. En la tabla siguiente se dan las fórmulas de los errores de estimación para algunos estimadores y los estimadores para tales errores. Los estimadores se usan cuando los parámetros que se incluyen en las fórmulas de los errores de estimación son desconocidos. PARÁMETRO MEDIA PROPORCION p ESTIMADOR ERROR ESTÁNDAR X p n p(1 p) n ESTIMADOR DEL ERROR Nivel de confianza y valor de Z 1 . Z /2 99 2.576 95 1.960 90 1.645 85 1.439 80 1.282 Para tamaños de muestra n>30, o conocida usar la distribución Normal Para muestras de menor tamaño, o desconocida usar la distribución t INTERVALOS DE CONFIANZA PARA POBLACIÓN NORMAL MEDIA Z 1 /2 X Z 1 /2 X Z 1 /2 s n X Z 1 /2 s n X t VARIANZA POBLACIONAL CONOCIDA, N FINITA Y n 0.05 N VARIANZA POBLACIONAL CONOCIDA, N INFINITA 0 X n N n N 1 n n 0.05 N POBLACIONAL POBLACIÓN NORMAL VARIANZA POBLACIONAL DESCONOCIDA s Y n 30, N FINITA Y n 0.05 N VARIANZA POBLACIONAL DESCONOCIDA s Y n 30, N FINITA Y n 0.05 N VARIANZA POBLACIONAL DESCONOCIDA s Y n 30 DIFERENCIA POBLACIONES NORMALES INDEPENDIENTES. VARIANZAS CONOCIDAS. POBLACIONES NORMALES INDEPENDIENTES. DE MEDIAS PROPORCIÓN P VARIANZAS IGUALES DESCONOCIDAS SE RECOMIENDA EL USO DE ESTA FÓRMULA EN MUESTRAS DE TAMAÑO GRANDE n>30 s n N n N 1 DIFERENCIA DE SE RECOMIENDA EL USO DE ESTA FÓRMULA EN PROPORCIONES MUESTRAS DE TAMAÑO GRANDE n>30 VARIANZA POBLACIONES NORMALES COCIENTE DE VARIANZAS MUESTRAS INDEPENDIENTES DE POBLACIONES NORMALES ; b= EJERCICIOS SOBRE EL ERROR ESTÁNDAR 1. Una agencia de encuestas selecciona 900 familias y calcula la proporción de éstas que utilizan cierta marca de detergente. Si la proporción estimada es 0.35 ¿Cuál es el error estándar estimado? Sol. 0.016 2. En el estudio de cierta característica X de una población se sabe que la desviación estándar es 3. Se va a escoger una muestra de tamaño 100, halle el error estándar de la media muestral. Sol. 0.3 3. Se escogió al azar una muestra de 10 niños de una escuela y se les preguntó el número de veces que habían utilizado el baño durante las horas de clases. Los resultados fueron los siguientes: 0, 4, 2, 3, 2, 0, 3, 4, 1, 1. Estime el error estándar del número de veces promedio que los niños de la escuela usan el baño durante las horas de clases. Sol. 0.4714 EJERCICIOS SOBRE ESTIMACIÓN POR INTERVALOS. 1. Una muestra aleatoria de 36 cigarrillos de una determinada marca dio un contenido promedio de nicotina de 3 miligramos. El contenido en nicotina de estos cigarrillos sigue una normal con una desviación estándar de 1 miligramo. a) Obtenga e interprete un intervalo de confianza del 95% para el verdadero contenido promedio de nicotina en estos cigarrillos. b) El fabricante garantiza que el contenido promedio de nicotina es 2.9 miligramos, ¿qué puede decirse de acuerdo con el intervalo hallado? Sol. [2.67, 3.33]. No podemos descartar lo afirmado por el fabricante ya que el valor 2.9 se encuentra dentro del intervalo 2. Los siguientes números representan el tiempo (en minutos) que tardaron 15 estudiantes en familiarizarse con el manejo de una nueva instrucción de cierta calculadora: 3.4, 2.8, 4.4, 2.5, 3.3, 4, 4.8, 2.9, 5.6, 5.2, 3.7, 3.0, 3.6, 2.8, 4.8. Supongamos que los tiempos se distribuyen normalmente. A) Determina e interpreta un intervalo del 95% de confianza para el verdadero tiempo promedio. B) El instructor considera que el tiempo promedio requerido por los alumnos es mayor que 5 minutos, ¿qué se puede decir de acuerdo con el intervalo hallado? Sol. [3.26 , 4.34]. La apreciación del instructor no parece correcta ya que el valor 5 minutos se encuentra fuera del intervalo.) 3. Queremos medir la diferencia en ventas entre dos categorías de empleados. Una está formada por personas con título superior y la otra por personas con estudios secundarios. Tomamos una muestra de 45 empleados del primer grupo y la media de ventas resulta ser 32. Tomamos una muestra de 60 empleados del segundo grupo y la media obtenida es 25. Supongamos que las ventas de los dos grupos siguen una normal con varianza 48 para el primer grupo y de 56 para el segundo. A) Calcula un intervalo del 90% de confianza para la verdadera diferencia de las medias. B) De acuerdo con el intervalo hallado, ¿hay evidencia de que las ventas medias de los grupos son iguales? Sol.[4.67,9.33]. El hecho de que las medias sean iguales quiere decir que la diferencia de las medias es 0. Como el 0 no está contenido en el intervalo, no hay evidencia de que se de la igualdad.) 4. Se desea saber si hay diferencia entre el tiempo (en minutos) que tardan los alumnos del grupo A y los del grupo B en resolver un problema matemático. Tomamos una muestra de 14 alumnos de A y obtenemos una media muestral de 17 minutos y una varianza muestral de 1.5. Tomamos una muestra de B de 25 alumnos obteniendo la media muestral de 19 y la varianza muestral de 1.8. Suponemos que los tiempos para los dos grupos se distribuyen normalmente y que las varianzas son iguales aunque desconocidas. A) Calcula un intervalo de confianza del 99% para la verdadera diferencia de las medias. B) De acuerdo con el intervalo hallado, ¿hay evidencia de que los dos tiempos promedios son iguales?( Sol. [0.83, 3.17]. Como el cero no está contenido en el intervalo, no hay evidencia de que los tiempos sean iguales.) 5. Una marca de lavadoras quiere saber la proporción de amas de casa que preferirían usar su marca. Toman al azar una muestra de 100 amas de casa y 20 dicen que la usarían. Calcula un intervalo de confianza del 95% para la verdadera proporción de amas de casa que preferirían dicha lavadora. Sol. [0.122 , 0.278]. 6. Se desea cambiar una máquina en una cadena de producción. Se toman muestras con la máquina actual y con la nueva máquina para determinar si se van a producir mejoras en el sistema. 75 de 1.000 artículos del procedimiento actual presentaron defectos y lo mismo sucedió con 80 de 2.500 partes del nuevo, determine un intervalo de confianza del 90% para la verdadera diferencia de proporciones de partes defectuosas. Sol. [0.0281, 0.0579]). 7. Un fabricante de baterías para automóvil asegura que las baterías que produce duran en promedio 2 años, con una desviación típica de 0.5 años. Si 5 de estas baterías tienen duración 1.5, 2.5, 2.9, 3.2 y 4 años, determine un intervalo de confianza del 95% para la varianza e indique si es válida la afirmación del fabricante. (Sol. [0.3 , 7]. Como el valor garantizado por el fabricante queda fuera del intervalo rechazamos dicha afirmación.) 8. Determina un intervalo de confianza del 90% para el cociente de varianzas tomando los datos del ejercicio 4. ( Sol. [0.552 , 2.904]) EJERCICIOS SOBRE EL TAMAÑO DE LA MUESTRA. 1. Queremos ajustar una máquina de refrescos de modo que el promedio del líquido dispensado quede dentro de cierto rango. La cantidad de liquido vertido por la máquina sigue una distribución normal con desviación estándar 0.15 decilitros. Deseamos que el valor estimado que se vaya a obtener comparado con el verdadero no sea superior a 0.2 decilitros con una confianza del 95%.¿De qué tamaño debemos escoger la muestra?(Sol. N=217). 2. Es necesario estimar entre 10.000 establos, el número de vacas lecheras por establo con un error de estimación de 4 y un nivel de confianza del 95%. Sabemos que la varianza es 1.000. ¿Cuántos establos deben visitarse para satisfacer estos requerimientos? (Sol. Como sabemos que hay 10.000 establos, tendremos que usar la fórmula en la que interviene el tamaño de la población y obtenemos n=235). 3. Una máquina llena cajas con cierto cereal. El supervisor desea conocer con un error de estimación de máximo 0.1 y un nivel de confianza del 90%, una media estimada del peso. Como la varianza era desconocida se procedió a escoger una muestra piloto. Los resultados fueron los siguientes: 11.02, 11.14, 10.78, 11.59, 11.58, 11.19, 11.71, 11.27, 10.93, 10.94. ¿Cuántas cajas debe escoger para que se cumplan los requisitos propuestos?(Sol. Debemos tomar la varianza estimada y al ser n<30 el valor de t, al sustituir en la fórmula obtenemos n=34). 4. Se desea conocer el peso promedio de una determinada clase de pescado con un error de estimación de 0.02 y con un nivel de confianza del 99%. Por datos anteriores se sabe que el peso mínimo es 1.48 libras y el máximo es de 2.47 libras.¿De qué tamaño debe escoger la muestra? Suponga que los pesos de estos pescados se distribuyen normalmente.(Sol. No conocemos la varianza pero la podemos estimar a partir de la fórmula A/4. Al sustituir en la fórmula obtenemos n=1015) 5. Se desea hacer una encuesta para determinar la proporción de familias que carecen de medios económicos para atender los problemas de salud. Existe la impresión de que esta proporción está próxima a 0.35. Se desea determinar un intervalo de confianza del 95% con un error de estimación de 0.05. ¿De qué tamaño debe tomarse la muestra?(Sol. N=350 ). 6. Un productor de semillas desea saber con un error de estimación del 1% el porcentaje de semillas que germinan en la granja de su competidor. ¿Qué tamaño de muestra debe tomarse para obtener un nivel de confianza del 95%?(Sol. Como no tenemos ninguna estimación de la proporción, tomaremos 0.5 y así obtenemos n=9.604) 7. Se desea realizar una encuesta entre la población juvenil de una determinada localidad para determinar la proporción de jóvenes que estaría a favor de una nueva zona de ocio. El número de jóvenes de dicha población es N=2.000. Determinar el tamaño de muestra necesario para estimar la proporción de estudiantes que están a favor con un error de estimación de 0.05 y un nivel de confianza del 95%.(Sol. Como no nos dan ninguna estimación de la proporción, tomaremos 0.5. El valor de n es 322).