BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA DIPLOMADO DE ESTADÍSTICA AVANZADA ME Lucia Linares Manzano MÓDULO 2 Inferencia Estadística ME Lucia Linares Manzano ESTIMADORES Indica como calcular el valor de una estimación con base en las mediciones contenidas en nuestra muestra Insesgados 𝐸 𝜃 =𝜃 Cuando el valor estimado es igual a valor real Sesgados 𝐸 𝜃 >𝜃 Cuando el valor estimado es superior o mayor al valor real SESGO DE UN ESTIMADOR El sesgo de un estimador esta dado por Parámetro objetivo 𝐵 𝜃 =𝐸 𝜃 −𝜃 Estimador ALGUNOS ESTIMADORES PUNTUALES INSESGADOS COMUNES Media muestral 𝜃 Media poblacional 𝜇 Proporción de una muestra 𝑝 Los estimadores tienen errores "𝜀“ y es la distancia de un estimador y su parámetro objetivo 𝜀= 𝜃−𝜃 EJEMPLO Una muestra n= 1000 votantes, seleccionados al azar en una ciudad, mostró y=560 a favor del candidato Jones. Estime p, la fracción de votantes de la población que están a favor de Jones y precise un limite de error estándar de 2 Referido a 2 sigma en el error de estimación. 𝑝 = y/n ¿Qué tan confiable es este valor ? ERROR ESTÁNDAR El error estándar para el estimador p esta dado por: 𝑝𝑞 𝑏=2 𝑛 p Es el estimador q omplemento EJERCICIO Una comparación de la durabilidad de dos tipos de llantas para un automóvil se obtuvo de muestras de prueba en carretera de n1=n2=100 llantas de cada tipo. Se registró el número de millas hasta quedar inútiles , el desgaste se definió como el número de millas hasta que la cantidad restante de la superficie de rodamiento llego a un valor pequeño especificado previamente. Las mediciones de los dos tipos de llantas se obtuvieron de manera independiente y se calcularon las siguientes medias y varianzas. 𝑦1 = 26400 𝑦2 = 25100 2 𝑠1 = 1440000 𝑠22 = 1960000 EJERCICIO 1 Un investigador esta interesado en la probabilidad de unir aptitudes de televisión e internet. Una muestra aleatoria de n=50 usuarios de internet dio que el tiempo medio semanal empleado en ver televisión era de 11.5 horas. y que la desviación estándar es de 3.5 horas. Estime el tiempo medio poblacional que los usuarios de internet pasan viendo televisión i fije un limite para el error de estimación. EJERCICIO 2 Una agencia de protección ambiental en conjunto con la universidad de Florida recientemente realizó un amplio estudio de los posibles efectos de trazas de elementos en el agua potable sobre la formación de cálculos renales. En la tabla siguiente se muestran los resultados. Los datos de estos individuos son de los diferentes lugares estudiados a) Estime la concentración promedio de calcio en el agua potable para pacientes con cálculos renales en Carolina. Establecer un límite El error es 0.7681 con 2 sigma es +-1.53 b)Calcule la diferencia en edades medias para pacientes con cálculos renales en Carolina y en las rocallosas. Establecer un límite El error es 0.8518 con 2 sigma es +-1.7036 Carolina Rocallosas Tamaño muestral 467 191 Edad promedio 45.1 46.4 Desviación estándar de la edad 10.2 9.8 Componente medio de calcio (ppm) 11.3 40.1 Desviación estándar de calcio 16.6 28.4 Proporción de fumadores en el estudio .78 .66 INTERVALO DE CONFIANZA Es un rango de valores creado a partir de los datos de la muestra, de modo que el parámetro poblacional es probable que ocurra dentro de este rango en probabilidad específica. Que es el nivel de confianza. INTERVALOS DE CONFIANZA 𝑃 𝜃𝐿 ≤ 𝜃 ≤ 𝜃𝑈 = 1 − 𝛼 Si sabemos que la media de la muestra sigue una distribución normal. Podemos utilizar la distribución normal estándar. Para calcular intervalos de confianza 𝜇 ± 𝑧𝜎 Nivel de confianza Probabilidad más cercana Valor z 80% 0.3997 1.28 94% 0.4699 1.88 96% 0.4798 2.05 TODO DEPENDE DEL NIVEL DE CONFIANZA Encontrar el valor z de un nivel de confianza del 92%. Es 1.75 el valor de Z EJERCICIO Una empresa quiere tener informacion sobre el ingreso medio de los gerentes intermedios en la industria detallista. Una muestra aleatoria de 256 gerentes revela una media de la muestra de $45 420. La desviacion estandar de esta muestra es de $ 2050. La empresa busca las respuestas a las preguntas siguientes. ¿Cuál es la media de la población? Igual que la media muestral ¿Cuál es un rango de valores racionales para la media poblacional? Con un NS=90% el valor Z=1.64 P(42058<=M<=48782) ¿Qué significa estos resultados? EJEMPLO Tras varios años de participar en el negocio de la renta de autos, Town Bank, sabe que la distancia media conocida en una renta durante 4 años es de 50 000 millas y la desviación estándar es de 5 000. Se quiere encontrar la proporción de los intervalos de confianza de 95% que van a incluir la media de la población de 50. Para facilitar los cálculos, realizaremos los cálculos en miles de millas y no en millas. Seleccionamos 60 muestras aleatorias de 30 de una población con una media de 50 y una desviación estándar de 5 CALCULANDO EN MINITAB Seleccionar Calc, Random DataNormal SELECCIONES STAT, BASIC STATISTICS 1-SAMPLE-Z DESVIACIÓN ESTÁNDAR DE UNA POBLACIÓN DESCONOCIDA Y UNA MUESTRA PEQUEÑA Cuando se tiene una muestra < a 30 se remplaza la distribución por una distribución t La distribución t es mas plana esto se debe a que la desviación estándar es mayor a la desviación estándar normal Es una distribución continua Es simétrica y con forma de campana No hay una sola sino una familia de distribuciones t INTERVALO DE CONFIANZA PARA LA MEDIA DE LA POBLACIÓN, CON DESVIACIÓN ESTÁNDAR DESCONOCIDA 𝜇 ± 𝑡𝜎 𝑠 𝜎= 𝑛 Solo tomar en cuenta que ahora se utiliza la distribución t (tablas)