1er Parcial de Inferencia (Completo) Inferencia Estadística: Consiste en asignar probabilidades de tal manera que se puedan alcanzar conclusiones para una determinada población partiendo de un experimento o de un muestreo. Las inferencias pueden ser decisiones acerca de la población. Es muy importante puesto que permite hacer estimaciones de los parámetros poblacionales de una población o permite tomar decisiones acerca de hipótesis relacionadas con los parámetros de una población para luego hacer extensivas esas decisiones o estimaciones. Prueba de significancia: tiene como objetivo examinar una hipótesis relacionada con los valores de uno o más parámetros poblacionales. Permite determinar si los resultados obtenidos en un experimento son debidos o no al azar. Experimento: Prueba o series de pruebas en las cuales se hacen cambios deliberados en ciertas variables (variables independientes) y se mide el efecto de esos cambios sobre variables denominadas variables de respuesta o variables dependientes. Un experimento es un cambio en las condiciones de operación de un sistema o proceso que se hace con el objetivo de medir el efecto de ese cambio en una o varias propiedades de un producto. Diseño de experimentos: Mecanismo de recolección de información. Consiste en planear un conjunto de pruebas experimentales, de tal manera que los datos generados puedan analizarse estadísticamente para obtener conclusiones validas, precisas y objetivas acerca de un sistema o proceso. Diseñar un experimento consiste en planificarlo de tal manera que se pueda obtener información valida y precisa sobre un determinado fenómeno que esté investigando. Objetivos del diseño de experimentos: 1. Promover disciplina en la conducción de experimentos. 2. Presentar un considerable número de diseños experimentales útiles en la investigación, así como un conjunto de métodos de análisis estadístico. 3. Enseñar a realizar el análisis estadístico de los datos experimentales, así como interpretar los resultados de esos análisis. Nivel de significancia (α): Riesgo de equivocarse, margen de error fijado por el investigador. Explique porque en todo experimento es necesario que se cumplan los principios básicos del diseño de experimentos. En todo experimento es necesario que se cumplan los tres principios fundamentales del diseño de experimento para garantizar la obtención de conclusiones valederas y precisas con el fin de disminuir el error experimental. Discuta la importancia de la aplicación de los métodos del diseño de experimentos al campo de ingeniería. La experimentación juega un papel fundamental en virtualmente todos los campos de la investigación y el desarrollo. El objetivo de la experimentación es obtener información de calidad. Información que permita desarrollar nuevos productos y procesos, comprender mejor un sistema (un proceso industrial, un procedimiento analítico,...) y tomar decisiones sobre como optimizarlo y mejorar su calidad, comprobar hipótesis científicas, etc. El análisis de los resultados experimentales permitirá obtener conclusiones sobre el sistema en estudio y decidir actuaciones futuras. Explique porque es importante reconocer la diferencia entre la significancia estadística y la significancia práctica cuando se analizan los resultados de un experimento. Porque en muchos casos al realizar un experimento donde la población posee un tamaño muy grande; la muestra puede arrojar resultados estadísticamente significativos pero sin embargo esta puede tener escasa significancia práctica o poco valedera a la hora de tomar decisiones. Discuta las ventajas del diseño de comparaciones pareadas. Las muestras son dependientes: porque cada muestra es sometida a los mismos procedimientos de avaluó a utilizar. Tiene mecanismos de control de la heterogeneidad del material experimental para reducir errores en los resultados generados en un experimento. Balances o control de la heterogeneidad del material experimental mediante la formación de bloques o pares; ya que por medio de estos pueden resultar más heterogéneos que el conjunto total de datos para eliminar la variabilidad y lograr mayor precisión del experimento. Permite comparar 2 tratamientos para estudiar la variabilidad de los datos generados de las muestras en la respuesta observada. Los dos tratamientos deben ser probados en cada par o bloque de manera aleatoria, es decir, que cada uno de ellos tenga la misma posibilidad de ser escogido para aplicarles dichos tratamientos. Mencione los mecanismos de control de la heterogeneidad del material experimental y sus efectos sobre los resultados experimentales. 1. Selección del material experimental homogéneo. Si esto no es posible debe seleccionar material experimental de tal manera que él pueda balancear o controlar los efectos de esa causa de variación. 2. Repetición y aleatorización: Las repeticiones le dan mayor oportunidad a los tratamientos a ser probados en los niveles de productividad o heterogéneos del material experimental. La aleatorización le da igual oportunidad a los tratamientos a ser probados en los distintos niveles de heterogeneidad del material experimental. 3. Uso de un diseño experimental adecuado: a. Diseño que no controla la heterogeneidad del material experimental porque no tiene ningún mecanismo de control: Diseño completamente aleatorizado. b. Diseños que tienen mecanismos de control de la heterogeneidad del material experimental: Diseño de bloques al azar, diseño de cuadrado latino, diseño de rectángulo latino y las variantes del diseño cuadrado latino. Efectos de la heterogeneidad del material experimental sobre los resultados experimentales: - Puede provocar diferencias entre tratamientos que no son productos de que exista una diferencia real entre los tratamientos (un tratamiento es superior a otro cuando lo contrario e cierto). - Puede abultar al error experimental con la inclusión de la variabilidad producto de una causa de variación que no es el azar. - El medio ambiente puede modificar el comportamiento de los tratamientos, entonces se deberá repetir el experimento en el tiempo y en el espacio. Una fábrica de un producto químico ha producido en promedio 825 toneladas por día de ese producto. Las cantidades diarias producidas la semana anterior fueron: 822, 885, 861, 873 y 852 toneladas. Usando α = 0,05, pruebe si estos datos indican que la cantidad promedio por día fabricada del producto es inferior a 825 toneladas. Días 1 2 3 4 5 Cantidades producidas (𝑌𝑖) 822 885 861 873 852 α=0,05 Ho = µ = 825, Ha = µ < 825, _ Tc = 𝑌−µo 𝑆 𝑌 , Tc: valor calculado de t. _ Y: media de las observaciones µo : Valor especificado por el fabricante. 𝑆 𝑌 : Error típico de la media, 𝑆 𝑌 = 𝑆 √𝑛 S: desviación típica, S = √𝑆 2 𝑆 2 : Variancia, 𝑆 2 = ∑𝑌𝑖 2 − (∑𝑌𝑖 2 )/𝑛 𝑛−1 _ Y= ∑𝑌𝑖 𝑛 , n: numero de observaciones. _ Y= ∑𝑌𝑖 𝑛 𝑆2 = = 822+885+861+873+852 5 ∑𝑌𝑖 2 − (∑𝑌𝑖)2 /𝑛 𝑛−1 = = 858,6 3688263−3685969.8 4 = 573.3 S = √𝑆 2 = √573.3 = 23.94 𝑆 𝑌 𝑆 = √𝑛 = 23.94 √5 = 10.70 _ Tc = 𝑌−𝑈𝑜 𝑆 𝑌 = 858.6 − 825 10.70 = 3.13 Con n – 1 grados de libertad (5 -1): 4 grados de libertad = 2.132 Reglas de decisión: Tc < -Tt → Rechazar Ho Tc > -Tt → Aceptar Ho 3,14 > - 2.132 Se decide aceptar Ho. Conclusión: Se decide aceptar que las toneladas diarias que se producen del producto químico son 825 toneladas, es decir, no es menos a 825 toneladas. Pr ≥ l t l = 0,0349 Reglas de decisión para Pr ≥ l t l: (Pr > l t l) > α Aceptar Ho (Pr > l t l) < α Rechazar Ho En este caso 0,0349 < α entonces se rechaza Ho. Un nuevo dispositivo de filtrado se instala en una planta química. Antes de su instalación, se tomó una muestra aleatoria de 9 observaciones y se obtuvo que la media del porcentaje de impurezas fuera igual a 27,9 por ciento y que la variancia de esas observaciones fuera 80,7. Después de la instalación del dispositivo, una muestra aleatoria de 8 observaciones permitió determinar que la media del porcentaje de impurezas fue 16,8 por ciento y la variancia 59,33. a) ¿Puede concluirse que las variancias son estadísticamente iguales? Use α = 0,05. b) ¿Puede concluirse que el dispositivo de filtrado ha reducido el porcentaje de impurezas en forma significativa? Use α = 0,01. 1. Variable de interés: porcentaje de impurezas. 2. Ho = µa = µb 3. Ha = µa > µb 4. Estadístico de prueba. _ Tc = _ Ya – Yb – (µa − µb) 𝑆𝑌𝑎 − 𝑌𝑏 _ Ya = 27,9% 𝑆 2 𝑎 = 80,7 _ Yb = 16,8% 𝑆 2 𝑏 = 59,33 Prueba de homogeneidad (Prueba de F) Ho = 𝑆 2 𝑎 = 𝑆 2 𝑏 Ha = 𝑆 2 𝑎 ≠ 𝑆 2 𝑏 Fc = Fc = max(𝑆 2 𝑎, 𝑆 2 𝑏) 𝑐𝑜𝑛 (𝑛𝑎−1)𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 min((𝑆 2 𝑎, 𝑆 2 𝑏) 𝑐𝑜𝑛 (𝑛𝑏−1)𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 max(80.7) 𝑐𝑜𝑛 (9−1)𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 min( 59.33) 𝑐𝑜𝑛 (8−1)𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 Fc = 80.7 59.33 8 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 = 1.36 7 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 Ft α/2 = 4.90 Reglas de decisión: Fc > Ft α/2 Rechaza Ho (Estadísticamente diferentes) Fc < Ft α/2 Acepta Ho (Estadísticamente iguales) 1.36 < 4.90 Acepta Ho → son estadísticamente iguales. _ _ Tc = 0 Ya – Yb – (µa − µb) (µa = µb) → (µa − µb = 0) 𝑆𝑌𝑎 − 𝑌𝑏 𝑆𝑌𝑎 − 𝑌𝑏 = 𝑆𝑝 √ 1 𝑛𝑎 + 1 𝑆𝑝 = √𝑆𝑝 2 𝑛𝑏 𝑆𝑝 2 = (𝑛𝑎 −1) 𝑆𝑎 2 + (𝑛𝑏 −1) 𝑆𝑏 2 𝑆𝑝 2 = (8∗80.7) + (7∗59.33) 𝑛𝑎+𝑛𝑏−2 9+8−2 = (645.6 + 415.31) 15 𝑆𝑝 = √70.73 = 8.41 1 1 9 8 𝑆𝑌𝑎 − 𝑌𝑏 = 8.41 √ + Tc = na = 9 27.9 – 16.8 4.08 = 4.08 = 2.72 Grados de libertad: na + nb – 2 = 9 + 8 -2 = 15 Tt = 2.947 Reglas de decisión: Tc < Tt Acepta Ho Tc > Tt Rechaza Ho = 70.73 nb = 8 2.72 < 2.947 Aceptar Ho. No se ha reducido impurezas significativamente. Se rechaza la alternativa. Los datos siguientes se relacionan con los accidentes en una fábrica que causan pérdidas de tiempo por mes en un periodo de un año (los datos son los números promedios de horas-hombre perdidas por mes en un periodo de un año) antes y después de ponerse en marcha un programa de seguridad industrial en seis plantas industriales. Antes del programa Después del programa 1 42 38 2 44 31 Planta 3 4 55 42 35 24 5 69 38 6 49 33 a) ¿Proporcionan los datos suficiente evidencia para concluir que el programa de seguridad industrial fue efectivo en reducir los accidentes que causan pérdidas de tiempo en la fábrica? Use α = 0.05 y el valor Pr> l t l reportado por el SAS. b) Haga el programa que permita analizar los datos usando el SAS. 1. Variable de interés: Horas-Hombres trabajadas. 2. Ho : µd = 0 3. Ha: µd > 0 (ha reducido) 4. Estadístico de prueba. _ Tc = 𝑑− µ𝑑 𝑆𝑑 con (nd – 1) grados de libertad. _ d= ∑𝑑𝑖 𝑛𝑑 𝑆𝑑 = 2 𝑆 = 𝑆2 = = −4 −13−20−18 −31−16 6 𝑆𝑑 = −17 → Sd = √𝑆2 √𝑛𝑑 ∑𝑑𝑖 2 − (∑𝑑𝑖)2 /𝑛𝑑 𝑛𝑑−1 2126+1734 5 = = 78.4 42 + 132 + 202 + 182 + 312 + 162 + 5 [(4+13+20+18+31+16)2 ] 6 𝑆𝑑 = √78.4 = 8.85 𝑆𝑑 = 8.85 √6 _ Tc = = 3.61 0 𝑑− µ𝑑 𝑆𝑑 = 17 3.61 = 4.71 con (nd – 1) grados de libertad = 5 α=0.05 Tt = 2.571 Reglas de decisión: Tc > Tt Rechazar Ho Tc < Tt Aceptar Ho 4.71 > 2.571 Rechaza Ho Reglas de decisión: (Para 1 cola) (Pr > l t l)/2 > α Acepto Ho (Pr > l t l)/2 < α Rechazo Ho 0.00265 < 0.05 Rechaza Ho Conclusión: Si Proporciona los datos suficientes para establecer que el programa de seguridad industrial es efectivo. OPTIONS LS=79; TITLE1 DISEÑO DE COMPARACIONES PAREADAS; TITLE2 PRUEBA DE QUE UN PROGRAMA DE SEGURIDAD INDUSTRIAL REDUCE ACCIDENTES; DATA PAR; INPUT PLANTA DESPUES ANTES; DATALINES; 1 38 42 2 31 44 3 35 55 4 24 42 5 38 69 6 33 49 ; PROC PRINT DATA=PAR; PROC TTEST H0=0 ALPHA=0.05; PAIRED DESPUES*ANTES; RUN; DISEÑO DE COMPARACIONES PAREADAS PRUEBA DE QUE UN PROGRAMA DE SEGURIDAD INDUSTRIAL REDUCE ACCIDENTES The TTEST Procedure Statistics Difference N Lower CL Mean Mean Upper CL Mean Lower CL Std Dev Std Dev DESPUES - ANTES 6 -26.29 -17 -7.708 5.527 8.8544 Statistics Difference Upper CL Std Dev Std Err Minimum Maximum 21.716 3.6148 -31 -4 DESPUES - ANTES T-Tests Difference DESPUES - ANTES DF t Value Pr > |t| 5 -4.70 0.0053 2 OPTIONS LS=79; TITLE PRUEBA DE QUE LA MEDIA DE PRODUCCION DE UN PRODUCTO QUIMICO ES INFERIOR A 825 TONS POR DIA; DATA PRODUCTO; INPUT PRODUCCION; DATALINES; 822 885 861 873 852 ; PROC PRINT DATA=PRODUCTO; PROC TTEST H0=825 ALPHA=0.05; VAR PRODUCCION; RUN; PRUEBA DE QUE LA MEDIA DE PRODUCCION DE UN PRODUCTO QUIMICO ES INFERIOR A 825 The TTEST Procedure Statistics Variable N Lower CL Mean Mean Upper CL Mean Lower CL Std Dev Std Dev Upper CL Std Dev PRODUCCION 5 828.87 858.6 888.33 14.345 23.944 68.804 Statistics Variable PRODUCCION Std Err Minimum Maximum 10.708 822 885 T-Tests Variable PRODUCCION DF t Value Pr > |t| 4 3.14 0.0349