Estadística-MA444 Solucionario Taller para el Examen Final Ciclo 2020-1 CASO: ROBOTEX La empresa Robotex, fabrica robots aspiradora, con bastante aceptación en el mercado. Por los avances de la robótica, este robot además de aspirar el polvo trapea el piso y aspira alfombras todo ello de manera inteligente, siendo capaces de “mapear” las habitaciones de una casa, reconociendo y evitando obstáculos (muebles, escaleras, etc.), además de optimizar el tiempo de aspirado al no volver a pasar dos veces por el mismo lugar. El Ing. Mariano Dueñas, jefe del Departamento de Desarrollo de Productos de Robotex, es el encargado de diseñar y ensamblar los diferentes modelos que comercializa Robotex. Su trabajo es muy especializado porque debe verificar una serie de componentes y tecnologías para el buen funcionamiento de los robots. El directorio le encarga junto a su equipo que propongan un plan de mejora del robot aspiradora modelo CX5. La primera parte de la implementación de su plan de mejora consiste en analizar y proponer algunas de las siguientes medidas: 1. Ampliar el período de garantía del robot aspiradora. 2. Seleccionar la cámara para el robot aspiradora que le reporte “mapear” mayor cantidad promedio de puntos. 3. Seleccionar la batería para el robot aspiradora que le brinde un mayor tiempo promedio de duración. Objetivo N° 1: Ampliar el período de garantía máximo del robot aspiradora El equipo de mejora propondrá ampliar el plazo de garantía de su robot aspiradora modelo CX5 a 5 años, siempre y cuando no más del 3% de los robots vendidos de ese modelo fallen antes de los 5 años. Por otro lado, se sabe que el tiempo de vida de los robots modelo CX5 sigue una Distribución Normal con media 10 años y desviación estándar de 2 años. ¿Recomendaría Usted al equipo ampliar el periodo de garantía? Interpretación: Determinar si se debe ampliar el Gerente de Ingeniería a 5 años el plazo de garantía de los robots aspiradora modelo CX5. Representación: Variable: X = Tiempo de vida (en años) del robot aspiradora modelo CX5 Distribución y parámetros: X~N(10; 2) OJO: VARIABILIDAD DE 4 AÑOS2 VARIANZA VARIABILIDAD DE 4 AÑOS DESVIACIÓN ESTÁNDAR Cálculo: 𝑃(𝑋 < 5) = 𝑃 (𝑍 < 5 − 10 ) = 𝑃(𝑍 < −2.5) = 0.00621 2 Análisis: 0.00621 < 0.03 SE CUMPLE LA CONDICIÓN Argumentación: Se recomienda al Gerente de Ingeniería ampliar el plazo de garantía a 5 años. Objetivo N° 2: Seleccionar la cámara para el robot aspiradora que le reporte “mapear” mayor cantidad promedio de puntos Los robots aspiradora de última generación, utilizan cámaras para realizar un mapeo de las habitaciones de la casa a limpiar, ya que optimizan el tiempo de aspirado al no dejar espacios sin limpiar ni pasar 2 veces por el mismo lugar. El equipo evalúa dos posibles marcas de cámaras para ensamblar su modelo CX5, para esto, elige un lote de cámaras de la marca A y otro de la marca B. En base al resultado de varias pruebas, tiene la sospecha que la cámara marca A es capaz de mapear en promedio una mayor cantidad de puntos que la cámara marca B. Con un nivel de significancia del 5% y asumiendo que el número de puntos sigue una distribución normal, ¿qué marca de cámara recomendará el equipo ensamblar el robot aspiradora modelo CX5? Cámaras Marca A (1) 238 puntos/seg. 105.387 (puntos/seg)2 14 Media (en miles de unidades) Varianza (en miles de unidades) Nro. de cámaras probadas Cámaras Marca B (2) 232 puntos/seg. 96.489 (puntos/seg)2 13 Considere que las varianzas del número de puntos de las cámaras marcan A y B son distintas. Interpretación: Determinar la marca de cámaras con la cual ensamblar el robot aspiradora modelo CX5. Representación: 𝐻𝑜 : 𝜇𝐴 ≤ 𝜇𝐵 𝐻1 : 𝜇𝐴 > 𝜇𝐵 Cálculo: 𝑺𝟐 t ( x1 x 2 ) (1 2 ) S12 S22 n1 n 2 𝑡𝑐 = ~ t ( v) 𝒗= (238 − 232) − 0 √105.387 + 96.489 14 13 𝑺𝟐 𝟐 (𝒏𝟏 +𝒏𝟐 ) 𝟏 𝟐 𝟐 𝟐 𝑺𝟐 ( 𝟐) 𝒏𝟐 + 𝒏𝟏 −𝟏 𝒏𝟐 −𝟏 𝑺𝟐 ( 𝟏) 𝒏𝟏 = 1.5518 105.387 96.489 2 ( 14 + 13 ) 𝑣= = 24.9728 ≈ 24 105.387 2 96.489 2 ( 14 ) ( 13 ) + 13 12 Análisis: Como tc=1.5518 < 1.71088 Ho No se rechaza Ho Por lo tanto, con un nivel de significancia del 5%, no existe evidencia estadística para afirmar que el número de puntos por segundo que mapea la cámara marca A es mayor que el número de puntos que mapea la marca B. Argumentación: Por lo tanto, recomendamos al Gerente de Ingeniería ensamblar los robots aspiradora con las cámaras marca B. Objetivo N° 3: Seleccionar la batería para el robot aspiradora con mayor tiempo promedio de duración. El equipo de mejora ha establecido que se elegirá la batería para el robot aspiradora modelo CX5 que registre mayor tiempo promedio de duración, para ello evaluará el tiempo de duración de tres marcas de baterías de diversos fabricantes, sometiendo a pruebas una muestra de baterías de cada marca. Los resultados obtenidos se muestran en el Cuadro N°1. Total Cuadro N° 1: Tiempo de duración de las baterías (en minutos) Batería A Batería B Batería C 177 188 185 182 194 185 186 193 187 178 190 181 181 191 180 186 194 179 177 190 187 1267 1527 1097 El cuadro N°2 muestra la tabla del ANOVA con algunos datos faltantes. Asimismo, el cuadro N°3 muestra los resultados del análisis de comparaciones múltiples de Tukey. Cuadro N° 2: Tabla de Análisis de Varianza (ANOVA) Suma de Grados de Cuadrado Fuente de variación cuadrados libertad medio Tratamientos Error Total 414.5774 193.7086 608.286 3-1=2 18 21-1=20 207.2887 10.7616 F 19.2619 Con un nivel de significación del 5%, ¿qué marca de batería propondrá el equipo de mejora para la fabricación del robot aspiradora modelo CX5. Representación: Factor: Marca de la batería. Tratamientos: Marca A, Marca B, Marca C. Variable respuesta: Tiempo de duración de la batería (en minutos). Unidad experimental: Una batería. Herramienta: ANVA. Hipótesis: 𝐻0 : 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑢𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎𝑠 𝑑𝑒𝑚á𝑠 Nivel de significancia: 𝛼 = 0.05 Cálculo: Cuadro N° 2: Tabla de Análisis de Varianza (ANOVA) Suma de Grados de Cuadrado Fuente de variación cuadrados libertad medio Tratamientos Error Total 414.5774 193.7086 608.286 3-1=2 18 21-1=20 207.2887 10.7616 F 19.2619 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 (0.05, 2,18) = 3.6823 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 19.2619 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑜 (0.05, 2,15) = 3.6823 → 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜 Conclusión: Con un 5% de significancia, podemos afirmar que al menos una de las marcas de batería tiene un tiempo de duración diferente. Según la Prueba de Tukey: No hay diferencia significativa en el tiempo de duración promedio de la batería de la Marca C y Marca A, siendo el tiempo de duración promedio de la batería de la Marca B mayor que las demás. Por lo tanto, la batería con la que se deberá fabricar los robots aspiradora es de la marca B ya que tienen un tiempo de duración promedio mayor que las otras marcas. Caso: El Drone El drone es un pequeño vehículo volador remotamente controlado por un operador. Estos pueden ser manejados en la pantalla del Smartphone, por lo general, están compuestos de fibra de carbono, materiales metálicos y de plástico muy poco. El fuselaje del aparato es también una placa lógica que contiene los sistemas de navegación y control. En este circuito, hay un chip GPS que permite precisar más el vuelo libre de navegación. Objetivo N° 1: Comparar la variabilidad de los tiempos empleados en la fabricación de la batería para los drones El área de producción del fabricante SUPERDRONE registró el tiempo empleado en la fabricación de la batería de ion de litio que llevan los drones del modelo CX-STAR. Para una muestra de 18 drones se tienen los siguientes tiempos: Asimismo, el área de producción del fabricante AEROVIRONMENT mostró la información del tiempo empleado en la fabricación de la batería de ion litio de los drones modelo JJRCH20, para una muestra de 50 drones: Tiempo empleado 𝑿 = 𝟑, 𝟖𝟐 𝒎𝒊𝒏. S= 1,76 min. Un supervisor de la International Consumer Electronics desea comparar la variabilidad de los tiempos empleados en la fabricación de la batería para los drones y entregará un reconocimiento al fabricante que presente tiempos más homogéneos. ¿A qué fabricante se le entregará el reconocimiento? Interpretación: Determinar a cuál fabricante se le deberá entregar el reconocimiento. Representación: Variable: *Tiempo de fabricación de la batería del fabricante SUPERDRONE *Tiempo de fabricación de la batería del fabricante AEROVIRONMENT Herramienta estadística: Coeficiente de variación Cálculo: Fabricante SUPERDRONE Fabricante AEROVIRONMEN 2,7839 1,2380 3,82 1,76 44,47% 46,07% PROMEDIO DESVIACION ESTANDAR CV (%) Análisis: CV(SUPEDRONE) =44,47% < CV(AEROVIRONMENT)= 46,97% Los tiempos de fabricación de las baterías del fabricante SUPERDRONE son más homogéneas. Argumentación: Por lo tanto, se le entregara el reconocimiento al fabricante SUPERDRONE. Objetivo N° 2: Uso de la bateria marca Syma X5c El jefe del área de producción de drones del fabricante AVDRONE está evaluando utilizar un tipo de batería para un nuevo modelo de drone. El tiempo de duración de esta marca de batería sigue una distribución exponencial con una duración promedio de 27 minutos. Si el jefe del área de producción está buscando una batería que dure por lo menos 23 minutos, y analizando la probabilidad de duración que sea de a lo más 50%, ¿debería utilizar la batería para el nuevo modelo de drone? Interpretación: Determinar si utilizará la batería para el nuevo modelo de drone. Representación: Variables: X: Tiempo de duración de la batería marca Syma X5c (min) X tiene exp(β=27) Herramienta estadística: Cálculo de la probabilidad para distribución exponencial. Cálculo: P(X≥23) = e-(23/27) = 0,4266 = 42.66% Análisis: P(X≥23) = 0,4266 = 42.66% <= 50% CUMPLE LA CONDICION Argumentación: Por lo tanto, se debe utilizar la batería marca batería marca Syma X5c por cumplir con la probabilidad de duración. Objetivo N° 3: Identificar si se da el cambio de proveedor para optimizar la señal de los drones Los drones utilizan un chip GPS que captan las ondas electromagnéticas emitidas por los satélites, estos logran que el tiempo de recepción de la señal de los drones sea óptima. En la última semana la empresa AVDRONE ha recibido lotes de chip de su proveedor Robotic 3D. El jefe de producción tomará la decisión de cambiar de proveedor, esto es comprar a NanoTec, si el tiempo promedio de la recepción de la señal es menor que la de Robotic 3D. Para ello seleciona dos muestras aleatorias de 11 drones que utilizan los chips de Nano Tec y Robotic 3D, la información se muestra en la siguiente tabla: Nano Tec (1) Robotic 3D (2) n1=11 n2=11 𝑿𝟏 = 𝟔𝟓 miliseg. 𝑋2 = 69,5 miliseg. S1= 20 miliseg. S2= 12 miliseg. Al nivel de significación del 5%, Asumir varianzas homogéneas y se distribuyen normalmente. ¿el jefe de producción de AVDRONE debe cambiar a Nano Tec o seguir con el proveedor Robotic 3D? Interpretación: Determinar si AVDRONE debe cambiar de proveedor de los chips para GPS. Representación: Variables: X1: tiempo de recepción de la señal del chip del proveedor Nano Tec (miliseg) X2: tiempo de recepción de la señal del chip del proveedor Robotic 3D (miliseg) Parametros: u1: tiempo promedio de recepción de la señal del chip Nano Tec (miliseg) u2: tiempo promedio de recepción de la señal del chip Robotic 3D (miliseg) Herramienta estadística: Prueba de hipótesis para diferencia de medias con varianzas homogeneas Hipótesis: Ho: 1 - 2 ≥ 0 (seguir con Robotic 3D) H1: 1 -2 < 0 (se debe cambiar a Nano Tec) Nivel de significancia: =0,05 Cálculo: _ 𝑡= _ (𝑥1 − 𝑥2 ) − (𝜇1 − 𝜇2 ) 𝑑𝑜𝑛𝑑𝑒 ~𝑡(𝑛1 +𝑛2 −2) 1 +𝑛 ) 2 (𝑛 − 1)𝑆12 + (𝑛2 − 1)𝑆22 1 2 𝑆𝑝 = 𝑛1 + 𝑛2 − 2 1 √𝑆𝑝2 ( 𝑛1 𝑡𝐶 = 65 − 69,5 − 0 √272 ( 1 + 1 ) 11 11 𝑆𝑝2 = = −0,6399 (11−1)202 +(11−1)122 11+11−2 = 272 Como Tc=-0,6399 > Tcritico= -1,72472 No se rechaza H0 Conclusión: con un nivel de significación del 5% no existe evidencia estadística para afirmar que el tiempo promedio de recepción de la señal en el chip del proveedor Nano Tec sea menor que el tiempo promedio de recepción de la señal en el chip del proveedor de Robotic 3D. Argumentación: Por lo tanto, se debe seguir con el proveedor Robotic 3D. Objetivo N° 4: Identificar la relación entre la temperatura del medio ambiente y el tiempo de vuelo de los drones del modelo CX-STAR. El área de producción del fabricante NanoTec registró el tiempo de vuelo de los drones del modelo CX-STAR en función de la temperatura del medio ambiente. Para una muestra de 10 drones se tienen los siguientes resultados: Temperatura (°C)_ X Tiempo de _Y vuelo (minutos) 25 26 20 25 23 18 18 20 21 22 8 9 10.3 8.4 8.6 12.5 14 11.50 8.9 10 ANOVA Fuente Regresión Error Total GL SC CM 8 35,176 a. Obtenga el modelo estimado de regresión lineal simple. 𝑦̂ = 𝛽̂0 + 𝛽̂1 𝑥 F 𝛽̂1 = 𝑛(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 ) − (∑𝑛𝑖=1 𝑥𝑖 )(∑𝑛𝑖=1 𝑦𝑖 ) 𝑛(∑𝑛𝑖=1 𝑥𝑖2 ) − (∑𝑛𝑖=1 𝑥𝑖 )2 𝛽̂0 = 𝑦̄ − 𝛽̂1 𝑥̄ Teniendo como resultados: 𝛽̂0 = 22.9405 𝛽̂1 = −0.5881, ̂ = 𝟐𝟐, 𝟗𝟒𝟏𝟓 − 𝟎. 𝟓𝟖𝟖𝟏 ∗ 𝑿 𝒀 Y=Duración del tiempo de vuelo (min) X= Temperatura (ºC) b. Interprete el coeficiente de regresión. ̂ 𝟏 = −𝟎. 𝟓𝟖𝟖𝟏 Si la temperatura se incrementa en 1ºC, entonces la duración del tiempo de 𝜷 vuelo disminuye en promedio 0.5881 minutos. c. Valide el modelo estimado. Use un =0.05. 𝑆𝐶𝑇 = ∑ 𝑦𝑖2 − (∑ 𝑦𝑖 )2 𝑛 = 35.176 2 (∑ 𝑥𝑖 ) 𝑆𝐶𝑅𝑒𝑔 = 𝛽̂12 (∑ 𝑥𝑖2 − )= 26.1467 𝑛 SCE = SCT - SCReg CMReg = SCReg/glreg = 26,1467/1 = 26,1467 CMError = SCError/glerror = 9,0293/8 = 1,1287 Fcal = 26,1467/1,1287 = 13,1653 Fuente GL SC CM F Regresión 1 26,1467 26,1467 23,1653 Error 8 9,0293 1,1287 Total 10-1=9 35,176 Hipótesis: H0: β1=0 H1:β1≠0 Nivel de significancia: =0,05 Fcrit= F(0,05,1,8) = 5,32 Decisión: como Fc= 23,1677 > 5,32 H0 se rechaza Conclusión: Con un nivel de significancia del 5%, el modelo de regresión lineal simple es válido. d. Determine e interprete el coeficiente de determinación. 𝑟2 = R2 = 26,1467 ∗ 35,176 𝑆𝐶𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 100= 74,33% El 74,33% de la variabilidad en la duración del tiempo de vuelo de los drones es explicado por la temperatura del medio ambiente. e. Estime el tiempo de vuelo cuando la temperatura del medio ambiente es 24°C. ̂ = 22,9405 − 0,5881(24) = 8,8256minutos Para X0=24 °C Y Caso: Dipsos a. El director de la empresa encuestadora desea estimar la proporción de ciudadanos que apoyan realizar cambios en la constitución política sobre la inmunidad de los parlamentarios. En una muestra piloto de 60 ciudadanos, 55 apoyan la propuesta de cambios. ¿Qué tamaño de muestra necesita seleccionar si desea una confianza del 95% y un error de estimación máximo de 0.04? Nivel de confianza: 95%, OJO: alfa = 1- Nivel de confianza alfa = 0.05 entonces Z (0.975) = 1.96 Margen de error: e = 0.04 p= 55/60 = 0.9167 𝑛= 1.962 ∗ 0.9167(1 − 0.9167) = 183,3430 ≈ 184 0.042 REDONDEO AL EXCESO b. La empresa actualmente tiene 1800 miembros. El gerente desea estimar la media del tiempo, en horas, que dedican los miembros en realizar sus trabajos. ¿De qué tamaño se necesita una muestra si deseamos tener 98% de confianza con un margen de error de 1.25 horas? En una muestra piloto de 40 miembros se obtuvo una desviación estándar de 7.5 horas. Nivel de confianza: 98%, OJO: alfa = 1- Nivel de confianza alfa = 0.02 entonces Z (0,99) = 2.33 Margen de error: e = 1,25 Desviación estándar: S = 7,5 2.33 ∗ 7.5 2 𝑛=( ) = 195.4404 ≈ 196 1.25 Como N=1800, entonces aplicamos el tamaño de muestra corregida: 𝑛 196 𝑛𝑐 = = 176,75357 ≈ 177 𝑛= 196 1+𝑁 1 + 1800