Estadística. Convocatoria extraordinaria Junio de 2015 Nombre………………………………………………………………………………. Titulación…………………………………………………… Grupo…………… Pregunta 1 (0.5 puntos) Boxplot A 0.0 0.3 0.6 Density Histogram 1 0 2 4 6 8 0 2 Boxplot B 0.15 -2 0 2 4 6 0 2 4 6 8 0.25 Boxplot D C 0.00 Density Histogram 4 3 0 2 4 6 8 -1 0 1 2 3 Boxplot C D 0.0 0.2 0.4 Histogram 3 4 Density 6 0.00 Density Histogram 2 4 -1 0 1 2 3 4 -2 0 2 Rellenar la tabla indicando qué Boxplot se corresponde con cada histograma. Histograma 1 2 3 4 Boxplot 4 4 Pregunta 2 (1.5 puntos) Tres personas, A, B, C, juegan lanzando una moneda cada una al dar una señal, y comparan los resultados. Gana el jugador cuya moneda cae en posición distinta de la de los otros dos; si las tres monedas caen en la misma posición, se repite el lanzamiento hasta que una sea diferente. Suponiendo que no se hacen trampas y que se usan monedas equilibradas, se pide: 1. Describir el espacio muestral (conjunto de posibles resultados del experimento) asociado a una ronda de lanzamientos. 2. ¿Cuál es la probabilidad de ganar del jugador A?, ¿y del B y el C? 3. Calcular la probabilidad de que, en una serie de seis partidas, C pierda, al menos cinco veces. 4. Si C gana, al menos una partida de seis, calcula la probabilidad de que gane exactamente dos partidas. Pregunta 3 (1.5 puntos) Se sabe que el diámetro en mm de unas piezas se distribuye normalmente con media 10 y desviación típica 1. Una pieza es aceptable si su diámetro está comprendido entre 9 y 11 mm. Cada pieza es independiente de las demás y son empaquetadas en lotes de 10. Con los datos de la tabla adjunta se pide: Área Cola Superior (>) Variable N(10,1) 8 0,97725 9 0,841345 10 0,5 11 0,158655 12 0,02275 1. Calcular la probabilidad de que una pieza sea aceptable. 2. Calcular la probabilidad de que en un lote de 10 piezas haya al menos 9 aceptables. 3. El diámetro en mm de otras piezas fabricadas en la misma empresa se distribuye normalmente con media 11 y desviación típica 1. Calcular la probabilidad de que el diámetro de una de estas piezas esté comprendido entre 9 y 11 mm. Pregunta 4 (2 puntos) La variable Tiempos contiene el resultado de un ensayo en que se han medido los tiempos de respuesta en minutos al Call Center de una empresa de servicios. En la columna de la izquierda se presentan los datos ajustados mediante una distribución exponencial. En la de la derecha los mismos datos se ajustan a una distribución triangular. Distribución Exponencial Función de densidad Distribución triangular f(x)=k e-kx, x>0 Función de densidad f(x)=13+kx , 0<x<b Histograma para Tiempos Histograma para Tiempos 30 30 Distribución Triangular 25 25 f recuen cia 20 frecuencia 20 15 15 10 10 5 5 0 0 0 10 20 30 40 50 Tiempos 0 10 20 30 40 50 Tiempos Pruebas de Bondad-de-Ajuste para Tiempos Prueba Chi-Cuadrada Pruebas de Bondad-de-Ajuste para Tiempos Prueba Chi-Cuadrada Chi-Cuadrada = 7,14125 con 10 g.l. Valor-P = 0,712046 Chi-Cuadrada = 36,8001 con 11 g.l. Valor-P = 0,000124462 Áreas de Cola para Tiempos Distribución Exponencial X Área Cola Inferior (<) 8,0 0,572639 9,0 0,615723 10,0 0,654464 11,0 0,689299 12,0 0,720622 Área Cola Superior (>) 0,427361 0,384277 0,345536 0,310701 0,279378 Áreas de Cola para Tiempos Distribución Triangular X Área Cola Inferior (<) 8,0 0,342983 9,0 0,381366 10,0 0,418594 11,0 0,454666 12,0 0,489584 Área Cola Superior (>) 0,657017 0,618634 0,581406 0,545334 0,510416 1. Elige el modelo correcto e indica por qué lo haces. Justifica bien la respuesta. 2. Continúa con el modelo correcto. Calcula el valor de K con los datos proporcionados por las áreas de las colas. 3. Calcula la media de tiempo de espera en la atención del Call Center. 4. ¿Qué probabilidad hay de habiendo esperado ya 8 minutos, tener que esperar al menos tres minutos más? Pregunta 5 (0.75 puntos) Se realiza una encuesta a 500 españoles y se les pregunta si creen que la situación económica está mejorando. De entre los encuestados, 265 (el 53%) contestan que sí. ¿Hay mayoría de españoles que piensen que realmente está mejorando la economía? Contesta a la pregunta eligiendo el contraste correcto y utilizando nivel de significación 0.05. Datos muestrales H0 H1 Tipo de contraste p-valor Conclusiones Pruebas de Hipótesis Pruebas de Hipótesis Pruebas de Hipótesis Proporción de muestra = 0,53 Tamaño de muestra = 500 Proporción de muestra = 0,53 Tamaño de muestra = 500 Proporción de muestra = 0,53 Tamaño de muestra = 500 Intervalo aproximado del límite superior de confianza del 95,0% para p: [0,567509] Intervalo aproximado del límite inferior de confianza del 95,0% para p: [0,492226] Intervalo aproximado de confianza del 95,0% para p: [0,485186;0,574458] Hipótesis Nula: proporción = 0,5 Alternativa: menor que Valor-P = 0,917182 Hipótesis Nula: proporción = 0,5 Alternativa: mayor que Valor-P = 0,0973291 Hipótesis Nula: proporción = 0,5 Alternativa: no igual Valor-P = 0,194658 Pregunta 6 (1.25 puntos) El archivo utilizado en este análisis contiene datos de resistencia a tracción de barras de acero. Se desea calcular la capacidad de este proceso de fabricación y para ello se toman 25 muestras de tamaño 4 de la variable Resistencia a la Tracción (gr/mm2). En la siguiente tabla se muestran los resultados del análisis inicial. Gráfico de Rangos para Resistencia Tracción 120 100 94,22 Rango 80 60 41,30 40 20 0 0,00 0 5 10 15 20 25 4 Gráfico X-bar para Resistencia Tracción 970 959,25 950 X-bar Gráfico X-bar Período #1-25 LSC: +3,0 sigma 959,247 Línea Central 929,16 LIC: -3,0 sigma 899,073 1 fuera de límites Gráfico de Rangos Período #1-25 LSC: +3,0 sigma 94,2178 Línea Central 41,3 LIC: -3,0 sigma 0,0 1 fuera de límites Estimados Período #1-25 Media de proceso 929,16 Sigma de proceso 20,0583 Rango promedio 41,3 Sigma estimada a partir del rango medio 930 929,16 910 899,07 890 0 5 10 15 4 20 25 Subgrupo 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 11,0 12,0 Tamaño 4 4 4 4 4 4 4 4 4 4 4 4 X-bar 906,75 914,375 925,125 935,375 925,5 915,25 939,75 918,5 937,625 932,5 942,125 938,5 Rango 37,5 45,0 36,5 24,5 14,0 25,5 27,5 46,5 32,0 41,5 11,0 * 114,0 Subgrupo 13,0 14,0 15,0 16,0 17,0 18,0 19,0 20,0 21,0 22,0 23,0 24,0 25,0 Tamaño 4 4 4 4 4 4 4 4 4 4 4 4 4 X-bar 930,5 916,125 918,125 944,875 903,125 937,375 * 961,625 939,375 926,5 927,5 928,625 925,75 938,125 Rango 51,5 19,5 49,5 27,5 37,0 23,5 78,5 37,0 51,5 44,5 55,0 56,0 46,0 Sabiendo que para n=4 d2=2.059, D3=0 y D4= 2.282 y para n=3 d2= 1.693, D3=0 y D4= 2.575. Se pide: 1. Calcula la línea media, y límites de control superior e inferior para los gráficos finales de medias y rangos para muestras de tamaño 4 y estima la capacidad. 2. Calcula los límites de control para el gráfico de medias si posteriormente se decide monitorizar esta resistencia a la tracción con muestras de tamaño 3. Pregunta 7 (1.5 puntos) Se ha realizado una encuesta entre los usuarios del servicio de pago de tributos de un ayuntamiento. Se les pregunta por la Satisfacción Global con el servicio recibido y por la valoración de la Eficiencia en la realización de la gestión, la Rapidez y la Disponibilidad de los empleados. Se desea estudiar cómo influyen las variables Eficiencia, Rapidez y Disponibilidad en la satisfacción de los ciudadanos. Para ello se construyen diversos modelos de regresión que se muestran a continuación. Variable dependiente: Satisfacción Global Variables independientes: Eficiencia Error Estadístico Parámetro Estimación Estándar T CONSTANTE 2,04629 0,543389 3,7658 Eficiencia 0,53013 0,0813362 6,51776 R-cuadrada = 24,4875 porciento R-cuadrado (ajustado para g.l.) = 23,9111 porciento Variable dependiente: Satisfacción Global Variables independientes: Disponibilidad Parámetro CONSTANTE Disponibilidad Estimación 2,15191 0,687819 Error Estándar 0,348673 0,0670301 Estadístico T 6,17172 10,2614 R-cuadrada = 44,5609 porciento R-cuadrado (ajustado para g.l.) = 44,1377 porciento Variable dependiente: Satisfacción Global Variables independientes: Rapidez Disponibilidad Error Estadístico Parámetro Estimación Estándar T CONSTANTE 0,0969208 0,393952 0,246022 Rapidez 0,439768 0,0570648 7,70646 Disponibilidad 0,543154 0,0588235 9,23362 R-cuadrada = 61,9457 porciento R-cuadrado (ajustado para g.l.) = 61,3603 porciento Valor-P 0,0002 0,0000 Valor-P 0,0000 0,0000 Valor-P 0,8061 0,0000 0,0000 Variable dependiente: Satisfacción Global Variables independientes: Rapidez Error Estadístico Parámetro Estimación Estándar T CONSTANTE 1,62822 0,458072 3,55449 Rapidez 0,607919 0,0693252 8,76909 R-cuadrada = 36,988 porciento R-cuadrado (ajustado para g.l.) = 36,507 porciento Variable dependiente: Satisfacción Global Variables independientes: Eficiencia Disponibilidad Error Estadístico Parámetro Estimación Estándar T CONSTANTE 0,350667 0,460092 0,762167 Eficiencia 0,355694 0,0659597 5,39259 Disponibilidad 0,590643 0,0634404 9,3102 R-cuadrada = 54,6952 porciento R-cuadrado (ajustado para g.l.) = 53,9983 porciento Variable dependiente: Satisfacción Global Variables independientes: Eficiencia Rapidez Error Estadístico Parámetro Estimación Estándar T CONSTANTE 1,64017 0,504653 3,25009 Eficiencia -0,00744205 0,129485 -0,0574743 Rapidez 0,613595 0,120816 5,07876 R-cuadrada = 36,9896 porciento R-cuadrado (ajustado para g.l.) = 36,0202 porciento Valor-P 0,0005 0,0000 Valor-P 0,4473 0,0000 0,0000 Valor-P 0,0015 0,9543 0,0000 Variable dependiente: Satisfacción Global Variables independientes: Eficiencia Rapidez Disponibilidad Error Estadístico Parámetro Estimación Estándar T CONSTANTE 0,169092 0,424515 0,398319 Eficiencia -0,0469915 0,101023 -0,465156 Rapidez 0,475248 0,0953631 4,98356 Disponibilidad 0,54432 0,0590549 9,2172 R-cuadrada = 62,0094 porciento R-cuadrado (ajustado para g.l.) = 61,1259 porciento Valor-P 0,6911 0,6426 0,0000 0,0000 Se pide 1. Analiza la regresión simple de la Satisfacción Global respecto a la Eficiencia en la gestión. Escribe el modelo, indica si la Eficiencia es significativa en él y por qué. ¿Cuánta variabilidad de Satisfacción Global es explicada por la Eficiencia? 2. Analiza la regresión con las tres variables explicativas. ¿Es un buen modelo? En caso de que no sea un buen modelo explica, basándote en el resultado del apartado 1, por qué. 3. Elige el mejor modelo. Escríbelo y analízalo. Pregunta 8 (1 punto) Se sabe que una variable y está relacionada con sus variables explicativas X según el siguiente modelo de regresión (entre paréntesis se muestran los estadísticos t del modelo) log(Y) = 1.2 +0.83 log(X1) + 0.77*log(X2) + 0.9*log(X3) (5.1) (3.1) (0.95) Si todas las variables están medidas en las mismas unidades (euros), se pide: 1. Si X1 se incrementa en un 1%, con las demás variables constantes, ¿cuánto se incrementa Y? 2. Si X3 se reduce en un 1% (con las demás variables constantes), ¿cuánto se reduce Y? 3. ¿Qué le sucedería al coeficiente R2 si se eliminase del modelo la variable X2? ¿Y si se elimina la variable X3? ¿Qué eliminación afectaría más a R2? Razonar las respuestas. 4. ¿Podemos afirmar que X3 es colineal con X1 y X2? Razona la respuesta. ¿Cómo podríamos saberlo?