Cuaderno de Ejercicios de Estadística Teórica Curso 2010/11 Departamento de Economía Aplicada GRADO ADE Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. Estadística Teórica Tema 1 Introducción a la Probabilidad 1.- En una sala multicine funcionan simultáneamente dos salas de proyección A y B. Representamos por SA el suceso de que en una determinada sesión la sala A se llene antes de empezar la proyección y por SB el suceso de que en la misma sesión se llene la sala B antes del comienzo. Sabemos que P(SA)=0,7; P(SB)=0,5 y P(SA∩SB)=0,45 Calcular: a) b) c) d) e) f) g) h) Probabilidad de que al menos una sala se llene. Probabilidad de que la sala A se llene y la B no se llene Probabilidad de que una sala se llene y la otra no Probabilidad de que ninguna de las dos se llene Probabilidad de que al menos una de las dos no se llene Probabilidad de que se llene B, supuesto que ya se ha llenado A ¿Son incompatibles SA y SB? Razona la respuesta ¿Son independientes SA y SB? Razone su respuesta 2.- Una empresa que se dedica a organizar conciertos representa a tres grupos musicales (A, B, C) que tienen la misma probabilidad de actuar. Los conciertos pueden celebrarse en tres áreas geográficas: zona norte, zona centro y zona sur, también equiprobables. Suponiendo que los grupos musicales y la zona de actuación son independientes. ¿Qué probabilidad existe de poder ver actuar al grupo A en la zona centro? 3.- Pepa y Pepe celebran su boda con sus familiares y amigos. A su boda acuden invitados que se dividen en: familia de la novia (50 invitados), del novio (60 invitados) y amigos (70 invitados). A la hora de elegir el menú, los invitados tienen que elegir entre carne y pescado, pero nunca los dos a la vez. Una vez estudiadas las peticiones resulta que 20 familiares de la novia eligieron carne, así como 30 del novio y 25 de los amigos. 2 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. a) Si se escoge un invitado al azar, ¿cuál es la probabilidad de que haya elegido carne y que sea familia de la novia? b) Una vez acabada la cena, se le pregunta a un invitado qué cenó. Éste responde que pescado, ¿cuál es la probabilidad de que fuera un amigo? c) ¿Cuál es la probabilidad de que un familiar haya comido carne?. Una vez respondido esto, ¿qué es más probable: que los familiares hayan elegido carne o que hayan elegido pescado? 4.- Suponga que existen solo tres compañías que ofrecen motores de búsqueda en de internet: Yaahoo, Aloo, Googlee, que se reparten el mercado en 60, 30 y 10 % respectivamente. Por la experiencia pasada se conoce que de las personas que buscaron en Yaahoo, un 25% no encontraron lo que buscaban, de las que buscaron en Aloo un 10% y de los que buscaron en Googlee un 17%. Sabiendo que se ha encontrado la información que se buscaba, ¿cuales son las probabilidades de haber usado cada uno de los tres buscadores? 3 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. Tema 2 Estadística Teórica Variables Aleatorias 1.- Una empresa de transportes está analizando el número de veces que falla la máquina expendedora de billetes. Dicha variable tiene como función de cuantía: P ( X = xi ) = 0,7 ⋅ 0,3 xi xi=0,1,2,….. a) ¿Cuál es la probabilidad de que un día la máquina no falle? b) ¿Cuál es la probabilidad de que un día falle menos de 4 veces? c) ¿Cuál es la probabilidad de que falle 5 veces? 2.- La demanda semanal de cierta materia prima por parte de una empresa es de tipo aleatorio y tiene como función de densidad: ⎧k ( x − 1) 2 f ( x) = ⎨ ⎩0 1≤ x ≤ 3 resto a) Determine k para que f(x) sea función de densidad b) La función de distribución c) ¿Qué stock debe disponer al principio de semana para garantizar que se atiende la demanda semanal con una probabilidad del 0,95? d) Calcule la demanda media semanal 3.- La demanda diaria de un determinado artículo (x) es una variable aleatoria con función de densidad: ⎧1 ⎪8 ⎪ ⎪12 − x f ( x) = ⎨ ⎪ 64 ⎪0 ⎪ ⎩ 0<x≤4 4 < x ≤ 12 otro caso Los beneficios diarios dependen de la demanda según la siguiente función: 4 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. ⎧− 5 ⎪ 5 ⎪ Bº = ⎨ ⎪10 ⎪⎩15 si x < 2 si 2 < x ≤ 4 si 4 < x ≤ 8 si 8 < x ≤ 12 Calcular: a) b) c) d) e) Probabilidad de que en un día cualquiera la demanda sea superior a 10 Probabilidad de que la demanda sea inferior a 3 La esperanza y la varianza de la demanda Función de distribución de la demanda Función de cuantía y función de distribución de la variable aleatoria beneficios diarios. f) Esperanza y varianza de la variable beneficios 4.- Un rentista desea invertir 100 millones de euros. Para ello dispone de dos alternativas: 9 Colocar el dinero en la Bolsa, lo que le garantiza una ganancia anual fija del 10% 9 Un plan de inversión cuya ganancia anual puede considerarse como una variable aleatoria cuyos valores dependen de las condiciones económicas. Por información de años anteriores un intermediario financiero ha determinado los posibles valores de ganancias y sus probabilidades para la segunda alternativa siendo éstas: Rentabilidad (%) 30 25 20 15 10 5 Probabilidad 0,2 0,2 0,3 0,15 0,1 0,05 5 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. ¿Cuál cree usted que es mejor alternativa de inversión? 5.- En un grupo de estudiantes de Economía se ha realizado un pequeño análisis de la relación existente entre el número de días semanales dedicados al estudio (X) y el número de convocatorias que se necesitaron para aprobar la asignatura (Y). Los resultados aparecen recogidos en la siguiente tabla de contingencia: Y 1 2 3 1 5 8 10 2 10 6 4 3 20 2 1 X A partir de esta información: a) b) c) d) Obtener las distribuciones marginales de X e Y. Obtener la distribución de X condicionada a que Y tome el valor 3. Obtener la distribución de Y condiconada a que X sea mayor o igual que 2. Analizar si X e Y son independientes. 6.- La función de densidad de una variable aleatoria continua es: ⎧k x 2 f ( x) = ⎨ ⎩0 0 ≤ x ≤ 3⎫ ⎬ d .c. ⎭ Se pide: a) Calcular la esperanza y la varianza de la variable aleatoria. 6 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. Tema 3 Estadística Teórica Modelos de Probabilidad: variables discretas y continuas 1.- Un vendedor (A) de enciclopedias sabe, por su experiencia, que la probabilidad de que le compre un cliente al que visita es de un 15%. Otro vendedor (B), consigue que le compren uno de cada diez clientes que visita (se supone que las ventas son independientes). a) Si un día cualquiera, el vendedor A visita a 5 clientes, y el vendedor B visita a 7. ¿Cuál es la probabilidad de que el vendedor A venda, al menos, una enciclopedia? b) Cuál es la probabilidad de que en el día descrito en el apartado a, el número de enciclopedias vendidas entre los dos vendedores sea una. 2.- El porcentaje de pastillas defectuosas de cierto medicamento detectado por una máquina de control de calidad es del 1%. Se pide: a) Si las pastillas se colocan en tubos de 20 ¿cuál es la probabilidad de que un tubo contenga al menos dos pastillas defectuosas? b) Si los tubos son empaquetados en cajas de 25 unidades ¿Cuál es la probabilidad de que una caja contenga 20 tubos sin pastillas defectuosas? 3.- En una centralita se recibe un promedio de 5 llamadas entre las 9 y las 10 horas en días laborables, recibiéndolas al azar. Encuentre la probabilidad: a) De que se reciba una o más llamadas entre las 9 y las 10 en un día determinado. b) De que se reciban exactamente dos llamadas. c) De que durante una semana de 5 días haya exactamente dos días en que no se reciban llamadas durante ese tiempo. 7 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. 4.- Si Z es una variable aleatoria que se distribuye como una N (0;1), calcular: a) b) c) d) e) f) g) P P P P P P P (Z>1,45) (0,68<Z<1,94) (Z>-1,53) (0<Z<2) (-3,2<Z<-0,30) (-1,96<Z<0,98) (-0,48<Z<0,48) 5.- Si X es una variable aleatoria que se distribuye como una Normal con media 10 y desviación típica 3, calcular: a) b) c) d) P (X>12) P (8<X<11) P (7<X<13) P (X>9) 6.- Si Z se distribuye como una N (0;1), obtenga el valor de “a”, a partir de la probabilidad dada: a) b) c) d) P P P P (Z<a) = 0,1515 (Z>a ) = 0,2358 (Z<a) = 0,90 (Z<a ) = 0,78 7.- Sabiendo que X se distribuye como una N (25;10), obtenga el valor de “ a” a partir de las probabilidades dadas: a) P (X>a) = 0,27 b) P (X<a) = 0,99 8.- Las calificaciones de la asignatura Estadística Teórica (entre 0 y 10) se distribuyen para un grupo como una normal de media 5,5 y desviación típica 3. Si el/la profesor/a decidiese aprobar un 50% de personas, a) ¿A partir de qué nota debería considerar como aprobado? b) ¿Y si sólo decidiese aprobar un 20%? 8 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. 9.- Para seleccionar entre 2000 aspirantes que solicitan una determinada beca de estudio en la Universidad se sugieren los siguientes criterios alternativos: a) b) c) d) Que su calificación en la prueba de lengua sea al menos 7 Que en las dos asignaturas de lengua e inglés sea al menos 7 Que por lo menos en una de esas dos asignaturas sea un 7 o más Que la media de las calificaciones de lengua, matemáticas e inglés sea al menos un siete Sabiendo que la calificación de los alumnos en lengua se distribuyen N(5,5; 2), las de inglés N(6; 1) y las de matemáticas N(3,5; 2,5) y suponiendo que sean independientes se pide: 1) Ordenar los criterios de más a menos restrictivos, de acuerdo con las probabilidades 2) Si como máximo solo pueden concederse 500 becas ¿cuáles de estos criterios pueden tenerse en cuenta? 10.- En una facultad, durante el curso 2009-2010 hay matriculados 3.208 alumnos. Según la información de que dispone Secretaría se sabe que: El número de alumnos que nuevos que se matricula cada año es una variable aleatoria que se distribuye según una normal con esperanza 600 y desviación típica 30. El número de alumnos que abandonan la facultad sin graduarse cada año es una variable aleatoria, independiente de la anterior, que se distribuye según una normal con esperanza 150 y desviación típica 30. El número de alumnos que se gradua cada año es una variable aleatoria independiente a las anteriores que se distribuye como una normal con esperanza 450 y desviación típica 50. Se pide: a) ¿Cuál es la probabilidad de que en el curso 2010-2011 el número de alumnos sea superior a 3.000? b) ¿Qué número de alumnos, en el curso 2010-2011, no se superará con una probabilidad del 99%? 9 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. 11.- Sea X una variable aleatoria distribuida como una χ2 con 18 grados de libertad. Calcular: a) b) c) d) e) P (X>7,015) P (X<13,67) P (9,39<X<28,86) P (X>a) = 0,5 P (X<a) = 0,05 12- Si T es una variable aleatoria que se distribuye como una t-Student con 22 grados de libertad, calcular: a) P (T>0,2564) b) P (0,6858<T<2,07) c) P (T<a) = 0,99 13.- La probabilidad de que una vacuna produzca reacciones alérgicas es 0,001. Se considera aceptable para su uso una vacuna cuando es experimentada en una muestra de 3000 ratones y no produce reacción alérgica en ninguno de ellos. Calcular: a) Probabilidad de que una variante sea aceptable. b) Si se elaboran 400 unidades de esa vacuna, calcular la probabilidad de que por lo menos 25 sean aceptables. 14.- Una empresa dedicada a la fabricación de vestidos de señora los fabrica con longitudes comprendidas entre 110 y 170 cm y con tallas que se diferencian entre sí en 10 cm y una talla extra de 200 cm. La empresa sabe que las alturas de las mujeres potenciales clientes medidas desde el hombro hasta los pies se distribuyen normalmente con media 135 y con desviación típica 15 y que la clienta cuya altura no coincide exactamente con una de las tallas se comprará la inmediatamente mayor. Si la empresa proyecta fabricar para la próxima temporada 50.000 vestidos ¿cuántas debería razonablemente hacer de cada una de las siete tallas previstas? 10 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. Estadística Teórica Tema 4 Introducción a la Inferencia Estadística 1. La empresa Grano Sol vende galletas ecológicas en paquetes de 60 unidades. Los dueños saben que el peso de cada galleta es una variable aleatoria que tienen una media de 71 gr. y una dispersión, medida a través de la desviación típica, de 10 gr. a) ¿Cuál es la probabilidad de que en un paquete de 60 galletas escogidas aleatoriamente, el peso medio de las galletas sea superior a 70 gramos? b) ¿Cuál sería el resultado si la varianza poblacional fuera desconocida? (Suponga que la desviación típica muestral es de 5 kg, y una cuasidesviación típica de 5,04). 2. Se sabe por los datos censales que la variabilidad de la altura de alumnos de una clase medida a través de la varianza es de 15,3. No obstante, para estudiar la variabilidad en el muestreo de la varianza muestral se decide tomar una m.a.s. de 15 alumnos. ¿Cuál es la probabilidad de que la varianza muestral sea mayor que 15? Nota: Suponga que la estatura es una variable aleatoria normalmente distribuida. 3. Se desea analizar las diferencias de calificaciones entre dos grupos de alumnos. Unos proceden del grupo 22 y otros del grupo 23. Para estudiar la distribución en el muestreo de la diferencia de medias se toman m.a.s. independientes de ambas poblaciones obteniéndose la siguiente tabla: Grupo 22 Grupo 23 Tamaño de la población Tamaño de la muestra Media de la población Media de la muestra Desviación típica de la población Desviación típica de la muestra Cuasidesviación Tipica de muestra 11 200 100 4,10 4,2153 1,55 1,5635 1,5713 150 75 5,18 5,3247 1,95 1,8238 1,8360 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. ¿Cuál es la probabilidad de que la diferencia de medias muestrales sea mayor que uno? 4. Un concesionario vende dos tipos de vehículos, unos de gama alta y otros de gama media. Las ventas de coches de gama alta suponen el 30% del total de coches vendidos. ¿Cuál es la probabilidad de que entre los últimos vehículos vendidos, se elijan 100 al azar y resulte que más del 35% sean de gama alta? 5. Según los resultados de un estudio exhaustivo de la población un 80% de las mujeres entrevistadas afirman utilizar algún producto cosmético todos los días, mientras que en el caso de los hombres este porcentaje en la actualidad asciende 55%. Una pequeña firma de cosmética se plantea sacar al mercado una crema hidratante de uso específico para hombres, pero antes de crear esa nueva línea de negocio, decide realizar su propia encuesta sobre una pequeña muestra aleatoria: selecciona a 50 mujeres y a 60 hombres y les pregunta sobre sus hábitos cosméticos. Calcule la probabilidad de que la diferencia entre la proporción de mujeres que utiliza cosméticos respecto a la proporción de hombres que los utiliza sea inferior al 20%. 12 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. Estadística Teórica Tema 5 Métodos de Estimacón. Propiedades de los estimadores puntuales 1. La variable aleatoria “renta de las familias” del municipio de Madrid se distribuye siguiendo un modelo N (µ,σ). Se extraen muestras aleatorias simples de tamaño 4. Como estimadores del parámetro µ, se proponen los siguientes: μ1* = Se a) b) c) x1 + 2 x2 + 3x3 6 μ 2* = x1 − 4 x2 −3 μ3* = x pide: Comprobar si los estimadores son insesgados ¿Cuál es el más eficiente? Si tuviera que escoger entre uno de ellos, ¿cuál escogería? Razone su respuesta a partir del Error Cuadrático Medio. 2. Sea una población con media µ y varianza 1, de la que se extraen M.A.S. de tamaño 4. Considere los siguientes estimadores de la media: μ1* = x μ1* = 1 n ∑ xi n + 1 i =1 a) Estudie la insesgadez y la consistencia de ambos estimadores. b) Elija uno de los dos en términos del error cuadrático medio. 3. Un atleta olímpico de salto de altura se enfrenta a un listón de 2,3 metros. Su entrenador desea estudiar el comportamiento del saltador. Sabe que el número de saltos fallidos por hora es una variable aleatoria distribuida coma una Poisson de parámetro λ . a) Calcule el estimador máximo verosímil del parámetro λ . b) Analice sus propiedades. 4. En una distribución N (μ, σ) se estima la media poblacional μ mediante la media de una muestra aleatoria simple de tamaño n. ¿Calcule el Error Cuadrático Medio del estimador media muestral? 13 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. 5. En vísperas de un referéndum el gobierno desea estimar el porcentaje de participación. Para ello selecciona una muestra aleatoria simple de 3.000 ciudadanos, a los que pregunta si tienen intención de votar. a) Obtener el estimador máximo-verosímil para estimar el porcentaje de participación. b) Analiza las propiedades del estimador. b) De los 3.000 encuestados hay 1.917 que aseguran que votarán, y 1.083 que afirman no tener intención de hacerlo. ¿Qué porcentaje de participación estimará verosímilmente el gobierno? 14 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. Estadística Teórica Tema 6 Estimación por intervalos 1. El peso (en gramos) de las cajas de cereales de una determinada marca sigue una distribución N (μ; 5). Se han tomado los pesos de 16 cajas seleccionadas aleatoriamente, y éstos han sido: 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509 y 496. a) Obtenga los intervalos de confianza del 90%, 95% y 99% para la media poblacional. b) Determine cuál sería el tamaño muestral necesario para conseguir, con un 95% de confianza, un intervalo de longitud igual a 2 gramos. c) Suponiendo ahora que la desviación típica poblacional es desconocida, calcule los intervalos de confianza para la media al 90%, 95% y 99%. 2. La afluencia de visitantes al parque natural de Monfragüe durante un mes, medida a través de una muestra aleatoria durante 10 días elegidos aleatoriamente, ha resultado ser la siguiente: 682, 553, 555, 666, 657, 649, 522, 568, 700, 552 Suponiendo que los niveles de afluencia siguen una distribución normal a) Calcula la media muestral y la varianza muestral. b) Calcula el intervalo de confianza para la media poblacional al 95% de confianza. (Nota: para facilitar los cálculos el resultado correcto de la desviación típica muestral es de 62,68 y la cuasidesviación típica muestral es de 66,07) c) Calcule e interprete el significado de un intervalo de confianza al 95% para la varianza poblacional. ¿qué podría decir si los adjudicatarios del parque afirman que la dispersión de la afluencia de personas es de 15 personas? 15 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. 3. El gasto diario en llamadas telefónicas de dos departamentos X e Y de una misma empresa sigue una distribución normal, con un gasto medio desconocido en ambos departamentos. Sin embargo, se conocen las desviaciones típicas, que son 100 y 110 euros, respectivamente. La dirección ha observado que una M.A.S de 20 días, el gasto medio diario en llamadas realizadas por el departamento X ha sido de 1.100 euros, y de 1.400 en el departamento Y. Obtenga un intervalo de confianza al 90% para la diferencia de gastos medios entre ambos departamentos. 4. Se selecciona una muestra aleatoria de 600 familias, a las que se pregunta si tienen o no ordenador en casa. Contestaron afirmativamente 240 familias. Obtenga un intervalo de confianza al nivel del 95% para la proporción real de familias que poseen ordenador en casa. 5. Según los dirigentes del partido A, la intención de voto del partido rival B, en Andalucía, es la misma que la que tiene en Madrid. Se realiza una encuesta a 100 personas en Andalucía de los que 25 mostraron su apoyo al partido B, y a otras 100 personas en Madrid de las que 30 se declaran simpatizantes del partido B. a) Construya un intervalo de confianza al 90% para la proporción de personas que votarían al partido B en Andalucía. b) ¿A cuántas personas habría que encuestar para tener un margen de error del ±2%, al nivel de confianza anterior? c) Construya un intervalo de confianza del 90% para la diferencia de proporciones en la intención de voto del partido B en las dos comunidades. ¿Se puede afirmar que los dirigentes del partido A tienen razón? 16 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. Estadística Teórica II: Inferencia Estadística Tema 7 Contraste paramétrico de hipótesis estadísticas 1. Un directivo de uno de los grandes operadores de Internet está considerando la posibilidad de ofrecer tarifa plana a sus clientes. Según sus conocimientos sobre el tema, sabe que está trabajando con una variable aleatoria que se distribuye como una normal. Mantiene la hipótesis de que los hogares que tienen Internet se conectan una media de 5 horas semanales, y sabe por otros estudios que la dispersión de 7,24 horas. No obstante, existen otros estudios que sostienen que el tiempo de conexión es más alto. Para evaluar, a un 10% de significación, dicha hipótesis, el directivo decide encuestar aleatoriamente a 300 hogares, obteniendo una media de 5,34 horas de conexión. a) Indique las hipótesis. b) Realice el contraste de hipótesis y analice la decisión que tomará. 2. El número de averías de un determinado tipo de coche se considera una variable aleatoria con distribución de Poisson de media 20 averías al mes. El equipo de mantenimiento intenta reducir esta media incorporando algunas mejoras. Para comprobar si con estas medidas se reduce el número medio de averías, se decide observar aleatoriamente el número de averías en los 25 meses siguientes a la introducción de las mejoras. Si el número medio de averías en esos 25 meses fue de 18,5 ¿Qué decisión debe adoptar el servicio técnico a un nivel de significación del 1%? Y si el servicio técnico relaja su nivel de exigencia al 15% de nivel de significación ¿Cambiaría su decisión? ¿Si tuviera recursos aumentaría el tamaño muestral para mejorar la aproximación a una normal por el Teorema Central del Limite? Calcule el p-valor y analice qué decisión tomaría según dicho valor. 3. Un laboratorio farmacéutico quiere lanzar un nuevo medicamento para la hipertensión, llamado HIPOTENSIL. El director de dicho laboratorio cree que la eficacia del medicamento sería de un 95%, medida ésta como la proporción de pacientes a los que se les suministra y experimentan una mejoría. Sin embargo, el inspector de sanidad del Ministerio no es tan optimista y opina que la eficacia es sólo del 85%. Para analizar la eficacia del medicamento antes de su comercialización, se selecciona una muestra aleatoria de 500 pacientes, a los que se les administra HIPOTENSIL, de los 17 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. cuales mejoran 467. ¿Tiene razón el director del laboratorio? Suponga un nivel de significación del 5%. Calcule el p-valor e interprételo. 4. Un fabricante de pastas alimenticias asegura en su campaña publicitaria que el peso medio de los paquetes es de 250 gramos. Otro fabricante de la competencia pretende denunciarlo por engaño publicitario, ya que cree que es menor. Para contrastarlo selecciona una muestra aleatoria simple de 20 paquetes al azar siendo los pesos (en gramos) resultantes, 240, 225, 240, 220, 240, 250, 200, 215, 230, 140, 200, 216, 240, 250, 225, 240, 245, 220, 240, 240. Formula las hipótesis nula y alternativa y realiza un contaste a un nivel de significación del 5%? Suponga que el peso sigue una distribución normal. 5. Las especificaciones de un tipo de báscula aseguran que los errores de los pesajes siguen una distribución N (0, σ ) . Se quiere contrastar la afirmación de que la dispersión de los errores de pesaje es igual a un kilo, frente a que es el doble. Para ello se realizan 5 pesajes en las que el error cometido resultó ser: 1; 0,9; − 0,2; 1,4; − 0,7 Para un nivel de significación del 5 % se pide que enuncie una regla de decisión (obtenga la región crítica) e indique si rechaza la hipótesis nula a la vista de muestra. 6. El análisis laboral que la U.E ha realizado para toda Europa, señala que en España, el salario mensual medio de los varones, en algunos sectores económicos, supera en más de 100 euros el salario medio de las mujeres que desempeñan las mismas tareas. El Ministerio de Trabajo español decide considerar el salario mensual medio como una variable aleatoria normalmente distribuida con desviación típica de 39,6 euros para los trabajadores masculinos y de 36 euros para las trabajadoras de dichos sectores. Para tratar de verificar lo publicado, se toman dos muestras aleatorias simples independientes de 500 trabajadores y 700 trabajadoras, obteniéndose unos salarios medios mensuales de 1.500 y 1.370 euros respectivamente. Realice el contraste indicando cuál es el estadístico de contraste, el valor experimental y el p-valor. 18 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. 7. En un informe presentado por un reportero a una revista feminista se afirma que el número medio de horas semanales de conexión a Internet es el mismo para hombres que para mujeres. Sin embargo no parece prudente publicar estos datos sin contrastarlos estadísticamente. Se selecciona para ello una muestra de 75 hombres y 50 mujeres. Los resultados muestrales se recogen en la siguiente tabla: Hombres Mujeres Tamaño muestral Número medio de horas/semana Desviación típica muestral Cuasidesviación típica muestral 75 7,42 9,08 9,14 50 5,34 7,24 7,31 a) Formule el contraste a realizar y señalar los supuestos que se deben realizar para resolver el ejercicio. b) Determine la región crítica del contraste. c) Calcule el estadístico del contraste. d) ¿Existe evidencia para rechazar la hipótesis nula a un nivel de significación del 5%? 8. Se sabe que un medicamento es efectivo en un 72% de los casos en los que se utiliza para tratar una determinada infección. Se ha desarrollado un nuevo medicamento y se ha comprobado que ha sido efectivo en 42 de los 50 casos tratados. ¿Estos datos proporcionan suficiente evidencia para demostrar que el nuevo medicamento tiene una efectividad distinta a la del antiguo? Utilice un 5% de nivel de significación. 9. Se desea comparar las horas que trabajan los voluntarios de Trinidad Jimenez (X) y de Tomás Gómez (Y) en la preparación de las primarias antes de las próximas Elecciones Autonómicas en Madrid. Para ello se ha tomado muestra aleatoria de 51 voluntarios de Trinidad Jiménez que responden a la pregunta ¿cuántas horas semanales dedicas a apoyar la campaña de Trini? Tras analizar los datos de la muestra, se obtiene una media de 3,3 horas y una desviación típica de 1,74 horas, y otra muestra aleatoria de tamaño 51 en las oficinas de Tomás Gómez. Tras analizar los datos se obtiene una media muestral de 4,5 horas con una dispersión de 2,4 horas. Se desea contrastar a un 5% de significación la hipótesis de que el número medio de horas dedicadas por los voluntarios de ambos candidatos son iguales, frente a que son distintas. Para facilitarle el trabajo se han calculado: 19 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. El intervalo de confianza al 95% para (μx-μy) que vale (-2,031;-0,37). El valor experimental que toma el estadístico de contraste para esas muestras: (( x − y ) ) ⋅ n.m n+m ns x2 + ms y2 = −2,86 n+m−2 Y el p-valor = 0,005 a) ¿Qué decisión tomaría al 5% de significación? b) ¿Cómo interpreta el p-valor? c) ¿Qué supuestos previos cree que debe hacer explícitos en este contraste de diferencia de medias? d) Interprete el intervalo de confianza y relaciónelo con el contraste de hipótesis realizado. Razone sus respuestas 20 Cuaderno de Ejercicios de Estadística Teórica UDI de Estadística, Departamento de Economía Aplicada. Estadística Teórica Tema 8 Introducción a los contrastes de hipótesis no paramétricos 1. Para una muestra aleatoria simple de 350 días, el número de urgencias tratadas diariamente en un hospital queda reflejado en la siguiente tabla: N° de urgencias 0-5; 5-10; 10-15; 15-20; 20-25; 25-30 Total diarias Número de días: 20; 65; 100; 95; 60; 10; 350 Contraste, con un nivel de significación del 5%, si la distribución del número de urgencias tratadas diariamente en el hospital se ajusta a una distribución normal. 2. Para conocer la opinión de los ciudadanos sobre la actuación del alcalde de una determinada ciudad, se realiza una encuesta a 199 vecinos del Distrito A y a 205 del distrito B, cuyos resultados se recogen en la siguiente tabla: Desacuerdo De acuerdo No Contestan Distrito A Distrito B 84 118 78 62 37 25 Contraste con un nivel de significación del 5 % que ambos distritos son homogéneos respecto a sus opiniones. 3. Novecientos cincuenta escolares se clasificaron de acuerdo a sus hábitos alimenticios y a su coeficiente intelectual: Coeficiente Intelectual Nutrición adecuada Nutrición inadecuada Total < 80 245 31 276 80-90 228 27 255 90-99 177 13 190 >=100 219 10 229 Total 869 81 950 Al nivel de significación del 10%, ¿cree que hay evidencia de relación entre las variables nutrición y coeficiente intelectual? 21