1 UNIDAD 1 VARIABLES ALEATORIAS Y DISTRIBUCIÓN DE PROBABILIDADES Una variable aleatoria es una función que asigna un número real a cada resultado del espacio muestral de un experimento aleatorio. Dicho de otra forma, una variable aleatoria es una función valorada numéricamente, cuyo valor está regido por factores en los que interviene el azar. Las variables aleatorias pueden ser discretas o continuas, según su rango de valores. VARIABLES ALEATORIAS DISCRETAS Una variable aleatoria que puede asumir una cantidad finita de valores o una sucesión infinita de valores enteros se llama variable aleatoria discreta. Por ejemplo, consideremos que un experimento consiste en contar los vehículos que llegan a un puesto de cobro; la variable aleatoria de interés es la cantidad de vehículos que llegan en un minuto y sus posibles valores son 0, 1, 2… Las variables aleatorias cualitativas deben asumirse como discretas, puesto que a cada posible valor podría asignársele un número. La descripción del conjunto de posibles valores de X y la probabilidad asociada a cada uno se denomina distribución de probabilidad. Si la variable puede tomar un número pequeño de valores, la forma más simple consiste en construir una tabla que contenga los posibles valores y sus respectivas probabilidades; si no son pocos, lo más adecuado es expresar dicha probabilidad como una ecuación. La distribución de probabilidad se describe mediante una función de probabilidad, representada por f(x). EJEMPLO 1.1. Un embarque de 8 aparatos similares que se envía a un distribuidor contiene 3 aparatos defectuosos. Si una persona realiza una compra aleatoria de 2 de estos aparatos, encuentre la distribución de probabilidades para el número de computadores defectuosos Solución: 2 p(X=0) = 5/8 * 4/7 = 10/28 p(X=1) = 5/8 * 3/7 * 2 = 15/28 p(X=2) = 3/28 Por lo tanto, la distribución de probabilidades puede expresarse así: x f(x) 0 10/28 1 15/28 2 3/28 Dicha distribución puede representarse mediante un diagrama de barras, teniendo en cuenta que se trata de una variable discreta. Siempre que se evalúen variables aleatorias, se cumple que: f(x) ≥ 0 2. f ( x) 1 1. Además, puede hablarse de una distribución acumulada de dicha variable; ésta se denota como F(X), indica la probabilidad de que X sea menor o igual a un valor específico y está dada por: x x F(X) = P(X≤x) = P(X) x 0 EJEMPLO 1.2. La producción diaria de 850 partes manufacturadas contiene 50 que no cumplen con los requerimientos del cliente. Del lote se escogen dos partes al azar; si X es el número de partes que no cumplen los requerimientos del cliente, hallar F(X=1). Solución: F(1) = P(X=0) + P(X=1) = 800/850*799/849 + 800/850*50/849*2 = 0.997 3 El valor esperado (E(x)) de una variable aleatoria discreta es un promedio ponderado de los valores que puede asumir la variable; los factores de ponderación son las probabilidades. Dicho valor esperado está dado por: E( x) xf ( x) Su varianza es un promedio ponderado de las desviaciones de cada valor posible respecto al promedio, elevadas al cuadrado; los factores de ponderación son las probabilidades. La varianza está dada por: Var( x) 2 ( x ) 2 f ( x) EJEMPLO 1.3. Calcular el valor esperado y la desviación estándar de la variable del número de aparatos defectuosos comprados en el caso del ejemplo 1.1. Solución: 1* 15 3 2* 0.75 aparatos defectuoso s 28 28 10 15 3 * (0 0.75) 2 * (1 0.75) 2 * (2 0.75) 2 0.634 aparatosdefectuosos 28 28 28 Frecuentemente las observaciones que se generan en experimentos estadísticos tienen algunos tipos generales de comportamiento, por eso sus variables se pueden describir esencialmente con unas pocas distribuciones, las cuales pueden representarse mediante una ecuación. Frente a la complejidad de los fenómenos bajo estudio, el experimentador aproxima y hace algunos postulados tentativos acerca del mecanismo aleatorio y deriva un modelo por el empleo de esos postulados en combinación con las leyes de probabilidad. Un modelo de probabilidad para la variable aleatoria X es una forma específica de distribución de probabilidades que es asumida para reflejar el comportamiento de X. Las probabilidades son registradas en términos de parámetros desconocidos que relacionan las características de la población y el método de muestreo. 4 “EL MODELO DEBE SER COHERENTE CON LA REALIDAD” En esta unidad se examinarán detalladamente algunas distribuciones específicas de probabilidad que han demostrado, empíricamente, ser modelos útiles para diversos problemas prácticos. Pero dichas distribuciones son teóricas porque sus funciones de probabilidad se deducen matemáticamente con base en ciertas hipótesis que se suponen válidas para esos fenómenos aleatorios. Dichas distribuciones son idealizaciones del mundo real, por lo tanto sus resultados no siempre coinciden con la realidad. ALGUNOS MODELOS DE DISTRIBUCIONES DISCRETAS 1. DISTRIBUCIÓN BINOMIAL: Se maneja cuando se satisfacen las siguientes características: a) El experimento consiste en una sucesión de n ensayos o intentos idénticos. b) El resultado de cada ensayo se clasifica dentro de dos categorías mutuamente excluyentes: Éxito o fracaso. El uso de esos términos es por conveniencia, pero no tienen la misma connotación de la vida real (éxito no necesariamente es lo que convenga). c) La probabilidad de éxito permanece constante en todos los ensayos. d) Los ensayos son independientes, lo que significa que la ocurrencia de uno de ellos no afecta el resultado de cualquier otro. La función de probabilidad binomial puede escribirse como: n f ( x) p x q n x , x donde x es el número de éxitos, n el número de ensayos, p es la probabilidad de éxito y q es la probabilidad de fracaso. A continuación se muestra la representación gráfica de una distribución binomial con valores de n y p determinados: 5 EJEMPLO 1.4. Cierta aerolínea hace ocho vuelos diarios de Bogotá a Miami. Suponga que la probabilidad de que alguno de los vuelos se retrase es 0.2. a) ¿Cuál es la probabilidad de que ninguno de los vuelos se retrase hoy? b) ¿Cuál es la probabilidad de que hoy se retrasen por lo menos 6 vuelos? Solución: 8 a) P(X=0) = * 0.2 0 * 0.88 0.1678 0 b) P(X≥6) = P(X=6) + P(X=7) + P(X=8) 8 8 * 0.2 6 * 0.8 2 * 0.2 7 * 0.81 0.28 = 6 7 = 0.00123 6 Media y varianza de la distribución binomial: Media = np Varianza = npq Revisemos la distribución de probabilidades de un caso binomial en el que p = 0.3 y el número de ensayos varía: En casi todos los libros de estadística se encuentran tablas de la distribución binomial para valores seleccionados de p. Para ilustrar su uso, veamos el siguiente ejemplo: EJEMPLO 1.5. Un examen de selección múltiple contiene 20 preguntas, cada una con cuatro posibles respuestas, de las cuales sólo una es correcta. Suponga que un estudiante sólo adivina las respuestas. a) ¿Cuál es la probabilidad de que el estudiante conteste correctamente más de la mitad de las preguntas? b) ¿Cuál es la probabilidad de que el estudiante conteste correctamente menos de 5 preguntas? c) ¿Cuál es la probabilidad de que el estudiante gane el examen? d) ¿Cuál es el número esperado de respuestas correctas? e) Responder las preguntas a) y c) si cada pregunta tiene 5 opciones. Solución: 7 p=¼ n = 20 a) P(X>10) = 1 – P(X10) = 1 – 0.9961 = 0.0039 b) P(X<5) = P(X4) = 0.4148 c) P(X12) = 1 – P(X11) = 1 – 0.9991 = 0.0009 d) = np = 20 * ¼ = 5 respuestas correctas e) La probabilidad de éxito sería ya de 1/5, por tanto: P(X>10) = 1 – P(X10) = 1 – 0.9994 = 0.0006 P(X12) = 1 – P(X11) = 1 – 0.9999 = 0.0001 2. DISTRIBUCIÓN HIPERGEOMÉTRICA: Como el muestreo sin reemplazo viola las condiciones de Bernoulli si la muestra no es grande, algunas veces es necesario plantear un tipo diferente de distribución. (Es evidente que la mayoría de muestreos se realiza sin reemplazo, esto implica que si la población es pequeña las probabilidades cambiarán en cada observación). Cuando se selecciona sin reemplazo una muestra aleatoria de tamaño n de una población de tamaño N y el interés recae en la probabilidad de seleccionar x éxitos de los k artículos considerados como éxitos en la población, se realiza un experimento hipergeométrico y su función de probabilidad viene determinada por: k N k x n x f ( x) N n La distribución hipergeométrica requiere el conocimiento de k y N. La media y la varianza de la distribución hipergeométrica son: nk N y 2 N n k k * n * 1 N 1 N N 8 EJEMPLO 1.6. En cierta empresa se fabricaron durante la semana 50 estaciones de juego para video. Cuarenta de ellas funcionaron perfectamente y las demás tenían algún defecto. Se seleccionó al azar una muestra de 5; ¿cuál es la probabilidad de que al menos 4 de ellas funcionaran perfectamente? Solución: 4010 4010 4 1 5 0 P(X4) = 0.742 50 5 3. DISTRIBUCIÓN DE POISSON: Este es el modelo de probabilidad más adecuado para eventos que ocurren aleatoriamente a través del tiempo o el espacio. Este tipo de leyes se aplica a sucesos con probabilidad muy baja de ocurrir, obteniéndose como la distribución límite de una sucesión de variable binomiales. Un tipo importante de problemas de decisión bajo incertidumbre es caracterizado por la pequeña probabilidad de ocurrencia de un acontecimiento particular, tal como un accidente. La función de probabilidad de Poisson calcula la probabilidad de exactamente x ocurrencias independientes durante un período de tiempo dado, si los eventos ocurren independientemente y a una tasa constante. La función de la probabilidad de Poisson también representa el número de ocurrencias sobre áreas o volúmenes constantes. Esta distribución supone: a) Independencia: El número de ocurrencias en un intervalo determinado es independiente del número de ocurrencias en cualquier otro intervalo. b) La posibilidad de dos ocurrencias simultáneas puede ser asumida como cero. c) El número promedio de ocurrencias por unidad de tiempo o espacio se considera una constante. d) La probabilidad de que suceda determinado número de eventos en un proceso de Poisson depende únicamente de la longitud del intervalo observado y no de su ubicación. La distribución de probabilidad de la variable aleatoria de Poisson X, que representa el número de resultados que ocurren en un intervalo de tiempo, área, espacio o volumen específico se denota así: 9 e t ( t ) x f ( x) , x! donde es el número promedio de resultados por unidad de tiempo o región y t es la longitud del intervalo. A continuación se observa la representación gráfica de una distribución de Poisson con una media baja: EJEMPLO 1.7. Al Departamento de Reservaciones de Aerolíneas Regionales llegan en promedio 48 llamadas por hora. a) Calcule la probabilidad de recibir 3 llamadas en un intervalo de 5 minutos. b) Calcule la probabilidad de recibir al menos una llamada en 15 minutos. c) ¿Cuál es la probabilidad de que la secretaria pueda ausentarse tres minutos sin interferir con la atención de las llamadas? Solución: e 48*1 / 12 (4) 3 0.1954 a) P( X 3) 3! 10 P( X 1) 1 P( X 0) b) 1 e 48*1 / 4 *120 0.999994 0! c) P( X 0) e 48 / 20 0.0907 Al igual que para la distribución binomial, existen también tablas para la distribución Poisson. Veamos un ejemplo: EJEMPLO 1.8. Los mensajes que llegan a un computador utilizado como servidor lo hacen de acuerdo con una distribución Poisson con una tasa promedio de 10 mensajes por hora. a) ¿Cuál es la probabilidad de que lleguen más de 3 mensajes en un espacio de 15 minutos? b) ¿Cuál es el número esperado de mensajes en una jornada de 14 horas? Solución: a) = 10 t=¼ = 2.5 P(X>3) = 1 – P(X3) = 1 – 0.7576 = 0.2424 b) = 10*14 = 140 mensajes La media y la varianza de la distribución de Poisson tienen el valor t. En general utilizaremos la distribución de Poisson como aproximación de experimentos binomiales donde el número de pruebas es muy alto, pero la probabilidad de éxito muy baja, teniendo en cuenta que µ = np 11 EJEMPLO 1.9. Se calcula que 0.5% de las llamadas al departamento de facturación de cierta empresa recibirá el tono de ocupado. ¿Cuál es la probabilidad de que al menos 5 de las 1200 personas que llamaron el día de hoy haya recibido tono de ocupado? Solución: µ = 0.005*1200 = 6 P( X 5) 0.7149 VARIABLES ALEATORIAS CONTINUAS Una variable aleatoria es continua cuando puede tomar cualquier valor dentro de un intervalo de números reales. Por lo tanto, no es posible conocer su valor exacto. Si la variable aleatoria es discreta, pero el rango es muy amplio, resulta más conveniente utilizar un modelo basado en variables aleatorias continuas. Cuando la variable es continua no tiene sentido hacer una suma de las probabilidades de cada uno de los términos en el sentido anterior, ya que el conjunto de valores que puede tomar la variable es no numerable. En este caso, lo que generaliza de modo natural el concepto de suma (Σ) es el de integral (∫). Dicha función es denominada función de densidad de probabilidad de X (f(x)) y cumple lo siguiente: a) f ( x) dx 1 b) P( x1 X x2 ) x2 f ( x)dx x1 c) f(x) ≥ 0 d) P(X = x) = 0 P( x1 X x2 ) P( x1 X x2 ) 12 Esta última propiedad podría describirse así: La probabilidad que un modelo de variable continua asigna a la observación de un valor exacto (es decir, medido con infinita precisión) es cero. La función de densidad podría mirarse como un modelo de la curva límite que obtendríamos en el histograma de una población disminuyendo indefinidamente las anchuras de cada clase. Lo anterior implica que la función de densidad de una variable continua se expresa siempre como una ecuación, que es hallada por regresión. f(x) es más general que un histograma. Trata de reflejar no el comportamiento de una muestra concreta, sino la estructura de los valores de la variable a largo plazo; además, es más operativa. La media o valor esperado de X está dado por: xf ( x)dx , donde -∞ e ∞ son los valores extremos posibles La varianza está dada por: 2 ( x ) 2 f ( x)dx = x 2 f ( x)dx 2 EJEMPLO 1.10. La demanda semanal de Pepsi, en miles de litros, de una cadena local de tiendas, es una variable continua X que tiene la densidad de probabilidad 2( x 1),1 x 2 f ( x) 0, en cualquierotro caso Encuentre la media y la desviación estándar de X. 13 Solución: 2 2 x( x 1)dx 5 / 3 1 2 2 2 x 2 ( x 1)dx 5 / 32 1 / 18 0.236 1 Lo anterior implica que se espera una demanda semanal promedio de 1667 litros de Pepsi y que la variabilidad de esta variable no es grande. ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS 1. Distribución uniforme continua: Se caracteriza porque la probabilidad es constante en un intervalo cerrado [a,b] y, por lo tanto, su función de densidad es plana. Eso implica que la probabilidad de que al hacer un experimento aleatorio, el valor de X este comprendido en cierto subintervalo de [a,b] depende únicamente de la longitud del mismo, no de su posición. Su función de densidad está dada por: f ( x) 1 , a xb ba Función de densidad y función acumulada de una variable uniforme 14 b Su media es: x b adx a ab 2 ab 1 (b a ) 2 dx y su varianza es: x * 2 ba 12 a b 2 EJEMPLO 1.11. Una aerolínea anuncia un tiempo de vuelo de 125 minutos para un itinerario determinado. Suponiendo que los tiempos reales de vuelo se distribuyen uniformemente entre 2 horas y 2 horas y media, a) ¿cuál es la probabilidad de que el vuelo no llegue más de cinco minutos tarde? b) ¿cuál es la probabilidad de que el vuelo llegue más de diez minutos tarde? c) ¿cuál es el tiempo esperado de vuelo? Solución: 130 a) P( X 130) (1 / 30)dx 1 / 3 120 150 b) P( X 135) (1 / 30)dx 1 / 2 135 c) 120 150 135 minutos 2 2. Distribución normal: Es la más empleada para modelar experimentos aleatorios porque describe ajustadamente muchos fenómenos naturales, industriales e investigativos; los errores en mediciones científicas se aproximan bien mediante la distribución normal. Esta distribución puede obtenerse al considerar el modelo de una variable binomial cuando el número de ensayos tiende a infinito. La función de densidad de una variable aleatoria normal X, con media µ desviación estándar σ es: 15 f ( x) 1 2 e ( x )2 2 2 , x La distribución normal presenta las siguientes características: 1. Su gráfica tiene forma de campana. 2. El punto más alto de la curva normal es la media, que también es la mediana y la moda de la distribución. 3. El área total bajo la curva es 1. 4. La curva es simétrica alrededor de la media; por lo tanto, el área a la izquierda de la media es 0.5 e igual a su derecha. 5. El eje x es una asíntota horizontal, es decir, los extremos de la curva se prolongan al infinito en ambas direcciones. 6. La desviación estándar determina el ancho de la curva. A mayores valores de σ se obtienen curvas más anchas y bajas (mayor dispersión de los datos). Distribuciones normales con diferentes medias e igual dispersión y distribuciones normales con igual media y diferente dispersión. 16 Por lo descrito, la probabilidad de que la variable aleatoria X tome un valor entre a y b es: P ( a X b) 1 b e 2 ( x )2 2 2 dx a Que gráficamente sería: Esta integral no es de fácil solución, pero dicho problema puede obviarse mediante la estandarización de la variable, que consiste en transformar todas las observaciones de cualquier variable aleatoria normal X a un nuevo conjunto de observaciones de una variable aleatoria normal Z con media 0 y varianza 1; todas las distribuciones normales pueden convertirse a “distribuciones normales estándar” restando la media de cada observación y dividiendo por la desviación estándar. x Z Para la utilización en problemas prácticos de la distribución normal existen ciertas tablas donde se encuentran los valores F(x) para una serie limitada de valores Z dados. 17 La gráfica anterior muestra que aproximadamente el 68% de las veces, una variable aleatoria normal asume un valor en el intervalo µ±σ, aproximadamente 95% en el intervalo µ± 2σ y más del 99% en µ ± 3σ EJEMPLO 1.12. Durante los últimos años ha crecido el volumen de acciones negociadas en la Bolsa. Durante las dos primeras semanas de abril, el volumen diario promedio fue de 586000 acciones. La distribución de probabilidad del volumen es aproximadamente normal con desviación estándar de 115000 acciones. a) ¿Cuál es la probabilidad de que el volumen negociado en un día sea menor a 395000 acciones? b) ¿Cuál es la probabilidad de que se negocien más de 800000 acciones? c) ¿Cuál es la probabilidad de que en un día se negocien entre 500000 y 600000 acciones? d) Si la Bolsa quiere emitir un boletín de prensa sobre el 5% de los días más activos, ¿qué volumen activará la publicación? Solución: Sea: X = miles de acciones negociadas. 395 586 a) P( X 395) P Z P( Z 1.66) 0.0485 115 800 586 b) P( X 800) P Z P( Z 1.86) 1 P( Z 1.86) 1 0.9686 0.0314 115 600 586 500 586 P(500 x 600) P Z P(0.75 Z 0.12) c) 115 115 0.5478 0.2266 0.3212 d ) P(Z z) 0.05 P(Z z) 0.95 De la tabla : z 1.645 z x x z 586 1.645 (115 ) 775 Eso implica que la publicación se sacará los días que se negocien más de 775000 acciones. 18 Aproximación normal a la distribución binomial: Una variable aleatoria discreta con distribución binomial se puede aproximar mediante una distribución normal si p no es cercana a 0 o a 1. La aproximación es muy buena si el número de ensayos es grande y mucho mejor si p es cercana a 0.5 Como el valor esperado y la varianza de X son respectivamente np y npq, la aproximación X np consiste en hacer Z , teniendo en cuenta un factor de corrección por continuidad. npq Para que la aproximación sea adecuada debe cumplirse que np y nq sean mayores que 5. EJEMPLO 1.13. Una prueba de opción múltiple tiene 200 preguntas, cada una con cuatro respuestas posibles de las que sólo una es correcta. ¿Cuál es la probabilidad de que con puras conjeturas se obtengan de 25 a 30 respuestas correctas para 80 de los 200 problemas acerca de los que el estudiante no tiene conocimientos? Solución: La probabilidad de una respuesta correcta para cada una de las 80 preguntas es ¼. σ= µ = np = 80(1/4) = 20 Los valores correspondientes son: z1 npq = (80(1/ 4)(3 / 4) ) 3.873 24 .5 20 1.16 3.873 z2 30.5 20 2.71 3.873 P(1.16 < Z < 2.71) = 0.9966 – 0.8770 = 0.1196 EJERCICIOS PROPUESTOS 1. Se elige una muestra de 20 empresas colombianas exportadoras. Se sabe por estadísticas de años anteriores que aproximadamente el 40% de las empresas colombianas exportadoras registra operaciones en más de 5 ciudades. a) ¿Qué tan probable es encontrar al menos 18 empresas que tengan operaciones en más de 5 ciudades? Si ese porcentaje fuera muy alto, ¿creerías que el porcentaje dado ha variado y que ya las empresas trabajan en más ciudades? b) ¿Qué tan probable es encontrar entre 10 y 15 empresas que laboren en más de 5 ciudades? 19 2. Recientemente se llevó a cabo la Macrorrueda de Negocios de Latinoamérica; estadísticas publicadas por Proexport muestran que el 40% de los compradores extranjeros era de México. Si se muestrean 40 compradores extranjeros al azar, ¿cuál es la probabilidad de que el número de mejicanos sea: a) Menor o igual a 15 b) Al menos 10, pero menos de 20 3. A mediados del mes pasado se realizó en Medellín la Macrorrueda de Negocios de Latinoamérica. Si se realizaron en promedio 20 negocios grandes por hora, ¿cuál es la probabilidad de que: a) se hicieran 10 negocios o menos entre las 10 y las 10 y media de la mañana de un día determinado? b) se realizaran entre 3 y 5 negocios –inclusive- en un período de 10 minutos? c) se hicieran por lo menos 10 negocios en un espacio de 1 hora? 4. A finales del año anterior estuvieron de visita en Colombia gran parte de los principales tours operadores de los Estados Unidos para conocer los principales destinos turísticos que ofrece el país e intercambiar oportunidades de negocios con operadores y empresarios colombianos. La probabilidad de que uno de esos operadores hubiera establecido negocios grandes en Colombia es 0.8; si se selecciona aleatoriamente un grupo de 15 operadores a) ¿cuál es la probabilidad de que al menos 12 hayan hecho grandes negocios? b) ¿cuál es la probabilidad de que menos de 5 hayan hecho grandes negocios? c) ¿cuál es la probabilidad de que más de 5 pero menos de 10 hayan hecho negocios grandes? 5. Los pasajeros de las aerolíneas llegan al azar e independientemente a la sección de documentación en un aeropuerto internacional. La frecuencia promedio de llegadas es de 10 pasajeros por minuto. a) ¿Cuál es la probabilidad de que no llegue nadie en un espacio de 15 minutos? b) ¿Cuál es la probabilidad de que lleguen al menos 3 pasajeros en cierto minuto? 6. Una encuesta nacional revela que el 60% de los administradores graduados trabajan en su área de estudios. Si se evalúan los 16 egresados de Administración de la Universidad X de este año, ¿cuál es la probabilidad de que: a) todos se empleen en administración? b) al menos el 75% de ellos se emplee en el área? c) menos de 10 se empleen en el área? 7. El estudio de un inventario muestra que, en promedio, las demandas de cierto artículo en un determinado almacén se realizan 10 veces al día. ¿Cuál es la probabilidad de que en un día dado se pida este artículo 20 a) más de 5 veces b) ninguna vez c) entre 15 y 20 veces, inclusive 8. Un especialista en telemercadeo realiza seis llamadas telefónicas por hora y es capaz de cerrar una venta en el 30% de esos contactos. Durante las siguientes dos horas, encuentre: a) La probabilidad de no cerrar ninguna venta. b) La probabilidad de que concrete por lo menos tres ventas. c) El número esperado de ventas en ese lapso. 9. Una compañía manufacturera utiliza un esquema para aceptación de los artículos producidos antes de ser embarcados. El plan es de dos etapas. Se preparan cajas de 25 para embarque y se selecciona una muestra de 3 para verificar si tienen algún artículo defectuoso. Si se encuentra por lo menos uno, la caja entera se regresa para verificarla al 100%; si no se encuentra ningún artículo defectuoso la caja se embarca. a) ¿Cuál es la probabilidad de que se embarque una caja que contiene 3 artículos defectuosos? b) ¿Cuál es la probabilidad de que una caja que contiene sólo un artículo defectuoso se regrese para verificación? c) Suponga que dicha compañía decide cambiar su esquema de aceptación. Bajo el nuevo esquema un inspector toma aleatoriamente un artículo, lo inspecciona y lo regresa a la caja; un segundo inspector hace lo mismo; finalmente, un tercer inspector lleva a cabo el mismo procedimiento. La caja no se embarca si cualquiera de los 3 inspectores encuentra un artículo defectuoso. Responda la pregunta a bajo este nuevo plan. 10. Se toma una muestra de 15 paquetes estadísticos para evaluar si permiten hacer un determinado análisis. Anteriores estudios indican que la probabilidad de que un software estadístico deje hacer ese análisis es 0.6. ¿Cuál es la probabilidad de que al menos 13 de los 15 paquetes seleccionados permitan hacer el análisis? a) Si se toma X = número de paquetes que permiten hacer el análisis. b) Si se toma X = número de paquetes que no permiten hacer el análisis. 11. Al conmutador de una universidad llegan en promedio 120 llamada/hora durante las horas de actividad. El conmutador no puede hacer más de 5 conexiones por minuto; calcule la probabilidad de que: a) el conmutador se encuentre congestionado en un minuto dado. b) se pierdan 3 o más llamadas si la recepcionista salió 2 minutos de la oficina. 12. Un embarque de 100 artículos contiene dos unidades defectuosas. Al revisarlo, se tomará una muestra y las unidades se inspeccionarán. Si se encuentra al menos una unidad defectuosa, se rechazará todo el embarque. a) Si se selecciona una muestra de 3 artículos, ¿cuál es la probabilidad de rechazar el embarque? b) ¿Cuál es esa probabilidad si la muestra es de 4 artículos? 21 c) ¿Cuál es esa probabilidad si la muestra es de 5 artículos? d) ¿Qué concluye? 13. Cuando una máquina nueva funciona bien, sólo el 3% de los artículos que produce tienen defectos. Si se seleccionan al azar 10 partes producidas por la máquina a) ¿cuál es la probabilidad de encontrar por lo menos un defectuoso? b) ¿cuál es la probabilidad de que al menos la mitad sean defectuosos? 14. Un nuevo proceso automatizado de producción ha tenido un promedio de 1.5 descomposturas por día. Debido al costo asociado con una descompostura, a la administración le preocupa la posibilidad de tener tres o más descomposturas durante un día. Suponga que esos daños ocurren al azar, que la probabilidad de daño es igual para dos intervalos cualquiera de igual longitud y que las descomposturas en un período son independientes de las que suceden en otros períodos. ¿Cuál es la probabilidad de tener 3 o más descomposturas en un día? 15. En la tabla siguiente se observan las distribuciones de probabilidad para calificaciones en una muestra de altos ejecutivos y mandos medios de sistemas de información. Las calificaciones van de 1 (muy insatisfecho) hasta 5 (muy satisfecho). Probabilidad Calificación de satisfacción en el trabajo 1 2 3 4 5 Altos ejecutivos Mandos medios 0.05 0.09 0.03 0.42 0.41 0.04 0.1 0.12 0.46 0.28 a) ¿Cuál es el valor esperado de calificación en cada grupo? b) Calcule la desviación estándar para ambos grupos. c) Con base en las dos medidas anteriores, haga comentarios sobre la satisfacción con sus trabajos de altos ejecutivos y mandos medios 16. El estudio de un inventario determina que, en promedio, las demandas de un artículo particular en un almacén se realizan cinco veces al día. ¿Cuál es la probabilidad de que en un día dado se pida este artículo a) más de cinco veces? b) ninguna vez? 17. Una funcionaria de crédito de cierta empresa calcula, con base en sus años de experiencia, que la probabilidad de que un solicitante no sea capaz de pagar las cuotas 22 del crédito que se le otorgó es de 0.025. El mes pasado esa funcionaria otorgó 40 créditos. a) ¿Cuál es la probabilidad de que no se recuperen 3 de esos créditos? b) ¿Cuál es la probabilidad de que no se recuperen al menos 3 de esos créditos? 1. Los días 27 y 28 de marzo de 2006 se llevará a cabo en Cartagena una macrorrueda de Agroindustria, donde se pretende que las empresas exportadoras colombianas del sector muestren la alta calidad, diseño y valor agregado de sus productos. Se tienen datos de asistencia de compradores internacionales a eventos de este tipo realizados en Latinoamérica y se ha encontrado que dicha variable tiene una distribución aproximadamente normal con media de 846 compradores y desviación estándar de 275 compradores. a) ¿Qué tan probable es que al evento asistan más de 1300 compradores internacionales? b) ¿Qué tan probable es que asistan entre 900 y 1200 compradores internacionales? c) Si el número de compradores internacionales supera por lo menos al 90% de los compradores internacionales en los eventos latinoamericanos de este tipo, el evento será destacado en la comunidad internacional mediante un boletín de prensa en Estados Unidos. ¿Cuántos compradores internacionales deben presentarse como mínimo para que se presente ese hecho? 2. Se ha encontrado, por datos históricos, que el del monto de negocios en las ferias de textiles que se han desarrollado en Colombia durante los últimos 5 años sigue aproximadamente una distribución normal con media 9.8 millones de dólares y desviación estándar de 8.7 millones de dólares. a) En Colombiatex, realizada en enero en Medellín, se efectuaron negocios por 33 millones de dólares; ¿hará parte del 5% de ferias textileras donde más negocios se han hecho? b) ¿Cuál es la probabilidad de que en una feria de este tipo se hagan negocios por más de 15 millones de dólares? 3. La revista X publicó el escalafón de las 500 empresas colombianas de mayores exportaciones en 2005; publicó sus activos, utilidades y patrimonios. Se encontró que el monto de los activos de dichas empresas sigue aproximadamente una distribución normal con media de 358 millones de dólares y una desviación estándar de 156.4 millones de dólares. Si se supone que para 2006 la distribución de los activos de esas empresas no varíe mucho, responda: a) ¿Qué tan probable es que los activos de una empresa de las que aparece en ese escalafón supere los 200 millones de dólares, pero no los 400 millones de dólares? 23 b) ¿Entre qué valores se encuentran los activos en el 80% de las empresas más “comunes” en cuanto a ese parámetro? 4. Cierta empresa planea exportar un neumático radial con banda de acero que venderá a través de una cadena americana de tiendas de descuento. La dirección de la empresa cree que la garantía de millas recorridas que se ofrezca con el neumático será un factor importante en la aceptación. Antes de firmar ese contrato, la dirección desea contar con información acerca de las millas que duran los neumáticos. En pruebas reales en carretera, se ha estimado que el promedio de distancia recorrida es 36500 millas y que la desviación estándar es 5000 millas. Si la distribución de probabilidad de las duraciones es aproximadamente normal, a) ¿Cuál es la probabilidad de que las millas recorridas rebasen las 40000? b) ¿Cuál es la probabilidad de que los neumáticos duren en buen estado más de 30000 millas, pero menos de 50000? c) La empresa planea una garantía según la cual el usuario recibirá un descuento en sus neumáticos de repuesto si los neumáticos originales no rebasan la distancia en millas especificada en la garantía. ¿Cuáles deben ser las millas recorridas para que no haya más de 10% de los neumáticos que aprovechen el descuento de la garantía? 5. El tiempo necesario para terminar un examen final en determinado curso se distribuye normalmente con 80 minutos de media y 10 minutos de desviación estándar. a) ¿Cuál es la probabilidad de terminar ese examen en una hora o menos? b) ¿Cuál es la probabilidad de que un alumno termine el examen en más de 60 minutos, pero en menos de 75 minutos? c) Suponga que en el grupo hay 60 alumnos y que el tiempo del examen es de 90 minutos. ¿Cuántos alumnos se espera que no puedan terminar el examen en el tiempo indicado? 6. 3256 personas presentaron los exámenes de ingreso a una universidad, los cuales se calificaban con un puntaje máximo de 100. Las calificaciones se aproximan a una distribución normal, con una media de 67.8 y una desviación estándar de 10.1. a) El 12% de los postulantes con más alta calificación en el examen son aceptados en la universidad. ¿Un estudiante que obtiene un puntaje de 73 en el examen es aceptado o no? b) ¿Qué porcentaje de postulantes obtuvieron una calificación entre 60 y 80? 7. Una prueba de admisión a una universidad tiene 200 preguntas, cada una con 4 posibles respuestas, de las que sólo una es correcta. Para pasar a entrevista se debe responder correctamente por lo menos el 75% de las preguntas. a) Un aspirante está seguro de 107 respuestas, pero tiene que responder las demás al azar. ¿Cuál es la probabilidad de que sea llamado a entrevista? b) Un aspirante sólo tiene que adivinar 10 para ajustar el número de respuestas correctas que necesita, ¿cuál es la probabilidad de que sea llamado a entrevista? 24 8. Se esperaba que la crisis monetaria en Asia a finales de 1997 y principios de 1998 tuviera como consecuencia reducciones apreciables del empleo en Estados Unidos por la inundación de su mercado con importaciones baratas. Se esperaba que California estuviera fuertemente afectado. El Instituto de Política Económica estimó que la cantidad media de pérdidas de empleo en California fuera de 126681. Suponga que la cantidad de empleos perdidos tiene una distribución normal y que su desviación estándar es de 30000. a) ¿Cuál es la probabilidad de que la cantidad de empleos perdidos estuviera entre 80000 y 130000? b) ¿Cuál es la probabilidad de que esa cantidad sea inferior a 50000? c) ¿Qué valor de corte dará como resultado una probabilidad de 0.95 de que la cantidad de empleos perdidos no sea mayor de ese valor? 9. Un estudio sobre el pago de facturas reveló que, en promedio, una factura se pagaba a los 20 días de su recepción. La desviación estándar equivalía a 5 días. a) ¿Qué porcentaje de facturas se paga antes de 15 días de su recepción? b) La gerencia desea estimular a los clientes para que paguen sus facturas mensuales lo más pronto que les sea posible. Por lo tanto, se anunció que estaría vigente una reducción de 2% en el precio para los clientes que pagaran en un lapso de siete días hábiles a partir de que se reciba la factura. Suponiendo que los pagos tienen distribución normal, de los 200 clientes que se espera este mes, ¿cuántos tendrían derecho a la reducción si todo continúa igual? 10. Estadísticas publicadas muestran que en una noche promedio de fin de semana, dos de cada diez conductores están ebrios. Si se verifican 400 conductores al azar la siguiente noche de sábado, ¿cuál es la probabilidad de que el número de conductores ebrios sea a) menor que 64? b) mayor a 100? c) al menos 70, pero menos de 90? 11. El salario inicial de los administradores de negocios internacionales recién egresados tiene una distribución aproximadamente normal, con media $1069000 y desviación estándar $369690. a) ¿Cuál es la probabilidad de que Paula, una recién egresada de la carrera, gane más de $2000000? b) Sergio gana $2000000. ¿Hace parte del 10% de los que más ganan? ¿Por qué? c) ¿Por debajo de que valor está el salario del 5% de los más mal pagos? 12. Durante la semana anterior se llevó a cabo la Macrorrueda de Negocios de Latinoamérica; estadísticas publicadas por Proexport muestran que el 40% de los compradores extranjeros era de México. Si se muestrean 100 compradores extranjeros al azar, ¿cuál es la probabilidad de que el número de mejicanos sea: a) Menor o igual a 35 25 b) Al menos 40, pero menos de 69 13. Los costos de servicio por mes en una agencia de viajes tienen una distribución aproximadamente normal, con promedio de $150 millones y desviación estándar de $6750000. a) ¿Cuál es la probabilidad de que en el próximo mes los costos de servicio estén entre 120 y 170 millones de pesos? b) ¿Por debajo de qué valor son los costos de servicio en el 20% de los meses con menores costos? 14. Sea X la variable aleatoria que denota la vida en horas de cierto equipo. La función de densidad de probabilidad es: 20000 x3 f ( x) 0 La ecuación está dada para x>100 y es 0 en cualquier otro caso Encuentre la vida esperada de este tipo de equipo. Interprete.