Índice 1. Variables aleatorias bidimensionales 2 2. Función de probabilidad conjunta 2.1. Actividades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 4 3. Función de densidad conjunta 4 4. Función de distribución acumulada 5 5. Distribuciones marginales 5 6. Distribuciones condicionales 6 7. Variables aleatorias independientes 7.1. Actividades propuestas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 8 8. Funciones de dos o más variables aleatorias 9 9. Esperanza matemática y variancia para la suma de variables aleatorias 10 10.Algunos resultados importantes 10.1.Propiedad reproductiva de la distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2.Propiedad reproductiva de la distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3.La distribución chi-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 12 12 12 11.Teorema del límite central 11.1.Problema de aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2.Propuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3.Algunas aplicaciones del teorema del límite central . . . . . . . . . . . . . 11.3.1. Aproximación normal a la distribución binomial . . . . . . . . . . 11.3.2. Aproximación normal a la distribución de Poisson . . . . . . . . . 11.3.3. El Teorema del Límite Central y los errores aleatorios de medición . . . . . . 13 13 13 14 14 15 15 12.Algunas aplicaciones del teorema del límite central 12.1.Aproximación normal a la distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2.Aproximación normal a la distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3.El teorema del límite central y los errores aleatorios de medición . . . . . . . . . . . . . . . . . . . . . 16 16 16 17 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.Covariancia y coeficiente de correlación 17 13.1.Propuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 14.Problemas adicionales sobre suma de variables aleatorias 20 Acerca de esta unidad En el estudio de las variables aleatorias hemos considerado hasta ahora, sólo el caso unidimensional. En estas condiciones, el resultado de un experimento se registra mediante un único número x. En muchas situaciones interesa observar dos o más variables aleatorias simultáneamente. Por ejemplo, podría seleccionarse de un proceso de producción, una lámina de acero y observarse dos características: la resistencia al corte y los diámetros de los puntos de soldadura. Entonces, tanto la resistencia al corte como los diámetros de las soldaduras son las variables aleatorias de interés. En este caso el resultado de cada experiencia se registra a través de un par ordenado de números reales (x, y). A lo largo de esta unidad nos proponemos estudiar la distribución conjunta de dos o más variables aleatorias, y a partir de estas distribuciones conjuntas, obtener las distribuciones marginales de cada variable, como así también las distribuciones condicionales, 1 proporcionar algunos resultados que permitan trabajar con problemas de la ingeniería, que involucran situaciones en las que una variable aleatoria es función de dos o más variables aleatorias. A los fines de favorecer el logro de estos objetivos usted encontrará distintos tipos de ayuda gráfica. En particular, para un reconocimiento rápido de las diferentes propuestas de esta unidad, hemos adoptado las siguientes señales: Introduce los comentarios y los contenidos que el profesor a cargo del curso ha elaborado especialmente. Introduce la lectura de los libros para la consulta de los contenidos de la asignatura. Presenta las preguntas, ejercitaciones o actividades para realizar. Es una parada de alerta. Introduce alguna recomendación, observación o sugerencia para el aprendizaje. 1. Variables aleatorias bidimensionales En lo que sigue introducimos las definiciones y conceptos para describir el comportamiento simultáneo de dos o más variables aleatorias. Sea S un espacio muestral asociado a una experiencia aleatoria; X e Y dos variables aleatorias definidas sobre S . Al par (X , Y ) lo llamaremos variable aleatoria o vector aleatorio bidimensional. S R X ×Y (X , Y ) (x, y) s Siendo x = X (s) ∈ R X el rango o recorrido de X , y = Y (s) ∈ R Y el rango o recorrido de Y . Entonces © ª R X ×Y = (x, y) : x ∈ R X , y ∈ R Y es el rango o recorrido del vector (X , Y ). Veamos algunos ejemplos. 1. Se observa el número de repuestos que se demandan en un día en cierta ferretería y el número de repuestos en existencia en dicho día. Si X representa la variable aleatoria demanda diaria e Y la variable aleatoria número de repuestos en existencia, y se conoce que R X = {0, 1, 2, 3} y R Y = {1, 2, 3}, entonces el rango o recorrido del vector es: R X ×Y = {(0, 1), (0, 2), (0, 3), (1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)} . 2. Consideremos nuevamente el caso en que se observa el diámetro de una soldadura y la resistencia al corte de una lámina de acero. Si X representa el diámetro expresado en mm e Y la resistencia expresada en kg, y se conoce que 0 ≤ X ≤ 6 mm , mientras que 0 ≤ Y ≤ 900 kg, entonces el rango o recorrido para el vector (X , Y ) es © ª R X ×Y = (x, y) : 0 ≤ x ≤ 6, 0 ≤ y ≤ 900 . 2 El análisis de estos ejemplos nos permite identificar: En relación al ejemplo 1 diremos que el vector (x, y) es un vector aleatorio bidimensional discreto. En este caso el vector asume solamente un número finito de pares ordenados. (Podría tratarse también de un vector que asuma un número infinito numerable de pares ordenados). En relación al ejemplo 2 diremos que (x, y) es un vector aleatorio bidimensional continuo. El vector aleatorio (x, y) asume en este caso, cualquier par ordenado de valores (x, y) de un rectángulo. (Podría ser otra región del plano.) 2. Función de probabilidad conjunta Para describir la distribución de probabilidad conjunta de (X , Y ) procedemos de un modo análogo al caso unidimensional. Definimos: Sea (X , Y ) un vector aleatorio bidimensional discreto y R X ×Y su rango o recorrido. Entonces, la función p: → 7→ R X ×Y (x, y) R p(x, y) se denomina función de probabilidad conjunta del vector (X , Y ) cuando satisface las siguientes condiciones: 1. p(x, y) ≥ 0. X p(x, y) = 1, 2. (x,y)∈R X ×Y 3. Si (x, y) ∈ A ⊂ R X ×Y , entonces X (x,y)∈A p(x, y) = P ((X , Y ) ∈ A) . Ésta se lee: probabilidad de que el valor asuma valores en A. En relación con esto, consideramos conveniente observar que: ¡ ¢ p(x, y) = P X = x, Y = y , ©¡ ¢ ª x, y, p(x, y) con (x, y) ∈ R X ×Y se denomina distribución de probabilidad conjunta del vector (X , Y ). La distribución de probabilidad conjunta de un vector aleatorio bidimensional discreto (X , Y ), suele presentarse mediante una tabla. Si retomamos el ejemplo ya visto, la siguiente tabla corresponde a la distribución de probabilidad conjunta del vector (X , Y ), donde X es la variable aleatoria número de repuestos que se demandan en cierta ferretería, e Y es la variable aleatoria número de repuestos en existencia por día, en dicha ferretería. X Y 1 2 3 0 1 2 3 0.05 0.03 0.02 0.05 0.10 0.05 0.05 0.15 0.30 0.05 0.05 0.10 La distribución de probabilidad conjunta del vector (X , Y ) se visualiza en la siguiente gráfica. 3 p(x, y) 1 3 1 2 2 x 3 y Si consideramos el suceso A: en un día no se satisface la demanda, entonces: A = {(2, 1), (3, 1), (3, 2)} , y P ((X , Y ) ∈ A) = p(2, 1) + p(3, 1) + p(3, 2) = 0.05 + 0.05 + 0.05 = 0.15. 2.1. Actividades 1. Verifique que P (x,y)∈R X ×Y p(x, y) = 1. 2. Calcule la probabilidad de que un día se pierda de vender dos repuestos (demanda insatisfecha). 3. Función de densidad conjunta Sea (X , Y ) un vector aleatorio bidimensional y R X ×Y su recorrido. Diremos que la función R2 (x, y) f : → 7 → R f (x, y) es la función de densidad conjunta del vector (X , Y ) cuando satisface las siguientes 1 condiciones 1. f (x, y) ≥ 0. Ï 2. f (x, y) d x d y = 1, R2 3. Si (x, y) ∈ A ⊂ R X ×Y , entonces Ï A f (x, y) d x d y = P ((X , Y ) ∈ A) . © ª Asimismo (x, y, f (x, y)), (x, y) ∈ R X ×Y se denomina distribución de probabilidad conjunta del vector (X , Y ). Veamos un ejemplo. Supongamos que la función de densidad de probabilidad conjunta para el vector (X , Y ) , - donde X es el diámetro de la soldadura e Y la resistencia al corte -, viene dada de la forma que se expresa a continuación: ( f (x, y) = 1 5400 0 si 0 ≤ x < 6, 0 ≤ y < 900. caso contrario. La gráfica correspondiente es: 4 f (x, y) 1 5400 6 x (mm) 90 0 y (kg) Entonces resulta: P (1 ≤ X ≤ 3; 400 ≤ Y ≤ 500) = Z 3 µZ 1 500 400 ¶ 200 dy 1 dx = = ≈ 0.037. 5400 5400 27 Interpretemos una vez más el significado de una probabilidad. El resultado hallado en el ejemplo anterior nos indica que: si observamos el diámetro de una soldadura y la resistencia al corte en cada lámina de acero de una muestra de tamaño n, con n convenientemente grande, alrededor del 3,7 % de las láminas presentan el diámetro entre 1 y 3 mm y la resistencia al corte entre 400 y 500 kg. 4. Función de distribución acumulada Al estudiar variables aleatorias unidimensionales encontramos que la función de distribución acumulada F , juega un papel importante. En el caso bidimensional también podemos definir una función de distribución acumulada como se indica a continuación: Para el caso discreto: F (u, v) = P (X ≤ u, Y ≤ v) = Para el caso continuo: F (u, v) = P (X ≤ u, Y ≤ v) = Z u −∞ X X p(x, y). x≤u y≤v µZ v −∞ ¶ f (x, y) d y d x. Los conceptos introducidos para un vector aleatorio bidimensional se extienden de manera natural al caso ndimensional. 1 5. Distribuciones marginales ¡ ¢ Dada p(x, y) = P X = x, Y = y la función de probabilidad conjunta del vector (X , Y ), se puede calcular con facilidad: p X (x) = P (X = x) ∀x ∈ R x , ¡ ¢ p Y (y) = P Y = y ∀y ∈ R y . En otras palabras, conocida la probabilidad conjunta del vector (X,Y) puede determinarse la función de probabilidad de X e Y respectivamente. Si consideramos de nuevo la tabla de la distribución conjunta del vector (X , Y ), donde X es el número de repuestos que se demandan diariamente en una ferretería e Y es el número de repuestos en existencia por día resulta, por ejemplo, que: pX X (0) = P (X = 0) = P (X = 0, Y = 1) + P (X = 0, Y = 2) + P (X = 0, Y = 3) = p(0, 1) + p(0, 2) + p(0, 3) = p(0, y). y∈R Y 5 p Y (1) = P (Y = 1) =X P (X = 0, Y = 1) + P (X = 1, Y = 1) + P (X = 2, Y = 1) + P (X = 3, Y = 1) = p(0, 1) + p(1, 1) + p(2, 1) + p(3, 1) = p(x, 1). x∈R X En general: p Y (x) = P (X = x) = p X (y) = P (Y = y) = X p(x, y), y∈R Y X p(x, y). x∈R X ©¡ ¢ ª ©¡ ¢ ª Las distribuciones x, p X (x) con x ∈ R] X e y, p Y (y) con y ∈ R]Y , se denominan distribuciones marginales de X e Y respectivamente. En forma análoga: Dada f (x, y), la función densidad de probabilidad conjunta del vector (X , Y ), se puede determinar : Z +∞ f X (x) = f Y (y) = −∞ Z +∞ −∞ f (x, y) d y, f (x, y) d x. Las funciones f X (x) y©¡f Y (y) se denominan densidades marginales de X ªe Y respecti¢ ª ©¡ ¢ vamente. Asimismo, x, f X (x) con x ∈ R] X e y, f Y (y) con y ∈ R]Y , son las distribuciones marginales de X e Y respectivamente. Volvamos a nuestro ejemplo. Si consideramos la función densidad conjunta del vector (X , Y ) donde X es el diámetro de la soldadura e Y la resistencia al corte, se obtiene que: f Y (x) = Z +∞ −∞ 1 dy = 5400 900 Z 0 900 1 dy = = , 5400 5400 6 para 0 ≤ x < 6. Luego: ( f Y (x) = 1 6 0 0 ≤ x < 6, caso contrario, es la función de densidad de la variable aleatoria continua X o función marginal X . Con el propósito de afianzar estos conceptos, en el espacio que sigue le proponemos como ejercicio que determine f Y (y). A partir de lo visto surge en forma natural la siguiente pregunta: ¿Puede determinarse la función de probabilidad conjunta o la función de densidad conjunta de un vector (X , Y ) a partir de las distribuciones marginales? Antes de dar respuesta a esta pregunta abordaremos brevemente el siguiente tema. 6. Distribuciones condicionales En la Unidad II , hemos definido la probabilidad condicional de que ocurra un evento, cuando se sabe que ha ocurrido otro evento. El concepto de la probabilidad condicional para eventos se puede extender al concepto de distribución condicional de una variable aleatoria X , dado que una segunda variable aleatoria Y ha asumido un valor específico, por ejemplo, y. Supongamos que: X e Y son variables aleatorias discretas con distribución de probabilidad conjunta conocida, 6 A es el evento X = x, en tanto B es el evento Y = y. Entonces P (A ∩ B ) , P (B ) P ( A/B ) = o sea que P ( X =x/Y =y ) = El cociente P (X = x, Y = y p(x, y) = . P (Y = y) p Y (y) p(x, y) p Y (y) se conoce como la función de probabilidad condicional para X , dado que Y = y. Este cociente es apropiado para evaluar cualquier declaración de probabilidad en relación a X , cuando se ha observado que la variable Y asumió un valor y. Continuamos con otras definiciones importantes. A continuación nos ocupamos tanto de las funciones de probabilidad condicional, - para el caso discreto -, como de las funciones de densidad condicional, - para el caso continuo -. Sea (X , Y ) un vector aleatorio con función de probabilidad conjunta p(x, y). La función de probabilidad condicional para Y , dado que X = x, se define como: p ( y/x ) = p(x, y) , p X (x) para p X (x) > 0. p (x/y ) = p(x, y) , p Y (y) para p Y (y) > 0. En forma análoga: Otra definición Sea (X , Y ) un vector aleatorio con función de densidad conjunta f (x, y). La función de densidad condicional para Y , dado que X = x, se define como: f ( y/x ) = f (x, y) , f X (x) para f X (x) > 0. f (x/y ) = f (x, y) , f Y (y) para f Y (y) > 0. En forma análoga: Veamos algunos ejemplos de aplicación. Consideramos la distribución conjunta del vector (X , Y ), donde X es la demanda de un repuesto e Y es la existencia del repuesto, entonces: p(3, 2) = P ( X =3/Y =2) = P (X = 3, Y = 2 p(3, 2) 0.05 = = = 0.15. P (Y = 2) p Y (2) 0.33 Esto significa: cuando hay dos repuestos en existencia alrededor del 15 % de los días no se satisface la demanda. Si f (x, y) es la función densidad conjunta del vector (X , Y ) donde X e Y son respectivamente las variables aleatorias peso y altura de una persona, entonces: Z 80 Z 80 f (x, 1.70) f (x/1.70) d x = d x, 60 60 f Y (1.70) es la probabilidad de que el peso de una persona que mide 1.70 m se encuentre entre 60 y 80 kg. (P (60≤X ≤80/Y =1.70)) 7 7. Variables aleatorias independientes Recordemos de la Unidad II que las condiciones 1. P ( A/B ) = P (A), 2. P (B/A ) = P (B ), 3. P (A ∩ B ) = P (A)P (B ), son equivalentes y caracterizan la independencia de los sucesos A y B . En forma análoga puede suceder que la densidad condicional (o la función de probabilidad) para Y sea igual a la densidad marginal (o función de probabilidad) para Y , sin importar el valor dado de X ; es decir: f ( y/x ) = f Y (y), en el caso continuo y p ( y/x ) = p Y (y), en el caso discreto. Esta situación motiva las siguientes definiciones de variables aleatorias independientes. Para las variables aleatorias discretas decimos: Dos variables aleatorias discretas X e Y son independientes si se verifica cualquiera de las siguientes condiciones equivalentes: 1. p(x, y) = p X (x) · p Y (y), ∀(x, y). 2. p (x/y ) = p X (x), ∀(x, y) con p Y (y) > 0. 3. p ( y/x ) = p Y (y), ∀(x, y) con p X (x) > 0. Del mismo modo, para las continuas decimos: Dos variables aleatorias discretas X e Y son independientes si se verifica cualquiera de las siguientes condiciones equivalentes: 1. f (x, y) = f X (x) · f Y (y), ∀(x, y). 2. f (x/y ) = f X (x), ∀(x, y) con f Y (y) > 0. 3. f ( y/x ) = f Y (y), ∀(x, y) con f X (x) > 0. 7.1. Actividades propuestas 1. En relación a la distribución conjunta del vector (X , Y ) donde X es la variable aleatoria número de repuestos que se demandan diariamente en cierta ferretería e Y es la variable aleatoria número de repuestos en existencia, le pedimos que determine: a) las distribuciones marginales de X e Y . b) la probabilidad de que, habiendo un repuesto en existencia, no se satisfaga la demanda. c) si X e Y son o no son variables aleatorias independientes. 8 2. Sean g (v) = ( e −v 0 v ≥ 0, caso contrario, y h(i ) = ( 3e −3i 0 i ≥ 0, caso contrario, las densidades marginales de las variables aleatorias independientes v (voltaje) e i (corriente), respectivamente, ¿cuál es la función densidad conjunta del vector (v, i )? 8. Funciones de dos o más variables aleatorias Con frecuencia se presentan problemas en los cuales aparece una variable aleatoria en función de dos o más variables aleatorias. Veamos algunos ejemplos: 1. Cuatro resistores están conectados en serie como se muestra en la figura. Si la resistencia del resistor i es una variable aleatoria que notamos con R i , entonces la resistencia del ensamble es R = R 1 + R 2 + R 3 + R 4 . R1 R3 R2 R4 2. Dos partes deben ensamblarse como se muestra en la figura. El espacio libre puede expresarse como Y = X 1 − X 2 (combinación lineal de X 1 y X 2 con escalares 1 y −1). Un espacio libre negativo significa interferencia. X1 X2 3. Un sistema está formado por n componentes que funcionan independientemente. Si el tiempo transcurrido hasta la falla de la componente i es una variable aleatoria Ti , entonces el tiempo transcurrido hasta la falla del sistema es una variable aleatoria T donde: a) T = máx {T1 , T2 , . . . , .Tn } si las componentes están conectadas en paralelo b) T = mı́n {T1 , T2 , . . . , Tn } si las componentes están conectadas en serie 9 Existen diferentes métodos para encontrar la distribución de probabilidad de una variable aleatoria, que es función de otras variables aleatorias. Nos limitaremos a enunciar algunos resultados útiles que nos permitirán resolver numerosos problemas de la ingeniería y abordar algunos temas de la inferencia estadística, tales como la estimación puntual y por intervalos de confianza de ciertos parámetros. En lo que sigue obtendremos la distribución de la variable aleatoria T del ejemplo 3a, bajo el supuesto de que las variables aleatorias T1 , T2 , . . . , Tn son independientes e idénticamente distribuidas; es decir, tienen la misma curva de densidad, que notaremos f Ti (t ). Si las componentes del sistema provienen de un mismo proceso de producción es razonable suponer que las variables aleatorias Ti están idénticamente distribuidas. F T (t ) = P (T ≤ t ) = P (T1 ≤ t , T2 ≤ t , . . . , Tn ≤ t ) = P (T1 ≤ t ) P (T2 ≤ t ) · · · P (Tn ≤ t ) = t µZ 0 f Ti (x) d x ¶n . Derivando miembro a miembro se obtiene la función densidad de la variable aleatoria T : f T (t ) = n t µZ 0 f Ti (x) d x ¶n−1 f Ti (t ). Para el ejemplo 3b conviene plantear: P (T > t ) = P (T1 > t , T2 > t , · · · , Tn > t ) . 9. Esperanza matemática y variancia para la suma de variables aleatorias Una variable aleatoria de interés es la que aparece cuando se considera una combinación lineal de n variables aleatorias X 1 , X 2 , . . . , X n , es decir: Z = H (X 1 , X 2 , . . . , X n ) = a 1 X 1 + · · · + a n X n . Nos interesa estudiar en primer término la esperanza matemática y la variancia de Z = H (X 1 , X 2 , . . . , X n ) = a 1 X 1 + · · · + a n X n bajo diferentes hipótesis. Comencemos por analizar un ejemplo simple. Sean X : número de piezas producidas por una máquina por la mañana; Y : número de piezas producidas por la misma máquina por la tarde. La siguiente tabla corresponde a la distribución de probabilidad conjunta del vector (X , Y ) X Y 1 2 1 2 3 0.05 0.05 0.10 0.35 0.15 0.30 La variable aleatoria Z = X + Y es el número total de piezas producidas por la máquina en un día. A partir de la distribución conjunta del vector (X , Y ) se puede determinar la distribución de probabilidad de la variable Z = X + Y . En efecto, R z = {2, 3, 4, 5} y 10 P (Z = 2) = P (X = 1, Y = 1) = 0.05. P (Z = 3) = P (X = 1, Y = 2) + P (X = 2, Y = 1) = 0.15. Del mismo modo usted puede completar las líneas de puntos P (Z = 4) = = 0.50. P (Z = 5) = = 0.30. Conocida la distribución de probabilidad de la variable aleatoria Z podemos calcular E (Z ) E (Z ) = 2P (Z = 2) + 3P (Z = 3) + 4P (Z = 4) + 5P (Z = 5) = 4.05. Como actividad le proponemos calcular E (X ) y E (Y ) y verificar que: E (Z ) = E (X + Y ) = E (X ) + E (Y ) Este resultado es un caso particular de la siguiente propiedad: à E n X i =1 ! ai X i = n X a i E (X i ) , (1) i =1 cualesquiera sean las variables aleatorias X 1 , X 2 , . . . , X n y los escalares a 1 , a 2 , . . . , a n . Le proponemos asimismo como actividcad calcular V (X ), V (Y ), V (Z ) donde Z = X +Y y verificar que V (X +Y ) 6= V (X ) + V (Y ). £ ¤ Si recordamos que V (X ) = E (X − E (X ))2 , y aplicamos la propiedad (1), después de desarrollar el cuadrado obtenemos: ¡ ¢ V (X ) = E X 2 − (E (X ))2 . (2) La relación (2) nos facilitará el cálculo de la variancia para la suma de dos variables. V (X + Y ) = = = = £ ¤ E (X + Y )2 − (E (X + Y ))2 = ¡ ¢ ¡ ¢ E X 2 + 2E (X Y ) + E Y 2 − (E (X ))2 − 2E (X )E (Y ) − (E (Y ))2 = ¡ ¢ ¡ ¢ ¡ ¢ E X 2 − (E (X ))2 + E Y 2 − E Y 2 + 2 (E (X Y ) − E (X )E (Y )) = V (X ) + V (Y ) + 2 (E (X Y ) − E (X )E (Y )) . Si X e Y son variables aleatorias independientes, entonces (se prueba fácilmente): E (X Y ) = E (X )E (Y ). En este caso es: V (X + Y ) = V (X ) + V (Y ). Este resultado es un caso particular de la siguiente propiedad: Si X 1 , X 2 , . . . , X n son n variables aleatorias independientes y a 1 , a 2 , . . . a n , n escalares, entonces: à V n X i =1 ! ai X i = n X i =1 a i2 V (X i ) . Es importante detenerse a observar: si X 1 y X 2 son variables aleatorias independientes entonces: 1. V (X 1 + X 2 ) = V (X 1 − X 2 ) = V (X 1) + V (X 2). p 2. σ (X 1 + X 2 ) = σ (X 1 − X 2 ) = V (X 1 ) + V (X 2 ) 6= σ (X 1 ) + σ (X 2 ) . 11 10. Algunos resultados importantes 10.1. Propiedad reproductiva de la distribución de Poisson Si X 1 , X 2 , . . . , X n son n variables aleatorias independientes y cada X i tiene una distribución de Poisson con parámetros λi , entonces la variable aleatoria : n X X= Xi , i =1 también tiene distribución de Poisson de parámetro λ = Pn i =1 λi . Veamos un ejemplo. Si la demanda diaria de repuesto en una ferretería es una X con distribución de Poisson de parámetro λ. entonP ces la demanda semanal (6 días) es una variable aleatoria D, siendo D = 6i =1 X i , con distribución de Poisson, de parámetro 6λ. (se supone independencia entre las demandas diarias). Es conveniente detenerse y observar la siguiente desigualdad: D= ¿Por qué es así? 6 X i =1 X i 6= 6X i . 10.2. Propiedad reproductiva de la distribución normal Si X 1 , X 2 , . . . , X n son n variables aleatorias independientes y cada X i tiene una distribución normal con E (X i ) = µi y V (X i ) = σ2i , entonces: Y = c 1 X 1 + c 2 X 2 + · · · + c n X n , es una variable aleatoria normal, con: E (Y ) = c 1 µ1 + c 2 µ2 + · · · + c n µn y V (Y ) = c 12 σ21 + c22 σ22 + · · · + c n2 σ2n . Veamos un ejemplo. La envoltura de plástico para un disco magnético está formada por dos hojas. Si el espesor de una hoja es una variable aleatoria, siendo: ¡ ¢ X ∼ N µx = 1, 5 mm , σ2x = 0, 01 mm2 , entonces el espesor de las dos hojas es una variable aleatoria Y , resultando: ¡ ¢ Y = X 1 + X 2 ∼ N µY = 3 mm , σ2Y = 0, 02 mm2 . (X i simboliza la variable aleatoria espesor de la hoja i ). Hemos supuesto además que las variables aleatorias X 1 y X 2 son independientes. 10.3. La distribución chi-cuadrado Si X 1 , X 2 , . . . , X n son n variables aleatorias independientes donde cada una tiene una distribución N (0, 1), entonces T = X 12 + X 22 + · · · + X k2 tiene una distribución que llamaremos chi-cuadrado con k grados de libertad y notaremos T ∼ χ2k . Esta distribución se aplicará para estimar la variancia de una variable aleatoria con distribución normal. Observemos la gráfica correspondiente para distintos valores de k. 12 11. Teorema del límite central Si X 1 , X 2 , . . . X n son n variables aleatorias independientes cualesquiera, con E (X i ) = µi y V (X i ) = σ2i , entonces, bajo ciertas condiciones que son válidas en la mayor parte de las aplicaciones, la variable aleatoria X = X 1 + X 2 + · · · + X n , con n convenientemente grande, tiene una distribución aproximadamente normal con parámetros P P E (X ) = ni=1 µi y V (X ) = ni=1 σ2i . Es importante realizar las siguientes observaciones: Por lo general se considera que n es convenientemente grande cuando es mayor que 30. En muchos problemas, la variable aleatoria que se considera puede ser representada como la suma de n variables aleatorias independientes, y por lo tanto, su distribución puede aproximarse por la distribución normal. Por ejemplo: El consumo diario de electricidad en una ciudad es igual a la suma de un número considerable de consumos individuales. Las condiciones generales citadas anteriormente pueden resumirse como sigue: Los términos individuales en la suma contribuyen con una cantidad despreciable a la variación de la suma y es poco probable que cualquier término haga una gran contribución a la suma. El Teorema del Límite Central establece que los sumandos no necesitan estar distribuidos normalmente a fin de que la suma sea aproximada a una distribución normal. 11.1. Problema de aplicación Al sumar números, un computador aproxima cada número al entero más próximo. Supongamos que todos los errores de aproximación son independientes y distribuidos uniformemente en [−0, 5; 0, 5]. Si se suman 1500 números, ¿cuál es la probabilidad de que la magnitud del error total exceda 15? Sea X i : error de aproximación en el i -ésimo número y X : error en la suma de los 1500 números. X= 1500 X i =1 Xi , E (X ) = 1500E (X i ) , V (X ) = 1500V (X i ) . 2 1 donde E (X i ) = 0 y V (X i ) = (0.5−(−0.5)) = 12 . 12 Por el teorema del límite central X tiene distribución aproximadamente normal con E (X ) = 0 y V (X ) = Por lo tanto P (|X | > 15) = 1 − P (|X | ≤ 15) = = 15 |X − 0| 1−P q ≤q = 1 − P (|Z | ≤ 1.34) = = 1 − (2 × 0.9099 − 1) = 1 − 0.8198 = 0.1802. 1500 12 1500 12 1500 12 . 11.2. Propuesta 1. El espesor de una lámina metálica en mm es una variable aleatoria, ¡ ¢ X ∼ N µ X = 0.5; σ X = 0.05 . El espesor de una lámina de papel aislante en mm es también una variable aleatoria, ¡ ¢ Y ∼ N µY = 0.05; σY = 0.02 . Obtenga la distribución del espesor del núcleo de un transformador que consta de 50 capas de láminas metálicas y 49 láminas de papel aislante. 13 2. La demanda diaria de agua por habitante en una ciudad de 10000 habitantes es una variable aleatoria X con E (X ) = 0.4 m3 y σ X = 0.09 m3 . La disponibilidad de agua para el consumo almacenado diariamente en una represa es una variable aleatoria ¡ ¢ Y ∼ N µY = 4500m3 ; σY = 450m3 . Calcule la probabilidad de que un día cualquiera no sea satisfecha la demanda. 3. Un supermercado tiene dos puertas de ingreso que indicamos con A y B . El número de clientes que entran por la puerta A en un período de 1 minuto es una variable aleatoria con distribución de Poisson de parámetro λ A = 2.5, y el número de clientes que entran por la puerta B en un período de 1 minuto es una variable aleatoria independiente de la anterior, con distribución de Poisson de parámetro λB = 2. Calcule la probabilidad de que en un período de 2 minutos entren por lo menos 5 clientes. 11.3. Algunas aplicaciones del teorema del límite central 11.3.1. Aproximación normal a la distribución binomial Consideremos la siguiente situación: se inspecciona un artículo que sale de un proceso de producción y se anota un 0 cuando dicho artículo no tiene defectos y un 1 cuando sí los tiene. Si p es la probabilidad de que un artículo resulte defectuoso, la variable aleatoria X que representa el estado del artículo se dice que tiene una distribución de Bernoulli con parámetro p. En síntesis una variable aleatoria con distribución de Bernoulli de parámetro p asume los valores 0 y 1 con probabilidades 1 − p y p respectivamente. Si se inspeccionan en forma independiente n artículos del proceso de producción y se anotan los valores para X 1 , X 2 , . . . , X n , donde X i = 1 si el i -ésimo artículo inspeccionado tiene defectos y X i = 0 si no es así entonces una variable aleatoria de interés es Y = X 1 + X 2 + · · · + X n , que representa el número total de artículos defectuosos en una muestra de tamaño n. La variable aleatoria Y tiene una distribución binomial de parámetros n y p, siendo E (Y ) = np y V (Y ) = np(1 − p). Por el Teorema del Límite Central, «para n convenientemente p grande», la variable aleatoria Y tiene una distribución aproximadamente normal con E (Y ) = np y σ(Y ) = np(1 − p). Si quisiéramos calcular la probabilidad de que en una muestra de 1000 artículos haya a lo sumo 10 defectuosos y suponiendo que la probabilidad de que un artículo es defectuoso es igual a 0.02 podríamos proceder de las siguientes maneras: 1. Aplicando la distribución binomial: P (Y ≤ 10) = ¶ 10 µ X 1000 0.02k · 0.981000−k , k k=0 lo cual resulta difícil de calcular. 2. Aplicando la aproximación por la distribución normal: µ ¶ 10 − 20 P (Y ≤ 10) = P Z ≤ = 0.0119, 4.427 14 donde 20 y 4.427 son los valores de la esperanza matemática y la desviación estándar de la variable aleatoria Y y Z la variable normal reducida. La aproximación normal a la distribución binomial es buena, en particular, cuando np > 5 y np(1−p) > 5. En general: Si Y es una variable aleatoria binomial con parámetros n y p entonces la variable aleatoria Y − np Zn = p np(1 − p) tiende a una distribución normal reducida cuando n es convenientemente grande. 11.3.2. Aproximación normal a la distribución de Poisson Si Y = X 1 + X 2 + · · · + X n , donde cada X i tiene distribución de Poisson de parámetro λi , entonces Y (cuando las P variables X i son independientes) tiene una distribución de Poisson con parámetro λ = ni=1 λi . p Para valores de n convenientemente grandes la variable aleatoria (Y −λ)/ λ tiende a una distribución normal reducida. Siendo λi > 0, cuando mayor sea el número de variables que se suman, mayor resultará el valor de λ. La aproximación normal a la distribución de Poisson se considera aceptable para valores grandes de λ; por lo tanto dicha aproximación se recomienda cuando los valores de λ no figuran en la tabla de la distribución de Poisson. 11.3.3. El Teorema del Límite Central y los errores aleatorios de medición Cualquier método para la determinación numérica de magnitudes físicas está sujeto a error. Si se realizan mediciones repetidas de una misma magnitud, encontraremos que los valores que se obtienen varían de una medición a otra, y estas fluctuaciones se explican por la presencia de errores de medición. Los errores suelen dividirse en tres grupos: errores groseros, errores sistemáticos y errores aleatorios. Los errores groseros son cometidos por falta de cuidado por parte del observador al leer los instrumentos o realizar un uso inadecuado de los mismos. Las mediciones afectadas con errores groseros suelen encontrarse rápidamente porque tienen valores “bastante” diferentes a las otras mediciones. Los errores sistemáticos, por lo general, son debido a los instrumentos de medición. Si, por ejemplo, una longitud se mide con una regla más corta de lo que indican sus divisiones, cada medición dará un valor mayor (constante) del verdadero valor. Estos errores no se encontrarán a menos que se repitan las mediciones con otra regla y obviamente estos errores no se prestan para un estudio probabilístico. Los errores aleatorios son aquellos que no muestran regularidades, o cuyas regularidades no conocemos. Estos errores son debidos a un gran número de causas que el observador no puede controlar, como las vibraciones del instrumento, variaciones de la temperatura del ambiente, corrientes de aire, etc. Los errores de este tipo fluctúan de forma irregular de una medición a otra, por lo cual no es posible predecir sus valores. Por lo tanto, los errores aleatorios se consideran como variables aleatorias y son tratados por los métodos de la teoría de la probabilidad. En cualquier método de medición habrá un gran número de causas de errores aleatorios. Si podemos suponer que cada una de estas causas produce cierto error elemental, y que los diversos errores elementales son variables aleatorias independientes, que por adición generan el error total, el Teorema del Límite Central justifica la distribución aproximadamente normal. En general, los errores aleatorios de medición se distribuyen simétricamente alrededor del valor cero (los errores positivos y negativos son igualmente probables) En ausencia de errores groseros y sistemáticos podemos suponer que cada valor de una medición de una magnitud se compone del verdadero valor más un error aleatorio. Si es el verdadero valor de una magnitud y x i el valor de la i -ésima medición entonces x i = α + ²i , donde ²i denota el error aleatorio en la i -ésima medición. Bajo el supuesto de que ²i son los valores de una variable aleatoria ² con distribución normal de parámetros 0 y σ, resulta que x i son los valores de una variable aleatoria X con distribución normal de parámetros α y σ (Justifique). En síntesis, la teoría de errores aleatorios se basa en el supuesto que el verdadero valor desconocido de una magnitud se identifica con la media de todas las posibles mediciones. Por otra parte, la desviación estándar de todas las posibles mediciones caracteriza el grado de precisión de las mismas. 15 12. Algunas aplicaciones del teorema del límite central 12.1. Aproximación normal a la distribución binomial Consideremos la siguiente situación. Se inspecciona un artículo que sale de un proceso de producción y se anota un 0 cuando dicho artículo no tiene defectos y un 1 cuando sí los tiene. Si p es la probabilidad de que un artículo resulte defectuoso, la variable aleatoria X que representa el estado del artículo se dice que tiene una distribución de Bernoulli con parámetro p. En síntesis una variable aleatoria con distribución de Bernoulli de parámetro p asume los valores 0 y 1 con probabilidades 1 − p y p respectivamente. Si se inspeccionan en forma independiente n artículos del proceso de producción y se anotan los valores para X 1 , X 2 , . . . , X n , donde X i = 1 si el i-ésimo artículo inspeccionado tiene defectos y X i = 0 si no es así entonces una variable aleatoria de interés es Y = X 1 + X 2 + · · · + X n , que representa el número total de artículos defectuosos en una muestra de tamaño n. La variable aleatoria Y tiene una distribución binomial de parámetros n y p, siendo E (Y ) = np y V (Y ) = np(1 − p). Por el Teorema del Límite Central, “para n convenientemente grande”, la variable aleatoria Y tiene una distribup ción aproximadamente normal con E (Y ) = np y σ(Y ) = np(1 − p). Si quisiéramos calcular la probabilidad de que en una muestra de 1000 artículos haya a lo sumo 10 defectuosos y suponiendo que la probabilidad de que un artículo es defectuoso es igual a 0.02 podríamos proceder de las siguientes maneras: 1. Aplicando la distribución binomial: P (Y ≤ 10) = ¶ 10 µ X 1000 0.02k · 0.981000−k , k k=0 lo cual resulta difícil de calcular. 2. Aplicando la aproximación por la distribución normal: ¶ µ 10 − 20 = 0.0119, P (Y ≤ 10) = P Z ≤ 4.427 donde 20 y 4.427 son los valores de la esperanza matemática y la desviación estándar de la variable aleatoria Y y Z la variable normal reducida. La aproximación normal a la distribución binomial es buena, en particular, cuando np > 5 y np(1−p) > 5. En general: Si Y es una variable aleatoria binomial con parámetros n y p entonces la variable aleatoria Y − np Zn = p np(1 − p) tiende a una distribución normal reducida cuando n es convenientemente grande. 12.2. Aproximación normal a la distribución de Poisson Si Y = X 1 + X 2 + · · · + X n , donde cada X i tiene distribución de Poisson de parámetro λi , entonces Y (cuando las P variables X i son independientes) tiene una distribución de Poisson con parámetro λ = ni=1 λi . p Para valores de n convenientemente grandes la variable aleatoria (Y −λ)/ λ tiende a una distribución normal reducida. Siendo λi > 0, cuando mayor sea el número de variables que se suman, mayor resultará el valor de λ. La aproximación normal a la distribución de Poisson se considera aceptable para valores grandes de λ; por lo tanto dicha aproximación se recomienda cuando los valores de λ no figuran en la tabla de la distribución de Poisson. 16 12.3. El teorema del límite central y los errores aleatorios de medición Cualquier método para la determinación numérica de magnitudes físicas está sujeto a error. Si se realizan mediciones repetidas de una misma magnitud, encontraremos que los valores que se obtienen varían de una medición a otra, y estas fluctuaciones se explican por la presencia de errores de medición. Los errores suelen dividirse en tres grupos: errores groseros, errores sistemáticos y errores aleatorios. Los errores groseros son cometidos por falta de cuidado por parte del observador al leer los instrumentos o realizar un uso inadecuado de los mismos. Las mediciones afectadas con errores groseros suelen encontrarse rápidamente porque tienen valores “bastante” diferentes a las otras mediciones. Los errores sistemáticos, por lo general, son debido a los instrumentos de medición. Si, por ejemplo, una longitud se mide con una regla más corta de lo que indican sus divisiones, cada medición dará un valor mayor (constante) del verdadero valor. Estos errores no se encontrarán a menos que se repitan las mediciones con otra regla y obviamente estos errores no se prestan para un estudio probabilístico. Los errores aleatorios son aquellos que no muestran regularidades, o cuyas regularidades no conocemos. Estos errores son debidos a un gran número de causas que el observador no puede controlar, como las vibraciones del instrumento, variaciones de la temperatura del ambiente, corrientes de aire, etc. Los errores de este tipo fluctúan de forma irregular de una medición a otra, por lo cual no es posible predecir sus valores. Por lo tanto, los errores aleatorios se consideran como variables aleatorias y son tratados por los métodos de la teoría de la probabilidad. En cualquier método de medición habrá un gran número de causas de errores aleatorios. Si podemos suponer que cada una de estas causas produce cierto error elemental, y que los diversos errores elementales son variables aleatorias independientes, que por adición generan el error total, el Teorema del Límite Central justifica la distribución aproximadamente normal. En general, los errores aleatorios de medición se distribuyen simétricamente alrededor del valor cero (los errores positivos y negativos son igualmente probables) En ausencia de errores groseros y sistemáticos podemos suponer que cada valor de una medición de una magnitud se compone del verdadero valor más un error aleatorio. Si es el verdadero valor de una magnitud y x i el valor de la i -ésima medición entonces x i = α + ²i , donde ²i denota el error aleatorio en la i -ésima medición. Bajo el supuesto de que ²i son los valores de una variable aleatoria ² con distribución normal de parámetros 0 y σ, resulta que x i son los valores de una variable aleatoria X con distribución normal de parámetros α y σ (Justifique). En síntesis, la teoría de errores aleatorios se basa en el supuesto que el verdadero valor desconocido de una magnitud se identifica con la media de todas las posibles mediciones. Por otra parte, la desviación estándar de todas las posibles mediciones caracteriza el grado de precisión de las mismas. 13. Covariancia y coeficiente de correlación Cuando vemos un niño de cinco años y decidimos que está muy alto, lo comparamos con la altura media de otros niños de la misma edad; es decir, relacionamos dos variables, la edad y la altura. Cuando se tienen dos variables aleatorias X e Y suele ser útil describir cómo varían conjuntamente, o disponer de una medida de la relación que existe entre las variables. Una medida de la relación que existe entre dos variables aleatorias es la covariancia. Definimos Se llama covariancia entre dos variables aleatorias X e Y , y se nota cov (X .Y ), al número £¡ ¢¡ ¢¤ cov (X , Y ) = E X − µ X Y − µY . De la definición surge de inmediato que: Si X e Y son variables aleatorias discretas con función de probabilidad conjunta p(x, y), entonces cov (X , Y ) = X ¡ (x,y)∈R X ×Y x − µX ¢¡ ¢ y − µY p(x, y). Si X e Y son variables aleatorias continuas con función densidad conjunta f (x, y), entonces 17 (3) cov (X , Y ) = Z +∞ Z +∞ ¡ −∞ −∞ x − µX ¢¡ ¢ y − µY f (x, y) d x d y. (4) Las expresiones (3) y (4) nos permiten una interpretación rápida de la covariancia. Veamos algunas cuestiones importantes. Si los valores grandes de X están asociados con valores grandes de Y , con una probabilidad alta, entonces la covariancia es positiva. En cambio si existe una probabilidad alta de que valores grandes de X se encuentren asociados con valores pequeños de Y o viceversa entonces la covariancia será negativa. Le proponemos probar que cov (X , Y ) = E (X · Y ) − E (X ) · E (Y ). En el caso en que las variables aleatorias son independientes, ya hemos observado que E (X · Y ) = E (X ) · E (Y ), y por lo tanto cov (X , Y ) = 0. Sin embargo puede mostrarse mediante un ejemplo que la recíproca no se cumple. El inconveniente que presenta la covariancia es que depende de las unidades en que vienen dadas las variables aleatorias. Si en vez de X e Y se toman las variables aleatorias a X , bY , donde a y b son escalares, resulta: cov (a X , bY ) = ab cov (X , Y ). Para evitar este inconveniente se ha recurrido al siguiente concepto. Introducimos la siguiente definición: Se llama coeficiente de correlación entre dos variables aleatorias X e Y y se nota ρ(X , Y ), al cociente cov (X , Y ) ρ(X , Y ) = . σ X · σY De la definición se deduce en forma inmediata que ¶ X − µ X Y − µY ρ(X , Y ) = E · . σX σY µ es la covariancia entre dos variables estandarizadas, es decir, variables que tienen esperanza matemática igual a cero y variancia igual a uno. Enunciaremos, sin demostrar, algunas propiedades del coeficiente de correlación. 1. −1 ≤ ρ(X , Y ) ≤ 1. 2. ρ(X , Y ) = −1 ⇔ Y = AX + B , con A < 0. 3. ρ(X , Y ) = 1 ⇔ Y = AX + B , con A > 0. Cuando el coeficiente de correlación toma el valor −1 entonces las observaciones del vector (X , Y ) se encuentran (con probabilidad uno) sobre una recta con pendiente negativa; en cambio cuando el coeficiente de correlación toma el valor 1, entonces las observaciones del vector (X , Y ) se encuentran (con probabilidad uno) sobre una recta con pendiente positiva. El valor ρ = 0 indica la ausencia de cualquier relación lineal entre las variables, sin embargo puede existir otro tipo de relación. Si existe una relación estrecha entre dos variables, el conocimiento de una de ellas puede ayudar a predecir el comportamiento de la otra; en cambio cuando la relación es débil, tener información sobre una de las variables no ayuda demasiado a extraer conclusiones sobre la otra. Si se conoce la función de densidad conjunta f (x, y) de un vector aleatorio continuo (X , Y ), entonces, es posible calcular el coeficiente de correlación entre X e Y . ¿Por qué? 18 ¢ ¡ Si sólo se tiene una muestra formada por n pares ordenados x i , y i , con i = 1, . . . , n, de observaciones del vector (X , Y ), una medida adecuada del grado de asociación lineal entre las variables X e Y viene dada por el estadístico ¡ ¢¡ ¢ 1 Pn n i =1 x i − x y i − y r=q ¡ ¢2 q 1 Pn ¡ ¢2 . 1 Pn x − x y − y n i =1 i n i =1 i El estadístico r se denomina coeficiente de correlación de la muestra. Observemos que el numerador de r es la media aritmética de los productos de las desviaciones correspondientes de x i e y i , y sus medias muestrales. Este valor se denomina covariancia muestral entre X e Y , y se simboliza por S X Y . En el denominador de r aparece el producto del desvío estándar de los valores de x i (S X ) con el desvío estándar de los valores y i (S Y ). Con la notación introducida, podemos escribir: r= SX Y . S X · SY Veamos las propiedades de r , las que pueden ser deducidas a partir de su definición: 1. 1 ≤ r ≤ 1. 2. Si r = 1 (ó r = −1), los puntos de la muestra están situados sobre una línea recta de pendiente positiva (negativa). 3. Si r asume valores próximos a 1 ó −1, habrá una asociación lineal fuerte entre las variables. 4. Si r es próximo a cero, entonces hay una correlación muy débil entre las variables. (Podrá existir una relación no lineal) 5. r es un número sin dimensión, es decir, no depende de las unidades empleadas para X e Y . Es claro que r es una medida muy útil para saber el grado en que la asociación entre las dos variables se aproxima a una relación funcional lineal. Por otra parte es fundamental que se comprenda que r por sí mismo no puede probar ni desmentir una relación causal entre X e Y aún cuando r = ±1. La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe entre X e Y , y ésta no debe manifestarse sólo por la existencia de una fuerte correlación entre X e Y . 13.1. Propuesta Los datos que figuran en la siguiente tabla fueron recopilados con el fin de estudiar la relación entre la vida útil de una herramienta y su velocidad de corte. vida útil velocidad de corte 41 86 18 104 22 100 43 85 6 107 20 104 21 106 35 99 35 90 11 110 15 108 13 105 32 91 Le proponemos que construya un diagrama de dispersión (visto en la Unidad I) representando sobre el eje horizontal la velocidad de corte. 1. ¿Cuáles son sus observaciones? 2. Calcule el coeficiente de correlación muestral. 19 14. Problemas adicionales sobre suma de variables aleatorias En cada problema tiene que definir todas las variables aleatorias implicadas en el mismo y fundamentar cada paso que realice. 1. Sobre un bloque de tipo A se colocan dos bloques de tipo B (denotados con B 1 y B 2 ) como se muestra en la figura. El ancho de los bloques de tipo A varía aleatoriamente con media 10 y desviación estándar 0.5. El ancho de los bloques de tipo B varía aleatoriamente con media 3 y desviación estándar 0.3. Sea Z la variable aleatoria ancho del hueco comprendido entre los bloques B 1 y B 2 . Calcule E (Z ) y V (Z ). B1 B2 A 2. El peso del equipaje para un pasajero turista que vuela con cierta aerolínea varía aleatoriamente con distribución normal, media 20 kg y desviación estándar de 5 kg. En cambio el peso del equipaje para un pasajero clase ejecutivo varía aleatoriamente con distribución normal, media µ = 10 kg y desviación estándar σ = 3 kg. Si en un vuelo de dicha aerolínea viajan doce pasajeros clase ejecutiva y cincuenta pasajeros de clase turista, ¿cuál es la probabilidad de que el peso total del equipaje sea a lo sumo de 1 250 kilogramos? 3. Sean X e Y variables aleatorias independiente idénticamente distribuidas que asumen los valores 1, 2 y 3. a) Indique los valores que asumen las variables aleatorias: 2X , X + Y y X − Y . b) Ordene de menor a mayor las esperanzas matemáticas y las variancias de las variables aleatorias del ítem 3a. 4. El tiempo que tarda un colectivo en realizar el viaje, tanto de la ciudad A a la ciudad B como de B a A varía aleatoriamente con media y desviación estándar igual a 60 minutos y 10 minutos respectivamente. ¿Cuál es la media y la desviación estándar del tiempo de un viaje de ida y vuelta entre las ciudades A y B ? (Suponga independencia entre los tiempos de ida y vuelta). 5. El consumo de combustible en litros de un ómnibus que realiza el trayecto Rosario Santa Fe es una variable aleatoria normalmente distribuida con media µ = 20 litros y desviación estándar σ = 2 litros. Calcule la probabilidad de que 640 litros resulten insuficientes para realizar 30 viajes. 6. Un ensamble eléctrico consta de 20 bloques de tipo A y 30 bloques de tipo B conectados longitudinalmente. Los ensambles se colocan en recipientes cuya longitud (en cm) varía aleatoriamente con distribución normal, media µ = 65 y desviación estándar σ = 0.5. Se conoce además que la longitud (en cm) de un bloque de tipo A varía aleatoriamente con media µ = 1.95 y desvío estándar σ = 0.01 y la longitud (en cm) de un bloque de tipo B es una variable aleatoria Y con media µ = 0.83 y desviación estándar σ = 0.02 cm. Calcule la probabilidad de que un ensamble entre en un recipiente, cuando ambos son elegidos al azar. 7. Las longitudes de trozos de cables que corta un autómata se distribuyen normalmente con media 3.5 m y desviación estándar 0.25 m. Se necesita un cable de por lo menos 33 m de longitud. Calcule la probabilidad de que la unión de 10 trozos de cables cortados por el autómata y elegidos al azar, resulten suficientes para cumplir con los requerimientos. 8. Una empresa de transporte maneja contenedores de tres tamaños: 27 m3 , 125 m3 y 512 m3 . Sea X i el número de contenedores de cada tipo embarcados durante una semana dada. Se conoce que: E (X 1 ) = 200, E (X 2 ) = 250, E (X 3 ) = 100, V (X 1 ) = 100, V (X 2 ) = 144, V (X 3 ) = 64. a) Suponiendo que las variables X 1 , X 2 y X 3 son independientes calcule la esperanza matemática y la variancia del volumen total embarcado. b) ¿Alguno de los valores calculados en 8a se modifica si las variables no son independientes? Explique. 20