1. Regla para los valores esperados en variables aleato

Valores esperados, varianza y desviación estándar para variables aleatorias Universidad de Puerto Rico ESTA 3041 Prof. Héctor D. Torres Aponte 1. Regla para los valores esperados en variables aleatorias A continuación expondremos las reglas al momento de calcular valores esperados cuando tenemos mas de una variable o simplemente alguna alteración de la variable original. Propiedad 1.1. Para variables aleatorias tenemos que: 1. Si X es una variable aleatoria y a, b números fijos entonces, µa+bX = a + bX. 2. Si X y Y son variables aleatorias entonces, µX+Y = µX + µY . Considere que la compañia “Gain Communications” vende productos de comunicación para propósitos militares y propósitos civiles. Las ventas del próximo año dependen de las condiciones del mercado las cuales no se pueden predecir con exactitud. Gain utiliza un modelo probabilı́stico para estimar sus ventas en el próximo año. La división de productos militares tiene la siguiente distribución: Unidades vendidas Probabilidad 1000 0.1 3000 0.3 5000 0.4 10,000 0.2 La división civil estima: Unidades vendidas Probabilidad 300 0.4 500 0.5 750 0.1 Ahora, sea X el número de unidades vendidas con propósito militar. Y el número de unidades vendidas con propósito civil. Utilizando las tablas de distribución podemos calcular el valor esperado para X de la siguiente manera: µX = (1, 000)(0.1) + (3, 000)(0.3) + (5, 000)(0.4) + (10, 000)(0.2) = 100 + 900 + 2000 + 2000 = 5000 1 lo que nos indica que el valor esperado para la variable aleatoria X es de 5,000 unidades. Haciendo lo mismo para la variable aleatoria Y obtenemos: µY = (300)(0.4) + (500)(0.5) + (750)(0.1) = 120 + 250 + 75 = 445 ası́ que el valor esperado para la variable aleatoria Y es de 445 unidades. Ahora, suponga que la compañia Gain genera una ganancia de $2,000 dólares por unidad militar y $3,500 por unidad civil. Podemos estimar la ganancia promedio para los productos militares: µ2,000X = 2, 000µX = (2, 000)(5, 000) = $10, 000, 000 De la misma forma, la ganancia promedio para los productos civiles es: µ3,500Y = 3, 500µY = (3, 500)(445) = $1, 557, 500 Ya tenemos la ganancia estimada promedio para el próximo año por tipo de producto, obviamente si queremos calcular cual es la ganancia total promedio de la compañia para el próximo año, solamente tenemos que tomar la suma de $10, 000, 000 + $1, 557, 500 lo que nos da un gran total de $11,557,500. Está será la ganancia promedio para el próximo año en la compañia Gain communications. Ahora, si queremos ver como matemáticamente es posible tenemos que hacer lo siguiente, la ganancia total (Z) para la compañia Gain communications es descrita por: Z = 2, 000X + 3, 500Y entonces la ganancia total promedio para el próximo año es: µZ = µ2,000X+3,500Y 1.1. = = = = = µ2,000X + µ3,500Y 2, 000µX + 3, 500µY 2, 000(5, 000) + 3, 500(445) 10, 000, 000 + 1, 557, 500 11, 557, 500 Varianza de una variable aleatoria Sabemos que la varianza y la desviación estándar son medidas de disperción. La notación para la varianza de datos se denotó como s2 . Ahora vamos a denotar la varianza de una 2 variable aleatoria como σX . 2 Definición 1.1. Suponga que X es una variable aleatoria discreta cuya distribución es: Valor de X Probabilidad x1 p1 x2 p2 ··· ··· xk pk con media µ. La varianza de la variable aleatoria X se define como: 2 σX = (x1 − µX )2 p1 + (x2 − µX )2 p2 + · · · + (xk − µX )2 pk k X = (xi − µX )2 pi i=1 cuya desviación estándar es v u k q uX 2 σX = σX = t (xi − µX )2 pi i=1 Note que los términos de la varianza de una variable aleatoria son muy similares a la varianza de una serie de datos, la única diferencia es que en vez de que cada término utilize x̄, se utiliza µX y se multiplica por la probabilidad pi . Ejemplo 1.2. Utilizando el ejemplo de la compañia Gain Communications, considere los estimados de los productos con propósito militar: Unidades vendidas Probabilidad 1000 0.1 3000 0.3 5000 0.4 10,000 0.2 Entonces, podemos encontrar la varianza de la variable aleatoria X. Para esto utilizamos la siguiente tabla: xi 1, 000 3, 000 5, 000 10, 000 pi 0.1 0.3 0.4 0.2 xi p i (xi − µX )2 pi 100 (1, 000 − 5, 000)2 (0.1) = 1, 600, 000 900 (3, 000 − 5, 000)2 (0.3) = 1, 200, 000 2000 (5, 000 − 5, 000)2 (0.4) = 0 2000 (10, 000 − 5, 000)2 (0.2) = 5, 000, 000 2 µX = 5, 000 σX = 7, 800, 000 Vemos que el valor esperado es la suma de todos los elementos en la tercera columna y la varianza es la suma de todos los elementos en la cuarta columna. Si queremos calcular la desviación estandar, entonces: q p 2 σX = σX = 7, 800, 000 = 2, 792.8 3 1.2. Reglas para la varianza de una variable aleatoria Definición 1.2. Dos variables aleatorias X y Y son independientes si al conocer eventos relacionados con la variable X no afecta a los eventos relacionados con la variable Y . Cuando dos variables no son independientes la varianza de sus sumas depende de su correlación. Obviamente, si no son independientes la correlación es distinta de cero. Anteriormente para un conjunto de datos utilizamos r para denotar la correlación entre dos conjuntos, ahora para denotar la correlación de dos variables aleatorias utilizamos la letra griega ρ (“rho”). Definición 1.3 (Regla de varianza para variables aleatorias). 1. Si X es una variable aleato2 2 . ria discreta e independiente y a, b números fijos entonces σa+bX = b2 σX 2. Si X y Y tienen una correlación ρ, entonces 2 σX+Y 2 σX−Y 2 = σX + σY2 + 2ρσX σY 2 = σX + σY2 − 2ρσX σY 3. Si X y Y son independientes entonces ρ = 0 y por lo tanto 2 σX+Y 2 σX−Y 2 = σX + σY2 2 = σX + σY2 Note que cuando X y Y son variables independientes entonces ρ = 0 entonces el término ±2ρσX σy = 0, por lo tanto ese último término se elimina. Ejemplo 1.3. Utilizando el ejemplo del “Pega 3” ya discutido en clase, sabemos que la 1 y 0 la otra parte del tiempo. Esto lo podemos utilizar para probabilidad de ganar $500 1,000 hacer la siguiente tabla: xi pi 0 0.999 500 0.001 xi p i (xi − µX )2 pi 0 (0 − 0.5)2 (0.999) = 0.24975 0.5 (500 − 0.5)2 (0.001) = 249.50025 2 µX = 0.5 σX = 249.75 Esto tiene una desviación estándar de σX = √ 249.75 = $15.80. Ahora, si se compra un boleto su ganancia neta se define como W = X − 1 esto es ya que X es la cantidad ganada menos el $1 invertido. La cantidad promedio que usted gana es µW = µ−1+X = −1 + µX = −$0.50 lo que nos indica que usted pierde $0.50 por cada jugada. 4 Ahora, suponga que usted compra un boleto ($1) dos dı́as diferentes. La ganancia de X y Y de cada boleto son independientes ya que son sorteos separados. La ganancia total promedio de ambos sorteos es: µX+Y = µX + µY = $0.50 + $0.50 = $1.00. Como X y Y son independientes entonces ρ = 0, lo que implica a que su varianza es 2 2 σX+Y = σX + σY2 = 2(249.75) = 499.5 y cuya desviación estándar es: σX+Y = √ 499.5 = $22.35 Note que esto no es lo mismo que la suma de las desviaciones estándares de cada variable ya que 15.80+15.80=31.60. Note que la varianza de variables independientes se suman, pero las desviaciones estándares no. Ejemplo 1.4. Las universidades a nivel subgraduado utilizan el SAT para propósitos de admisión. Suponga que la variable aleatoria X representa la puntuación obtenida en la parte de matemáticas con µX = 625 y σX = 90. Además, suponga que Y es la variable aleatoria que representa la puntuación en la parte verbal con µY = 590 y σ = 100. ¿Cual es la media y la desviación estándar de la puntuación total obtenida en el examen del SAT?, esto es, calclular µX+Y . Para esto tenemos que el promedio de la puntuación total del SAT es µX+Y = µX + µY = 625 + 590 = 1215 No podemos calcular la varianza y la desviación estándar por que no tenemos el factor de correlación ρ. Ahora, suponga que ρ = 0.7, entonces 2 σX+Y 2 = σX + σY2 + 2ρσX σY = (90)2 + (100)2 + (2)(0.7)(90)(100) = 30, 700 Cuya desviación estándar es σX+Y = 1.3. p 30, 700 = 175. Distribución binomial Una compañia de recursos humanos le pregunta a 100 empleados si se sienten presionados en el trabajo. Si vemos, las posibles respuestas son “si” o “no”. Esto es un claro ejemplo de lo que es una distribución binomial. Podemos decir que la distribución binomial es útil al momento de querer medir éxitos o fracasos en algún experimento. Para poder utilizar la distribución binomial, tenemos que cumplir ciertos requisitos: 5 1. Tiene que tener un número fijo de n observaciones. 2. Las n observaciones tienen que ser independientes. 3. Cada observación se tiene que clasificar entre “éxito” o “fracaso”. 4. La probabilidad de éxito, llamada p, tiene que ser igual para todas las observaciones. Definición 1.4. La distribución del conteo X de “éxitos” que cumpla con los requisitos mencionados anteriormente es una distribución binomial con parametros n y p. El parametro n es el número de observaciones y p es la probabilidad de éxito de cualquier observación. Ejemplo 1.5. Cada consumido tiene una probabilidad de 0.25 de preferir nuestro producto sobre otros productos de la competencia. Si le preguntamos a 5 consumidores, ¿Cual es la probabilidad de que exactamente 2 consumidores prefieran nuestro producto? Para esto, tenemos que definir que nuestra variable aleatoria X es el conteo de consumidores que prefieren nuestro producto. Vemos que X es una variable aleatoria binomial con parametros n = 5 y p = 0.25. Usando una notación mas corta, podemos decir que, X ∼ Bin(5, 0.25). Note que lo que queremos calcular es P (X = 2). S = ‘‘éxito’’ → prefieren nuestro producto Ahora com primer paso, F = ‘‘fallo’’ → no prefieren nuestro producto suponga que el primer y el tercer encuestado son s, entonces, el “outcome” es SF SF F pero como los eventos son independientes entonces Sea P (SF SF F ) = P (S)P (F )P (S)P (F )P (F ) = (0.25)(0.75)(0.25)(0.75)(0.75) = (0.25)2 (0.75)3 Ahora si vermos todas nuestas opciones, obtenemos 10 posibilidades SSF F F SF SF F SF F SF SF F F S F SSF F F SF SF F SF F S F F SSF F F SF S F F F SS vemos que cada observación tiene la misma probabilidad de ocurrir, entonces P (X = 2) = 10(0.25)2 (0.75)3 = 0.2637 Note que el patrón de todas las observaciones se basa que de 5 personas 2 son éxito. Definición 1.5. El número de maneras para obtener k éxitos de n observaciones es dado por el coeficiente binomial, este se define como n n! = k!(n − k)! k para k = 0, 1, 2, ..., k 6 Note que n! = n × (n − 1) × (n − 2) × · · · × 3 × 2 × 1 y por definición 0! = 1. Ahora por ejemplo si queremos cuantas opciones tenemos si que remos dos éxitos en 5 personas, para esto tenemos que, n 5! 5! = = k 3!(5 − 3)! 3!2! 5 × 4× 6 3! = 6 3!2! 5 × 2× 6 2 = 62 = 10 Ahora la definición formar de la distribución de probabilidad de una variable aleatoria binomial es, Definición 1.6. Si X ∼ Bin(n, p) entonces n k P (X = k) = p (1 − p)n−k k Ejemplo 1.6. En el ejemplo anterior se entrevisto a 5 personas, por lo tanto n = 5 con una probabilidad idénticamente distribuida de 0.25 por lo tanto p = 0.25 que prefieran nuestro producto. Por lo tanto aplicando la definición anterior tenemos que 5 P (X = 2) = (0.25)2 (0.75)5−2 2 5 = (0.25)2 (0.75)3 . 2 Ejemplo 1.7. Una encuesta encontró que un 65 % de todos los consumidores financieros están muy satisfechos con su institución bancaria. Suponga que 25 clientes son escogidos aleatoriamenete y que esta encuestra es válida al momento hacer dicha selección. ¿Cual es la probabilidad de que exactamente ’19 clientes están muy satisfechos con su institución primaria? Para esto, tenemos que la probabilidad de que los clientes estén muy satisfechos es p = 0.65 por lo tanto los que no están muy satisfechos son 1 − p = 1 − 0.65 = 0.35. Como se observaron 25 clientes, entonces n = 25 y queremos ver 19 de estos eventos por lo tanto k = 19. Entonces tenemos 25 P (X = 19) = (0.65)19 (0.35)25−19 19 = (177, 100)(0.00027884)(0.00183827) = 0.0908 Esto significa que 9.08 % de las veces se obtienen 19 de 25 clientes que están muy satisfechos con su intitución financiera. 7 Ejemplo 1.8. Según el U.S. Census Bureau, aproximadamente 6 % de todos los trabajadores en Jackson, Mississippi están desempleados. Si se realiza una encuesta telefónica aleatoria, ¿Cual es la probabilidad de que se obtengan 2 o menos trabajadores desempleados de una uestra de 20 trabajadores? Para resolver este problema, tenemos que p = 0.6, por lo tanto 1 − p = 1 − 0.06 = 0.94. Sea X el número de trabajadores desempleados, entonces queremos calcular P (X ≤ 2), P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) Entonces tenemos que calcular la probabilidad individual de cada evento y luego sumar, a esto se le conoce como la probabilidad acumulada. P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) 20 20 20 0 20 1 19 = (0.06) (0.94) + (0.06) (0.94) + (0.06)2 (0.94)18 0 1 2 = 20! 20! 20! (0.06)0 (0.94)20 + (0.06)1 (0.94)19 + (0.06)2 (0.94)18 0!(20 − 0)! 1!(20 − 1)! 2!(20 − 2)! = 20! 20! 20! (0.06)0 (0.94)20 + (0.06)1 (0.94)19 + (0.06)2 (0.94)18 0!(20)! 1!(19)! 2!(18)! = 6 20! 20× 6 19! 20 × 19× 6 18! (0.06)0 (0.94)20 + (0.06)1 (0.94)19 + (0.06)2 (0.94)18 0! 6 20! 1! 6 19! 2! 6 18! = (1)(0.06)0 (0.94)20 + (20)(0.06)1 (0.94)19 + 190(0.06)2 (0.94)18 = (1)(0.290106) + (20)(0.0185174) + 190(0.00118196) = 0.885026 1.4. Media y desviación estándar de la distribución binomial Definición 1.7. Si X ∼ Bin(n, p) entonces la media y la desviación estándar se definen como: µ = np p σ = np(1 − p) 2. Distribución Poisson Esta distribución cuenta variables aleatorias. Cuenta el número de eventos “éxitos” que ocurren en alguna unidad fija de medida como lo es la longitud, el área o el tiempo. Existen ciertos requisitos necesarios que se deben cumplir para decir que es un evento Poisson: 8 1. El número de eventos a ocurrir en cualquier unidad fija de medida tienen que ser independientes. No puede existie un “overlapping”. 2. La probabilidad de que un evento ocurra tiene que ser igual para todas las opciones. 3. La probabilidad de que 2 o mas eventos ocurran se hace 0 si la unidad de medida fija se aproxima a 0. La definición formal para la distribución Poisson es: Definición 2.1. La distribución del conteo X de éxitos que cumple con los requisitos de un evento Poisson es una distribución de probabilidad Poisson con media µ. El parameto µ es la media de los “éxitos” por unidad de medida. Los posibles valores para X son números enteros 0, 1, 2, · · · . Si k ∈ (0, ∞) entonces P (X = k) = cuya desviación estándar es √ µk e−µ k! µ. Note que e ≈ 2.71828183. Ejemplo 2.1. En un bando sus clientes llegan aleatoriamente a promedio de 3.2 clientes cada 4 minutos. ¿Cual es la probabilidad de tener mas de 7 clientes en un intérvalo de 4 minutos? Para esto tenemos que µ = 3.2 clientes/4 minutos y queremos ver X > 7 clientes/ 4 minutos. En teorı́a es necesario encontrar valores para X = 8, 9, 10, 11, 12, ... pero veamos lo que pasa: (3.2)8 e−3.2 8! (3.2)9 e−3.2 P (X = 9|µ = 3.2) = 9! (3.2)10 e−3.2 P (X = 10|µ = 3.2) = 10! (3.2)11 e−3.2 P (X = 11|µ = 3.2) = 11! (3.2)12 e−3.2 P (X = 12|µ = 3.2) = 12! (3.2)13 e−3.2 P (X = 13|µ = 3.2) = 13! P (X = 8|µ = 3.2) = = 0.1111 = 0.0040 = 0.0013 = 0.0004 = 0.0001 = 0.0000 Si seguimos calculando para X = 14, 15, ... vamos a obtener P (X) = 0, ası́ que basta con llegar a P (X = 13). Ahora tomando la suma tenemos que: P (X > 7) = P (X ≥ 8) = 0.0169. 9

1. Regla para los valores esperados en variables aleato

Documentos relacionados

Productos

Apoyo

1. Regla para los valores esperados en variables aleato

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib