Explicación de la tarea 4 Felipe Guerra Nota: Esta tarea corresponde a distribuciones continuas de probabilidad, la tarea de la semana anterior correspondía a distribuciones discretas. La diferencia entre unas y otras radica en que las distribuciones discretas solo pueden tomar valores específicos (0, 1, 2, 3, …) en tanto que las distribuciones continuas pueden tomar cualquier valor. Esto redunda en que para las distribuciones continuas (y para esta tarea) las probabilidades puntuales no tienen sentido, pues los valores puntuales son infinitamente pequeños, las formulas de Excel en lugar de retornar valores puntuales cuando acum=0 devuelven el valor de la función de densidad. Para este curso no se utilizarán los valores de acum=0 cuando use distribuciones de probabilidad continua. 1. Considerando el problema 7 de la tarea 3 cuyo texto aquí se presenta: Se sabe que el número de quejas por semana que llegan a un parque de diversiones que abre todos los días es una variable aleatoria que se ajusta bien a la distribución Poisson. En promedio se reciben 9 quejas por semana (el parque abre todos los días). La lectura de la semana dice: La Distribución Exponencial. Esta distribución se aplica para modelar el tiempo transcurrido entre la ocurrencia de dos “éxitos” consecutivos; Y también: La distribución exponencial modela el tiempo de espera a que ocurra un éxito de una distribución Poisson, razón por la cual hay una relación entre los parámetros θ y λ que es θ = 1/λ. Esta relación es importante considerar cuando se aplica la distribución exponencial para modelar tiempo de espera de un éxito de una distribución Poisson. Por lo tanto usaremos la distribución exponencial para resolver este problema. a. Calcular la probabilidad de que pasen menos de 1 día entre dos quejas consecutivas. Primero calculemos el valor de Θ (tiempo promedio entre dos “éxitos”) La misma lectura de la semana menciona: … hay una relación entre los parámetros Θ y λ que es Θ = 1 / λ Por lo tanto: Si λ = 9 quejas / semana ó 9/7 = 1.285 quejas por día Entonces Θ = 1/1.28 días entre quejas ó 0.778 días entre quejas Para calcular el inciso a. usamos la formula =DISTR.EXP(x, λ, acum) ó =DISTR.EXP(1,1.285 ,1) Que se lee: la probabilidad de que haya 1 día o menos (acum) entre dos quejas dado que el promedio de quejas por día es de 1.285 Observe que Excel usa para sus cálculos el valor de λ en lugar del valor de Θ Otro punto importante es que acum=1 regresa el valor de frecuencia acumulada de la probabilidad, sin embargo acum=0 NO regresa el valor de frecuencia individual, sino la función de densidad en este punto. Usted no usará acum=0 en este curso. b. Calcular la probabilidad de que el tiempo entre dos quejas consecutivas sea entre 10 y 20 horas. De manera similar que lo anterior ahora buscamos la posibilidad entre dos tiempos acumulados. Primero convertimos el tiempo (10 y 20 horas) a una fracción de día. 10 horas = 10/24 días, 20 horas= 20/24 días =DISTR.EXP(20/24,1.285,1) - DISTR.EXP(10/24,1.285,1) Lo que esta formula representa es la diferencia entre la probabilidad de que el tiempo entre quejas sea de 20 horas o menos, menos la probabilidad de que el tiempo entre quejas sea de 10 horas o menos. Página 1 de 7 c. Obtener el tiempo promedio entre dos quejas consecutivas y su desviación estándar. La lectura menciona: Definición de la Distribución Exponencial. … E(X) = Θ y Var(X) = Θ2 Por lo tanto: E(X) = 0.778 días ó 18.666 horas. (Ver pregunta 1 a.) σ = √ Θ2 = Θ = 0.778 días ó 18.666 horas. 2. El tiempo (en años) que funciona bien un aparato eléctrico hasta que falla sigue una distribución exponencial con media de 5 años. a. Calcular la probabilidad de que el aparato cumpla con una misión de 2 años. Para resolver este problema, primero calculemos el valor de λ, dado que tenemos solo el valor de Θ. λ = 1 / Θ = 1/5 Como nos piden la posibilidad de que el aparato cumpla con una misión de 2 años, eso se traduce a la posibilidad de que no falle antes de 2 (o en otras palabras que falle después de 2 años) por lo tanto usamos: =1-DISTR.EXP(2,1/5,1) Es decir la probabilidad total menos la probabilidad de que el aparato falle antes de 2 años. b. El fabricante desea ofrecer un tiempo de garantía w tal que si el aparato falla antes de w entonces se repone gratis por un aparato nuevo. Cual es la garantía que debe ofrecer el fabricante tal que se aplique en el 10% de los aparatos. Para resolver este problema usamos la siguiente lógica: Sea w el tiempo que acumula una probabilidad de falla de 10% de los aparatos (es decir 10% de los aparatos no cumplen con ese tiempo). Luego: P(x ≤ w) = F(w) = 0.10 es decir w -x/5 -w/5 ∫ (1/ 5)e dx = 1- e = 0.10 y despejando w se tiene que: 0 -w/5 1 - 0.10 = e -w/5 0.90 = e ln(0.90) = -w/5 w = - ln(0.90) (5) Página 2 de 7 3. Suponer que la velocidad de los autos en una autopista se ajusta a una distribución normal con media 94.5 Km/h y una desviación estándar de 7.5 Km/h. a. Obtener la probabilidad de que un auto viaje entre 90 y 100 Km/h. Para la solución de este problema utilizaremos la fórmula =DISTR.NORM( x, media, desv_estándar, acum) Como lo habíamos mencionado anteriormente para este curso usted no utilizará el valor de acum=0 para distribuciones continuas, pues esta opción devuelve el valor de la función de densidad. La respuesta se calcula de la siguiente forma: =DISTR.NORM( 100, 94.5, 7.5, 1 ) - DISTR.NORM( 90, 94.5, 7.5, 1 ) Es decir, la probabilidad de que un auto viaje a 100 Km/h o menos, menos la probabilidad de que viaje a 90 Km/h o menos. (Vea la explicación de la semana pasada para una explicación mas detallada de el por que de la resta). b. Si la policía desea multar por exceso de velocidad al 5% de los autos, cual es la velocidad límite que debe establecer. Para responder esta pregunta utilizaremos la función =DISTR.NORM.INV( probabilidad, media, desv_estándar ) La cual nos devuelve el valor de x para un nivel de probabilidad (acumulado), conociendo la media y la desviación estándar. Despejando: =DISTR.NORM.INV( 0.95, 94.5, 7.5 ) = 106.84 Km/h Observe que para la probabilidad estamos usando 0.95, esto es debido a que buscamos multar solamente a 5% de los carros, es decir el 95% irán a esa velocidad o menos. 4. Si X es una v.a. que sigue una distribución Ji-cuadrada con 17 grados de libertad: La distribución Ji-cuadrada en excel utiliza la formula : =DISTR.CHI( x, grados_de_libertad ) Esta formula (junto con las usadas en los siguientes problemas) tiene una particularidad que debemos considerar. La formula retorna el acumulado en la cola del lado derecho de la distribución, como lo muestra la siguiente gráfica: Es importante considerar esta particularidad, ya que es diferente a las otras distribuciones de probabilidad que habíamos visto hasta el momento. No me pregunten por que esto es así, no tengo la menor idea de que es lo que estaban pensando las gentes de Microsoft cuando crearon estas funciones diferentes de las demás. Explicado lo anterior continuemos con la solución de este problema. Página 3 de 7 a. Obtener P (1.5 < X < 3.2). =DISTR.CHI( 1.5, 17 ) - DISTR.CHI( 3.2, 17 ) Observe que la resta la estamos realizando en forma inversa a como lo hemos hecho con otras distribuciones restando la probabilidad del valor mayor P(x≥3.2) de la probabilidad del valor menor P(x≥1.5), precisamente debido a que el acumulado se hace a partir de la cola del lado derecho de la distribución. b. Obtener el valor de w tal que P(X > w) = 0.18 Para este inciso utilizamos la formula inversa =PRUEBA.CHI.INV(probabilidad, grados_de_libertad) La cual devuelve el valor de w tal que la probabilidad acumulada (de la cola del lado derecho) para una probabilidad dada en una distribución Ji-cuadrada con n grados de libertad P(x≥w). Despejando: =PRUEBA.CHI.INV(0.18,17) = 22.12392608 5. Si X es una v.a. que sigue una distribución t de student con 23 grados de libertad. La distribución T de Student en Excel utiliza la formula : =DISTR.T( x, grados_de_libertad, colas ) La última parte de esta formula indica la (colas) indica si se tomarán un solo lado o los dos lados de la gráfica como se muestra a continuación: Distribución T se Student (23 g.l.) con una sola cola Página 4 de 7 Distribución T se Student (23 g.l.) con dos colas Observe que la probabilidad de las colas se acumula a partir de los extremos hacia el centro, y que el centro se encuentra en el valor de X=0. a. Obtener P ( -1.2 < X < 1.8) Para resolver este problema tomemos en consideración lo siguiente: Dado que la formula =DISTR.T(x, grados_de_libertad, 2) devuelve únicamente valores para dos lados simétricos de la distribución, y en este caso los lados no son simétricos debemos de usar la suma de dos distribuciones acumuladas considerando una sola cola. El lado izquierdo de la distribución se calcula con la formula: =0.5 - DISTR.T(1.2, 23, 1) = 0.3788 Observe que para el cálculo usamos el valor positivo 1.2, esto es debido a que la formula solamente acepta valores positivos de x, pero podemos calcular los valores negativos por simetría. El lado derecho se calcula con la formula: =0.5 - DISTR.T(1.8, 23, 1) = 0.4575 Utilizamos el valor 0.5 para representar la mitad de la distribución dado que el valor total de las distribuciones de probabilidad es 1 como lo habíamos mencionado con anterioridad, y siendo una distribución simétrica 0.5 representa exactamente la mitad. La respuesta total representada por el área roja corresponde a la suma de las dos formulas anteriores: =(0.5 - DISTR.T(1.2, 23, 1)) + ( 0.5 - DISTR.T(1.8, 23, 1)) = 0.8363 Página 5 de 7 b. Obtener el valor de w tal que P(X > w) = 0.23 Para resolver este inciso utilizamos la formula: =DISTR.T.INV(probabilidad, grados_de_libertad) La cual calcula el valor de x necesario para obtener una probabilidad especifica en una distribución T de Student con n grados de libertad de dos colas. Como lo muestra la gráfica siguiente: P(x) 2 P(x) 2 Observe que la formula calcula el valor de x tal que en cada una de las colas (por simetría) se obtiene la mitad de la probabilidad buscada. Como en este inciso estamos buscando un solo valor de w tal que P(x>w)=0.23 lo cual se representa gráficamente así: w Por lo tanto para calcular el resultado usamos: =DISTR.T.INV(0.23*2,23) = 0.7514 Observe que estamos usando el doble de la probabilidad solicitada (0.23*2) ya que si usáramos el valor natural 0.23 lo que obtendríamos seria una probabilidad de 0.125 en cada uno de los lados de la curva. El problema solicita P(x>w) lo cual está representado por el área roja, si la pregunta hubiera sido P(x<w)=0.23 hubiéramos usado el valor negativo de x (para representar la cola del lado izquierdo). Página 6 de 7 6. Si X es una v.a. que sigue una distribución F con 5 grados de libertad en el numerador y 12 grados de libertad en el denominador. La distribución F en Excel utiliza la formula : =DISTR.F( x, grados_de_libertad_numerador, grados_de_libertad_denominador) Esta formula también calcula el valor de probabilidad acumulado a partir de la cola del lado derecho como lo muestra la gráfica: Con base a lo anterior la solución del problema es como sigue: a. Obtener P ( 0.95 < X < 1.8) =DISTR.F(0.95, 5, 12) - DISTR.F(1.6, 5, 12) = 0.2970 Nuevamente observe que debido a la acumulación desde el extremo derecho de la cola la formula se escribe P(x≥0.95) - P(x≥1.8) b. Obtener el valor de w tal que P(X > w) = 0.07 Para la solución de este problema usamos la formula: =DISTR.F.INV( probabilidad, g.libertad_numerador, g.libertad_denominador ) La cual calcula el valor de w tal que P(X>w) = probabilidad (acumulado del lado derecho) Por lo tanto la solución es: =DISTR.F.INV( 0.07, 5, 12 ) = 2.7520 Página 7 de 7