Explicación de la tarea

Anuncio
Explicación de la tarea 4
Felipe Guerra
Nota: Esta tarea corresponde a distribuciones continuas de probabilidad, la tarea de la semana anterior
correspondía a distribuciones discretas. La diferencia entre unas y otras radica en que las distribuciones
discretas solo pueden tomar valores específicos (0, 1, 2, 3, …) en tanto que las distribuciones
continuas pueden tomar cualquier valor.
Esto redunda en que para las distribuciones continuas (y para esta tarea) las probabilidades
puntuales no tienen sentido, pues los valores puntuales son infinitamente pequeños, las formulas de Excel
en lugar de retornar valores puntuales cuando acum=0 devuelven el valor de la función de densidad. Para
este curso no se utilizarán los valores de acum=0 cuando use distribuciones de probabilidad
continua.
1. Considerando el problema 7 de la tarea 3 cuyo texto aquí se presenta:
Se sabe que el número de quejas por semana que llegan a un parque de diversiones que abre
todos los días es una variable aleatoria que se ajusta bien a la distribución Poisson. En
promedio se reciben 9 quejas por semana (el parque abre todos los días).
La lectura de la semana dice:
La Distribución Exponencial.
Esta distribución se aplica para modelar el tiempo transcurrido entre la ocurrencia de dos “éxitos”
consecutivos;
Y también:
La distribución exponencial modela el tiempo de espera a que ocurra un éxito de una distribución
Poisson, razón por la cual hay una relación entre los parámetros θ y λ que es θ = 1/λ. Esta relación es
importante considerar cuando se aplica la distribución exponencial para modelar tiempo de espera de un
éxito de una distribución Poisson.
Por lo tanto usaremos la distribución exponencial para resolver este problema.
a. Calcular la probabilidad de que pasen menos de 1 día entre dos quejas consecutivas.
Primero calculemos el valor de Θ (tiempo promedio entre dos “éxitos”)
La misma lectura de la semana menciona:
… hay una relación entre los parámetros Θ y λ que es Θ = 1 / λ
Por lo tanto:
Si λ = 9 quejas / semana ó 9/7 = 1.285 quejas por día
Entonces Θ = 1/1.28 días entre quejas ó 0.778 días entre quejas
Para calcular el inciso a. usamos la formula =DISTR.EXP(x, λ, acum) ó =DISTR.EXP(1,1.285 ,1)
Que se lee: la probabilidad de que haya 1 día o menos (acum) entre dos quejas dado que el
promedio de quejas por día es de 1.285
Observe que Excel usa para sus cálculos el valor de λ en lugar del valor de Θ
Otro punto importante es que acum=1 regresa el valor de frecuencia acumulada de la
probabilidad, sin embargo acum=0 NO regresa el valor de frecuencia individual, sino la
función de densidad en este punto. Usted no usará acum=0 en este curso.
b. Calcular la probabilidad de que el tiempo entre dos quejas consecutivas sea entre 10 y 20 horas.
De manera similar que lo anterior ahora buscamos la posibilidad entre dos tiempos acumulados.
Primero convertimos el tiempo (10 y 20 horas) a una fracción de día.
10 horas = 10/24 días, 20 horas= 20/24 días
=DISTR.EXP(20/24,1.285,1) - DISTR.EXP(10/24,1.285,1)
Lo que esta formula representa es la diferencia entre la probabilidad de que el tiempo entre
quejas sea de 20 horas o menos, menos la probabilidad de que el tiempo entre quejas sea
de 10 horas o menos.
Página 1 de 7
c. Obtener el tiempo promedio entre dos quejas consecutivas y su desviación estándar.
La lectura menciona:
Definición de la Distribución Exponencial.
… E(X) = Θ y Var(X) = Θ2
Por lo tanto:
E(X) = 0.778 días ó 18.666 horas. (Ver pregunta 1 a.)
σ = √ Θ2
= Θ = 0.778 días ó 18.666 horas.
2. El tiempo (en años) que funciona bien un aparato eléctrico hasta que falla sigue una distribución
exponencial con media de 5 años.
a. Calcular la probabilidad de que el aparato cumpla con una misión de 2 años.
Para resolver este problema, primero calculemos el valor de λ, dado que tenemos solo el valor de
Θ.
λ = 1 / Θ = 1/5
Como nos piden la posibilidad de que el aparato cumpla con una misión de 2 años, eso se traduce
a la posibilidad de que no falle antes de 2 (o en otras palabras que falle después de 2 años) por lo
tanto usamos:
=1-DISTR.EXP(2,1/5,1)
Es decir la probabilidad total menos la probabilidad de que el aparato falle antes de 2 años.
b. El fabricante desea ofrecer un tiempo de garantía w tal que si el aparato falla antes de w entonces se
repone gratis por un aparato nuevo. Cual es la garantía que debe ofrecer el fabricante tal que se aplique
en el 10% de los aparatos.
Para resolver este problema usamos la siguiente lógica:
Sea w el tiempo que acumula una probabilidad de falla de 10% de los aparatos (es decir 10% de
los aparatos no cumplen con ese tiempo). Luego:
P(x ≤ w) = F(w) = 0.10 es decir
w
-x/5
-w/5
∫ (1/ 5)e dx = 1- e = 0.10
y despejando w se tiene que:
0
-w/5
1 - 0.10 = e
-w/5
0.90 = e
ln(0.90) = -w/5
w = - ln(0.90) (5)
Página 2 de 7
3. Suponer que la velocidad de los autos en una autopista se ajusta a una distribución normal con
media 94.5 Km/h y una desviación estándar de 7.5 Km/h.
a. Obtener la probabilidad de que un auto viaje entre 90 y 100 Km/h.
Para la solución de este problema utilizaremos la fórmula
=DISTR.NORM( x, media, desv_estándar, acum)
Como lo habíamos mencionado anteriormente para este curso usted no utilizará el valor de
acum=0 para distribuciones continuas, pues esta opción devuelve el valor de la función de
densidad.
La respuesta se calcula de la siguiente forma:
=DISTR.NORM( 100, 94.5, 7.5, 1 ) - DISTR.NORM( 90, 94.5, 7.5, 1 )
Es decir, la probabilidad de que un auto viaje a 100 Km/h o menos, menos la probabilidad de
que viaje a 90 Km/h o menos. (Vea la explicación de la semana pasada para una explicación
mas detallada de el por que de la resta).
b. Si la policía desea multar por exceso de velocidad al 5% de los autos, cual es la velocidad límite que
debe establecer.
Para responder esta pregunta utilizaremos la función
=DISTR.NORM.INV( probabilidad, media, desv_estándar )
La cual nos devuelve el valor de x para un nivel de probabilidad (acumulado), conociendo la
media y la desviación estándar.
Despejando:
=DISTR.NORM.INV( 0.95, 94.5, 7.5 ) = 106.84 Km/h
Observe que para la probabilidad estamos usando 0.95, esto es debido a que buscamos multar
solamente a 5% de los carros, es decir el 95% irán a esa velocidad o menos.
4. Si X es una v.a. que sigue una distribución Ji-cuadrada con 17 grados de libertad:
La distribución Ji-cuadrada en excel utiliza la formula :
=DISTR.CHI( x, grados_de_libertad )
Esta formula (junto con las usadas en los siguientes problemas) tiene una particularidad
que debemos considerar. La formula retorna el acumulado en la cola del lado derecho de la
distribución, como lo muestra la siguiente gráfica:
Es importante considerar esta particularidad, ya que es diferente a las otras distribuciones de
probabilidad que habíamos visto hasta el momento.
No me pregunten por que esto es así, no tengo la menor idea de que es lo que estaban pensando las gentes de Microsoft
cuando crearon estas funciones diferentes de las demás.
Explicado lo anterior continuemos con la solución de este problema.
Página 3 de 7
a. Obtener P (1.5 < X < 3.2).
=DISTR.CHI( 1.5, 17 ) - DISTR.CHI( 3.2, 17 )
Observe que la resta la estamos realizando en forma inversa a como lo hemos hecho con otras
distribuciones restando la probabilidad del valor mayor P(x≥3.2) de la probabilidad del valor menor
P(x≥1.5), precisamente debido a que el acumulado se hace a partir de la cola del lado derecho de
la distribución.
b. Obtener el valor de w tal que P(X > w) = 0.18
Para este inciso utilizamos la formula inversa
=PRUEBA.CHI.INV(probabilidad, grados_de_libertad)
La cual devuelve el valor de w tal que la probabilidad acumulada (de la cola del lado derecho)
para una probabilidad dada en una distribución Ji-cuadrada con n grados de libertad P(x≥w).
Despejando:
=PRUEBA.CHI.INV(0.18,17)
= 22.12392608
5. Si X es una v.a. que sigue una distribución t de student con 23 grados de libertad.
La distribución T de Student en Excel utiliza la formula :
=DISTR.T( x, grados_de_libertad, colas )
La última parte de esta formula indica la (colas) indica si se tomarán un solo lado o los dos lados
de la gráfica como se muestra a continuación:
Distribución T se Student (23 g.l.) con una sola cola
Página 4 de 7
Distribución T se Student (23 g.l.) con dos colas
Observe que la probabilidad de las colas se acumula a partir de los extremos hacia el centro, y
que el centro se encuentra en el valor de X=0.
a. Obtener P ( -1.2 < X < 1.8)
Para resolver este problema tomemos en consideración lo siguiente:
Dado que la formula =DISTR.T(x, grados_de_libertad, 2) devuelve únicamente valores para dos
lados simétricos de la distribución, y en este caso los lados no son simétricos debemos de usar la
suma de dos distribuciones acumuladas considerando una sola cola.
El lado izquierdo de la distribución se calcula con la formula:
=0.5 - DISTR.T(1.2, 23, 1) = 0.3788
Observe que para el cálculo usamos el valor positivo 1.2, esto es debido a que la formula
solamente acepta valores positivos de x, pero podemos calcular los valores negativos por
simetría.
El lado derecho se calcula con la formula:
=0.5 - DISTR.T(1.8, 23, 1) = 0.4575
Utilizamos el valor 0.5 para representar la mitad de la distribución dado que el valor total de las
distribuciones de probabilidad es 1 como lo habíamos mencionado con anterioridad, y siendo una
distribución simétrica 0.5 representa exactamente la mitad.
La respuesta total representada por el área roja corresponde a la suma de las dos formulas
anteriores:
=(0.5 - DISTR.T(1.2, 23, 1)) + ( 0.5 - DISTR.T(1.8, 23, 1)) = 0.8363
Página 5 de 7
b. Obtener el valor de w tal que P(X > w) = 0.23
Para resolver este inciso utilizamos la formula:
=DISTR.T.INV(probabilidad, grados_de_libertad)
La cual calcula el valor de x necesario para obtener una probabilidad especifica en una
distribución T de Student con n grados de libertad de dos colas. Como lo muestra la gráfica
siguiente:
P(x)
2
P(x)
2
Observe que la formula calcula el valor de x tal que en cada una de las colas (por simetría) se
obtiene la mitad de la probabilidad buscada.
Como en este inciso estamos buscando un solo valor de w tal que P(x>w)=0.23 lo cual se
representa gráficamente así:
w
Por lo tanto para calcular el resultado usamos:
=DISTR.T.INV(0.23*2,23)
= 0.7514
Observe que estamos usando el doble de la probabilidad solicitada (0.23*2) ya que si usáramos el
valor natural 0.23 lo que obtendríamos seria una probabilidad de 0.125 en cada uno de los lados
de la curva.
El problema solicita P(x>w) lo cual está representado por el área roja, si la pregunta hubiera sido
P(x<w)=0.23 hubiéramos usado el valor negativo de x (para representar la cola del lado
izquierdo).
Página 6 de 7
6. Si X es una v.a. que sigue una distribución F con 5 grados de libertad en el numerador y 12
grados de libertad en el denominador.
La distribución F en Excel utiliza la formula :
=DISTR.F( x, grados_de_libertad_numerador, grados_de_libertad_denominador)
Esta formula también calcula el valor de probabilidad acumulado a partir de la cola del lado
derecho como lo muestra la gráfica:
Con base a lo anterior la solución del problema es como sigue:
a. Obtener P ( 0.95 < X < 1.8)
=DISTR.F(0.95, 5, 12) - DISTR.F(1.6, 5, 12) = 0.2970
Nuevamente observe que debido a la acumulación desde el extremo derecho de la cola la formula
se escribe P(x≥0.95) - P(x≥1.8)
b. Obtener el valor de w tal que P(X > w) = 0.07
Para la solución de este problema usamos la formula:
=DISTR.F.INV( probabilidad, g.libertad_numerador, g.libertad_denominador )
La cual calcula el valor de w tal que P(X>w) = probabilidad (acumulado del lado derecho)
Por lo tanto la solución es:
=DISTR.F.INV( 0.07, 5, 12 ) = 2.7520
Página 7 de 7
Descargar