Subido por 20240398

Distribuciones de Probabilidad Discretas

Anuncio
5.- Distribuciones de Probabilidad Discretas
Función de Probabilidad
p(X = x) =
5.1.- Distribución Binomial
5.2.- Distribución Hipergeométrica
5.5.- Distribución de Poisson
n!
p x qn- x
x!(n - x)!
 k  N  k 

 x

 nx 





p ( x) 
N



 n 



e   x
P( X  x) 
x!
5.2.1 Aproximación de la Hipergeométrica por la Binomial
5.6 Aproximación de la Binomial por la de Poisson
5.3.- Distribución Geométrica
5.4.- Distribución Multinomial
5.7.- Distribución Binomial Negativa
5.8.- Distribución Uniforme (Discreta)

Se llama función de probabilidad de una variable aleatoria
discreta X a la aplicación que asocia a cada valor de xi de
la variable su probabilidad pi.

La función de masa de probabilidad de un dado. Todos los
números tienen la misma probabilidad de aparecer cuando
este es tirado. X 1 2 3 4 5 6
Pi

1/6
1/6
1/6
1/6
1/6
1/6
Hay que advertir que el concepto de función de
probabilidad sólo tiene sentido para variables aleatorias
que toman un conjunto discreto de valores. Para variables
aleatorias continuas el concepto análogo es el de función
de densidad.
Distribución Binomial
Notación: X ~ B( n,p )
Una v.a. Binomial representa el número de éxitos que ocurren
en n repeticiones independientes de un ensayo de Bernoulli
cuya probabilidad de éxito es p.
Función de probabilidad:
p(x) =
n px (1-p)n-x,
x = 0,1,2,3,..., n.
x
x = variable aleatoria
n es el número de pruebas
n!
x es el número de éxitos
p(X = x) =
p x qn- x
x!(n - x)!
p es la probabilidad de éxito
q es la probabilidad de fracaso
Función de probabilidad de la distribución Binomial o también denominada
función de la distribución de Bernoulli. Verificándose: 0 < p < 1
Supongamos que un experimento aleatorio tiene las siguientes
características:
 En cada prueba del experimento sólo son posibles dos resultados:
el suceso A (éxito) y su contrario A` (fracaso).
 El resultado obtenido en cada prueba es independiente de los
resultados obtenidos anteriormente.
 La probabilidad del suceso A es constante, la representamos por p,
y no varía de una prueba a otra. La probabilidad de A` es 1- p y la
representamos por q .
 El experimento consta de un número n de pruebas.
Todo experimento que tenga estas características diremos que sigue el
modelo de la distribución Binomial. A la variable X que expresa el
número de éxitos obtenidos en cada prueba del experimento, la
llamaremos variable aleatoria binomial.
La v.a. binomial es una v.a. aleatoria discreta, sólo puede tomar los
valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas.
Como hay que considerar todas las maneras posibles de obtener kéxitos y (n-k) fracasos debemos calcular éstas por combinaciones
(número combinatorio n sobre k).
• La distribución binomial es una distribución de
probabilidad ya que: P(x)  0 y  P(x) = 1
• La distribución binomial tiene dos parámetros: n y p
• La media de la distribución binomial es: x = np
• La desviación estándar es: x = npq
Ejemplo 1: En cierta población la prevalencia de alergia es de
20%. Si se selecciona una muestra aleatoria de 10.
Calcular:
a) La probabilidad de que la muestra contenga exactamente
un alérgico.
éxito = tener alergia  p=0.2 y q=0.8
n = 10
x=1
nCx * p^x * q^(n-x)
P(X=1) = 10! (0.2)1 (0.8)9
1!9!
= 10 (0.2) (0.8)9 = 0.2684
b. La probabilidad de que la muestra incluya menos de dos
alérgicos
p = 0.2; q = 0.8; n = 10
P(X<2) = P(X=0) + P(X=1)
= 10! (0.2)0 (0.8)10 + 0.2684
0!10!
= 0.1074 + 0.2684 = 0.3758
c. La probabilidad que la muestra incluya 2 o más alérgicos.
p(x); x = 2,3,4,5,6…….
p(x>=2)….. :. 1- P=(0,1) 1-0.3758 = 0.6242
d. La probabilidad que la muestra incluya entre uno y tres
alérgicos inclusive.
x = 1,2,3
Ejemplo 2: Una máquina fabrica una determinada pieza y se
sabe que produce un 7 por 1000 de piezas
defectuosas. Hallar la probabilidad de que al
examinar 50 piezas sólo haya una defectuosa.
p = 7/1000 = 0.007
n = 50
x=1
Se trata de una distribución binomial de parámetros
B(50, 0.007) y debemos calcular la probabilidad p(X=1).
Ejemplo 3: La probabilidad de éxito de una determinada
vacuna es 0.72. Calcula la probabilidad de a que
una vez administrada a 15 pacientes:
a) Ninguno sufra la enfermedad (x = 15)
b) Todos sufran la enfermedad (x = 0)
c) Dos de ellos contraigan la enfermedad (x = 13)
Distribución binomial de parámetros B(15, 0.72)
Ejemplo 4: La probabilidad de que el carburador de un coche
salga de fábrica defectuoso es del 4 por 100. Hallar:
a) El número de carburadores defectuosos esperados en un
lote de 1000
μ = n*p = 1000*0.04 = 40 carburadores defectuosos
b) La varianza y la desviación típica
σ2 = n*p*q = 1000*0.04*0.96 = 38.4; σ =
= 6.19
Ejemplo 5: Imaginemos una escuela primaria donde los
alumnos llegan tarde a menudo. 5 alumnos están en el jardín
de niños. La directora lleva tiempo estudiando el problema,
habiendo llegado a la conclusión de que hay una probabilidad
de 0.4 de que un alumno llegue tarde y de que los alumnos
lleguen independientemente uno de otro ¿Cómo trazamos una
distribución binomial de probabilidad que ilustre las
probabilidades de que 0,1,2,3,4 ó 5 estudiantes lleguen tarde
simultáneamente?
nCx * p^x * q^(n-x)
p = 0.4;
k = 0.6;
n=5
Realicemos el cálculo de cada valor de x:
Para x = 0 obtenemos que :
P(0) = 5!/0!(5-0)! (0.4 )^0 (0.6)^5
P(0) = 0.07776
Para x = 3 obtenemos que :
P(3) = 5!/3!(5-3)! (0.4 )^3 (0.6)^2
P(3) = 0.2304
Para x = 1 obtenemos que :
P(1) = 5!/1!(5-1)! (0.4 )^1 (0.6)^4
P(1) = 0.2592
Para x = 4 obtenemos que :
P(4) = 5!/4!(5-4)! (0.4 )^4 (0.6)^1
P(4) = 0.0768
Para x = 2 obtenemos que:
P(2) = 5!/2!(5-2)! (0.4 )^2 (0.6)^3
P(2) = 0.3456
Para x = 5 obtenemos que :
P(5) = 5!/5!(5-5)! (0.4 )^5 (0.6)^0
P(5) = 0.01024
Distribución Hipergeométrica
Población: N
k éxitos
N-k fracasos
Muestra
n
Notación: X ~ H(N, k, n)
Un conjunto de N objetos contiene: k objetos
clasificados como éxitos y N-K como fracasos.
Se toma una muestra de tamaño n, al azar y
(sin reemplazo) de entre los N objetos.
La v.a. Hipergeométrica X representa el nº de éxitos en la muestra
Función de probabilidad
 k  N  k 
 

x  n  x 

p( x) 
N
 
n
k
E ( X )  np
siendo p 
N
N n
V ( X )  np(1  p)
N 1
Si el tamaño muestral n es muy pequeño en relación al número total de
elementos, N, las probabilidades hipergeométricas son muy parecidas a
las binomiales, y puede usarse la distribución binomial en lugar de la
hipergeométrica.
ÉXITO es el numero de valores “verdaderos” que se desean
tener en una muestra y que tiene una población.
FRACASO es el complemento del los éxitos (tanto en la
muestra como en la población) De esta manera concluimos
que: N = Nf + Ne
La distribución hipergeometrica considera experimentos que obedezcan 3 de las 4 propiedades de un
experimento binomial:
• El experimento consiste en una secuencia de n
intentos, donde n se fija antes del experimento.
• Los intentos son idénticos, y cada uno de ellos
puede resultar en dos posibles resultados, que se
denotan por éxito (S) o fracaso (F) (p(S)+p(F)=1).
• La probabilidad de éxito es constante de un
intento a otro.
Se debilitara la propiedad de independencia entre
los intentos, es decir, los intentos individuales
se consideraran dependientes, el experimento
resultante
se
llamara
experimento
hipergeometrico.
Es fácil describir la situación que nos lleva a
la distribución hipergeometrica. Debe de haber
una población que contenga cierto número de
éxitos y fracasos.
La selección se hace sin reemplazo, y
estamos interesados en el numero de éxitos
escogidos; el numero total de formas de
escoger n objetos de N objetos es el
N
coeficiente binomial: n
Y el numero de formas de escoger y éxitos
y (n-y) fracasos es el producto
Ne
Nf
n - y
y
(Si y>Ne, tome Nye y Py(y) igual a 0;
Nf
Si n-y>Nf, tome n - y y Py(y) igual a 0.
( )
( )(
( )
(
)
)
Así concluimos que la formula para la
distribución hipergeometrica será:
PY(y)=
Ne
y
Nf
n - y
( )(
)
N
(n )
N: población
n: muestra
k: éxitos :. N-k: fracasos
x: éxitos en la muestra
 k  N  k 
 

x  n  x 

p ( x) 
N
 
n
Ejemplo 1: En una jaula hay 30 pericos rusos y 20 pericos
chinos si extraemos 10 pericos al azar, calcular
posibilidad de que 3 de ellos hablen chino
(característica deseada).
N
n
k
x
= 50
= 10
= 20
= 3
 k  N  k 
 

x  n  x 

p ( x) 
N
 
n
N: población
n: muestra
k: éxitos :. N-k: fracasos
x: éxitos en la muestra
20
3
30
7
( )( )
P(x)=
=0.2259
50
(10)
Ejemplo 2: De los 20 hombres y 18 mujeres del salón el 50%
réprobo el examen de estadística, si tomamos 10
alumnos al azar probabilidad.
a) 4 alumnos reprobados y b) 3 mujeres reprobadas
a) N
k
n
x
= 38
= 19
= 10
= 4
19
19
( 4)( 6 )
PY(y)=
=0.2224
38
(10 )
N: población
n: muestra
b) N
k
n
x
= 38
= 9
= 10
= 3
9
29
k: éxitos :. N-k: fracasos
( 3 )( 7 )
PY(y)=
=0.2273
38
(10 )
x: éxitos en la muestra
Ejemplo 2: De los 20 hombres y 18 mujeres del salón el 50%
réprobo el examen de estadística, si tomamos 10
alumnos al azar probabilidad.
N: población
c) 5 hombres reprobados
n: muestra
c) N
k
n
x
= 38
= 10
= 10
= 5
10
28
k: éxitos :. N-k: fracasos
( 5 )( 5 )
PY(y)=
=0.05239
38
(10 )
x: éxitos en la muestra
Distribución de Poisson
Notación: X ~ P()
El experimento observado es la aparición de sucesos en un soporte
continuo:
*Tiempo (llegada de autobuses a una parada,...)
*Espacio (errores por página, ...)
Características del proceso:
Es estable: produce a largo plazo un número medio de sucesos
constante λ por unidad de observación (tiempo, espacio, área) y los
sucesos aparecen aleatoriamente de forma independiente , es decir,
el proceso no tiene memoria, ya que conocer sucesos en un
intervalo no ayuda a predecir sucesos en el siguiente.


Expresa la probabilidad de que ocurra un evento un
determinado número de veces en una medida dada (tiempo,
distancia, piezas, etc).
Cabe destacar que las ocurrencias son discretas.
Si el numero esperado de ocurrencias en el intervalo es λ, entonces la
probabilidad de que haya exactamente k ocurrencias es:
Función de probabilidad:
p(x)=
e – x
x= 0,1,2, ...
x!
λ y x deben de estar expresadas en la misma medida.
Si el número promedio de ocurrencias en un intervalo de tiempo o en
una región específica es λ>0.
La v.a. X que es igual al número de ocurrencias independientes en el
intervalo o región tiene una distribución de Poisson con tasa λ
Distribución de Poisson
Si n muy grande y p muy pequeño, es conveniente utilizar la
distribución de Poisson, ya que se consigue una buena
aproximación.
Esta distribución se emplea para describir sucesos discretos que
ocurren con poca frecuencia en el tiempo o en el espacio; por ello a
veces recibe el nombre de distribución de sucesos raros.
Variable aleatoria X: esta representa la cantidad de veces que
ocurre un suceso de interés en un intervalo dado.
Ya que X es una cuenta, puede tomar teóricamente cualquier valor
entero entre 0 e infinito.
Sea λ una constante que indica el número promedio de veces que
acontece un suceso en un intervalo.
Distribución de Poisson
Si la probabilidad de que X tome el valor de x es
P( X  x) 


x
e

x!
se dice que X tiene
distribución de Poisson
parámetro λ.
una
con
e = 2.71828, este es la base de
los log. naturales
Usos:
describir la cantidad de ambulancias que se requieren en
una ciudad en una noche particular,
describir la cantidad de partículas emitidas por una
cantidad específica de material radiactivo o
describir el número de colonias de bacterias que crecen
en una caja de Petri.
Determinar la cantidad de personas de una población de
10,000 que se involucra en un accidente vehicular cada año. El
número de personas implicadas sería la siguiente la cual
también es la varianza: ʎ = np donde p = 0.00024.
¿Cual es la probabilidad de que máximo 3 personas tengan un
accidente en un año. 0.091 + 0.218 + 0.261 + 0.209 = 0.779
= (10000)(0.00024) = 2.4
=
e 2.4 ( 2.4)1
0.091 + P ( X  1) 
1!
 0.218
e 2.4 (2.4) 2
+ P( X  2) 
2!
 0.261
¿Cual es la probabilidad de que más de 7 personas tengan un
accidente en un año.
P( X  7)  1  P( X 7)
P(x>7) = 1 – (0.091 + 0.218 + 0.261 + 0.209 + 0.125 + 0.060 + 0.024 )
= 0.012
Ejemplo en clase
En la inspección de hojalata producida por un proceso electrolítico
continuo, se identifican 0.2 imperfecciones en promedio por minuto.
Determine las probabilidades de identificar
a) una imperfección en 3 minutos
b) al menos dos imperfecciones en 5 minutos
c) cuando más una imperfección en 15 minutos.
a) Un solo éxito
b) Un rango indeterminado de éxitos, pero sí de fracasos
c) Un rango determinado de éxitos
RESUMEN DE CONVERGENCIAS DE DISTRIBUCIONES
Normal
N(, 2)
n20
 10
=np
2 =np(1-p)
Binomial
B(n,p)
N>50
n/N0,1
Hipergeométrica
H(N, k, n)
= 
2 = 
=np
np7
Poisson
P()
Distribución Binomial
Notación: X ~ B( n,p )
n!
p(X = x) =
p x qn- x
x!(n - x)!
Características
Distribución Hipergeométrica
Notación: X ~ H(N, k, n)
 k  N  k 

 x

 nx 





p ( x) 
N

 n 



Características
Aproximación de la Hipergeométrica por la Binomial
Ejemplo
Conclusión
Distribución de Poisson
Notación: X ~ P()
e   x
P( X  x) 
x!
Ejemplo
Aproximación de la Binomial a la Poisson
Cierta enfermedad tiene una
probabilidad muy baja de
ocurrir, p=1/100.000. Calcular la
probabilidad de que en una
ciudad con 500.000 habitantes
haya más de 3 personas con
dicha enfermedad. Calcular el
número esperado de habitantes
que la padecen.
Si consideramos la v.a. X que
contabiliza el número de personas que padecen la enfermedad
es claro que sigue un modelo
binomial, pero que puede ser
bien aproximado por un modelo
de Poisson de modo que
Distribución Geométrica G(P)
Cumple con los supuestos de Bernoulli
X  número de fracasos que tienen lugar antes de que
aparezca el primer éxito.
Función Cuantía
f(x)=qxp
x=0,1,2,....n
Momentos:
Media = E[x]= q/p
Función de distribución
F(x)=
1-qx+1
x0
0
x<0
Varianza Var(x)= q/p2
F. Característica
F. Generatriz de momentos
x(t)= E[eitx]=p/(1- e it)
gx(t)= E[etx]= p/(1- e t)
Distribución Multinomial
Generalización de la ley Binomial cuando el experimento
en cuestión permite más de dos resultados posibles.
Resultados:
A1,A2,...Ak
Porb. Asociadas:
P1,P2,....Pk Pi=1
X  número de veces que se presenta cada uno de los
sucesos
cuando
se
realizan
n-repeticiones
independientes del experimento.
Función Cuantía
f(x1,x2,..,xk)=
n!
Momentos:
P1x1...Pkxk
X1!...Xk!
F. Generatriz de momentos
gx(t)= E[etx]= ( Pi eti)
Media = E[x]= npi
Varianza Var(x)=npi(1-pi)
Distribución Binomial Negativa o de Pascal
XNB(p,k)
NB(p,k) cumple con los supuestos de Bernoulli
X  número de repeticiones necesarias hasta observar k
éxitos.
Función Cuantía
 x 1  k
x k
P ( X  x )  f ( x )    p (1  p )
 k 1 
Momentos:
Media = E[x]= k/p
Varianza Var(x)= k/p(1/q)
Distribución Uniforme Discreta
Decimos que una variable aleatoria discreta sigue una
distribución uniforme discreta, cuando la probabilidad en
todos los puntos es la misma.
Función de distribución
Función Cuantía
f(x)=
0
si xxi
i=1,2,..k
1/k si x=xi
i=1,2,..k
F(x)=
0
si x<x1
1/k
si x1x2
2/k
si x2x3
............
1
si xxk
Distribución Uniforme Discreta
Momentos:
•Media
•Varianza
= E[x]= 1/k xi
Var(x)= E[x2]- [E[x]2]=1/k (xi- )2
•Función Característica
x(t)= E[eitx]= eitx1/n
•Función generatriz de momentos
gx(t)= E[etx]= etx1/n
Descargar