Esquema de los contenidos del tema 11

Anuncio
Análisis de Datos I
Esquema del Tema 11
Tema 11: Modelos de distribución de
probabilidad: Variables discretas
1. INTRODUCCIÓN
2. EL MODELO UNIFORME
3. EL MODELO BINOMIAL, B(N; )
Las tablas estadísticas
Ejemplo
4. EL MODELO DE DISTRIBUCIÓN MULTINOMIAL
__________________
Bibliografía: Tema 11 (pág. 289-300) y Tabla I
del apéndice final
Ejercicios recomendados: 1, 2, 3, 4, 7, 8, 9, 11,
12 y 13.
Carmen Ximénez
1
Análisis de Datos I
Esquema del Tema 11
1. INTRODUCCIÓN
En la práctica, la función de probabilidad de la mayoría de las variables discretas se ajusta
a un modelo teórico expresado mediante una fórmula concreta.
2. EL MODELO UNIFORME
Todos los valores asumibles por la variable X son equiprobables (=tienen la misma
probabilidad). Por tanto, puede asumirse una distribución uniforme.
Gráficamente se representa mediante:
,25
,20
f(x)
,15
Donde: f ( x) 
,10
,05
0
1
2
3
4
1
.
J
5
X
3. EL MODELO BINOMIAL, B(N; )
Consiste en la distribución del nº de aciertos en una serie de ensayos de Bernouilli.
Para que la distribución de probabilidad de una variable X siga el modelo Binomial ha de
cumplirse que …
1. La variable esté definida como variable dicotómica: en términos de Acierto (1) y error (0)
2. Se de una repetición de N ensayos independientes en la variable dicotómica en los que “la
probabilidad de que el ensayo verifique la condición 1 (p.e., acierto) sea constante”, y se
representa por .
3. Se defina una variable X, como el nº de veces que se verifica la condición (los 1) en los N
ensayos. Los valores de X (los xi) oscilan entre 0 y N: X = {0, 1, 2, …, N}
Si se cumplen las anteriores condiciones, la variable X (nº aciertos) se ajusta al Modelo
Binomial con parámetros N y . Es decir: X ~ B (N; )
a) Función de probabilidad de una variable Binomial:
N
f ( x)      x  (1   ) N  x
x 
N 
N!
Donde:   
x ! ( N  x ) !
x 
b) Valor esperado: E(X) = N · 
c) Varianza:
Carmen Ximénez
2(X) = N ·  (1 - )
2
Análisis de Datos I
Esquema del Tema 11
Tablas estadísticas
No siempre es necesario aplicar la fórmula para obtener la función de probabilidad asociada
a un valor de la variable. Existen tablas donde se puede consultar el valor de f (xi). La tabla
de la Binomial (Tabla I del libro en págs. 404-408) tiene la siguiente estructura:
N
x
2
0
1
2
..
.


0,01 …
980
020
0+
20





Dado X ~ B (N; ), para buscar una f (xi):
… 0,99 1ª columna: valor de N
2ª columna: posibles valores de X: 0, 1, …, N
..
3ª columna: valor de f(xi) bajo diferentes valores de 
.
- Por brevedad, aparece en porcentajes.
… f (xi) …
- El signo + significa que hay más de tres ceros.
..
Ejemplo:
.
0,50
P(X = 1) = f(1) = 0,02 bajo X ~ B (N = 2;  = 0,01)
Nota: Cuando N > 20, f (xi) puede aproximarse mediante el modelo Normal (lo veremos en el tema 12)
Ejemplo 1 (resuelto)
Un estudiante responde a un test de 3 preguntas con cinco opciones de respuesta (donde
sólo 1 es correcta). Si ha respondido azar:
1) Elabore el modelo de distribución para la variable X (nº de aciertos al azar)
X ~ B (N = 3;  = 0,20)
N
3
3!
f ( x)      x  (1  )N x  f (0)     0, 20 0  (0, 80) 3 
 1  0, 512  0, 512
x
0!(3  0)!
 
0
3
3!
f (1)     0, 201  (0, 80) 2 
 0, 20  0, 64  0, 384
1!(3  1)!
1 
3
3!
f (2)     0, 20 2  (0, 80)1 
 0, 04  0, 80  0, 096
2
2!(3
 2)!
 
3
3!
f (3)     0, 20 3  (0, 80) 0 
 0, 008  1  0, 008
3
3!(3
 3)!
 
Xi
f(xi)
0
0,512
1
0,384
2
0,096
3
0,008
2) ¿Cuál es la probabilidad de que acierte todas las preguntas?
P(X = 3) = f(3) = 0,008 (coincide con el valor dado en las tablas de probabilidad)
3) Valor esperado: E(X) = N ·  = (3) (0,20) = 0,60
Varianza:
2(X) = N ·  (1 - ) = (3) (0,20 · 0,80) = 0,48
4) ¿Cuál es la probabilidad de que acierte como máximo 2 preguntas?
P(X  2) = F(2) = 0,512 + 0,384 + 0,096 = 0,992
5) ¿Cuál es la probabilidad de que acierte entre 1 y 2 preguntas (ambas inclusive)?
P(1 X  2) = F(2) - F(0) = 0,992 - 0,512 = 0,480
6) ¿Cuál es la probabilidad de que acierte al menos 2 preguntas?
P(X  2) = 1 - P(X  1) = 1 – 0,896 = 0,104
Carmen Ximénez
3
Análisis de Datos I
Esquema del Tema 11
4. MODELO DE DISTRIBUCIÓN MULTINOMIAL
Se realizan N ensayos independientes que dan lugar a k resultados: X = { X1, X2, … Xk }
con probabilidades 1, 2, … k, respectivamente (donde 1 + 2 + … + k = 1).
Este modelo se trata de una extensión de la Binomial útil para variables politómicas
(variables discretas con más de 2 categorías).
Función de probabilidad de una variable multinomial:
f ( X 1 , X 2 , ..., X k ) 
N!
  X 1   X 2  ...   X k
X 1 ! X 2 ! ... X k !
Ejemplo 2
X: Actitud hacia la donación de órganos
X1: En contra ........ con 1 = 0,15
X2: Indiferentes ..... con 2 = 0,40
X3: A favor ........... con 3 = 0,45
Si se extrae una muestra aleatoria de 20 sujetos. ¿Cuál es la probabilidad de que 5 estén
en contra, 10 sean indiferentes y 5 estén a favor?
f ( X 1  5 , X 2  10 , X 3  5) 
N!
20!
 π X1  π X 2  π X1 
0,15 5  0,40 10  0,45 5  0,41
X 1!X 2!X 3!
5! 10! 5!
5. EJERCICIOS
Ejercicio 1
Supongamos que es igual de probable que nazcan niños que niñas. Si nos fijamos en los
próximos 5 partos de una determinada clínica, determine:
1. La probabilidad de que todas sean niñas
2. La probabilidad de que las niñas sean minoría
3. El valor esperado y la varianza de la variable X: “número de niñas”
Ejercicio 2
El 70% de pacientes que sufren una determinada enfermedad se curan al aplicarles un
tratamiento. Si tomamos una m.a.s. de 10 pacientes con esa enfermedad y pasan el tratamiento:
1. ¿Cuál es la probabilidad de que se recuperen todos?
2. ¿Cuál es la probabilidad de que se recuperen al menos la mitad?
3. ¿Cuántos debemos esperar que se curen?
4. ¿Cuál es la probabilidad de que se recuperen como máximo 6 pacientes?
5. ¿Cuál es la probabilidad de que se recuperen entre 2 y 4 (ambos inclusive)?
Ejercicio 3
¿Cuál es la probabilidad de que al tomar 6 sujetos al azar, los seis superen el Q3 en la variable
creatividad?
Carmen Ximénez
4
Descargar