Análisis de Datos I Esquema del Tema 11 Tema 11: Modelos de distribución de probabilidad: Variables discretas 1. INTRODUCCIÓN 2. EL MODELO UNIFORME 3. EL MODELO BINOMIAL, B(N; ) Las tablas estadísticas Ejemplo 4. EL MODELO DE DISTRIBUCIÓN MULTINOMIAL __________________ Bibliografía: Tema 11 (pág. 289-300) y Tabla I del apéndice final Ejercicios recomendados: 1, 2, 3, 4, 7, 8, 9, 11, 12 y 13. Carmen Ximénez 1 Análisis de Datos I Esquema del Tema 11 1. INTRODUCCIÓN En la práctica, la función de probabilidad de la mayoría de las variables discretas se ajusta a un modelo teórico expresado mediante una fórmula concreta. 2. EL MODELO UNIFORME Todos los valores asumibles por la variable X son equiprobables (=tienen la misma probabilidad). Por tanto, puede asumirse una distribución uniforme. Gráficamente se representa mediante: ,25 ,20 f(x) ,15 Donde: f ( x) ,10 ,05 0 1 2 3 4 1 . J 5 X 3. EL MODELO BINOMIAL, B(N; ) Consiste en la distribución del nº de aciertos en una serie de ensayos de Bernouilli. Para que la distribución de probabilidad de una variable X siga el modelo Binomial ha de cumplirse que … 1. La variable esté definida como variable dicotómica: en términos de Acierto (1) y error (0) 2. Se de una repetición de N ensayos independientes en la variable dicotómica en los que “la probabilidad de que el ensayo verifique la condición 1 (p.e., acierto) sea constante”, y se representa por . 3. Se defina una variable X, como el nº de veces que se verifica la condición (los 1) en los N ensayos. Los valores de X (los xi) oscilan entre 0 y N: X = {0, 1, 2, …, N} Si se cumplen las anteriores condiciones, la variable X (nº aciertos) se ajusta al Modelo Binomial con parámetros N y . Es decir: X ~ B (N; ) a) Función de probabilidad de una variable Binomial: N f ( x) x (1 ) N x x N N! Donde: x ! ( N x ) ! x b) Valor esperado: E(X) = N · c) Varianza: Carmen Ximénez 2(X) = N · (1 - ) 2 Análisis de Datos I Esquema del Tema 11 Tablas estadísticas No siempre es necesario aplicar la fórmula para obtener la función de probabilidad asociada a un valor de la variable. Existen tablas donde se puede consultar el valor de f (xi). La tabla de la Binomial (Tabla I del libro en págs. 404-408) tiene la siguiente estructura: N x 2 0 1 2 .. . 0,01 … 980 020 0+ 20 Dado X ~ B (N; ), para buscar una f (xi): … 0,99 1ª columna: valor de N 2ª columna: posibles valores de X: 0, 1, …, N .. 3ª columna: valor de f(xi) bajo diferentes valores de . - Por brevedad, aparece en porcentajes. … f (xi) … - El signo + significa que hay más de tres ceros. .. Ejemplo: . 0,50 P(X = 1) = f(1) = 0,02 bajo X ~ B (N = 2; = 0,01) Nota: Cuando N > 20, f (xi) puede aproximarse mediante el modelo Normal (lo veremos en el tema 12) Ejemplo 1 (resuelto) Un estudiante responde a un test de 3 preguntas con cinco opciones de respuesta (donde sólo 1 es correcta). Si ha respondido azar: 1) Elabore el modelo de distribución para la variable X (nº de aciertos al azar) X ~ B (N = 3; = 0,20) N 3 3! f ( x) x (1 )N x f (0) 0, 20 0 (0, 80) 3 1 0, 512 0, 512 x 0!(3 0)! 0 3 3! f (1) 0, 201 (0, 80) 2 0, 20 0, 64 0, 384 1!(3 1)! 1 3 3! f (2) 0, 20 2 (0, 80)1 0, 04 0, 80 0, 096 2 2!(3 2)! 3 3! f (3) 0, 20 3 (0, 80) 0 0, 008 1 0, 008 3 3!(3 3)! Xi f(xi) 0 0,512 1 0,384 2 0,096 3 0,008 2) ¿Cuál es la probabilidad de que acierte todas las preguntas? P(X = 3) = f(3) = 0,008 (coincide con el valor dado en las tablas de probabilidad) 3) Valor esperado: E(X) = N · = (3) (0,20) = 0,60 Varianza: 2(X) = N · (1 - ) = (3) (0,20 · 0,80) = 0,48 4) ¿Cuál es la probabilidad de que acierte como máximo 2 preguntas? P(X 2) = F(2) = 0,512 + 0,384 + 0,096 = 0,992 5) ¿Cuál es la probabilidad de que acierte entre 1 y 2 preguntas (ambas inclusive)? P(1 X 2) = F(2) - F(0) = 0,992 - 0,512 = 0,480 6) ¿Cuál es la probabilidad de que acierte al menos 2 preguntas? P(X 2) = 1 - P(X 1) = 1 – 0,896 = 0,104 Carmen Ximénez 3 Análisis de Datos I Esquema del Tema 11 4. MODELO DE DISTRIBUCIÓN MULTINOMIAL Se realizan N ensayos independientes que dan lugar a k resultados: X = { X1, X2, … Xk } con probabilidades 1, 2, … k, respectivamente (donde 1 + 2 + … + k = 1). Este modelo se trata de una extensión de la Binomial útil para variables politómicas (variables discretas con más de 2 categorías). Función de probabilidad de una variable multinomial: f ( X 1 , X 2 , ..., X k ) N! X 1 X 2 ... X k X 1 ! X 2 ! ... X k ! Ejemplo 2 X: Actitud hacia la donación de órganos X1: En contra ........ con 1 = 0,15 X2: Indiferentes ..... con 2 = 0,40 X3: A favor ........... con 3 = 0,45 Si se extrae una muestra aleatoria de 20 sujetos. ¿Cuál es la probabilidad de que 5 estén en contra, 10 sean indiferentes y 5 estén a favor? f ( X 1 5 , X 2 10 , X 3 5) N! 20! π X1 π X 2 π X1 0,15 5 0,40 10 0,45 5 0,41 X 1!X 2!X 3! 5! 10! 5! 5. EJERCICIOS Ejercicio 1 Supongamos que es igual de probable que nazcan niños que niñas. Si nos fijamos en los próximos 5 partos de una determinada clínica, determine: 1. La probabilidad de que todas sean niñas 2. La probabilidad de que las niñas sean minoría 3. El valor esperado y la varianza de la variable X: “número de niñas” Ejercicio 2 El 70% de pacientes que sufren una determinada enfermedad se curan al aplicarles un tratamiento. Si tomamos una m.a.s. de 10 pacientes con esa enfermedad y pasan el tratamiento: 1. ¿Cuál es la probabilidad de que se recuperen todos? 2. ¿Cuál es la probabilidad de que se recuperen al menos la mitad? 3. ¿Cuántos debemos esperar que se curen? 4. ¿Cuál es la probabilidad de que se recuperen como máximo 6 pacientes? 5. ¿Cuál es la probabilidad de que se recuperen entre 2 y 4 (ambos inclusive)? Ejercicio 3 ¿Cuál es la probabilidad de que al tomar 6 sujetos al azar, los seis superen el Q3 en la variable creatividad? Carmen Ximénez 4