Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I M. González Departamento de Matemáticas. Universidad de Extremadura M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Conceptos Básicos 1. Considera el experimento aleatorio "observar el sexo de los hijos de una familia con 3 descendientes". (a) Construye el espacio de probabilidad asociado sabiendo que la probabilidad de ser varón es 0.49. (Ω, P) V-Varón; M-Mujer Ω = {VVV, VVM, VMV, MVV, VMM, MVM, MMV, MMM} P(VVV) = 0.493 P(VVM) = 0.492 ∗ 0.51 = P(VMV) = P(MVV) P(VMM) = 0.49 ∗ 0.512 = P(MVM) = P(MMV) P(MMM) = 0.513 M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Conceptos Básicos 1. (b) Calcula el espacio de probabilidad de la variable aleatoria (v.a.) X="número de hijos varones de una familia con 3 hijos", y calcula la probabilidad de que la variable sea menor o igual que -0.05, 0, 0.5, 1, 3, 3.5 X : Ω −→ Ω0 = {0, 1, 2, 3} (Ω0 , PX ) VVV −→ 3 VVM −→ 2 ... MMV −→ 1 MMM −→ 0 PX ({0}) = P(X = 0) = P({ω ∈ Ω : X(ω) = 0}) = P(MMM) = 0.513 PX ({1}) = P(X = 1) = P({ω ∈ Ω : X(ω) = 1}) = = P({VMM, MMV, MVM}) = 3 ∗ 0.49 ∗ 0.512 X P ({2}) = P(X = 2) = P({ω ∈ Ω : X(ω) = 2}) = = P({VVM, VMV, MVV}) = 3 ∗ 0.492 ∗ 0.51 PX ({3}) = P(X = 3) = P({ω ∈ Ω : X(ω) = 3}) = P(VVV) = 0.493 M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Conceptos Básicos 1. (c) Calcula E[X] y Var[X]. (Ω0 , PX ) Ω0 = {0, 1, 2, 3} PX ({0}) = P(X PX ({1}) = P(X PX ({2}) = P(X PX ({3}) = P(X = 0) = 0.513 = 1) = 3 ∗ 0.49 ∗ 0.512 = 2) = 3 ∗ 0.492 ∗ 0.51 = 3) = 0.493 P E[X] = µX = xi ∈Ω0 xi PX ({xi }) = 0 ∗ PX ({0}) + 1 ∗ PX ({1}) + 2 ∗ PX ({2}) + 3 ∗ PX ({3}) = 1.47 P Var[X] = σX2 = xi ∈Ω0 (xi − E[X])2 PX ({xi }) = P 2 X 2 2 X 2 X 2 xi ∈Ω0 xi P ({xi }) − E[X] = 0 ∗ P ({0}) + 1 ∗ P ({1}) + 2 ∗ PX ({2}) + 32 ∗ PX ({3}) − 1.472 = 0.7497 M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Conceptos Básicos 1. (d) Si Y="número de hijas de una familia con 3 descendientes", ¿son X e Y independientes? Y : Ω −→ Ω0 = {0, 1, 2, 3} (Ω0 , PY ) VVV −→ 0 VVM −→ 1 ... MMV −→ 2 MMM −→ 3 PY ({0}) = P(Y = 0) = P({ω ∈ Ω : Y(ω) = 0}) = P(VVV) = 0.493 PY ({1}) = P(Y = 1) = P({ω ∈ Ω : Y(ω) = 1}) = = P({VVM, VMV, MVV}) = 3 ∗ 0.492 ∗ 0.51 Y P ({2}) = P(Y = 2) = P({ω ∈ Ω : Y(ω) = 2}) = = P({VMM, MMV, MVM}) = 3 ∗ 0.49 ∗ 0.512 PY ({3}) = P(Y = 3) = P({ω ∈ Ω : Y(ω) = 3}) = P(MMM) = 0.513 M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Conceptos Básicos 1. (d) Si Y="número de hijas de una familia con 3 descendientes", ¿son X e Y independientes? Independencia de Variables Aleatorias X e Y son independientes si para todo A, B ⊆ Ω0 P({X ∈ A} ∩ {Y ∈ B}) = P({X ∈ A})P({Y ∈ B}) P({X = 1} ∩ {Y = 1}) = P({VMM, MVM, MMV} ∩ {VVM, VMV, MVV}) = P(∅) = 0 P(X = 1)P(Y = 1) 6= 0 M. González DEPENDIENTES Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Distribución Binomial Experimento aleatorio inicial: Ω = {EXITO(E), FRACASO(F)}, P(E) = p, P(F) = 1 − p. Experimento aleatorio: "Repetir n veces de forma independiente el experimento aleatorio inicial" (p = P(E) constante) Ωn = {E . . . E, FE . . . E, · · · , F . . . FE, F . . . F} P(E . . . E) = pn P(FE . . . E) = pn−1 (1 − p) = P(EFE . . . E) = · · · = P(E . . . EF) P(FFE . . . E) = pn−2 (1 − p)2 = P(FEFE . . . E) = · · · = P(E . . . EFF) P(F . . . F) = (1 − p)n X =número de éxitos en las n repeticiones independientes del experimento inicial. X : Ωn → {0, 1, . . . , n} n P(X = k) = pk (1 − p)n−k , k = 0, . . . , n k X ∼ B(n, p) E[X] = µX = np, Var[X] = σX2 = np(1 − p) M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Distribución Binomial 3. Se sabe que un determinado antígeno da reacciones positivas en un 20% de la población. ¿Cuál es la probabilidad de que tomando 5 muestras de sangre al azar, se produzca reacción como máximo en dos de las muestras?. ¿Y exactamente en 3 de ellas? ¿Y en ninguna de las muestras? X=número de muestras de sangre entre 5 tomadas al azar que dan positivo ante el antígeno ∼ B(5, 0.2) P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0.328 + 0.410 + 0.205 = 0.943 P(X = 3) = 0.051 P(X = 0) = 0.328 M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Distribución Normal Es el modelo teórico que viene determinado por la siguiente función de densidad, definida en toda la recta real: 1 2 2 f (x) = √ e−(x−µ) /2σ σ 2π , −∞ < x < ∞ Intuitivamente, es la distribución de probabilidad que se asume para variables consideradas simétricas respecto a su media y cuyos valores se disponen en un "histograma" que se ajusta a la forma de la llamada campana de Gauss 0.4 N(0, 1) 0.0 0.1 0.2 0.3 Los parámetros de esta distribución son su media, µ, que es el eje de simetría de la gráfica, y la varianza σ 2 . Escribiremos X ∼ N(µ, σ 2 ) −4 −2 0 2 4 M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Distribución Normal 0.3 0.2 0.1 0.0 0.0 0.1 0.2 0.3 0.4 N(2,1) 0.4 N(0,1) −4 −2 0 2 4 6 −6 −4 −2 0 x x N(0,4) N(2,4) 2 4 6 2 4 6 0.00 0.00 0.10 0.10 0.20 0.20 −6 −6 −4 −2 0 2 4 6 x −6 −4 −2 0 x M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Distribución Normal TIPIFICACIÓN: X−µ ∼ N(0, 1) σ A la distribución N(0, 1) se le denomina Normal Estándar. X ∼ N(µ, σ 2 ) ⇒ Z = TABLA III-2: u ≥ 0 → P(Z ≤ u) P(Z ≤ u) u La distribución N(0, 1) es la simétrica respecto al 0, es decir, si Z ∼ N(0, 1) P(Z ≤ u) = P(Z ≥ −u) u P(Z ≥ u) = P(Z ≤ −u) −u M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Distribución Normal 9. Supongamos que la presión diastólica en mujeres hipertensas se centra entorno a una media de 100mm con una desviación típica de 14mm y que su distribución es normal. Calcula: (a) La probabilidad de que la presión diastólica sea menor que 88mm. (b) La probabilidad de que la presión diastólica sea mayor que 115mm. X =presión diastólica de una mujer hipertensa ∼ N(100, 142 ) (a) X − 100 88 − 100 X − 100 P(X < 88) = P < Z= ∼ N(0, 1) 14 14 14 = P(Z < −0.86) = P(Z > 0.86) = 1 − P(Z ≤ 0.86) = 1 − 0.8051 = 0.1949 −0.86 0.86 M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Distribución Normal 9. X =presión diastólica de una mujer hipertensa ∼ N(100, 142 ) (c) La probabilidad de que la presión diastólica se encuentre entre 96 y 104mm. P(96 ≤ X ≤ 104) 96 − 100 X − 100 104 − 100 = P ≤ ≤ 14 14 14 = P(−0.29 ≤ Z ≤ 0.29) = P(Z ≤ 0.29) − P(Z ≤ −0.29) = P(Z ≤ 0.29) − (1 − P(Z ≤ 0.29)) = 2 ∗ P(Z ≤ 0.29) − 1 = 2 ∗ 0.6141 − 1 = 0.2282 −0.29 M. González 0.29 Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Distribución Normal Z ∼ N(0, 1) TABLA III-1: α ∈ [0, 1] → zα ≥ 0 P(Z ≥ zα ) = α/2 P(Z ≤ zα ) = 1 − α/2 P(−zα ≤ Z ≤ zα ) = 1 − α 9. X =presión diastólica de una mujer hipertensa ∼ N(100, 142 ) (d) El valor t, tal que la probabilidad de que la presión sea menor que t, sea 0.95. X − 100 t − 100 ≤ = 0.95 P(X < t) = 0.95 ⇔ P 14 14 t − 100 ⇔ P Z≤ = 0.95 14 1 − α/2 = 0.95 ⇒ α = 0.1 t − 100 = z0.1 = 1.645 ⇒ t = 100 + 14 ∗ 1.645 = 123.03 14 M. González Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I Variables Aleatorias: Distribución Normal TABLA III-1: α ∈ [0, 1] → zα ≥ 0 Z ∼ N(0, 1) P(Z ≥ zα ) = α/2 P(−zα ≤ Z ≤ zα ) = 1 − α P(Z ≤ zα ) = 1 − α/2 9. X =presión diastólica de una mujer hipertensa ∼ N(100, 142 ) (e) El valor t, tal que la probabilidad de que la presión sea mayor que t, sea 0.95. (f) Dos valores simétricos entorno a la media tales que la probabilidad de que la presión esté entre ellos sea de 0.95. P(100 − t < X < 100 + t) = 0.95 ⇔ (100 − t) − 100 X − 100 (100 + t) − 100 ⇔P ≤ ≤ = 0.95 14 14 14 −t t ⇔P ≤Z≤ = 0.95 14 14 1 − α = 0.95 ⇒ α = 0.05 t = z0.05 = 1.960 ⇒ t = 14 ∗ 1.960 = 27.44 14 100 − t = 72.56 M. González 100 + t = 127.44 Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I