Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I

Anuncio
Bioestadística: Variables Aleatorias.
Distribuciones de Probabilidad I
M. González
Departamento de Matemáticas. Universidad de Extremadura
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Conceptos Básicos
1. Considera el experimento aleatorio "observar el sexo de los hijos
de una familia con 3 descendientes".
(a) Construye el espacio de probabilidad asociado sabiendo que la
probabilidad de ser varón es 0.49.
(Ω, P)
V-Varón; M-Mujer
Ω = {VVV, VVM, VMV, MVV, VMM, MVM, MMV, MMM}
P(VVV) = 0.493
P(VVM) = 0.492 ∗ 0.51 = P(VMV) = P(MVV)
P(VMM) = 0.49 ∗ 0.512 = P(MVM) = P(MMV)
P(MMM) = 0.513
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Conceptos Básicos
1. (b) Calcula el espacio de probabilidad de la variable aleatoria (v.a.)
X="número de hijos varones de una familia con 3 hijos", y calcula la
probabilidad de que la variable sea menor o igual que -0.05, 0, 0.5, 1, 3, 3.5
X : Ω −→ Ω0 = {0, 1, 2, 3}
(Ω0 , PX )
VVV −→ 3
VVM −→ 2
...
MMV −→ 1
MMM −→ 0
PX ({0}) = P(X = 0) = P({ω ∈ Ω : X(ω) = 0}) = P(MMM) = 0.513
PX ({1}) = P(X = 1) = P({ω ∈ Ω : X(ω) = 1}) =
= P({VMM, MMV, MVM}) = 3 ∗ 0.49 ∗ 0.512
X
P ({2}) = P(X = 2) = P({ω ∈ Ω : X(ω) = 2}) =
= P({VVM, VMV, MVV}) = 3 ∗ 0.492 ∗ 0.51
PX ({3}) = P(X = 3) = P({ω ∈ Ω : X(ω) = 3}) = P(VVV) = 0.493
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Conceptos Básicos
1. (c) Calcula E[X] y Var[X].
(Ω0 , PX )
Ω0 = {0, 1, 2, 3}
PX ({0}) = P(X
PX ({1}) = P(X
PX ({2}) = P(X
PX ({3}) = P(X
= 0) = 0.513
= 1) = 3 ∗ 0.49 ∗ 0.512
= 2) = 3 ∗ 0.492 ∗ 0.51
= 3) = 0.493
P
E[X] = µX = xi ∈Ω0 xi PX ({xi }) =
0 ∗ PX ({0}) + 1 ∗ PX ({1}) + 2 ∗ PX ({2}) + 3 ∗ PX ({3}) = 1.47
P
Var[X] = σX2 = xi ∈Ω0 (xi − E[X])2 PX ({xi }) =
P
2 X
2
2
X
2
X
2
xi ∈Ω0 xi P ({xi }) − E[X] = 0 ∗ P ({0}) + 1 ∗ P ({1}) + 2 ∗
PX ({2}) + 32 ∗ PX ({3}) − 1.472 = 0.7497
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Conceptos Básicos
1. (d) Si Y="número de hijas de una familia con 3 descendientes", ¿son X e
Y independientes?
Y : Ω −→ Ω0 = {0, 1, 2, 3}
(Ω0 , PY )
VVV −→ 0
VVM −→ 1
...
MMV −→ 2
MMM −→ 3
PY ({0}) = P(Y = 0) = P({ω ∈ Ω : Y(ω) = 0}) = P(VVV) = 0.493
PY ({1}) = P(Y = 1) = P({ω ∈ Ω : Y(ω) = 1}) =
= P({VVM, VMV, MVV}) = 3 ∗ 0.492 ∗ 0.51
Y
P ({2}) = P(Y = 2) = P({ω ∈ Ω : Y(ω) = 2}) =
= P({VMM, MMV, MVM}) = 3 ∗ 0.49 ∗ 0.512
PY ({3}) = P(Y = 3) = P({ω ∈ Ω : Y(ω) = 3}) = P(MMM) = 0.513
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Conceptos Básicos
1. (d) Si Y="número de hijas de una familia con 3 descendientes",
¿son X e Y independientes?
Independencia de Variables Aleatorias
X e Y son independientes si para todo A, B ⊆ Ω0
P({X ∈ A} ∩ {Y ∈ B}) = P({X ∈ A})P({Y ∈ B})
P({X = 1} ∩ {Y = 1}) =
P({VMM, MVM, MMV} ∩ {VVM, VMV, MVV}) = P(∅) = 0
P(X = 1)P(Y = 1) 6= 0
M. González
DEPENDIENTES
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Distribución Binomial
Experimento aleatorio inicial: Ω = {EXITO(E), FRACASO(F)},
P(E) = p, P(F) = 1 − p.
Experimento aleatorio: "Repetir n veces de forma independiente el
experimento aleatorio inicial" (p = P(E) constante)
Ωn = {E . . . E, FE . . . E, · · · , F . . . FE, F . . . F}
P(E . . . E) = pn
P(FE . . . E) = pn−1 (1 − p) = P(EFE . . . E) = · · · = P(E . . . EF)
P(FFE . . . E) = pn−2 (1 − p)2 = P(FEFE . . . E) = · · · = P(E . . . EFF)
P(F . . . F) = (1 − p)n
X =número de éxitos en las n repeticiones independientes del
experimento inicial.
X : Ωn → {0, 1, . . . , n}
n
P(X = k) =
pk (1 − p)n−k , k = 0, . . . , n
k
X ∼ B(n, p)
E[X] = µX = np, Var[X] = σX2 = np(1 − p)
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Distribución Binomial
3. Se sabe que un determinado antígeno da reacciones positivas en un
20% de la población. ¿Cuál es la probabilidad de que tomando 5
muestras de sangre al azar, se produzca reacción como máximo en dos
de las muestras?. ¿Y exactamente en 3 de ellas? ¿Y en ninguna de las
muestras?
X=número de muestras de sangre entre 5 tomadas al azar que dan
positivo ante el antígeno ∼ B(5, 0.2)
P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) =
0.328 + 0.410 + 0.205 = 0.943
P(X = 3) = 0.051
P(X = 0) = 0.328
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Distribución Normal
Es el modelo teórico que viene determinado por la siguiente función
de densidad, definida en toda la recta real:
1
2
2
f (x) = √ e−(x−µ) /2σ
σ 2π
,
−∞ < x < ∞
Intuitivamente, es la distribución de probabilidad que se asume para
variables consideradas simétricas respecto a su media y cuyos valores
se disponen en un "histograma" que se ajusta a la forma de la llamada
campana de Gauss
0.4
N(0, 1)
0.0
0.1
0.2
0.3
Los parámetros de esta distribución son su media, µ, que es el
eje de simetría de la gráfica, y la
varianza σ 2 . Escribiremos X ∼
N(µ, σ 2 )
−4
−2
0
2
4
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Distribución Normal
0.3
0.2
0.1
0.0
0.0
0.1
0.2
0.3
0.4
N(2,1)
0.4
N(0,1)
−4
−2
0
2
4
6
−6
−4
−2
0
x
x
N(0,4)
N(2,4)
2
4
6
2
4
6
0.00
0.00
0.10
0.10
0.20
0.20
−6
−6
−4
−2
0
2
4
6
x
−6
−4
−2
0
x
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Distribución Normal
TIPIFICACIÓN:
X−µ
∼ N(0, 1)
σ
A la distribución N(0, 1) se le denomina Normal Estándar.
X ∼ N(µ, σ 2 ) ⇒ Z =
TABLA III-2: u ≥ 0 → P(Z ≤ u)
P(Z ≤ u)
u
La distribución N(0, 1) es la simétrica respecto al 0, es decir, si Z ∼ N(0, 1)
P(Z ≤ u) = P(Z ≥ −u)
u
P(Z ≥ u) = P(Z ≤ −u)
−u
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Distribución Normal
9. Supongamos que la presión diastólica en mujeres hipertensas se centra
entorno a una media de 100mm con una desviación típica de 14mm y que su
distribución es normal. Calcula:
(a) La probabilidad de que la presión diastólica sea menor que 88mm.
(b) La probabilidad de que la presión diastólica sea mayor que 115mm.
X =presión diastólica de una mujer hipertensa ∼ N(100, 142 )
(a)
X − 100
88 − 100
X − 100
P(X < 88) = P
<
Z=
∼ N(0, 1)
14
14
14
= P(Z < −0.86) = P(Z > 0.86) = 1 − P(Z ≤ 0.86)
= 1 − 0.8051 = 0.1949
−0.86
0.86
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Distribución Normal
9. X =presión diastólica de una mujer hipertensa ∼ N(100, 142 )
(c) La probabilidad de que la presión diastólica se encuentre entre 96 y
104mm.
P(96 ≤ X ≤ 104)
96 − 100
X − 100
104 − 100
= P
≤
≤
14
14
14
= P(−0.29 ≤ Z ≤ 0.29) = P(Z ≤ 0.29) − P(Z ≤ −0.29)
= P(Z ≤ 0.29) − (1 − P(Z ≤ 0.29))
= 2 ∗ P(Z ≤ 0.29) − 1 = 2 ∗ 0.6141 − 1
= 0.2282
−0.29
M. González
0.29
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Distribución Normal
Z ∼ N(0, 1)
TABLA III-1: α ∈ [0, 1] → zα ≥ 0
P(Z ≥ zα ) = α/2
P(Z ≤ zα ) = 1 − α/2
P(−zα ≤ Z ≤ zα ) = 1 − α
9. X =presión diastólica de una mujer hipertensa ∼ N(100, 142 )
(d) El valor t, tal que la probabilidad de que la presión sea menor que t, sea
0.95.
X − 100
t − 100
≤
= 0.95
P(X < t) = 0.95 ⇔ P
14
14
t − 100
⇔ P Z≤
= 0.95
14
1 − α/2 = 0.95 ⇒ α = 0.1
t − 100
= z0.1 = 1.645 ⇒ t = 100 + 14 ∗ 1.645 = 123.03
14
M. González
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Variables Aleatorias: Distribución Normal
TABLA III-1: α ∈ [0, 1] → zα ≥ 0
Z ∼ N(0, 1)
P(Z ≥ zα ) = α/2
P(−zα ≤ Z ≤ zα ) = 1 − α
P(Z ≤ zα ) = 1 − α/2
9. X =presión diastólica de una mujer hipertensa ∼ N(100, 142 )
(e) El valor t, tal que la probabilidad de que la presión sea mayor que t, sea
0.95.
(f) Dos valores simétricos entorno a la media tales que la probabilidad de
que la presión esté entre ellos sea de 0.95.
P(100 − t < X < 100 + t) = 0.95 ⇔
(100 − t) − 100
X − 100
(100 + t) − 100
⇔P
≤
≤
= 0.95
14
14
14
−t
t
⇔P
≤Z≤
= 0.95
14
14
1 − α = 0.95 ⇒ α = 0.05
t
= z0.05 = 1.960 ⇒ t = 14 ∗ 1.960 = 27.44
14
100 − t = 72.56
M. González
100 + t = 127.44
Bioestadística: Variables Aleatorias. Distribuciones de Probabilidad I
Descargar