Variable Aleatoria Continua. Principales Distribuciones Definición

Anuncio
Variable Aleatoria Continua.
Principales Distribuciones
Definición de v. a. continua
Función de Densidad
Función de Distribución
Características de las v.a. continuas
Principales Distribuciones continuas
Ejercicios
Definición de v. a. continua
Las variables aleatorias continuas se definen sobre espacios muestrales infinitos
no numerables, es decir, toman un número de valores infinito. Se
representan mediante letras mayúsculas y pueden tomar como posibles
valores:
X = { x1, x2, ... , xi , ... , xn, … }
Se suele comentar que las variables aleatorias discretas son el resultado de
contar (edad de una persona, nº de hijos, nº de hermanos, nº de veces que
aparece cara en un lanzamiento de moneda, nº de puntos de un dado,
etc…), mientras que las variables aleatorias continuas son el resultado de
medir (velocidad media de un automóvil, talla y peso de una persona,
etc…)
Ejemplo:
Si consideramos la variable aleatoria altura de las personas españolas mayores
de 21 años, esta variable puede tomar infinitos valores, ya que entre
cualesquiera dos valores, digamos 163.5 y 164.5, pueden darse infinitos
valores de altura, uno de los cuales es exactamente el 164.
1
Función de Densidad: f(x)
Sea (Ω, ℘(Ω), P) un espacio de probabilidad y X una v. a. c. Se llama función de
densidad, f(x), a una función real no negativa, tal que ∀a, b ∈R, con -∞ ≤ a ≤
b ≤ ∞:
y que verifica:
(i) f(x) ≥ 0
(ii)
Gráficamente se representa
mediante una curva.
Observación
f(x) no representa la probabilidad
de nada, es sólo al integrar cuando
obtenemos probabilidades.
Función de Distribución, F(x)
Sea (Ω, ℘(Ω), P) un espacio de probabilidad, X v. a. continua, {xi} i = 1 .. ∞ los
valores que toma y f(x) la función de densidad de X.
Se llama función de distribución (acumulativa) de la v.a.c. X, F(x), a la
probabilidad de que X sea menor o igual que x; es decir:
Que cumple las siguientes propiedades:
(i) F(- ∞) = 0
(iii) F(∞) = 1
(v) F es monótona no decreciente, es decir, si xi ≤ xj entonces F(xi) ≤ F(xj)
(vi) F es continua
(vii) Si f(x) es continua, entonces F(x) es derivable y
(viii) P(a ≤ X ≤ b) = F(b) - F(a) =
2
Función de Distribución, F(x)
Gráficamente resulta:
Características de las v.a. continuas
Se trata de resumir la información de una variable aleatoria en un conjunto de
medidas (números).
Esperanza:
Sea X una v. a. c. El valor esperado o esperanza matemática de X, denotada por
E(X) o por µ, se define como:
E(X) es un valor fijo que depende de la distribución de probabilidad de X. Está
medida en las mismas unidades que X.
Propiedades de la esperanza:
(i) Si C es una constante, entonces E(C) = C.
(ii) Linealidad: E(aX + b) = aE(X) + b, ∀a, b ∈ ℜ
(iii) Si g(X) es una función de X, entonces:
(iv) Si g(X), h(X) son funciones de X, entonces E[g(X)+h(X)]=E[g(X)]+E[h(X)]
(v) |E[g(X)]| ≤ E[|g(X)|]
3
Características de las v.a. continuas
Varianza:
Sea X una v. a. d. La varianza de X se denota con Var(X), V(X) o σ2 y se
define como
V ( X ) = ∫ ( X − µ ) 2 f ( x)dx
ℜ
La raíz cuadrada positiva de la varianza se llama desviación típica y se
denota con σ. Tanto la varianza como la desviación típica miden la
dispersión de la v.a. respecto a su media.
Observaciones:
- La varianza y la desviación típica son cantidades positivas.
- La desviación típica está medida en las mismas unidades que la v.a.
Propiedades de la varianza:
(i) Si C es una constante, V(C)=0
(ii) V(X) = E(X2) - E2(X)
(iii) Si a y b son constantes: V(aX+b) = a2 V(X)
La desviación media se define como la esperanza de |X-µ|.
Principales Distribuciones
Como ocurría con las variables aleatorias discretas, en la práctica, la
función de densidad de la mayoría de las variables continuas se ajusta a un
modelo teórico expresado mediante una fórmula concreta. Veremos los más
habituales.
V.A. CONTINUAS
Normal N(µ, σ)
Chi-Cuadrado de Pearson χ2
t de Student
F de Fisher-Snedecor
4
Principales Distribuciones
Distribución Normal N(µ,σ)
Es el modelo de distribución más utilizado en la práctica, ya que:
1.
2.
3.
Multitud de fenómenos se comportan según una distribución normal.
(distribución de pesos, alturas, coeficientes de inteligencia, errores en la
medida, etc…)
Es la distribución muestral de varios estadísticos maestrales, tales como
la media, etc…
Es una buena aproximación de otras distribuciones (así la distribución
de una variable binomial, de Poisson, etc… son aproximadamente
normales).
Se dice que una variable aleatoria continua sigue una distribución normal si
su función de densidad viene dada por la expresión:
Principales Distribuciones
Esta distribución viene definida por dos parámetros:
µ: es el valor medio de la distribución y es precisamente donde se sitúa el
centro de la curva (de la campana de Gauss).
σ: es la desviación típica. Indica si los valores están más o menos alejados del
valor central
Se caracteriza porque la gráfica de la función de densidad forma una curva,
simétrica respecto a un valor central que coincide con la media de la
distribución, y se extiende sin límite, tanto en la dirección positiva como
negativa del eje X, de forma asintótica (campana de Gauss).
Por ser función de densidad, el área total
encerrada bajo la curva y sobre el
eje X es igual a 1. Un 50% de los
valores están a la derecha de este
valor central y otro 50% a la
izquierda.
5
Principales Distribuciones
La curva de cualquier
función de densidad está
construida de tal modo que
el área bajo la curva,
limitada por los dos puntos
x = a y x = b es igual a la
probabilidad de que la
variable aleatoria X asuma
un valor entre x = a y x = b.
Principales Distribuciones
Es posible transformar todas las observaciones de cualquier v. a. X con
distribución normal a un nuevo conjunto de observaciones de una
variable aleatoria normal Z con media 0 y varianza 1. Esta distribución
normal se denomina normal tipificada, y su ventaja reside en que hay
tablas donde se recoge la probabilidad acumulada para cada punto de la
curva de esta distribución.
Para transformar una v. a. X en una normal tipificada se crea una nueva
variable (Z) que será:
Z=
X −µ
σ
Por tanto:
x −µ

P ( X ≤ x i ) = P Z ≤ i

σ 

b−µ
a−µ
≤Z≤
P ( a ≤ X ≤ b) = P

σ 
 σ
6
Principales Distribuciones
X
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
0,5000
0,5040
0,5080
0,5120
0,5160
0,5199
0,5239
0,5279
0,5319
0,5359
0,1
0,5398
0,5438
0,5478
0,5517
0,5557
0,5596
0,5636
0,5675
0,5714
0,5723
0,2
0,5793
0,5832
0,5871
0,5910
0,5948
0,5987
0,6026
0,6064
0,6103
0,6141
0,3
0,6179
0,6217
0,6255
0,6293
0,6331
0,6368
0,6406
0,6443
0,6480
0,6517
0,4
0,6554
0,6591
0,6628
0,6664
0,6700
0,6736
0,6772
0,6808
0,6844
0,6879
0,5
0,6915
0,6950
0,6985
0,7019
0,7054
0,7088
0,7123
0,7157
0,7090
0,7224
0,6
0,7257
0,7291
0,7324
0,7357
0,7389
0,7422
0,7454
0,7486
0,7517
0,7549
0,7
0,7580
0,7611
0,7642
0,7673
0,7704
0,7734
0,7764
0,7794
0,7813
0,7852
0,8
0,7881
0,7910
0,7939
0,7967
0,7995
0,8023
0,8051
0,8078
0,8106
0,8133
0,9
0,8159
0,8186
0,8212
0,8238
0,8264
0,8289
0,8315
0,8340
0,8365
0,8389
1,0
0,8416
0,8438
0,8461
0,8485
0,8508
0,8531
0,8554
0,8577
0,8599
0,8621
1,1
0,8643
0,8665
0,8686
0,8708
0,8729
0,8749
0,8770
0,8790
0,8810
0,8830
1,2
0,8849
0,8869
0,8888
0,8907
0,8925
0,8944
0,8962
0,8980
0,8997
0,9015
1,3
0,9032
0,9049
0,9066
0,9082
0,9099
0,9115
0,9131
0,9147
0,9162
0,9177
1,4
0,9192
0,9207
0,9222
0,9236
0,9251
0,9265
0,9279
0,9292
0,9306
0,9319
1,5
0,9332
0,9345
0,9357
0,9370
0,9382
0,9394
0,9406
0,9418
0,9429
0,9441
Principales Distribuciones
1,6
0,9452
0,9463
0,9474
0,9484
0,9495
0,9505
0,9515
0,9525
0,9535
0,9545
1,7
0,9554
0,9564
0,9573
0,9582
0,9591
0,9599
0,9608
0,9616
0,9625
0,9633
1,8
0,9641
0,9649
0,9656
0,9664
0,9671
0,9678
0,9686
0,9693
0,9699
0,9706
1,9
0,9713
0,9719
0,9726
0,9732
0,9738
0,9744
0,9750
0,9756
0,9761
0,9767
2,0
0,97725
0,97778
0,97831
0,97882
0,97932
0,97982
0,98030
0,98077
0,98124
0,98169
2,1
0,98214
0,98257
0,98300
0,98341
0,98382
0,98422
0,98461
0,98500
0,98537
0,98574
2,2
0,98610
0,98645
0,98679
0,98713
0,98745
0,98778
0,98809
0,98840
0,98870
0,98899
2,3
0,98928
0,98956
0,98983
0,99010
0,99036
0,99061
0,99086
0,99111
0,99134
0,99158
2,4
0,99180
0,99202
0,99224
0,99245
0,99266
0,99286
0,99305
0,99324
0,99343
0,99361
2,5
0,99379
0,99396
0,99413
0,99430
0,99446
0,99461
0,99477
0,99492
0,99506
0,99520
2,6
0,99534
0,99547
0,99560
0,99573
0,99585
0,99598
0,99609
0,99621
0,99632
0,99643
2,7
0,99653
0,99664
0,99674
0,99683
0,99693
0,99702
0,99711
0,99720
0,99728
0,99736
2,8
0,99744
0,99752
0,99760
0,99767
0,99774
0,99781
0,99788
0,99795
0,99801
0,99807
2,9
0,99813
0,99819
0,99825
0,99831
0,99836
0,99841
0,99846
0,99851
0,99856
0,99861
¿Cómo se lee esta tabla?
La columna de la izquierda indica el valor cuya probabilidad acumulada
queremos conocer. La primera fila nos indica el segundo decimal del valor que
estamos consultando. Los valores del interior de la tabla representan áreas (o
probabilidades)
7
Principales Distribuciones
Llamaremos zα al punto del eje OX que deja a su izquierda un área α en la
curva, es decir P( Z ≤ z ) = α
α
Como la curva normal es simétrica respecto a su media y esta, en el caso
de la normal tipificada (que es la tabulada) es 0, se verifica
zα = z1−α
Hay ocasiones en que estamos interesados en conocer el punto del eje OX
que deja a su izquierda , bajo la curva normal tipificada, un área α.
En estos casos buscamos en el interior de la tabla el valor más cercano
a α, y las coordenadas de la fila-columna de la posición de ese valor
nos da el punto buscado.
Principales Distribuciones
Aproximación de la Binomial a la Normal.
Distribución Binomial:
Si n es pequeña Î Las probabilidades se obtienen de la fórmula de la
binomial o de su tabla acumulada.
Si n es grande Î Las probabilidades se obtienen por aproximación.
Aproximación discreta (la de Poisson) para aproximar probabilidades
de la binomial Îcuando n es grande y p cercana a 0 ó a 1 (1-p cercano a 0).
Aproximación continua (la normal) para aproximar probabilidades de
la binomial Î es excelente cuando n es grande (n >30) pero sigue siendo
buena para valores relativamente pequeños de n, siempre y cuando p esté
cercano a 0.5. (np y nq ambos ≥ 5).
Cuidado con las probabilidades asociadas a los puntos extremos de los
intervalos considerados Î Corrección de continuidad
8
Principales Distribuciones
Ejemplo:
Una prueba de opción múltiple tiene 200 preguntas, cada una con 4 posibles
respuestas, de las cuales sólo 1 es la correcta. ¿Cuál es la probabilidad de que
un alumno que contesta al azar 80 de ellas acierte entre 25 y 30? La
probabilidad de una respuesta correcta para cada una de las 80 respuestas es
p=1/4.
X = nº de respuestas correctas de las 80 contestadas
P(25 ≤ X≤ 30)=
∑ b(x;80, 1 4 )
X∈B(80, ¼)
30
x = 25
Usamos la aproximación a la normal con µ = np = 80. ¼ = 20 y σ = npq = 80 1 3 = 3.873
44
Se necesita conocer el área entre 24.5 y 30.5 (por la corrección de continuidad). Los
correspondientes valores de Z son:
24.5 − 20
Z1 =
= 1.16
3.873
30.5 − 20
Z2 =
= 2.71
3.873
Principales Distribuciones
La probabilidad de responder correctamente de 35 a 30 preguntas la
proporciona el área comprendida entre estos dos valores bajo la curva
de la normal estándar
P( 25 ≤ X ≤ 30) =
∑ b(x;80, 1 4 ) ≈ P(1.16 < Z < 2.71) =
30
x = 25
= P ( Z < 2.71) − P ( Z < 1.16) = 0.9966 − 0.8770 = 0.1196
9
Principales Distribuciones
Distribución Chi - Cuadrado de Pearson χ2k
Principales Distribuciones
Aproximación de χ2 a la Normal
10
Principales Distribuciones
Distribución t de Student tk
Principales Distribuciones
Distribución F de Fisher-Snedecor Fk1,k2
11
Ejercicios
Ejercicio 4.1
La variable X=" nº de centímetros a que un dardo queda del centro" al ser
tirado por una persona, se observó que tenía por función de densidad
f(x):
k
0<x<10
0
restantes casos
Se pide:
a) Hallar k para que f(x) sea función de densidad. Representarla
b) Hallar la función de distribución. Representarla
c) Media, Varianza y Desviación Típica.
d) P(X≤1)
e) Probabilidad de acertar en la diana.
Ejercicio 4.2
Se emplean calibradores para rechazar todos los componentes en los cuales
haya cierta dimensión cuya medida no esté dentro de las especificaciones
1.5 ± d. Se sabe que esta medida tiene una distribución normal con media
1.5 y desviación estándar de 0.2. Determine el valor de d, de modo que
las especificaciones cubran el 95% de las medidas.
Ejercicios
Ejercicio 4.3
En la observación del nº de glóbulos rojos (en millones) de los habitantes de
una gran ciudad se observó que seguían aproximadamente una
distribución normal de media 4.5 y desviación típica 0.5.
Se pide calcular:
a) Probabilidad de que un habitante tomado al azar tenga más de cinco
millones de glóbulos rojos.
b) Tanto por ciento de la ciudad con menos de 3.75 millones
c) Nº de glóbulos rojos del 20 por 100 más alto de la ciudad
d) Nº de glóbulos rojos del 10 por 100 más bajo de la ciudad
e) Nº de glóbulos rojos del 80 por 100 más próximo a la media
12
Ejercicios
Ejercicio 4.4
Un biólogo comprobó que la probabilidad de que al inyectar a una rata un
determinado producto sobreviviera después de una semana era de 0.5.
Si el biólogo inyectó el producto a un lote de 100 ratas.
Se pide calcular:
a) Probabilidad de que vivan más de 65
b) Probabilidad de que vivan entre 40 y 60
c) Probabilidad de que vivan menos de 30
d) Probabilidad de que vivan más de 45. ¿Qué significa esta
probabilidad?
Ejercicio 4.5
Una variable aleatoria sigue una distribución χ2 de Pearson. Se pide
calcular:
a) Los puntos críticos: χ2 0.90;5 χ2 0.01;26 χ2 0.025;8 χ2 0.08;10
b) Las probabilidades: P(χ28 ≥ 3.49); P(χ28 ≤ 15.51); P(χ210 ≥ 4);
P(χ220 ≤ 29);
Ejercicios
Ejercicio 4.6
Una variable aleatoria sigue una distribución t de Student
Se pide calcular:
a) Los puntos críticos: t 0.20;20 t 0.99;10 t 0.25;10
b) Las probabilidades: P(t10 ≥ 1.372); P(t8 ≤ 1.2); P(-0.5 ≤ t6 ≤ 0.6);
P(|t24|>2)
Ejercicio 4.7
Una variable aleatoria sigue una distribución F de Fisher-Snedecor
Se pide calcular:
a) Los puntos críticos: F0.1;10,12 F0.05;5,24 F 0.90;28,30
b) Las probabilidades: P(2 ≤ F10;20 ≤ 2.25)
13
Ejercicios
Ejercicio 4.8
La población de sujetos tallados en el servicio militar se distribuye en X:
altura N (1,69; 0,01) y en Y: peso N (68,2; 1,80). Suponiendo que
ambas variables son independientes en la población y que
seleccionamos una muestra aleatoria de 10 sujetos:
a) ¿Cuál es la probabilidad de que su estatura esté comprendida entre
1,65 y 1,70 m.?
b) ¿Cuál es la probabilidad de que su altura y peso sean superiores a
1,72 m. y 65 kg.?
c) ¿Cuáles son los pesos que delimitan al 50 por 100 central de los
sujetos?
d) Si creamos la nueva variable: W = 2 ·X: Calcule E(W), σ2(W) y
P(3,32 ≤ W ≤ 3,40)
Ejercicios
Ejercicio 4.9
La variable extroversión (X) se distribuye según el modelo normal con
media 50 y desviación típica 10. Conteste a las siguientes preguntas:
a) Probabilidad de que los sujetos obtengan como mucho una puntuación
de 35
b) Probabilidad de que los sujetos obtengan una puntuación mayor de 60
en extroversión
c) Calcule la puntuación en extroversión que deja por debajo de sí al
80% de los sujetos
d) Probabilidad de observar un valor comprendido entre 42 y 59
e) Calcule la puntuación que corresponde al centil 90 en directas,
diferenciales y típicas
f) Calcule los valores que acotan el 50% central de sujetos
g) Calcule la puntuación S que corresponde al centil 75 (siendo S= 2·zi+5)
h) Si se extrae una muestra aleatoria de 25 alumnos, ¿cuál es la
probabilidad de que su media aritmética sea mayor de 55?
14
Ejercicios
Ejercicio 4.10
La variable U se distribuye según χ2 con 9 grados de libertad, la variable V
se distribuye según t de student con 15 grados de libertad y la variable
W se distribuye según F de Snedecor con 6 y 8 grados de libertad.
Según esto conteste a las siguientes preguntas:
a) Probabilidad de que la variable U adopte como mucho el valor 8
b) Puntuación U tal que la probabilidad de obtener como máximo
ese valor sea 0,70
c) Probabilidad de observar valores en la variable V entre -1,341 y
2,602
d) Calcular la puntuación V que corresponde al centil 80
e) Probabilidad de que la variable W adopte como mínimo el valor
4,65
f) Puntuación W que corresponde a la probabilidad acumulada de
0,90
15
Descargar