Subido por Angel Pedro

1 Estadistica Politecnica Madrid

Anuncio
ESTADISTICA
CURSO 2017/2018
GRADO EN INGENIERIA EN TECNOLOGIAS INDUSTRIALES (GITI)
GRADO EN INGENIERIA DE ORGANIZACION (GIO)
GRADO EN INGENIERIA QUIMICA (GIQ)
Departamento de ingenier a de organizacion,
administracion de empresas y estad stica.
1. PROFESORES
Jesus Juan Ruiz. M1 y GIO
Mar a Jesus Sanchez Naranjo. T2
Jose Mira McWilliams. GIQ
Camino Gonzalez Fernandez. M2
Carolina Garc a Martos. M3
Francisco Javier Cara Ca~
nas. T1
Eduardo Caro Huertas. T3
2. PROGRAMA
1. Fundamentos de Probabilidad. Probabilidad. De nicion y propie-dades. Probabilidad
condicionada. Independencia de sucesos. Teorema de la probabi-lidad total y teorema de
Bayes.
2. Variable Aleatoria. Variables aleatorias discretas y continuas. Funciones de probabilidad,
densidad y distribucion. Esperanza, varianza y momentos. Transformaciones lineales y
no lineales. Generacion de numeros aleatorios (Metodo de Monte Carlo). Distribucion
conjunta. Distribuciones marginales y condicionadas. Independencia de variables aleatorias.
Esperanza de vectores aleatorios. Covarianza y correlacion. Matriz de varianzas. Esperanzas
y varianzas condicionadas. Suma de variables aleatorias.
3. Modelos de Probabilidad. Distribucion binomial y distribucion geometrica. Distribucion
de Poisson y distribucion exponencial. Distribucion normal. Teorema central del l mite.
Relacion entre binomial, Poisson y normal. Aplicacion a control de recepcion. Planes de
muestreo simple por atributos. Riesgo del comprador y riesgo del vendedor. La distribucion
normal n-dimensional.
4. Estad stica descriptiva. Descripcion de una variable: datos y distribucion de frecuencias.
Representaciones gra cas: histogramas. Medidas de centralizacion y dispersion. Medidas
de asimetr a y curtosis. Diagramas de cajas y diagrama de tallos y hojas. Transformaciones
lineales y no lineales. Descripcion de varias variables. Gra cos de dispersion. Covarianza y
correlacion. Matriz de varianzas y covarianzas. Transformaciones lineales de varias variables.
5. Estimacion. Muestra y poblacion. Muestreo aleatorio simple. La identi cacion del modelo.
Metodo de los momentos. Metodo de maxima verosimilitud. Propiedades de los estimadores.
Distribucion de medias, varianzas y proporciones muestrales. Distribucion 2 . Intervalo para
una proporcion. Intervalo para la media de la distribucion de Poisson. Intervalos para medias
de distribuciones normales: va-rianza conocida y varianza desconocida. Distribucion t de
Student. Intervalo para varianzas de distribuciones normales. Intervalo general (asintotico)
para la media.
6. Contraste de hipotesis. Contraste para la proporcion, contraste para la media y la
varianza de distribuciones normales. Contraste para la media de la distribucion de Poisson.
Comparacion de dos tratamientos. Contraste de dos varianzas. Distribucion F: Contrastes
de bondad de ajustes de 2 .
LIBROS RECOMENDADOS
Estad stica. Apuntes de la Asignatura. ETSII-UPM.
Fundamentos de Estad stica. Daniel Pe~
na, Alianza Editorial (2010).
Problemas resueltos de Estad stica. J. Juan, J.G. Palomo, M.J. Sanchez, e I. Sanchez. S ntesis
(2000):
Estadística
Parte I. Probabilidad
1. Fundamentos de Probabilidad
2. Variable Aleatoria
3. Modelos de Probabilidad
Parte II. Inferencia
4. Estadística Descriptiva
5. Estimación
6. Contraste de Hipótesis
Fundamentos de Probabilidad
1
Laboratorio de Estadística
Escuela Técnica Superior de Ingenieros Industriales
Universidad Politécnica de Madrid
http://www.etsii.upm.es/ingor/estadistica/
Profesores
Jesús Juan Ruiz.
María Jesús Sánchez Naranjo.
José Manuel Mira McWilliams.
Camino González Fernández.
Carolina García Martos.
Francisco Javier Cara Cañas.
Eduardo Caro Huertas.
Fundamentos de Probabilidad
2
Estadística
Parte I. Probabilidad
Tema 1.
Fundamentos
de Probabilidad
Experimento Aleatorio
El término “experimento aleatorio” se utiliza
en la teoría de la probabilidad para referirse
a un proceso cuyo resultado no es conocido
de antemano con certeza.
“Suma de valores en el lanzamiento de 2
dados.”
Fundamentos de Probabilidad
4
Ejemplos
• Número de piezas defectuosas en una
muestra de 100 piezas.
• Número de llamadas a una centralita
telefónica en un día.
• Energía eléctrica consumida en Madrid
durante un periodo de tiempo.
Fundamentos de Probabilidad
5
Espacio Muestral
Conjunto formado por todos los posibles
resultados de un experimento aleatorio.
• DISCRETOS:
• Lanzamiento de un DADO: S = {1,2,3,4,5,6}
• Piezas defectuosas en una muestra de 100
S = {0,1,2,...,100}
• Llamadas a una centralita durante un día
S = {0,1,2,3,...,∞}
• CONTINUOS:
• Energía consumida en Madrid: S={[0, ∞)}
Fundamentos de Probabilidad
6
Suceso
Cualquier subconjunto del espacio muestral.
•
“Obtener un número par al lanzar un dado”:
A = {2,4,6}
•
“Observar menos de 5 piezas defectuosas en una
muestra de 100”:
B = {0,1,2,3,4}
•
“Tener más de 50 llamadas de teléfono en una hora”:
C = {51,52,...,∞}
•
“Tener una demanda de energía eléctrica entre 300
Mwh y 400 Mwh” : D =(300,400)
7
Fundamentos de Probabilidad
Operaciones
Sean A y B dos subconjuntos de S
• Unión
A ∪ B = {x : (x ∈ A) o (x ∈ B)}
• Intersección
A ∩ B = {x : (x ∈ A) y (x ∈ B)}
A∪B
A∩B
• Complementario
A = {x : x∉ A}
Fundamentos de Probabilidad
A
8
Propiedades
Dados tres sucesos A,B y C de un espacio muestral S
A ∪ B = B ∪ A
Conmutativa : 
A ∩ B = B ∩ A
 A ∪ ( B ∪ C ) = ( A ∪ B) ∪ C
Asociativa : 
 A ∩ ( B ∩ C ) = ( A ∩ B) ∩ C
 A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C )
Distributiva : 
 A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C )
A ∪ B = A ∩ B
Leyes de De Morgan : 
A ∩ B = A ∪ B
Fundamentos de Probabilidad
9
Axiomas de Probabilidad
Dado un espacio muestral S, una función de probabilidad
asigna valores P(A) a cada suceso A ⊂ S y satisface :
1.
0 ≤ P(A) ≤ 1
2.
P(S) = 1
3. Para una secuencia de sucesos A1,A2 ,… , An
que cumplen Ai ∩ A j = ∅ cuando i ≠ j
n
P (∪ Ai ) = i =1 P( Ai )
n
i =1
Fundamentos de Probabilidad
10
Problema fundamental
Dado un espacio muestral discreto con resultados A1,
A2, ..., An disjuntos, el experimento aleatorio queda
caracterizado si asignamos un valor P(Ai) no negativo a
cada resultado Ai de forma que
P(A1)+P( A2)+ ...+P(An)=1.
• Ejemplo. Se lanza dos veces una moneda.
{XX,XC,CX,CC}
Se asigna probabilidad 1/4 a cada uno de los cuatro
resultados anteriores.
¿ Es una asignación correcta?
Fundamentos de Probabilidad
11
Propiedades elementales
1. P (∅) = 0.
2. P ( A) = 1 − P( A).
3. Si A ⊂ B entonces P(A) ≤ P(B).
4. Para dos sucesos cualesquiera A, B ⊂ S ,
P ( A ∪ B) = P ( A) + P( B) − P( A ∩ B).
5. Para n sucesos A1,A2 ,...,An ⊂ S ,
n
n
i =1
i =1
n
n
P(∪ Ai ) =  P( Ai ) −  P( Ai ∩ A j ) +
n
n
i =1 j > i
n
 P(A ∩ A
i
j
∩ Ak ) + ⋯ + (−1) n +1 P( A1 ∩ A2 ∩ ⋯ ∩ An )
i =1 j >i k > j
Fundamentos de Probabilidad
12
Asignación de probabilidades
1. Clásica (Laplace): Equiprobabilidad
2. Frecuencialista (von Mises, 1931)
3. Subjetiva
Fundamentos de Probabilidad
13
Clásica: sucesos
equiprobables
Sea un experimento con un número finito N de
resultados excluyentes y equiprobables, la
probabilidad del suceso A es
N ( A)
P( A) =
,
N
donde N es el número de resultados posibles
del experimento y N(A) el número de resultados
favorables al suceso A.
Fundamentos de Probabilidad
14
Ejemplos (equiprobabilidad)
• Lanzamiento de una moneda. S={C,X}
P(C ) =
1
2
• Lanzamiento de un dado. S={1,2,3,4,5,6}
P (" Número par " ) =
3 1
= .
6 2
• Extracción de una de las 40 cartas de la baraja,
S={1 Oros,2 Oros,...., Rey Bastos}
P ( Bastos ) =
10 1
= .
40 4
Fundamentos de Probabilidad
15
Lanzamiento de dos dados
1er Dado
2º Dado
1
2
3
4
5
6
1
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
(1,6)
2
(2,1)
(2,2)
(2,3)
(2,4)
(2,5)
(2,6)
3
(3,1)
(3,2)
(3,3)
(3,4)
(3,5)
(3,6)
4
(4,1)
(4,2)
(4,3)
(4,4)
(4,5)
(4,6)
5
(5,1)
(5,2)
(5,3)
(5,4)
(5,5)
(5,6)
6
(6,1)
(6,2)
(6,3)
(6,4)
(6,5)
(6,6)
P(“suma 7”) = 6/36 = 1/6
Fundamentos de Probabilidad
16
Urna: 2 Negras y 3 Blancas
1ª Bola
B1
B1
B2
B3
N1
N2
B1,B2
B1,B3
B1,N1
B1,N2
B2
B3
B2,B1 B3,B1
B3,B2
B2,B3
B2,N1 B3,N1
B2,N2 B3,N2
N1
N2
N1,B1 N2,B1
N1,B2 N2,B2
N1,B3 N2,B3
N2,N1
N1,N2
Se extraen dos bolas al azar, una detrás de otra,
sin reposición.
P(“1ª Blanca y 2ª Negra”) = 6/20 = 3/10
Fundamentos de Probabilidad
17
Urna: 2 Negras y 3 Blancas
2ª Bola
1ª Bola
B1
B2
B3
N1
N2
B1
B1,B1
B1,B2
B1,B3
B1,N1
B1,N2
B2
B2,B1
B2,B2
B2,B3
B2,N1
B2,N2
B3
B3,B1
B3,B2
B3,B3
B3,N1
B3,N2
N1
N1,B1
N1,B2
N1,B3
N1,N1
N1,N2
N2
N2,B1
N2,B2
N2,B3
N2,N1
N2,N2
Se extraen dos bolas al azar, una detrás de otra,
con reposición.
P(“1ª Blanca y 2ª Negra”) = 6/25
Fundamentos de Probabilidad
18
Combinatoria: 5 objetos tomados de dos en dos
SIN REEMPLAZAMIENTO
EL ORDEN
1
2
3
4
5
(1,2)
(1,3)
(1,4)
(1,5)
Primera extracción
2
3
4
(2,1)
(3,1)
(4,1)
(3,2)
(4,2)
(2,3)
(4,3)
(2,4)
(3,4)
(2,5)
(3,5)
(4,5)
5
(5,1)
(5,2)
(5,3)
(5,4)
1
2
3
4
5
1
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
Primera Extracción
2
3
4
(2,1)
(3,1)
(4,1)
(2,2)
(3,2)
(4,2)
(2,3)
(3,3)
(4,3)
(2,4)
(3,4)
(4,4)
(2,5)
(3,5)
(4,5)
Número = 20
1
EL ORDEN
NO IMPORTA
IMPORTA
1
CON REEMPLAZAMIENTO
1
2
3
4
5
(1,2)
(1,3)
(1,4)
(1,5)
Número = 25
Primera extracción
2
3
4
(2,3)
(2,4)
(2,5)
(3,4)
(3,5)
5
(5,1)
(5,2)
(5,3)
(5,4)
(5,5)
5
1
2
3
4
5
(4,5)
Número = 10
1
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
Primera extracción
2
3
4
(2,2)
(2,3)
(2,4)
(2,5)
(3,3)
(3,4)
(3,5)
(4,4)
(4,5)
5
(5,5)
Número = 15
Fundamentos de Probabilidad
19
Combinatoria: Número posible de
reordenaciones de n objetos tomados de r en r
EL ORDEN
SIN
REEMPLAZAMIENTO
n!
(n − r ) !
NO IMPORTA
EL ORDEN
n
 
r
IMPORTA
Fundamentos de Probabilidad
CON
REEMPLAZAMIENTO
nr
 n + r − 1


 r 
20
S=('A','B','C','D') elección de tres elementos
Sin Reemplazamiento
Orden No
Importa
Orden Importa
##
##
##
##
##
##
##
##
##
##
##
##
##
X1 X2 X3
1
A B C
2
A C B
3
C A B
4
C B A
5
B C A
6
B A C
7
A B D
8
A D B
9
D A B
10 D B A
11 B D A
12 B A D
##
##
##
##
##
1
2
3
4
##
##
##
##
##
##
##
##
##
##
##
##
##
13
14
15
16
17
18
19
20
21
22
23
24
X1 X2 X3
A C D
A D C
D A C
D C A
C D A
C A D
B C D
B D C
D B C
D C B
C D B
C B D
X1 X2 X3
A B C
A B D
A C D
B C D
Con Reemplazamiento
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
1
2
3
4
5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
X1 X2 X3
A A A
B A A
C A A
D A A
A B A
B B A
C B A
D B A
A C A
B C A
C C A
D C A
A D A
B D A
C D A
D D A
X1 X2 X3
A A A
A A B
A A C
A A D
A B B
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
X1 X2 X3 ##
X1 X2 X3
A A B ## 33 A A C
B A B ## 34 B A C
C A B ## 35 C A C
D A B ## 36 D A C
A B B ## 37 A B C
B B B ## 38 B B C
C B B ## 39 C B C
D B B ## 40 D B C
A C B ## 41 A C C
B C B ## 42 B C C
C C B ## 43 C C C
D C B ## 44 D C C
A D B ## 45 A D C
B D B ## 46 B D C
C D B ## 47 C D C
D D B ## 48 D D C
##
##
##
##
##
##
6
7
8
9
10
X1 X2 X3
A B C
A B D
A C C
A C D
A D D
##
##
##
##
##
##
11
12
13
14
15
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
X1 X2 X3
A A D
B A D
C A D
D A D
A B D
B B D
C B D
D B D
A C D
B C D
C C D
D C D
A D D
B D D
C D D
D D D
X1 X2 X3
X1 X2 X3 ##
B B B ## 16 B D D
B B C ## 17 C C C
B B D ## 18 C C D
B C C ## 19 C D D
B C D ## 20 D D D
Fundamentos de Probabilidad
21
Lotería Primitiva
1 - 6 - 21 - 29 - 33 -43
1. La primitiva. Se eligen 6 números distintos del 1 al 49,
ambos inclusive.
• Probabilidad de acertar los 6.
• Probabilidad de acertar 5.
• Probabilidad de acertar 4.
• Probabilidad de no acertar ninguno.
• Probabilidad de que salga un número concreto, por
ejemplo el número 1.
Fundamentos de Probabilidad
22
Ejemplo 1: Lotería Primitiva
P (Acertar 6) =
1
1
=
= 0,000000072
 49  13.983.816
 
6
 6   43
  ×  
4
2
13.545
P (Acertar 4) =     =
= 0,00097
13.983.816
 49 
 
6
 6   43
  ×  
5
1
258
P (Acertar 5) =     =
= 0,000018
13.983.816
 49 
 
6
 43
 
6
6.096.454
P(Ninguno) =   =
= 0,44
 49  13.983.816
 
6
 48 
 
5
6
P (Salga el 1) =   =
= 0,1224
 49  49
 
6
Fundamentos de Probabilidad
23
Ejemplo 2: Metro
En una estación de metro hay 5 pasajeros
esperando a un tren con 10 vagones, si cada
pasajero elige un vagón al azar, ¿cuál es la
probabilidad de que todos elijan un vagón
diferente?
P ( A) =
N ( A) 10 × 9 × 8 × 7 × 6
=
= 0.3024
N
105
Fundamentos de Probabilidad
24
Ejemplo 3: Fabricación por
lotes
De un lote con 100 piezas se toman al azar 10, si
todas las piezas elegidas son buenas se acepta el
lote y se rechaza en caso contrario. ¿Cuál es la
probabilidad de aceptar un lote con 10 piezas
defectuosas?
100  100 !
 90 
90 !
 =
N = 
; N ( A) =   =
 10  10 ! 90 !
 10  80 !10 !
N ( A) 90 ! 90 ! 90 × 89 × ⋯ × 81
P ( A) =
=
=
= 0.330
80 ! 100 ! 100 × 99 × ⋯ × 91
N
Fundamentos de Probabilidad
25
Ejemplo 4: Cumpleaños
Probabilidad de que en un grupo de r = 25 personas haya
al menos dos con el mismo cumpleaños.
1
2
... 365
A1
A2 ... Ar
r
A = " No haya ninguna coincidencia"
365 × (365 - 1) × ⋯ × (365 − r + 1)
365 r
P( A ) = 1 - P(A) ,
r = 25 → P( A ) = 0.578
P ( A) =
Fundamentos de Probabilidad
26
Probabilidad y Frecuencia Relativa
La probabilidad P(A) de un suceso A es el límite
nA
P ( A) = lim
n →∞ n
dónde nA es el número de veces que ha
ocurrido A al repetir ir el experimento n veces en
idénticas condiciones.
Fundamentos de Probabilidad
27
Proporción de caras observadas al
lanzar una moneda 200 veces
Nº de Caras / Nº de Lanzam ientos
Frecuencia relativa de caras
1,00
0,50
0,00
0
50
100
150
200
Nº de lanzam iento
Fundamentos de Probabilidad
28
Simulación lanzamiento de un dado
u = sample(1:6,size=20,replace=TRUE)
u
## [1] 4 1 3 1 2 1 6 4 2 5 6 2 6 5 6 1 5 5 1 2
table(u)
## u
## 1 2 3 4 5 6
## 5 4 1 2 4 4
barplot(table(u))
Fundamentos de Probabilidad
29
Simulación lanzamiento de un dado
u1 = sample(1:6, size=100, replace=TRUE)
table(u1)/100
## u1
##
1
2
3
4
5
6
## 0.18 0.14 0.17 0.12 0.19 0.20
barplot(table(u3)/100,xlab='100 dados’)
Fundamentos de Probabilidad
u2 = sample(1:6, size=10000, replace=TRUE)
table(u2)/10000
## u2
##
1
2
3
4
5
6
## 0.1645 0.1599 0.1644 0.1704 0.1715 0.1693
barplot(table(u2)/10000,xlab='10000 dados')
30
Resultados de 3036 sorteos de la Primitiva
Núm
Veces
1
376
2
361
3
400
4
360
5
381
6
385
7
367
8
345
9
366
10
374
11
382
12
369
13
357
14
378
15
376
16
363
17
365
%
0.12385
0.11891
0.13175
0.11858
0.12549
0.12681
0.12088
0.11364
0.12055
0.12319
0.12582
0.12154
0.11759
0.12451
0.12385
0.11957
0.12022
Núm
Veces
18
351
19
354
20
345
21
369
22
388
23
386
24
348
25
356
26
364
27
361
28
364
29
380
30
398
31
363
32
363
33
358
34
373
%
0.11561
0.11660
0.11364
0.12154
0.12780
0.12714
0.11462
0.11726
0.11989
0.11891
0.11989
0.12516
0.13109
0.11957
0.11957
0.11792
0.12286
Núm
Veces
35
374
36
379
37
378
38
405
39
408
40
375
41
386
42
363
43
361
44
363
45
393
46
372
47
403
48
379
49
TOTAL
351
18216
%
0.12319
0.12484
0.12451
0.13340
0.13439
0.12352
0.12714
0.11957
0.11891
0.11957
0.12945
0.12253
0.13274
0.12484
0.11561
0.12245
La frecuencia con la que ha aparecido cada número es muy próxima a
0.12245=6/49, que es la probabilidad de que aparezca un número
concreto en cada sorteo
Fundamentos de Probabilidad
31
Simulación con R: muestras
sample( 1:49, size = 6, replace = FALSE) # Extrae 6 números al azar
entre 1 y 49 sin reemplazamiento
## [1]
8 35
3 40 32 23
Calculo por simulación de la probabilidad de aparición del número 27
u =
for
{
x
v
# creo un vector con 10.000 ceros
# Bucle k toma valores de 1 a 10.000
# comienzo bucle
= sample(1:49, size = 6, replace = FALSE) # sorteo k
= x == 27 # por ejem. v es [FALSE FALSE FALSE FALSE TRUE FALSE],
indicaría que el quinto número es el 27
u[k] = sum(v) # sum(v) es cero o uno , según esté o no el 27
}
# fin del bucle
sum(u)/10000 # Probabilidad de obtener 27
rep(0,10000)
(k in 1:10000)
## [1] 0.1255
Fundamentos de Probabilidad
32
Simulación con R: cumpleaños
Simular con R una muestra al azar de 25 fechas de cumpleaños y
comprobar si hay repeticiones.
x = sample(1:365,25,replace=TRUE) # extrae con reemplazamiento 25 num.
u = sort(x) # los ordena
print(u)
## [1]
3
4
6 13 32 41 41 68
## [18] 232 272 299 312 318 330 330 353
74
88
89 121 204 207 212 214 221
duplicated(u) # indica si hay valores repetidos (FALSE no y TRUE sí)
## [1] FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
## [12] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [23] FALSE TRUE FALSE
sum(duplicated(u)) # número de 'TRUES'
## [1] 2
Fundamentos de Probabilidad
33
Simulación con R: ejemplos
1. Lanzamiento de 10 monedas
x = sample(c('C','X'), size = 10, replace = TRUE)
print (x)
## [1] "C" "X" "X" "C" "X" "X" "X" "X" "X" "C“
2.Lanzamiento de 3 dados
y = sample(1:6, size = 3, replace = TRUE)
print(y)
## [1] 2 4 4
3. Quiniela al azar
z = sample(c('1','X','2'),size = 14, replace = TRUE)
print (z)
## [1] "X" "X" "2" "2" "X" "1" "X" "1" "X" "2" "X" "2" "2" "2“
4.Quiniela al azar no equiprobable
u = sample(c('1','X','2'),size = 14, replace = TRUE, prob = c(.7,.2,.1))
print (u)
## [1] "2" "1" "X" "1" "2" "1" "X" "1" "1" "X" "X" "1" "1" "1"
Fundamentos de Probabilidad
34
Probabilidad Condicionada
Definición. Sea B un suceso con
probabilidad distinta de cero, se define
probabilidad del suceso A dado B a:
P( A | B) =
P( A ∩ B)
.
P( B)
Fundamentos de Probabilidad
35
Probabilidad Condicionada
Fumadores
(F)
No Fumadores
(N)
TOTAL
Mujeres
(M)
Hombres
(H)
TOTAL
0,12
0,18
0,30
0,39
0,31
0,70
0,51
0,49
1,00
0,18

P
(
F
|
H
)
=
= 0,37

0,49

P( F ) = 0,30 

0,12
= 0,24
 P( F | M ) =
0
,
51

Fundamentos de Probabilidad
36
Utilidad
• Actualizar probabilidad del suceso A en
función de la información disponible I
P(A|I) = P(A∩I)/P(I)
• Cálculo de la intersección de sucesos
P(A ∩ B) = P(A|B)P(B)
• Cálculo de probabilidad de un suceso
P( A) = P(( A ∩ B) ∪ ( A ∩ B)) = P( A | B) P( B) + P( A | B) P( B)
Fundamentos de Probabilidad
37
Ejemplo Urna
Probabilidad de “1ª Blanca y 2ª Negra”
• Sin reemplazamiento:
P(B1 ∩ N2) = P(B1) P(N2| B1)
= (3/5)(2/4) = 3/10
• Con reemplazamiento:
P(B1 ∩ N2) = P(B1) P(N2| B1)
= (3/5)(2/5) = 6/25
Fundamentos de Probabilidad
38
Cumpleaños
Probabilidad de que en un grupo de r = 25 personas
haya al menos dos con el mismo cumpleaños.
1
2
... 365
A1
Br = " No haya ninguna coincidencia en r "
A2
... Ar
r
P(Br ) = P(B1 ) P ( B2 | A1 ) P ( B3 | A1 ≠ A2 ) ⋯ P( Br | A1 ≠ A2 ≠ ⋯ ≠ Ar −1 )
365 − 1 365 − 2
365 − r + 1
×
× ⋯×
365
365
365
P( Br ) = 1 - P(Br ) ,
r = 25 → P( Br ) = 0.578
= 1×
Fundamentos de Probabilidad
39
Ejemplo
Urna U1
Urna U2
Se elige una urna al azar y se extrae una bola: ¿ P(Blanca) ?
P( B) = P( B | U 1) P(U 1) + P( B | U 2) P(U 2)
3 1 1 1 17
= × + × =
= 0.425
5 2 4 2 40
Fundamentos de Probabilidad
40
Ejemplo (cont.)
Urna U1
Urna U2
Se toma al azar una bola de U1 y se mete en U2. Se extrae
una bola de U2: ¿ P(Blanca) ?
P( B) = P( B | B1) P( B1) + P( B | N1) P( N1)
2 3 1 2 8
= × + × =
= 0.32
5 5 5 5 25
Fundamentos de Probabilidad
41
Cuentas de colores
Un coleccionista tiene 73 cuentas de 6 colores en un
vaso: 8 rojas, 9 rosas, 11 verdes, 12 azules, 15
amarillas y 18 moradas. Saca dos cuentas al azar sin
reposición:
1. ¿Cuál es la probabilidad de que sean las dos
rojas?
2. ¿Cuál es la probabilidad de que una sea roja y
otra verde?
3. ¿Cuál es la probabilidad de que ninguna sea roja?
4. ¿Cuál es la probabilidad de que sean del mismo
color?
Rojas 8
Rosas 9
Verdes 11
Azules 12
Amarillas 15
5. ¿Cuál es la probabilidad de que sean
Moradas 18
diferentes?
Fundamentos de Probabilidad
42
Cuentas de colores: Solución
1.
∩
2.
∩
3. P
∩
8
8
7
73 72
8 11 11
73 72 73
∩
65
73
8
72
64
72
7
9
8
11
8
7
9
8
4.
5. 1
10
12 11 15 14 18 17
73 72
11 10 12 11 15 14 18 17
73 72
Fundamentos de Probabilidad
43
Independencia
Si el conocimiento de la ocurrencia de un suceso B cambia
la probabilidad de que ocurra otro A, se dice que A y B son
dependientes, en ese caso P(A|B)≠ P(A).
Cuando el suceso A es independiente de B, la ocurrencia de
B no cambia la probabilidad de A, es decir P(A|B) = P(A).
Como P(A|B) = P(A∩B)/P(B),
A y B son independientes ⇔ P(A∩B) = P(A) P(B)
Fundamentos de Probabilidad
44
Lanzamiento de dos monedas
S = {CC, CX, XC,XX}
Hipótesis:
• Monedas equilibradas: P(C) = P(X)
• Independientes
P (CC) = P(C) P(C) = (1/2)×(1/2) = 1/4
P (CX) = P(C) P(X) = (1/2)×(1/2) = 1/4
P (XC) = P(X) P(C) = (1/2)×(1/2) = 1/4
P (XX) = P(X) P(X) = (1/2)×(1/2) = 1/4
Fundamentos de Probabilidad
45
Independencia (3 o más sucesos)
• Tres sucesos A, B y C son independientes si
•P(A ∩ B∩ C) = P(A) P(B) P(C)
•P(A ∩ B) = P(A) P(B)
•P(A ∩ C) = P(A) P(C)
•P(B ∩ C) = P(B) P(C)
• Los sucesos A1 , A2 , ..., An
son independientes si
cualquier subconjunto Ai1, Ai2, ..., Aik, cumple
P(Ai1∩Ai2∩...∩ Aik) = P(Ai1)P( Ai2)...P(Aik)
Fundamentos de Probabilidad
46
Probabilidad Total
B1
B6
B2
B3
B7
A
B8
B4
B9
Partición.
B1,B2 ,...,Bn : B j ⊂ S
B5
Bi ∩ B j = ∅, ∀i ≠ j
B10
B1 ∪ B2 ∪ ⋯ ∪ Bn = S
P( A) = P( A ∩ S )
= P[ A ∩ ( B1 ∪ B2 ∪ ⋯ ∪ Bn )]
= P[( A ∩ B1 ) ∪ ( A ∩ B2 ) ∪ ⋯ ∪ ( A ∩ Bn )]
= P ( A ∩ B1 ) + P ( A ∩ B2 ) + ⋯ + P ( A ∩ Bn )
P( A) = P( A | B1 ) P ( B1 ) + P( A | B2 ) P( B2 ) + ⋯ P( A | Bn ) P( Bn )
Fundamentos de Probabilidad
47
Teorema de Bayes
Sea B1 ,B2 ,...,Bn una partición del espacio S
tal que P(B j ) > 0, para j = 1,2 ,...,n y sea A
cualquier suceso con P(A) > 0, entonces
para cualquier Bi :
P(Bi|A) =
P(A|Bi )P(Bi )
n
 P(A|B
j
.
)P(B j )
j =1
Fundamentos de Probabilidad
48
Ejemplo Bayes 1: Almacén
M-1
M-2
M-3
5% D
20 % D
10 % D
200 p/h
100 p/h
100 p/h
ALMACÉN
El porcentaje de piezas defectuosas fabricadas por tres máquinas es 5%,
20% y 10%. La primera fabrica 200 piezas por hora y las otras dos 100
piezas por hora. Todas las piezas fabricadas se llevan a un almacén. Al
final del día se toma una pieza del almacén y es defectuosa, ¿cuál es la
probabilidad de que proceda de M-1, M-2 o M-3?
Fundamentos de Probabilidad
P(M 1 | D) =
P( D | M 1 ) P(M 1 )
P( D | M 1 ) P(M 1 ) + P( D | M 2 ) P(M 2 ) + P( D | M 3 ) P(M 3 )
=
P(M 2 | D) =
0.05 × 0.5
= 0.25
0.05 × 0.5 + 0.20 × 0.25 + 0.10 × 0.25
P( D | M 2 ) P(M 2 )
P( D | M 1 ) P(M 1 ) + P( D | M 2 ) P(M 2 ) + P( D | M 3 ) P(M 3 )
=
P(M 3 | D) =
49
0.20 × 0.25
= 0.50
0.05 × 0.5 + 0.20 × 0.25 + 0.10 × 0.25
P( D | M 3 ) P(M 3 )
P( D | M 1 ) P(M 1 ) + P( D | M 2 ) P(M 2 ) + P( D | M 3 ) P(M 3 )
=
0.10 × 0.25
= 0.25
0.05 × 0.5 + 0.20 × 0.25 + 0.10 × 0.25
P(M 1 | D) + P(M 2 | D) + P(M 3 | D) = 1
Fundamentos de Probabilidad
50
Ejemplo Bayes 2: Virus
Si una persona es portadora del virus A, un análisis de sangre lo
detecta el 99% de las veces. Sin embargo, el test también
proporciona “falsos positivos”, indicando la presencia del virus en
el 3% de personas sanas. Si sólo 5 de cada 1000 personas tienen el
virus, ¿cuál es la probabilidad de que una persona tenga el virus
realmente si el análisis ha dado positivo?
V =" Tener el Virus"
S =" El análisis es positivo"
P(V ∩ S )
P ( S | V ) P(V )
=
P (V | S ) =
P( S )
P( S | V ) P (V ) + P( S | V ) P (V )
0.99 × 0.005
=
= 0.142
0.99 × 0.005 + 0.03 × 0.995
Fundamentos de Probabilidad
51
Ejemplo Virus
(Aplicado a 1.000.000 personas)
NEGATIVO
POSITIVO
Total
SANOS
965.150
29.850
995.000
ENFERMOS
50
4.950
5.000
Total
965.200
34.800
1.000.000
Entre los 34.800 que han dado positivo, sólo
4.950 tienen el virus
P(V|S) = 4.950/34.800 = 0.142
Fundamentos de Probabilidad
52
Capı́tulo 1: Ejercicios propuestos
1. Sean A y B dos sucesos no disjuntos cualesquiera de un experimento aleatorio. Indicar cual de las
siguientes probabilidades es mayor P1 = P (AB | A) ó P2 = P (AB | A ∪ B). Justificar la respuesta.
2. Dado dos sucesos A y B, tal que P (A) > 0 y P (B) > 0 indicar, justificando la respuesta, si son
ciertas o no las afirmaciones siguientes:
(a) Si A y B son sucesos mutuamente excluyentes entonces no pueden ser independientes.
(b) Si A y B son independientes entonces no pueden ser mutuamente excluyentes.
3. Demostrar que si dos sucesos A y B son independientes, también los son A y B, y A y B, donde A
y B representan los sucesos complementarios de A y B respectivamente.
4. Sean dos sucesos equiprobables e independientes tal que la probabilidad de su unión es 0.75. Obtener
la probabilidad de cada uno de ellos.
5. Si la probabilidad de que un interruptor cualquiera de la figura se encuentre cerrado (es decir, pase
corriente) es p, calcular la probabilidad de que pase corriente de A a B para las tres configuraciones
siguientes:
6. Teniendo en cuenta que para cualquier par de sucesos, A1 , A2 se cumple que
Pr(A1 A2 ) ≥ Pr(A1 ) + Pr(A2 ) − 1,
P
demostrar que la extensión a n sucesos es Pr(A1 A2 ...An ) ≥ ni=1 Pr(Aı ) − (n − 1).
7. La probabilidad de que un componente de una máquina se averı́e antes de 100 horas es 0.01. La
máquina tiene 50 componentes; calcular la probabilidad de averı́s de la máquina antes de 100 horas
en los casos siguientes:
(a) La máquina se averı́a cuando lo hace uno o más componentes.
1
(b) La máquina se averı́a cuando fallan dos o más componentes.
(c) La máquina sólo se averı́a cuando lo hacen todos los componentes.
8. Un matrimonio tiene dos hijos y se sabe que uno de ellos es varón. Aceptando que la probabilidad
de varón y hembra es la misma. ¿ Cuál es la probabilidad de que los dos sean varones?
9. Una urna contiene 5 bolas rojas, 3 blancas y 2 azules. Si se extraen 6 bolas con reposición, calcular
la probabilidad de obtener 2 bolas de cada color.
10. El sorteo de la loterı́a primitiva consiste en acertar los seis números extraı́dos al azar y sin reposicin
de una bombo que contiene 49 bolas numeradas del 1 al 49. Un participante ha realizado una
apuesta múltiple y ha tachado 8 números. Calcular la probabilidad de acertar 6, 5, 4, 3, 2, 1 o
ninguno de los números premiados. Si juega todos los dı́as del año (365 sorteos) la misma apuesta
¿cuál es la probabilidad de que no acierte más de cuatro en ningún sorteo del año?
11. Dos pueblos de alta montaña están comunicados por cuatro tramos de carretera según se muestra
en la figura (a). Los dı́as de invierno debido a la nieve es frecuente que las carreteras estén cortadas.
Cuando nieva, la probabilidad de que cualquier tramo sea transitable es 0.8 con independencia de
lo que ocurra con el resto. ¿Cuál es la probabilidad de que un vehı́culo pueda viajar de Villarriba a
Villabajo un dı́a con nieve? Para mejorar las comunicaciones se piensa construir un nuevo tramo de
carretera entre los puntos A y B. Cuando nieva la probabilidad de accesibilidad es también 0.8 con
independencia del resto. ¿Cuál es la probabilidad de que una persona pueda hacer el viaje anterior
con esta nueva configuración (b)?
12. Dos estudiantes A y B están matriculados en un curso. A asiste a las clases el 80% de los dı́as y
B el 60%, siendo las asistencias de ambos independientes. Si exactamente uno de los dos está en
clase un dı́a concreto, ¿cuál es la probabilidad de que sea A?
13. La probabilidad de que un componente se averı́e en un perı́odo de tiempo dado es 0.01. Su estado
(averiado o funcionando) se comprueba con un ensayo que cumple que cuando el componente
2
funciona la probabilidad de que el ensayo diga lo contrario es 0.05, pero si el componente está
averiado el ensayo no se equivoca. Si el ensayo indica que el componente está averiado, ¿cuál es la
probabilidad de que realmente lo esté?
14. Cuatro estudiantes comparten piso, después de una comida deciden el siguiente procedimiento para
elegir quin lava los platos: en un sombrero meten cuatro papeles doblados e indistinguibles, en
uno de ellos pone ‘Sı́’ y en los otros tres ‘No’. El primero coge un papel y lo abre, si el resultado
es ‘Sı́’ le toca fregar, si el resultado es que ‘No’ se libra. No se devuelve el papel al sombrero. A
continuacin el segundo coge el papel, y se aplica el mismo criterio, y as sucesivamente hasta que uno
de ellos obtiene el papel con el ‘Sı́’. ¿Quién tiene más probabilidad de lavar los platos, el primero
o el último?
15. Tres fichas están marcadas con las letras A, B, C, respectivamente, y una cuarta con las tres ABC.
Se meten en una urna y se toma una de ellas al azar. Se pregunta si los tres sucesos consistentes
en la presencia de la letra A, la letra B o la C sobre la ficha son o no independientes.
16. Tres personas comparten una oficina con un teléfono. De las llamadas que llegan, 2/5 son para A,
2/5 para B y 1/5 para C. El trabajo de estos hombres les obliga a frecuentes salidas, de manera
que A está fuera el 50% de su tiempo, y B y C el 25%. Calcular la probabilidad de que :
(a)
(b)
(c)
(d)
No esté ninguno para responder al teléfono.
Esté la persona a la que se llama.
Haya tres llamadas seguidas para una persona.
Haya tres llamadas seguidas para tres personas diferentes.
17. En un campeonato de tenis usted tiene la opción de escoger la secuencia de partidos A − B − A o
la B − A − B, donde A y B indican sus oponentes. Para clasificarse debe usted ganar dos partidos
consecutivos. El jugador A es mejor que el B. ¿ Qué secuencia será preferida?
18. Un jurado de tres miembros que decide por mayorı́a tiene dos miembros que deciden independientemente el veredicto correcto con probabilidad p y el tercero lanza una moneda. Si un juez tiene
probabilidad p de acertar, ¿cuál de los dos sistemas tiene mayor probabilidad de acertar?
19. Una comunidad de vecinos ha contratado un sistema de alarma para evitar robos en sus hogares.
En caso de robo la alarma se pone en funcionamiento con seguridad. La probabilidad de que se
produzca un robo en el vecindario es 0.001. Existen además otras causas (viento, golpes bruscos,
...) que ponen en funcionamiento el sistema de alarma, la probabilidad de que en una noche se
produzca una falsa alarma es 0.01. Si se declara una señal de alarma, ¿cuál es la probabilidad de
que sea falsa?
20. Una pareja que espera un hijo está preocupada porque un test practicado al feto ha dado positivo
a una enfermedad muy rara que solo la padecen uno de cada 10000 individuos. Sin embargo, el test
es bastante seguro: de acuerdo con el laboratorio acierta el 99 por ciento de los casos, tanto para
los bebés con la enfermedad como para los sanos. ¿Cuál es la probabilidad de que el feto tenga la
enfermedad teniendo en cuenta que el resultado del test ha sido positivo?
21. Un concursante debe elegir entre tres puertas, detrás de una de las cuales se encuentra un magnı́fico
regalo. Hecha la elección, el presentador que sabe donde se encuentra el premio le abre una de las
dos puertas no escogidas donde (lógicamente) no está el premio y a continuación le da al concursante
la posibilidad de cambiar la puerta elegida. ¿Qué debe hacer el concursante?
3
Estadística
Parte I. Probabilidad
Tema 2. Variable
Aleatoria
Variable Aleatoria
Una variable aleatoria es una función que asigna un número
real a cada uno de los resultados de un experimento aleatorio.
Lanzamiento de 2
monedas
X(s) ≡Número de CARAS
s X(s)
CC→ 2
CX → 1
XC → 1
XX → 0
Probabilidad y variable aleatoria
2
Variable Aleatoria Discreta
Cuando los valores que toma una variable
aleatoria son finitos o infinitos
numerables se dice que es discreta.
•
Resultado obtenido al lanzar un dado
{1,2,3,4,5,6}
•
Número de veces que hay que lanzar una
moneda hasta obtener una CARA
{1,2,3,4, ...}
Probabilidad y variable aleatoria
3
Distribución de probabilidad
Sea { x1 , x2 , ..., xn } los valores que puede tomar la
variable aleatoria X. Se denomina distribución de
probabilidad de la variable aleatoria a P( X=xi ) que
cumple:
• P ( X = xi ) ≥ 0
• Σi=1 P ( X = xi ) = 1.
x P(X=x)
0 → 1/4
Nº de Caras al
lanzar 2 monedas
1 → 1/2
2 → 1/4
Probabilidad y variable aleatoria
4
Distribución de probabilidad
=
p(X)
1/4
= 1/2
1/4
=0
=1
=2
1
3
1/2
1/4
0
2
x
Nº de Caras al lanzar 2 monedas
5
Probabilidad y variable aleatoria
Lanzamiento de un dado
x
P ( X = x)
1
2
1/ 6
1/ 6
3
4
1/ 6
1/ 6
5
6
1/ 6
1/ 6
=
P (X = x)
1/6
1
1
= ,
6
2
3
4
5
6
x
= 1,2,3,4,5,6
6
Función de distribución
La función de distribución FX ( x ) de una variable aleatoria
X se define para todo número real x como:
FX ( x ) = PX ( X ≤ x ).
Ejemplo. X = Número de caras al lanzar 2 monedas
x
FX ( x )
(-∞,0)
0
[0,1)
1/4
[1,2)
3/4
[2,∞)
1
F(x)
1
3/4
1/2
1/4
0
1
2
3
x
7
Probabilidad y variable aleatoria
1
Función de
Distribución
3/4
1/2
1/4
0
1
2
3
x
Distribución
puntual de
probabilidad
1/2
1/4
0
1
2
3
x
Probabilidad y variable aleatoria
8
Lanzamiento de un dado
F(x)
1
1
2
3
4
5
6
x
p(x)
1/6
1
2
3
4
5
6
x
P ( X = x)
1
2
1/ 6
1/ 6
3
4
1/ 6
1/ 6
5
6
1/ 6
1/ 6
x
9
Probabilidad y variable aleatoria
Función de Distribución F(x)
Una función F(x) es una función de distribución si
y sólo si cumple las siguientes condiciones:
a.
lim F ( x) = 0 y
x → −∞
lim F ( x) = 1.
x → +∞
b. F(x) es una función no decreciente.
c. F(x) es continua por la derecha :
∀h > 0, lim F ( x + h) = F ( x).
h →0
Probabilidad y variable aleatoria
10
Variable aleatoria continua
Una variable aleatoria X es continua si
su función de distribución FX ( x ) es
continua.
F(x)
1
0
3/4
x
1/2
1/4
0.25
0.75
0
0,5
=
0.50
0
1
1
1,5
<0
0≤ ≤1
>0
x
11
Probabilidad y variable aleatoria
Generación números aleatorios
Generar valores al azar de la distribución uniforme
runif(1) #genera un valor al azar en el intervalo [0,1] con dist. uniforme
## [1] 0.5498192
runif(25) # genera 25 valores independientes con dist. uniforme en [0,1]
## [1] 0.13841597
## [7] 0.13076084
## [13] 0.90280394
## [19] 0.52071798
## [25] 0.34428384
0.24418695
0.12667461
0.30585911
0.09812817
Probabilidad y variable aleatoria
0.71302890
0.97046547
0.89637537
0.42877694
0.83867345
0.98281857
0.33943981
0.59504927
0.55214026
0.84036605
0.62345635
0.52124912
0.50127997
0.60393346
0.87002649
0.71727385
12
Instrucciones en R
x = runif(1000) # crea un vector con 1000 valores con dist. uniforme
en [0,1]
plot(x,cex=.8,col='blue') #dibuja en orden los 1000 valores de x en c
olor azul (cex controla el tamaño de cada punto)
hist(x) # histograma de los 1000 valores
13
Probabilidad y variable aleatoria
n = 1.000
n = 100.000
n = 10.000
n = 1.000.000
hist(x,probability = TRUE, nclass=50,col='grey')
14
Función de densidad
La función de densidad de probabilidad
fX(x) de una variable aleatoria continua X
es la función que verifica
x
FX ( x) =  f X (t ) dt , ∀ x.
−∞
Si FX(x) es derivable, además
d
FX ( x) = f X ( x).
dx
15
Probabilidad y variable aleatoria
F(x)
Función de distribución
1
3/4
FX(x) = x, x∈[0,1]
1/2
1/4
0
0,5
1
1,5
x
f(x)
Función de densidad
1
fX(x) = 1, x∈[0,1]
0
0,5
1
1,5
x
2. Variable aleatoria
16
Propiedades de la función de densidad
Una función fX (x) es una función de densidad de
probabilidad de una variable aleatoria X si y sólo si
cumple:
a. f X ( x) ≥ 0 para todo x.
b.

∞
-∞
f X ( x) dx = 1.
Área = 1
17
Probabilidad y variable aleatoria
Cálculo de probabilidades
f X (x)

b
a
a
f X ( x) dx
b
P(a ≤ X ≤ b) = FX (b) − FX (a )
b
=  f X ( x) dx
a
Esperanza de una variable
aleatoria
Se define
esperanza o media de una
variable aleatoria discreta X y se representa
n
por E[X] al valor
E[ X ] =  xi P ( X = xi ).
i =1
Ejemplo: Lanzamiento de un dado
1
1
1
1
1
1
E[ X ] = 1× + 2 × + 3 × + 4 × + 5 × + 6 × = 3.5
6
6
6
6
6
6
Centro de la
distribución de
probabilidad
1/6
1
3
5
x
3.5
19
Probabilidad y variable aleatoria
Esperanza de una variable
aleatoria
Se define esperanza o media de una variable aleatoria
continua X con función de densidad fX(x) y se representa
por E[X] al valor
∞
E[ X ] =
x f
X
( x) dx.
−∞
Ejemplo : Distribución uniforme f X (x) = 1, 0 ≤ x ≤ 1
1
1
x2
1
E[ X ] =  x × 1 dx =
= .
2 0 2
0
Centro de la
distribución de
probabilidad
1
0
0,5
1
1,5
x
Probabilidad y variable aleatoria
20
Propiedades de E[X]
Transformaciones lineales Y = a X+b (a y
b constantes)
E[aX + b] = a E [ X ] + b
Demostración:
=
+
=
=
( =
E[X]
)+
( =
)
1
21
Probabilidad y variable aleatoria
Varianza
Sea X una variable aleatoria con media µ,
se denomina varianza a
Var ( X ) = E[ ( X - µ )2 ].
• Variable aleatoria discreta
∞
Var[ X ] =
 (x − µ)
2
P( X = x).
x = −∞
• Variable aleatoria continua
∞
Var[ X ] =  ( x − µ ) 2 f X ( x) dx
−∞
Probabilidad y variable aleatoria
22
Propiedades de la varianza
1. Var ( X ) = E[( X − µ ) 2 ] = E[ X 2 ] − µ 2 .
2. Var (aX + b) = a 2Var ( X )
Ejemplos
Lanzamiento de un dado
35
1
1
1
1
1
1
Var[ X ] = (12 × + 2 2 × + 32 × + 4 2 × + 52 × + 6 2 × ) − (3.5) 2 = .
12
6
6
6
6
6
6
Distribución uniforme
1
1
1 1
x3
Var[X] =  x ×1 dx − (1 / 2) =
− = .
3 0 4 12
0
2
2
23
Probabilidad y variable aleatoria
Desigualdad de Tchebychev
Area ≥ 1 −
µ-k σ
µ
1
k2
µ+k σ
Para cualquier variable aleatoria
µ = E[ X ]
σ 2 = Var[ X ]
1
P( X − µ ≤ kσ ) > 1 − 2 .
k
Probabilidad y variable aleatoria
24
Momentos de una Variable Aleatoria
Momentos respecto al Origen
µ1 = E[ X ] = µ
µ 2 = E[ X 2 ]
µ p = E[ X p ]
Momentos respecto a la media
α1 = E[( X − µ )] = 0
α 2 = E[( X − µ ) 2 ] = σ 2
α p = E[( X − µ ) p ]
25
Probabilidad y variable aleatoria
Transformaciones
Dada una variable aleatoria X con función
de densidad f X ( x) vamos a ver como se obtiene
la función de densidad fY ( y ) de la variable
aleatoria Y , definida como
Y = g(X)
Casos a considerar :
* La función g es monótona creciente
* La función g es monótona decreciente
* La función g no es monótona
Probabilidad y variable aleatoria
26
Función g creciente
FY ( y ) = P (Y ≤ y )
= P( g ( X ) ≤ y )
= P( X ≤ g −1 ( y ) )
y
= FX ( g −1 ( y ))
Y≤ y
x = g -1(y)
X ≤ g -1(y)
fY ( y ) =
dFY ( y )
dy
d g −1 ( y )
=
× f X ( g −1 ( y ))
dy
27
Probabilidad y variable aleatoria
Función g decreciente
FY ( y ) = P (Y ≤ y )
= P( g ( X ) ≤ y)
= P ( X ≥ g −1 ( y ) )
y
= 1 − FX ( g −1 ( y ))
fY ( y ) =
x = g -1(y)
X ≥ g -1(y)
Probabilidad y variable aleatoria
dFY ( y )
dy
d g −1 ( y )
=−
× f X ( g −1 ( y ))
dy
28
Función monótona
d g −1 ( y )
fY ( y ) =
× f X ( g −1 ( y ))
dy
29
Probabilidad y variable aleatoria
Transformación no monótona
Y ≤y
y
x1
x2 x3
x4
x5 x6
x
FY ( y ) = P (Y ≤ y )
= P( x1 ≤ X ≤ x2 ) + P( x3 ≤ X ≤ x4 ) + P( x5 ≤ X ≤ x6 )
Probabilidad y variable aleatoria
30
Ejemplo de transformación
El radio de una esfera es una variable aleatoria
cuya función de densidad es
f X ( x) = 3 x 2 , 0 ≤ x ≤ 1.
¿Cuál es la función de densidad del volumen?
Y = Volumen de la esfera
4
 3Y 
Y = π X3  X =

3
 4π 
fY ( y ) =
1
3
1
4
 3y 3
g ( x) = π x 3 ;  g −1 ( y ) = 
 ;
3
 4π 
=
d −1
g ( y ) × f X ( g −1 ( y ))
dy
3
4π
.
, 0≤ y≤
4π
3
31
Probabilidad y variable aleatoria
4
y = π x3
3
0
1
f X ( x ) = 3 x 2 , 0 ≤ x ≤ 1.
Probabilidad y variable aleatoria
x
0
fY ( y ) =
4π/3
y
3
4π
, 0≤ y≤
.
4π
3
32
Un caso muy relevante del problema
inverso
Dada una variable aleatoria X con distribución
uniforme (0,1), encontrar la transformación Y =
g(X) que hace que Y tenga la función de densidad
fY(y)
d g −1 ( y )
= fY ( y )
dy
−1
g ( x) = Fy ( x)
Probabilidad y variable aleatoria
33
Representación gráfica con ejemplo
Generar valores al azar con función de densidad
fY ( y) = 0.3 e−0.3y , y ≥ 0
FY ( y) =1− e−0.3y
1
g(x) = F (x) = − log(1− x )
0.3
−1
Y
Generamos valores U[0,1]
x = 0.65→ y = g(0.65) = 3.5
Probabilidad y variable aleatoria
34
Distribución conjunta
de variables aleatorias
Definiciones (v. a. discretas)
Distribución de probabilidad conjunta
de dos variables aleatorias X, Y
 P( X = x, Y = y ) ≥ 0, ∀x, y

P ( X = x, Y = y )  x = ∞ y = ∞
  P( X = x, Y = y ) = 1.
 x = −∞ y = −∞

Función de distribución conjunta:
FXY ( x, y ) = P ( X ≤ x, Y ≤ y )
Modelos Multivariantes
36
Lanzamiento de dos dados
Dado ROJO
1
1/36
1/36
1/36
1/36
1/36
1/36
1
2
3
4
5
6
Dado
AZUL
2
1/36
1/36
1/36
1/36
1/36
1/36
3
1/36
1/36
1/36
1/36
1/36
1/36
4
1/36
1/36
1/36
1/36
1/36
1/36
5
1/36
1/36
1/36
1/36
1/36
1/36
6
1/36
1/36
1/36
1/36
1/36
1/36
X = “ Resultado de dado ROJO”
Y = “ Resultado de dado AZUL”
Distribución conjunta de probabilidad
P ( X=i , Y=j ) =1/36, (i,j de 1 a 6)
37
Modelos Multivariantes
Ejemplo
Ejemplo: Se lanzan dos dados y se definen las variables
aleatorias suma (S) y valor absoluto de la diferencia (D)
de los resultados.
Distribución Conjunta P(S= x, D= y)
0
1
D : DIFERENCIA 2
DE DOS DADOS 3
4
5
Modelos Multivariantes
2
1/36
S : SUMA DE DOS DADOS
5
6
7
8
9
10 11 12
1/36
1/36
1/36
1/36
1/18
1/18
1/18
1/18
1/18
1/18
1/18
1/18
1/18
1/18
1/18
1/18
1/18
1/18
1/18
3
4
1/36
38
Distribuciones Marginales
0
1
D : DIFERENCIA 2
DE DOS DADOS 3
4
5
S : SUMA DE DOS DADOS
2
3
4
5
6
7
8
9
10 11 12
1/36
1/36
1/36
1/36
1/36
1/36 6/36
1/18
1/18
1/18
1/18
1/18
10/36
1/18
1/18
1/18
1/18
8/36
1/18
1/18
1/18
6/36
1/18
1/18
4/36
1/18
2/36
1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Marginal de S
Marginal de D
39
Modelos Multivariantes
Distribuciones Marginales
y =∞
P ( X = x ) =  P ( X = x, Y = y )
y = −∞
x =∞
P(Y = y ) =  P( X = x, Y = y )
x = −∞
0,18
0,16
0,14
0,12
0,1
0,08
0,06
Suma de
dos dados
Modelos Multivariantes
0,04
0,02
0
1
2
3
4
5
6
7
8
9
10
11
12
13
40
Distribuciones condicionadas
0
1
2
3
4
5
D : DIFERENCIA
DE DOS DADOS
S : SUMA DE DOS DADOS
2
3
4
5
6
7
8
9 10 11 12
1/36
1/36
1/36
1/36
1/36 6/36
1/36
1/18
1/18
1/18
1/18
1/18
10/36
1/18
1/18
1/18
8/36
1/18
1/18
1/18
1/18
6/36
1/18
4/36
1/18
1/18
2/36
1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
D|S= 8
Distribución de la diferencia
entre los dados condicionada a
que la suma es 8.
0
1
2
3
4
5
P(D = y | S=8) = P(D=y, S=8) / P(S=8)
1/5
0
2/5
0
2/5
0
1
41
Modelos Multivariantes
Independencia
Las variables aleatorias X, Y son independientes
si y sólo si
P (X = x , Y = y ) = P( X = x ) × P( Y = y )
Dado ROJO
Dado
AZUL
1
2
3
4
5
6
Modelos Multivariantes
1
1/36
1/36
1/36
1/36
1/36
1/36
2
1/36
1/36
1/36
1/36
1/36
1/36
3
1/36
1/36
1/36
1/36
1/36
1/36
4
1/36
1/36
1/36
1/36
1/36
1/36
5
1/36
1/36
1/36
1/36
1/36
1/36
6
1/36
1/36
1/36
1/36
1/36
1/36
42
Variables aleatorias continuas
d b
P(a ≤ X ≤ b, c ≤ Y ≤ d ) = c a f XY ( x, y ) dx dy
Siendo f XY ( x, y ) la función de densidad conjunta,
que cumple :
1)
f XY ( x, y ) ≥ 0, ∀x, y
∞
∞
2) −∞ −∞ f XY ( x, y ) dx dy = 1
43
Modelos Multivariantes
Variables aleatorias continuas
Función de distribución
FX , Y ( x, y ) = 
x

y
−∞ −∞
f X , Y (u , v) du dv
Funciones de densidad marginales
∞
f X ( x) =  f X ,Y ( x, y ) dy
−∞
∞
fY ( y ) =  f X ,Y ( x, y ) dx
−∞
Modelos Multivariantes
44
Las variables aleatorias X, Y tienen como función
de densidad conjunta
f XY ( x, y ) = 6 xy 2 , 0 < x < 1, 0 < y < 1
1. P( X ≤ x, Y ≤ y ) = 
x
0

2. P( X + Y ≤ 1) =

y
0
6uv 2 dudv = x 2 y 3
6 xy 2 dxdy
y
x + y ≤1
=
1
0

1− y
0
6 xy 2 dxdy =
1
5
x = 1-y
3. Marginales
1
f X ( x ) =  6 xy 2 dy = 2 x, 0 < x < 1
0
1
fY ( y ) =  6 xy 2 dx = 3 y 2 , 0 < y < 1
0
45
Modelos Multivariantes
Independencia
Las variablesaleatorias X, Y son independientes si y sólo si
f XY (x,y) = f X (x)fY (y).
1.
2.
 f X ( x ) = 2 x, 0 < x < 1

f XY ( x, y ) = 6 xy 2 , 0 < x < 1, 0 < y < 1  
 f ( y) = 3 y 2 , 0 < y < 1
 Y
Independientes
x1

 f X ( x) = 0 x dy = 1, 0 < x < 1
1
f XY ( x, y ) = , 0 ≤ y ≤ x ≤ 1  
11
x
 fY ( y ) =  dx = − log( y ), 0 < y < 1
yx

1
y
No independientes
0
Modelos Multivariantes
x 1
46
Funciones de densidad condicionadas
, #)
,
(#)
"
# =
|"
#
"|
," (
," (
, #)
,
( )
=
%& '()
%& '()
Modelos Multivariantes
"
# >0
>0
47
Independencia -II
1.
 f X ( x ) = 2 x, 0 < x < 1

f XY ( x, y ) = 6 xy , 0 < x < 1, 0 < y < 1  
2

 fY ( y ) = 3 y , 0 < y < 1
6 xy 2
= 2 x, 0 < x < 1
f X |Y ( x | y ) =
3x2
2
Independientes
x1

f
x
=
(
)
X
0 x dy = 1, 0 < x < 1

1
2. f XY ( x, y ) = , 0 ≤ y ≤ x ≤ 1  
11
x
 fY ( y ) =  dx = − log( y ), 0 < y < 1
y
x

1
f X |Y ( x | y ) = −
, y ≤ x ≤1
x log( y )
No independientes
1
f Y | X ( y | x) = , 0 ≤ y ≤ x
x
Modelos Multivariantes
48
Independencia -III
Las variables aleatorias X, Y son independientes si y sólo si
f X |Y (x | y) = f X (x)
fY | X (y | x) = fY (y)
49
Modelos Multivariantes
Ejemplo
 c, x 2 + y 2 ≤ r 2
f ( x, y ) = 
2
2
2
0, x + y > r
1.
c=
1
.
2
πr
∞
2. f X ( x) = −∞ f ( x, y )dy
1 +
=

π r2 −
=
Modelos Multivariantes
r 2 −x2
dy
r 2 − x2
2
2
2
r
−
x
, −r ≤ x≤r
2
πr
50
Ejemplo (cont.)
3. f Y ( y ) = 
∞
−∞
=
=
f ( x, y )dx
1
π r2
2
πr
2
4. f X |Y ( x | y ) =
+ r2 − y2
−
r 2 − y2
dx
r2 − y2 , − r ≤ y ≤ r
f ( x, y )
1
=
, − r2 − y2 ≤ x ≤ r 2 − y2
fY ( y ) 2 r 2 − y 2
fY(y)
fX|Y(x|y)
51
Modelos Multivariantes
Independencia
Las variables aleatorias X, Y son independientes si y sólo si
f XY (x,y) = f X (x)f Y (y).
1.
 f X ( x ) = 2 x, 0 < x < 1

f XY ( x, y ) = 6 xy , 0 < x < 1, 0 < y < 1  
 f ( y) = 3 y 2 , 0 < y < 1
 Y
Independientes
2.
2

=
f
x
r 2 − x2
(
)
X

2
 1
πr
, x2 + y2 ≤ r 2



f ( x, y ) = πr 2
 0, x 2 + y 2 > r 2

2
=
f
y
r 2 − y2
(
)
Y

2
πr

2
,− r ≤ x ≤ r
,− r ≤ y ≤ r
No Independientes
Modelos Multivariantes
52
Esperanza de g(X,Y)
(a ) Si X, Y son variables aleatorias discretas, se define
esperanza de la función g ( X , Y ) como :
x =∞ y =∞
E[g(X,Y)] =
  g ( x, y ) P ( X = x, Y = y )
x = −∞ y = −∞
(b) Si X, Y son variables aleatorias continuas, se define
esperanza de la función g ( X , Y ) como :
E[g(X,Y)] = 
∞

∞
−∞ −∞
g ( x, y ) f XY ( x, y )dxdy
53
Modelos Multivariantes
Propiedades de E[g(X,Y)]
Si g(X, Y) = g1(X) + g 2(Y ) se cumple
E[g1(X) + g 2(Y)] = 
∞
∞
=
∞
∞
( g (x) + g 2(y)) f XY ( x, y )dxdy
−∞ −∞ 1
∞
∞
g (x) f XY ( x, y )dxdy +   g 2(y) f XY ( x, y )dxdy
−∞ −∞ 1
−∞ − ∞
∞
∞
∞
g1 ( x) 
f XY ( x, y ) dy dx +  g 2 ( y ) 
f XY ( x, y )dx dy
−∞
−
∞
−
∞
−
∞




=
∞
=
∞
−∞
g1 ( x) f X ( x)dx + 
∞
−∞
g 2 ( y ) fY ( y )dy
= E[ g1 ( X )] + E[ g 2 (Y )]
Ejemplo
E[X + Y] = E[X] + E[Y]
Modelos Multivariantes
54
Covarianza
La covarianza de dos variables aleatorias X, Y , se denota por
Cov(X,Y) y se define como :
Cov(X,Y) = E[(X − μ X )(Y − μY )]
∞
∞
= −∞ −∞ (x − μ X )(y − μY ) f ( x, y )dxdy
donde μ X = E[X] y μY = E[Y].
Si las v.a' s son discretas :
Cov(X,Y) = E[(X − μ X )(Y − μY )]
=   (xi − μ X )(y j − μY )P ( X = xi , Y = y j )
i
j
55
Modelos Multivariantes
Propiedades de la covarianza
La covarianza es una medida de la dependencia lineal entre las
dos variables. Si las variables son independientes, Cov(X,Y)=0
∞
∞
−∞ −∞ (x − μ X )(y − μY ) f ( x, y )dxdy
∞ ∞
= −∞ − ∞ (x − μ X )(y − μY )f X ( x) f Y ( y )dxdy
Cov(X,Y) =
∞
∞
= −∞ (x − μ X )f X ( x )dx −∞ (y − μY )f Y ( y )dy = 0
Propiedades
• Cov(X,Y)=E[XY] - E[X]E[Y]
•Var (X+Y) = Var(X) + Var(Y) + 2 Cov(X,Y)
Modelos Multivariantes
56
Medias y Matriz de Varianzas
X, Y dos variables aleatorias con función de densidad conjunta f (x,y)
X : f X ( x) → µ X = E[ X ], σ X2 = Var[ X ]
σ Y2 = Var[Y ]
Y : f Y ( y ) → µY = E[Y ],
σ XY = Cov( X , Y )
Vector
aleatorio
X 
U =   ;
Y 
Vector de medias
µ
E [U ] =  X
 µY
Matriz
σ
Var [U ] = 
 σ XY
2
X



de varianzas
σ XY
σ Y2




57
Modelos Multivariantes
Correlación
Se define coeficiente de correlación ρ entre dos variables
aleatorias X, Y como
ρ(X,Y) =
Cov ( X , Y )
.
Var ( X ) Var (Y )
Propiedades
• -1 ≤ ρ(X,Y) ≤ +1
• Si X e Y son independientes, entonces ρ(X,Y) = 0.
• Y = a + b X ⇔ ρ(X,Y) = 1 (b>0) o ρ(X,Y) = -1 (b<0)
Modelos Multivariantes
58
n variables aleatorias
Para calcular probabilidades de un suceso en el que intervienen
variables aleatorias X1, X2, ..., Xn es preciso conocer la
distribución de probabilidad conjunta de todas ellas.
Si las variables son continuas se emplea la función de densidad
conjunta
 X1 
 
 X2 
X= 
⋮
 
X 
 n
f X (x1 ,x 2 ,..., x n )
59
Modelos Multivariantes
Vector de variables aleatorias
X = ( X 1 , X 2 ,..., X n ) → Conjunto (vector) de n v.a. continuas
Su distribución de probabilidad viene determinada por
su función de densidad conjunta : f X ( x1 , x2 ,..., xn )
o por la función de distribución conjunta FX ( x1 , x2 ,..., xn ).
FX ( x1 , x2 ,..., xn ) = 
xn

xn−1
−∞ −∞
Modelos Multivariantes
x1
⋯  f X (t1 , t 2 ,..., t n )dt1dt 2 ⋯ dt n
−∞
60
Distribuciones marginales
X = ( X 1 , X 2 ,..., X n ) → Conjunto (vector) de n v.a. continuas
La función de densidad marginal de X i , f i ( xi ),
f i ( xi ) = 
∞

∞
−∞ −∞
⋯
∞
f ( x , x ,..., xn )dx1dx2 ⋯ dxn
−∞ X 1 2
Todas menos xi
La función de densidad marginal de ( X i , X j ), f ij ( xi , x j ),
f ij ( xi , x j ) = 
∞

∞
−∞ −∞
∞
⋯  f X ( x1 , x2 ,..., xn )dx1dx2 ⋯ dxn
−∞
Todas menos xi y xj
Modelos Multivariantes
61
Esperanza
Esperanza de g( X) = g ( X1, X 2 ,..., X n )
E[ g ( X)] = −∞∞ −∞∞ ⋯ −∞∞ g ( x1, x2 ,..., xn ) f X ( x1, x2 ,..., xn )dx1dx2 ⋯ dxn
Es fácil demostrar :
E[ X i ] = −∞∞ −∞∞ ⋯ −∞∞ xi f X ( x1, x2 ,..., xn )dx1dx2 ⋯ dxn
= −∞∞ xi f i ( xi ) dxi
E[ g ( X1, X 2 )] = −∞∞ −∞∞ ⋯ −∞∞ g ( x1, x2 ) f X ( x1, x2 ,..., xn )dx1dx2 ⋯ dxn
= −∞∞ −∞∞ g ( x1, x2 ) f12 ( x1, x2 )dx1dx2
Modelos Multivariantes
62
Vector de Medias y Matriz de
Varianzas
X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias
 µ1   µ1 = E[ X 1 ]
  
 µ 2   µ 2 = E[ X 2 ]
E[ X] =   → 
⋮
 ⋮  
 µ  µ = E[ X ]
 n  n
n
 σ 12 σ 12 ⋯ σ 1n 


 σ 12 σ 22 ⋯ σ 2n  
Var ( X i ) = σ i2
→
=
Var [ X] 
 
= σ ij i ≠ j
⋮
⋮
⋱
⋮

 Cov( X i , X j )
σ
2 
 1n σ 2n ⋯ σ n 
Modelos Multivariantes
63
Independencia
Las variables aleatorias X 1,X 2 ,..., X n son independientes si y sólo si
f(x1,x2 ,..., xn ) = f1(x1 )f 2(x2 )⋯ f n(xn ).
Modelos Multivariantes
64
Transformaciones Lineales
X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias
a = ( a1 , a2 ,..., an )T , → Vector de n constantes
Y = a1 X 1 + a2 X 2 + ⋯ + an X n = a T X
E[Y ] = a T E[ X] = a1µ1 + a2 µ 2 + ⋯ + an µ n
 σ 12

σ
Var [Y ] = a T Var [ X ] a = (a1 a2 ⋯ an ) 12
 ⋮
σ
 1n
σ 12
σ 22
⋮
σ
2n
 a1 
 
⋯ σ 2 n  a 2 
⋱
⋮  ⋮ 
 
⋯ σ 2n  an 
⋯ σ
1n
65
Modelos Multivariantes
Transformaciones Lineales
Caso General
X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias
 a11 a12 ⋯

a22 ⋯
a
a =  21
⋮
⋮ ⋱

a
 m1 am 2 ⋯
 Y1   a11 a12 ⋯
  
 Y2   a21 a22 ⋯
 ⋮ = ⋮
⋮ ⋱
  
Y   a
 m   m1 am 2 ⋯
Var[Y ] = A Var[ X] AT
 a11

a
=  21
⋮

a
 m1
Modelos Multivariantes
a12
a22
⋮
am 2
a1n 

a2 n 
→ Matriz de m × n constantes
⋮ 

amn 
a1n  X 1 
 
a2 n  X 2 
= AX → E[Y ] = AE[ X]
⋮  ⋮ 
 
amn  X n 
⋯ a1n  σ 12 σ 12

⋯ a2 n  σ 12 σ 22
⋱ ⋮  ⋮
⋮



⋯ amn  σ 1n σ 2 n
 a11

⋯ σ 2 n  a12
⋱
⋮  ⋮

⋯ σ 2n  a1n
⋯ σ
1n
a21 ⋯ am1 

a22 ⋯ am 2 
⋮ ⋱ ⋮ 

a2 n ⋯ amn 
66
Transformaciones Lineales
(Independencia)
X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias independie ntes
a = ( a1 , a 2 ,..., a n ) T , → Vector de n constantes
Y = a1 X 1 + a 2 X 2 + ⋯ + an X n
 σ 12 0 ⋯

 0 σ 22 ⋯
(
)
Var [Y ] = a1 a 2 ⋯ a n 
⋮ ⋱
 ⋮
 0
0 ⋯

= a12σ 12 + a22σ 22 + ⋯ + an2σ n2
0  a1 
 
0  a 2 
⋮  ⋮ 
 
σ n2  a n 
67
Modelos Multivariantes
Ejemplo:
Calcular la media y la varianza de la suma de 12 variables
aleatorias independientes con distribución uniforme en (0,1)
 U1 


 U2 
U =
,
U i → Uniforme(0,1)
⋮ 


U 
 12 
Y = U1 + U 2 + ⋯ + U12
 E[U i ] = 1 / 2

 Var[U i ] = 1 / 12
Cov(U i ,U j ) = 0

12
E[Y ] =  E[U i ] =6
i =1
12
Var[Y ] =  Var[U i ] =1
i =1
Modelos Multivariantes
68
Ejemplo
Se dispone de n sobres con sus correspondientes
cartas. Se extraen las cartas de los sobres, se sortean
y se vuelven a introducir de forma aleatoria cada una
en un sobre. ¿Cuál es el número esperado de cartas
que coinciden con su sobre inicial?
X ≡ Número de coincidencias
X = X1 + X 2 + ⋯ + X n
0, Si la carta i no coincide con su sobre inicial
Xi = 
 1, Si la carta i sí coincide con su sobre inicial
E[ X ] = E[ X 1 ] + E[ X 2 ] + ⋯ + E[ X n ]
=
1 1
1
+ + ⋯ + = 1.
n n
n
69
Modelos Multivariantes
Media de n variables aleatorias independientes
X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias independie ntes

E[ X 1 ] + E[ X 2 ] + ⋯ + E[ X n ]
=
[
]
E
X

n
X1 + X 2 + ⋯ + X n 
X =

n

Var[ X 1 ] + Var[ X 2 ] + ⋯ + Var[ X n ]
=
[
]
Var
X


n2
Si las variables tienen la misma media y varianza
μ = E[X i ] ∀i
σ 2 = Var[X i ] ∀i
 E[ X ] = µ
X1 + X 2 + ⋯ + X n


X =
σ2
n
Var[ X ] = n
Modelos Multivariantes
70
Capı́tulo 2: Ejercicios propuestos
1. Dada la variable aleatoria discreta X, cuya función de probabilidad viene definida por
P (X = x) = kx, x = 1, 2, ..., 5
(a) Calcular el valor de la constante k
(b) Calcular P (X > 2)
(c) Calcular E[X] y V ar[X].
(d) Calcular E[Y ] si Y = 2X + 5
2. Dada la variable aleatoria X, cuya función de densidad es
f (x) =
k(1 − x2 ), si 0 < x < 1
0,
en el resto
(a) Obtener k.
(b) Dibujar la función de densidad.
(c) Calcular la probabilidad P (X < 0.3).
(d) Obtener la media y la varianza de X.
(e) Obtener la media y la varianza de la variable Y = 3X − 1.
(f) Obtener la media y la varianza de la variable Z = 3X 2 .
3. Un modelo que habitualmente se utiliza en balı́stica para comprobar la correcta calibración de las
armas es
x
x2
f (x) = 2 exp − 2 ,
x ≥ 0, σ ≥ 0,
σ
2σ
donde la variable aleatoria X es la distancia del punto de impacto del proyectil al centro del blanco
al que iba dirigido y σ es el parámetro que mide la precisión. Si para una distancia determinada
de disparo la precisión del arma es σ = 10 cm,
(a) ¿Cuál es la probabilidad de que un impacto esté a una distancia menor o igual de 5 cm del
centro?
(b) Calcular la función de distribución.
(c) ¿Cuál es la probabilidad de que al lanzar 10 proyectiles, ninguno haya impactado a una distacia
menor de 5 cm del centro del blanco?
(d) ¿Cuál es la probabilidad de que al lanzar 10 proyectiles, todos hayan impactado a una distacia
menor de 5 cm del centro del blanco?
4. Un gran almacén guarda cajas que contienen piezas de distinto tipo. La proporción X de piezas de
tipo A en una caja se puede considerar una variable aleatoria con función de densidad:
f (x) = kx(1 − x) con 0 ≤ x ≤ 1
(a) Calcular el valor de k, la media y la varianza de la variable aleatoria X.
1
(b) Si se toman 10 cajas al azar.¿Cuál es la probabilidad de que ninguna de ellas contenga una
proporción de piezas de tipo A igual o superior al 75% ?
5. De acuerdo con la teorı́a cinética de los gases, la velocidad V de una molécula de masa m de un
gas a la temperatura (absoluta) T es una variable aleatoria con la siguiente función de densidad:
f (v) =
donde α =
4
2
2
√ v 2 e−v /α ,
α3 π
v≥0
p
2kT /m, siendo k la constante de Boltzmann. Además,
√
E(V ) = 2α/ π, Var(V ) = (3/2 − 4/π)α2
(a) Calcular el valor medio de la energı́a cinética, mV 2 /2, de una molécula. ¿ A una misma
temperatura T , qué gas tiene mayor valor medio de energı́a cinética, uno ligero u otro más
pesado?
(b) Obtener la función de densidad de la energı́a cinética de una molécula. Indicar si depende de
la masa molecular.
6. Sea X una variable aleatoria con distribución uniforme en (0, 1). Calcular la probabilidad de que
2
Y > 0.8 si Y = e−X .
7. Si X es una variable aleatoria con media µ. Demostrar que cuando m = µ, E[(X − m)2 ] es mı́nima.
8. Una variable aleatoria tiene distribución uniforme en el intervalo [−a, +a]. Calcular la media, la
varianza, el coeficiente de asimetrı́a y el coeficiente de apuntamiento o curtosis.
9. La variable aleatoria Z tiene como función de densidad
1
z2
f (z) = √
exp − 2 , −∞ < z < ∞,
2σ
2πσ
σ>0
Obtener la función de densidad de Y = |Z| y su media.
10. Si X es una variable aleatoria con
√ distribución uniforme entre 0 y θ, obtener la función de densidad
de la variable aleatoria Y = + X.
11. La función de densidad de una variable aleatoria X es
f (x) = 1/2, −1 < x < 1
(a) Calcular la media y la varianza de X.
(b) Obtener la función de densidad de Y = X 2 .
(c) Calcular la media de Y .
12. La función de distribución de la variable aleatoria X es FX (x). Obtener la función de densidad de
la variable aleatoria Y = F (X).
13. Adaptar la demostración de la desigualdad de Chebychev y demostrar la desigualdad de Markov
P (X > a) ≤
1
E [X]
a
donde X es una variable aleatoria positiva (P (X > 0) = 1)
2
14. Se elige un punto al azar interior a la circunferencia de ecuación x2 + y 2 = r2 . Llamando Z a la
variable aleatoria definida por la distancia entre el punto elegido y el centro de la circunferencia,
calcular las funciones de densidad y distribución de Z.
15. Supóngase una diana circular con centro en el origen de coordenadas de radio r y X, Y las coordenadas de un punto elegido al azar (por ejemplo, el lanzamiento de un dardo). Supóngase que
cualquier otro punto de la diana tiene la misma probabilidad de ser elegido. Calcule fXY (x, y) y
fX (x).
16. La función de densidad de una variable aleatoria bidimensional viene dada por la expresión:
fXY (x, y) =
xy + cex , cuando 0 < x < 1 y 0 < y < 1
0,
en el resto
Indicar si son independientes las variables aleatorias X e Y .
17. La cantidad en miligramos de dos componentes contenidos en un producto es una variable aleatoria
bidimensional, cuya función de densidad viene dada por la expresión
fXY (x, y) =
4xy, cuando 0 ≤ x ≤ 1 y 0 ≤ y ≤ 1
0,
en el resto
(a) Obtener las funciones de densidad marginales.
(b) Calcular la covarianza.
(c) Calcular P (X + Y ≤ 0.5)
(d) Calcular la probabilidad de que la cantidad del primer componentes sea menor que 0.3 miligramos
cuando la del segundo es 0.8 miligramos.
18. La función de densidad de la variable aleatoria bidemendional (X, Y ), bien dada por la expresión:
kxy, cuando 0 < x < y < 1
fXY (x, y) =
0,
en el resto
(a) Calcular el valor de k.
(b) Calcular P (X < 0.5|Y = 0.5).
(c) ¿Son independientes las variables aleatorias X e Y ?
19. X e Y son dos variables aleatorias continuas independientes con la misma función de distribución
F . Calcular la función de densidad de
U = max(X, Y).
20. Obtén la distribución de probabilidad del máximo, del mı́nimo y de la media de los resultados
obtenidos al lanzar dos dados equilibrados. Se acepta que los resultados de los dados son variables
aleatorias independientes.
21. X e Y son variables aleatorias con coeficiente de correlación lineal ρ = −1. Si las varianzas son
iguales, calcular la varianza de Z = X + Y − 1.
3
22. La distribución de probabilidad conjunta de las variables aleatorias Y1 e Y2 es la siguiente:
Y2
-1
0
1
-1
1/16
3/16
1/16
Y1
0
3/16
0
3/16
1
1/16
3/16
1/16
Calcular su coeficiente de correlación e indicar si son independientes.
23. La función de densidad conjunta de X e Y viene dada por
f (x, y) = xy,
0 < x < 1, 0 < y < 2
(a) Obtener las funciones de densidad marginales y decir si X e Y son independientes.
(b) Calcular P(X + Y < 1).
24. Un ordenador tarda un total de Y segundos en procesar un mensaje de correo electrónico, esta
cantidad incluye el tiempo X durante el cual el mensaje está en la cola esperando a ser procesado
(Y ≥ X). La función de densidad conjunta de las variables aleatorias X, Y es
fX,Y (x, y) = e−y ,
0≤x≤y<∞
Calcular la probabilidad de que un mensaje haya estado menos de un segundo en la cola si el tiempo
total que ha durado su procesamiento ha sido mayor que dos segundos.
25. Sea X un valor elegido al azar de la distribución uniforme en el intervalo [0,1]. A continuación
se toma al azar otro valor Y de la distribución uniforme [X, 1]. Calcular la función de densidad
marginal de Y.
26. Sean X, Y, U y V variables aleatorias, demostrar que si Y = U + V, entonces
Cov(X, Y ) = Cov(X, U ) + Cov(X, V ).
27. Dos variables aleatorias X1 e X2 tienen la misma distribución de probabilidad y son independientes.
La función de densidad de Xi para i = 1, 2 es f (xi ) = e−xi , xi ≥ 0.
(a) Obtener la función de densidad conjunta.
(b) Se define Y2 = X1 + X2 , obtener la función de densidad de Y2
(c) Se disponen de tres variables aleatorias independientes con la misma función de densidad
definida anteriormente, obtener la función de densidad de Y3 = X1 + X2 + X3 .
(d) Se disponen de n variables aleatorias independientes con la misma función de densidad definida
anteriormente, obtener la función de densidad de Yn = X1 + X2 + ... + Xn .
(e) Calcular la media y la varianza de Yn .
4
Estadística
Parte I. Probabilidad
Tema 3.
Modelos de
Probabilidad
Proceso de Bernoulli
El resultado de un experimento admite
dos categorías: “Aceptable” y
“Defectuoso”.
Se repite el experimento n veces.
La probabilidad de “defectuoso” es la
misma p en todos los experimentos.
Los experimentos son independientes.
Modelos univariantes
2
Ejemplos de procesos de Bernoulli
Lanzamiento de n monedas.
Resultado: cara o cruz.
Se extraen piezas al azar de un
sistema continuo de fabricación. Se
clasifican las piezas en aceptables o
no.
Lanzamiento de un dado n veces. En
cada lanzamiento se clasifica como 6
o distinto de 6.
3
Modelos univariantes
Distribución Binomial (n,p)
n
Proporción defectuosas = p
X = “ Nº de defectuosas al extraer n piezas”
Modelos univariantes
4
Distribución binomial (n=10,p)
p 4 (1 − p) 6
10 
 
4
↓
10 
P( X = 4) =   p 4 (1 − p) 6
4
5
Modelos univariantes
Distribución binomial (n,p)
 n
P( X = k ) =   p k (1 − p) n − k , k = 0, 1, 2,..., n
k 
0,4
(1) P(X = k) ≥ 0, ∀ k .
(2)
n
 n
k =0
 
  k  p
k
(1 − p) n − k = 1.
n =10, p=0.2
0,3
0,2
0,1
0
0
1
2
3
4
5
6
7
8
9
10
x
Modelos univariantes
6
Propiedades de la dist. binomial
n
E[ X ] =  k × P( X = k ) = np.
k =0
Var[ X ] = E[ X 2 ] − E[ X ] 2 = np(1 − p)
0,08
0,06
5
0,04
n = 100, p = 0.5
0,02
0
0
20
40
50
60
80
100
7
Modelos univariantes
Distribuciones binomiales
0,16
0,2
n = 25, p = 0.5
0,12
n = 25, p = 0.2
2
0,12
2.5
0,08
0,16
0,08
0,04
0,04
0
0
0
5
10 12.5 15
20
25
x
0,08
55
10
15
20
25
x
0,1
n = 100 , p = 0.5
0,06
0
0,08
n = 100, p = 0.2
0,06
5
0,04
4
0,04
0,02
0,02
0
0
0
20
40 50 60
x
Modelos univariantes
80
100
0
2020
40
60
80
100
x
8
Ejemplo
Un contrato estipula la compra de componentes en lotes
grandes que deben contener un máximo de 10% de piezas
con algún defecto. Para comprobar la calidad se toman 11
unidades y se acepta el lote si hay como máximo 2 piezas
defectuosas. ¿Es un buen procedimiento de control?
Sea p la proporción de piezas en un lote,
X ≡ Número de defectuosas en la muestra
P(Aceptar) = P(X ≤ 2)
11
11
11
=   p 0 (1 − p )11 +   p 1 (1 − p )10 +   p 2 (1 − p ) 9
0
1
2
p
5%
10% 15% 20% 25%
P( Aceptar ) 0.985 0.910 0.779 0.617 0.45
9
Modelos univariantes
Distribución binomial
P1
P2
Q1
x
Si
=
=
=
=
dbinom(27,size=50,prob=0.5) # o P1=dbinom(10,50,.5)
pbinom(27,size=50,prob=0.5)
qbinom(.95,size=50,prob=0.5)
rbinom(5,size=50,prob=0.5)
es una variable con distribición binomial de parámetros
= 50 y
= 0.5,
1 = ( = 27),
2=
≤ 27 ,
y Q1 es el valor tal que
( ≤ 1) = 0.95
es un vector con 5 valores generados al azar de X.
## [1] 25 26 26 22 32
Modelos univariantes
10
Distribución binomial
k=0:50
pk = dbinom(k,size=50,prob=0.5)
plot(k,pk,col='blue',type='h',lwd=2,main='dbinom(n=50,p=0.5)')
Modelos univariantes
11
Ejemplo: control de procesos
Las piezas de un proceso de fabricación pueden ser aceptables o defectuosas.
Cuando el proceso está bajo control, el porcentaje de piezas defectuosas
fabricadas es 3%. De la producción de cada hora se toma una muestra de 200
piezas al azar.
1.
El ingeniero de calidad decide que si el número de defectuosas en la
muestra es 8 o más, se detenga el proceso y se analice si está bajo control.
¿Cuál es la probabilidad de parar el proceso de manera injustificada?
2.
Calcular la probabilidad de parar el proceso, cuando está fabricando con
un porcentaje de defectuosas del 5%.
3.
Calcular la probabilidad de no detener el proceso si está fabricando un 6%
de piezas defectuosas.
4.
Repetir el cálculo del apartado 3 para p (porcentaje de defectuosas) entre
1% y 10%. Dibujar las probabilidades en función de p.
Modelos univariantes
12
Solución
1. P1 = pbinom(8,200,0.03) igual a
0.8504038
2. P2 = 1- pbinom(8,200,0.05) igual
a 0.6729755
3. P3 = pbinom(8,200,0.06) igual a
0.1469911
4. px = seq(0.01,0.10,0.005)
P3 = 1 - pbinom(8,200,px)
plot(px,P3,type='l',col='red',
main=‘Prob de detener proceso')
13
Modelos univariantes
Distribución Geométrica (p)
Y
n
Proporción defectuosas = p
Y = “Piezas extraídas hasta que aparezca una defectuosa”
Modelos univariantes
14
Distribución geométrica (p)
p
(1-p)p
(1-p)2p
↓
(1-p)k-1p
1
2
3
↓
...
k
P( X = k ) = (1 − p) k −1 p, k = 1,2,3,...
15
Modelos univariantes
Propiedades de la v.a. geométrica
E[Y ] =
1
,
p
Var[Y ] =
1− p
p2
0,3
0,25
0,2
p=0.3
0,15
0,1
0,05
0
0
Modelos univariantes
4
8
12
16
20
16
Distribución Geométrica
p1
p2
q1
x
=
=
=
=
dgeom(6, prob=0.10)
pgeom(6, prob=0.10)
qgeom(.90, prob=0.10)
rgeom(5, prob=0.10)
Si
es una variable con distribición geométrica de parámetro
1=
= 6 = 0.0531441,
p2 =
≤ 6 = 0.5217031,
y q1 es el valor tal que
= 0.10,
≤ 1 = 0.90 → 1 = 21
es un vector con 5 valores generados al azar de X.
## [1] 11 21 2 3 64
Modelos univariantes
17
Distribución Geométrica
k=0:40
pk=dgeom(k,prob=0.10)
plot(k,pk,type='h',col='red',lwd=3,main='d
geom(p=0.10)')
Modelos univariantes
18
Distribución de Poisson
Número de defectos aparecidos en tramos de
longitud fija de hilos de cobre.
Número de partículas por centímetro cúbico
en líquidos con sustancias en suspensión.
Emisiones radiactivas: número de partículas
emitidas en intervalos de tiempo fijo.
Número de llamadas a una centralita de
teléfonos en un día
Modelos univariantes
19
Distribución de Poisson
Ejemplo: Fabricación continua de conductor de
cobre.
λ ≡ Número medio de defectos cada 100 m
X ≡ Número de defectos en un tramo de 100 m
Modelos univariantes
20
Límite de la dist. binomial
n
PX ( x ) =   p x (1 − p ) n − x ,
 x
p=
x
n!
λ
λ  
PX ( x ) = lim
  1 − 
n
n → ∞ ( n − x )! x!  n  
λ
n
n− x
n
λx
n ( n − 1) ⋯ ( n − x + 1) 
λ 
λ
−
=
−
1
1
lim




x! n → ∞
n 
n

nx
→ e −λ
→1
=
λx
x!
e−λ ,
−x
→1
x = 0 ,1, 2 ,...
21
Modelos univariantes
Distribución de Poisson
P( X = x) =
λx
x!
e −λ , x = 0,1,2,..
2,5000E-01
2,0000E-01
λ=3
1,5000E-01
1,0000E-01
5,0000E-02
0,0000E+00
0
Modelos univariantes
2
4
6
8
10
12
14
16
22
Media y Varianza
P ( X = x) =
∞
λx
x!
E[ X ] =  x ×
x=0
= λe
E[ X ] = λ
−λ
e −λ ,
λx
x!
∞

e
−λ
x = 0 ,1, 2 ,...
∞
λx
x =1
x!
=  x×
λ x −1
x =1( x − 1)!
e −λ
=λ
eλ
Var [ X ] = λ
Modelos univariantes
23
Ejemplo
Una fuente radiactiva emite partículas según
un proceso de Poisson de media 10
partículas por minuto. Se desea calcular:
Probabilidad de 5 partículas en un minuto
Probabilidad de 0 partículas en un minuto
Probabilidad de más de 5 partículas en un
minuto.
Probabilidad de 30 o menos partículas en 5
minutos.
Modelos univariantes
24
Ejemplo Poisson
105
= 0.0378
1. P ( X = 5) = e
5!
2. P ( X = 0) = e −10 = 4.54 ×10 −5.
3. P( X > 5) = 1 − P ( X ≤ 5)
−10
5
10 x
= 1− e 
= 0.933.
!
x
x =0
4. Y ≡ Nº de partículas en 5 minutos
λ ' = 5 ×10 = 50
−10
P (Y ≤ 30) = e
−50
30
50 x
= 0.0016

x = 0 x!
25
Modelos univariantes
Ejemplo Poisson
1. p1 = dpois(5, lambda = 10)
= 3.783327e-02
2. p2 = dpois(0, lambda = 10)
= 4.539993e-05
3. p3 = 1 - ppois (5, 10)
4. p4 = ppois(30,lambda=50)
Modelos univariantes
= 0.932914
= 1.594027e-03
26
Poisson de media 10
k=0:30 pk=dpois(k,lambda=10)
plot(k,pk,type='h',col='blue',lwd=3,main='dpois(lambda=10)')
27
Modelos univariantes
Distribución Exponencial
T
t1
t2 t3
t4
t5 t6
t7
Ejemplo: Fabricación continua de conductor de
cobre.
λ ≡ Número medio de defectos cada 100 m
T ≡ “Distancia entre dos defectos consecutivos”
Modelos univariantes
28
Distribución Exponencial
T≥ t
0
t
P(T ≥ t ) = P {0 defectos en el intervalo [0, t)}
= e −λt , t ≥ 0
FT (t ) = P(T ≤ t )
= 1 − e −λt , t ≥ 0
fT (t ) = λe −λt , t ≥ 0.
29
Modelos univariantes
Función de densidad
Propiedades (Exponencial)
fT (t ) = λe − λt , t ≥ 0.
0,1
0,08
0,06
λ = 0.1
0,04
0,02
0
0
10
20
30
40
50
60
T
∞
E[T ] =  t fT (t )dt
∞
−∞
−λt
=  λte
0
Modelos univariantes
dt =
1
λ
Var[T ] = E[T 2 ] − E[T ]2
∞
=  λt 2e −λt dt −
0
1
λ2
=
1
λ2
.
30
Ejemplo distribución exponencial
Una fuente radiactiva emite partículas según
un proceso de Poisson de media 10
partículas por minuto. Se desea calcular:
Tiempo medio entre partículas
Calcula la función de densidad del tiempo
en segundos entre dos partículas y
dibújala
Probabilidad de que aparezca la primera
partícula antes de 4 segundos
Probabilidad de un minuto sin partículas.
31
Modelos univariantes
Ejemplo distribución exponencial (sol.)
1.
= 10
,→
=
!
"
= 0.1
1
&
2. $% & = exp − , & > 0
6
6
3.
4.
=6
#
2
1
&
1
- ≤ 4 = . exp − /& = 1 − 0 3 = 0.486582
6
4 6
2
34
- > 60 = 1 − .
4
Modelos univariantes
1
&
exp − /& = 0 1!4 = 4.54 × 1017
6
6
32
Ejemplo distribución exponencial
1. Rate = 10 part/min = 10 part/60 s= 1/6 part/s
2. t=seq(0,35,.01)
ft = dexp(t,rate = 1/6)
plot(t,ft,col='red',lwd='2',type='l')
3. p3 = pexp(4,1/6) = 0.4865829
4. p4 = 1- pexp(60,1/6) = 4.539993e-05
33
Modelos univariantes
Distribución Normal: Campana de Gauss
σ
µ
 1  x − µ  2 
1
f X ( x) =
exp− 
 , x ∈ ℜ
σ
2
2π σ

 

Modelos univariantes
34
Medidas Características
X → N (µ ,σ )
σ
µ
Var[ X ] = σ 2
E[ X ] = µ
E[( X − µ )3 ] = 0
CA = Asimetría =
E[( X − µ ) 4 ] = 3σ 4
E[( X − µ )3 ]
σ
3
=0
CAp = Curtosis =
E[( X − µ ) 4 ]
σ
4
=3
35
Modelos univariantes
0.6
8
σ
µ-σ
µ
0.95
5
µ2σ
Modelos univariantes
µ
+2σ
µ+σ
0.997
µ3σ
µ
+3σ
36
Normal Estándar
Z → N (0,1)
1
0
1 −z2 / 2
f Z ( z) =
e
, z ∈ℜ
2π
z
Φ( z ) = 
−∞
1 −t 2 / 2
e
dt
2π
TABLAS
37
Modelos univariantes
Estandarización
X → N (µ ,σ ) 
P( X ≤ a) = P(
X −µ
σ
Z=
≤
X −µ
a−µ
σ
N(µ,σ)
σ
→ N (0,1)
) = P( Z ≤
a−µ
σ
) = Φ(
a−µ
σ
).
N(0,1)
µ a
P( X ≤ a)
Modelos univariantes
P(Z ≤ z )
z = (a-µ)/σ
38
z
TABLA
Normal Estándar
P (Z ≤ z)
N(0,1)
z
Ejemplo.
P ( Z ≤ 1.96) = 0.9750
0
.5000
.5398
.5793
.6179
.6554
.6915
.7257
.7580
.7881
.8159
.8413
.8643
.8849
.9032
.9192
.9332
.9452
.9554
.9641
.9713
.9772
.9821
.9861
.9893
.9918
.9938
.9953
.9965
.9974
.9981
.9987
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
0,01
.5040
.5438
.5832
.6217
.6591
.6950
.7291
.7611
.7910
.8186
.8438
.8665
.8869
.9049
.9207
.9345
.9463
.9564
.9649
.9719
.9778
.9826
.9864
.9896
.9920
.9940
.9955
.9966
.9975
.9982
.9987
0,02
.5080
.5478
.5871
.6255
.6628
.6985
.7324
.7642
.7939
.8212
.8461
.8686
.8888
.9066
.9222
.9357
.9474
.9573
.9656
.9726
.9783
.9830
.9868
.9898
.9922
.9941
.9956
.9967
.9976
.9982
.9987
0,03
.5120
.5517
.5910
.6293
.6664
.7019
.7357
.7673
.7967
.8238
.8485
.8708
.8907
.9082
.9236
.9370
.9484
.9582
.9664
.9732
.9788
.9834
.9871
.9901
.9925
.9943
.9957
.9968
.9977
.9983
.9988
0,04
.5160
.5557
.5948
.6331
.6700
.7054
.7389
.7704
.7995
.8264
.8508
.8729
.8925
.9099
.9251
.9382
.9495
.9591
.9671
.9738
.9793
.9838
.9875
.9904
.9927
.9945
.9959
.9969
.9977
.9984
.9988
0,05
.5199
.5596
.5987
.6368
.6736
.7088
.7422
.7734
.8023
.8289
.8531
.8749
.8944
.9115
.9265
.9394
.9505
.9599
.9678
.9744
.9798
.9842
.9878
.9906
.9929
.9946
.9960
.9970
.9978
.9984
.9989
0,06
.5239
.5636
.6026
.6406
.6772
.7123
.7454
.7764
.8051
.8315
.8554
.8770
.8962
.9131
.9279
.9406
.9515
.9608
.9686
.9750
.9803
.9846
.9881
.9909
.9931
.9948
.9961
.9971
.9979
.9985
.9989
0,07
.5279
.5675
.6064
.6443
.6808
.7157
.7486
.7794
.8078
.8340
.8577
.8790
.8980
.9147
.9292
.9418
.9525
.9616
.9693
.9756
.9808
.9850
.9884
.9911
.9932
.9949
.9962
.9972
.9979
.9985
.9989
0,08
.5319
.5714
.6103
.6480
.6844
.7190
.7517
.7823
.8106
.8365
.8599
.8810
.8997
.9162
.9306
.9429
.9535
.9625
.9699
.9761
.9812
.9854
.9887
.9913
.9934
.9951
.9963
.9973
.9980
.9986
.9990
0,09
.5359
.5753
.6141
.6517
.6879
.7224
.7549
.7852
.8133
.8389
.8621
.8830
.9015
.9177
.9319
.9441
.9545
.9633
.9706
.9767
.9817
.9857
.9890
.9916
.9936
.9952
.9964
.9974
.9981
.9986
.9990
39
Modelos univariantes
P (Z
N(0,1)
≤
z )
z
z
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
0,00
.9990323
.9993128
.9995165
.9996630
.9997673
.9998409
.9998922
.9999276
.9999519
.9999683
0,01
.9990645
.9993363
.9995335
.9996751
.9997759
.9998469
.9998963
.9999305
.9999538
.9999696
Modelos univariantes
0,02
.9990957
.9993590
.9995499
.9996868
.9997842
.9998527
.9999004
.9999333
.9999557
.9999709
0,03
.9991259
.9993810
.9995657
.9996982
.9997922
.9998583
.9999042
.9999359
.9999575
.9999721
0,04
.9991552
.9994023
.9995811
.9997091
.9997999
.9998636
.9999080
.9999385
.9999592
.9999733
0,05
.9991836
.9994229
.9995959
.9997197
.9998073
.9998688
.9999116
.9999409
.9999609
.9999744
0,06
.9992111
.9994429
.9996102
.9997299
.9998145
.9998739
.9999150
.9999433
.9999625
.9999755
0,07
.9992377
.9994622
.9996241
.9997397
.9998215
.9998787
.9999184
.9999456
.9999640
.9999765
0,08
.9992636
.9994809
.9996375
.9997492
.9998282
.9998834
.9999216
.9999478
.9999655
.9999775
0,09
.9992886
.9994990
.9996505
.9997584
.9998346
.9998878
.9999247
.9999499
.9999669
.9999784
40
Ejemplo (Normal)
La longitud X de ciertos tornillos es una variable
aleatoria con distribución normal de media 30 mm y
desviación típica 0.2 mm. Se aceptan como válidos
aquellos que cumplen
29.5 ≤ X ≤ 30.4.
2.
Proporción de tornillos no aceptables por cortos.
Proporción de tornillos no aceptables por largos.
3.
Proporción de tornillos válidos.
1.
41
Modelos univariantes
Ejemplo (Solución2)
X → N (30, 0.2) 
Z=
X −µ
σ
→ N (0,1)
X − 30 29.5 − 30
≤
)
0 .2
0.2
= P ( Z ≤ −2.5) = Φ (−2.5) = 0.0062
1. P ( X ≤ 29.5) = P (
0.0062
0.9938
0.0062
-2.5
Tablas
2.5
Modelos univariantes
42
Ejemplo (Solución)
X − 30 30.4 − 30
)
≤
0 .2
0 .2
= P ( Z ≤ 2) = Φ (2) = 0.9772
P ( X > 30.4) = 1 − 0.9772 = 0.0228
2. P ( X ≤ 30.4) = P (
29.5 − 30 X − 30 30.4 − 30
≤
≤
)
0.2
0.2
0.2
= P (−2.2 ≤ Z ≤ 2)
3. P (29.5 ≤ X ≤ 30.4) = P (
= Φ (2) − Φ (−2.2)
= 0.9772 − 0.0062 = 0.9710
Modelos univariantes
43
Ejemplo (Solución R)
1. p1 = pnorm(29.5, mean = 30, sd = 0.2) = 0.006209665
2. p2 = 1- pnorm(30.4, mean = 30, sd = 0.2) = 0.022750132
3. p3 = pnorm(30.4, mean = 30, sd = 0.2)- pnorm(29.5, mean = 30, sd = 0.2) = 0.97104
Modelos univariantes
44
Teorema Central del Límite
Sean
variables aleatorias
!, 8, … ,
independientes con media µ y desviación
típica σ, entonces cuando n tiende a infinito
X1 + X 2 + ⋯ + X n
σ2
→ N (µ , )
X=
n
n
Válido en muchos casos prácticos para n pequeños
Modelos Multivariantes
45
Teorema Central del Límite
Sea X 1,X 2 ,...,X n una secuencia de variables aleatorias
independientes con la misma distribución de probabilidad
de media µ y varianza σ 2 < ∞. Entonces
 X −µ

≤ t  = Φ (t ), − ∞ < t < ∞
lim P
n →∞
σ / n

donde X = ( X 1 + X 2 + ⋯ + X n ) / n y
1 t −x2 / 2
e
dx

−∞
2π
es la función de distribución de la normal estándar.
Φ (t) =
Modelos Multivariantes
46
Aplicación: Media de 12 “Uniformes”
Se lanza 12 veces la ruleta circular que aparece en la figura.
Se calcula la media de los doce valores.
0
x
(a) Genera por simulación 12 valores y obtén la media
(b) Repite el experimento anterior cuatro veces más y
proporciona los valores medios obtenidos
0.25
0.75
(c) Repite el experimento anterior 10000 veces y dibuja el
histograma
0.50
(d) Analiza teóricamente el experimento y determina la distribución de
probabilidad de la media de 12 variables aleatorias independientes con
distribución uniforme en [0,1]
Modelos univariantes
47
Simulaciones de 12 uniformes
Medias
##
##
[1] 0.720904 0.875773 0.760982 0.886125 0.456481 0.166372 0.325095
[8] 0.509224 0.727705 0.989737 0.034535 0.152373
0.55044
s2=runif(12)
##
##
[1] 0.735685 0.001136 0.391203 0.462494 0.388144 0.402485 0.1789636
[8] 0.951658 0.453728 0.326752 0.965415 0.707481
0.49709
s3=runif(12)
##
##
[1] 0.644542 0.389828 0.698543 0.544057 0.226467 0.484557 0.793007
[8] 0.005987 0.187712 0.681833 0.370104 0.361625
0.44902
s4=runif(12)
##
##
[1] 0.868795 0.904155 0.617425 0.134032 0.782193 0.429199 0.927274
[8] 0.773243 0.259681 0.321225 0.060195 0.043456
0.51007
s5=runif(12)
##
##
[1] 0.055053 0.625542 0.964470 0.827302 0.315028 0.213025 0.732496
[8] 0.499241 0.729772 0.080336 0.435530 0.236580
0.47619
s1=runif(12)
Modelos univariantes
48
Simulaciones y distribución de las medias
x
Media 0.5
49
Modelos univariantes
Simulación de 10000 medias e histograma
x = matrix(runif(120000),10000,12)
con número aleatorios con dist. unif.
m= rowMeans(x)
hist(rowMeans(x),nclass=50,col='light
='Media de 12 v.a. U[0,1]')
Modelos univariantes
# crea una matriz de dimensión 10.000 x 12
[0,1]
# calcula las medias de las 10.000 filas
blue',xlab='Media',xlim=c(0,1),prob=T,main
50
Aplicación Teorema Central del Límite
(media de 12 V.A. con dist. Uniforme [0,1])
:=
= : ==
?@A : = ?@A
!
!
+
+
8
8
!
+
+⋯+
12
+⋯+
12
!8
8
+ ⋯+
12
!8
=
=
?@A
=
!8
=
+=
8
+ ?@A
8
!
!
=
1
>
2
+ ⋯+ =
12
?@A
!8
+ ⋯ + ?@A
128
: ~D 0.5,
=
=
1
12
1B + 1B + ⋯ + 1B
2
2
2=1
2
12
!8
=
1B + 1B + ⋯ + 1B
12
12
12 = 1
8
12
128
1
12
51
Modelos univariantes
Media y Varianza de Uniforme [0,1]
=
1,5
!
=. / =
E
1
?@A
0,5
0
-0,2
0
0,2 0,4 0,6 0,8
x
Modelos Multivariantes
1
1,2
==
8
2
F
1
0
1
=
2
− =[ ]8
!
I 1
1
8
8
=
=. / = F =
3
3
E
0
8
1
1
1
?@A
= −
=
3
2
12
8
52
Aplicación Teorema Central del Límite
(media de 12 V.A. con dist. Uniforme [0,1])
x = matrix(runif(120000),10000,12)
con número aleatorios con dist. unif.
m= rowMeans(x)
hist(rowMeans(x),nclass=50,col='light
='Media de 12 v.a. U[0,1]')
# crea una matriz de dimensión 10.000 x 12
[0,1]
# calcula las medias de las 10.000 filas
blue',xlab='Media',xlim=c(0,1),prob=T,main
x1 = seq(0,1,.005)
lines(x1,dnorm(x1,mean=0.5,sd=1/12),col='red',lwd=2)
Modelos univariantes
53
Modelos univariantes
54
2. Aplicación Teorema Central del Límite
Binomial como suma de variables aleatorias
Proporción de
defectuosas p
Extraigo una pieza con reposición
0, KL0 &@MN0
=J
1, O0$0L&PQR@
J
Repito el experimento n veces, llamo
1* ,
,
!,
8, … ,
0
1
El número de piezas defectuosas en la muestra de
n es igual a S
Y ->Binomial
! ; 8 ; ⋯;
55
Modelos univariantes
2. Aplicación Teorema Central del Límite
Binomial como suma de variables aleatorias
El número de piezas defectuosas en la muestra de
n es igual a S
! ; 8 ; ⋯;
?@A
1*
E[Y]= E[
=
0× 1*
= 8 *=
; 18 × * 8
!
;
Var[Y]=Var[
Modelos univariantes
!
8
;
;1×
8
; ⋯;
8
08 ×
1*
; ⋯;
]
]
1*
56
2. Aplicación Teorema Central del Límite
Binomial como suma de variables aleatorias
Proporción de
defectuosas p
Extraigo n piezas con reposición
0
1*
0,
1,
1
El número de piezas defectuosas
en la muestra de n es igual a
S
! ; 8 ; ⋯;
J
Y tiene distribución Binomial (n, p)
Y tiende a distribución normal
T U, V ~W UV, UV X * V
57
Modelos univariantes
Aproximación Binomial-Normal n=25, p=1/2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
1
Modelos Multivariantes
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
58
Aproximación Binomial-Normal n = 50, p=0.5
0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
30
35
40
45
Modelos Multivariantes
50
59
Corrección por continuidad
Binomial: P(X ≤ 10)
Normal: P(X ≤ 10.5)
Modelos Multivariantes
60
Corrección por continuidad
Normal:
P(X ≤ 10.5)
Binomial:
P(X ≤ 10)
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
61
Modelos Multivariantes
Se ha tomado una muestra de 45 piezas de un proceso que fabrica
un promedio de 25% de piezas fuera de especificación.
1.¿Cuál es la probabilidad de que en la muestra haya exactamente
13 elementos defectuosos?
Cálculo exacto: X → Binomial(n = 45 , p = 0 .25 )
 45 
P(X = 13 ) =   0 .25130 .7532 = 0 .110
 13 
Aproximación Normal: Y → N( 11 .25 , 2 .9 )
P(X = 13 ) = P( 12 .5 ≤ Y ≤ 13 .5 ) = 0 .1142
2. ¿Cuál es la probabilidad de que la muestra contenga
13 o más piezas defectuosas?
E : P(X ≥ 13 ) = P(X = 13 ) + P(X = 14 ) + ⋯ + P(X = 45 ) = 0 .325
A : P(Y ≥ 12 .5 ) = 1 - Φ (
Modelos Multivariantes
12 .5 - 11 .25
) = 1 − Φ( 0 .4310 ) = 0 .333
2 .9
62
3. Aplicación teorema central del límite
Aprox. de la distribución de Poisson
Ejemplo: Fabricación continua de conductor de cobre.
λ ≡ Número medio de defectos cada 100 m
100 m
Dividimos los 100 metros en 100 tramos de 1 metro, sea
! el número de defectos en el primer metro, 8 el número
de defectos en el segundo metro, y así sucesivamente.
X ≡ Número de defectos en un tramo de 100 m
Y = YX + YZ + ⋯ + YX[[ ~\]^__]U(`)
63
Modelos univariantes
3. Aplicación teorema central del límite
Aprox. de la distribución de Poisson
100 m
X ≡ Número de defectos en un tramo de 100 m
=
!
+
8
+ ⋯+
!44
= "⁄!44
E[ ] = "⁄!44 , ?@A
=[ ] = =[
Var[ ] = ?@A[
!]
+ =[
!] +
8]
?@A[
~D( ,
Modelos univariantes
+ ⋯ + =[
8] +
!44 ]
=
⋯ + ?@A[
)
!44 ]
=
64
Binomial-Poisson-Normal
Binomial
n,p
n→∞
p → 1/ 2
µ = np
σ = np (1 − p )
n → ∞, p → 0
λ = np
Poisson
λ
λ →∞
µ =λ
Normal
µ,σ
σ= λ
Modelos Multivariantes
65
Aplicación a Control de
Recepción
Modelos Multivariantes
66
Plan de muestreo simple por atributos
Una compañía recibe lotes con un gran número de piezas.
Según el contrato cada lote debe tener como máximo una
proporción de piezas defectuosas igual pA (AQL).
Un plan de muestreo simple por atributos consiste en
determinar
n: número de piezas muestreadas
c: número máximo de piezas defectuosas en
la muestra
De forma que si X es el número de piezas defectuosas en la
muestra se aplica la siguiente regla:
x ≤ c se acepta el lote
x > c se rechaza el lote
Modelos Multivariantes
67
Riesgos del vendedor y comprador
Riesgo del vendedor: Probabilidad de
rechazar un lote bueno (con porcentaje
de defectuosas igual al pA (AQL))
α=P( X > c| p = pA).
Riesgo del comprador: Probabilidad
de aceptar un lote malo (con un
porcentaje de defectuosas pR>> pA)
β = P( X≤ c| p = pR).
Modelos Multivariantes
68
Planteamiento del problema
n
Muestra
Lote
DATOS:
OBJETIVO:
pA= AQL α: Riesgo vendedor
n: tamaño muestral
pR = RQL β: Riesgo comprador
c: máximo defectuosas
69
Modelos Multivariantes
Ecuación del vendedor
p ≡ Proporción de piezas defectuosa s en el lote
X ≡ Número de piezas defectuosa s en una muestra de n
X → Binomial ( n , p ) ≈ N ( np , np (1 − p ) )
Si p = p A
α = P(X > c|p = p A ) = P(
X − np A
>
np A (1 − p A )
c − np A
)
np A (1 − p A )
= P ( Z ≥ z1−α )
Conocido α  z1−α =
N(0,1)
c − np A
np A (1 − p A )
α
0
Modelos Multivariantes
z1-α
70
Ecuación del comprador
Si p = p R :
X − np R
≤
np R (1 − p R )
β = P(X ≤ c|p = p R ) = P(
c − np R
)
np R (1 − p R )
= P( Z ≤ zβ )
Conocido β  z β =
c − np R
np R (1 − p R )
N(0,1)
β
zβ 0
71
Modelos Multivariantes
Valores de n y c
z1−α =
c − np A
np A (1 − p A )
 z1−α
n=


zβ =
p A (1 − p A ) − z β
pR − p A
c − npR
npR (1 − pR )
p R (1 − p R ) 



2
c = np A + z1−α np A (1 − p A )
Modelos Multivariantes
72
Lote Bueno
p=pA
Probabilidad de
aceptar un lote
bueno
α
npA c
Lote Malo
p=pR
β
c
npR
Rechazar Lote
Aceptar Lote
Modelos Multivariantes
Probabilidad de
rechazar un lote
malo
c
73
Ejemplo: plan de muestreo
Diseñar un plan de muestreo para lotes de 10000
unidades con un AQL igual al 0.02, RQL igual a
0.08, riesgo de comprador de 0.10 y del vendedor
igual al 0.05.
Para α = 0.05  z1-α = 1.64 y β = 0.10  z β = −1.28
2
 1.65 0.02 × 0.98 + 1.28 0.08 × 0.92 
 ≈ 93
n = 

0
.
08
0
.
02
−


c = 93 × 0.02 + 1.65 93 × 0.02 × 0.98 ≈ 4
Modelos Multivariantes
74
Plan de muestreo simple por atributos
planSimple = function(pa, pr, alfa = 0.05, beta = 0.05)
#
# Plan de muestreo simple por atributos
#
# pa : AQL # pr : RQL
# alfa : riesgo del vendedor # beta : riesgo del comprador
#
# RESULTADOS: n = tamaño de muestra
#
c = máximo número de piezas defectuosas para aceptar un lote
{
zalfa = qnorm (1-alfa ,0 ,1)
zbeta = qnorm (beta, 0, 1)
n = ( (zalfa*sqrt(pa*(1-pa))-zbeta*sqrt(pr*(1-pr)) )/( pr-pa ) )^2
c = n*pa + zalfa * sqrt( n*pa*(1-pa) )
n=round(n)
c=round(c)
names(n) = 'n'
names(c) = 'c'
sol = c(n,c)
sol
}
Modelos univariantes
75
Plan de muestreo simple por atributos en R
source('planSimple.R')
planSimple(pa = .02, pr=0.08, alfa = 0.05, beta = 0.10)
## n
## 93
c
4
p = seq(0,.15,0.001)
px = 1-pbinom(4,size=93,prob=p)
plot(p,px,type='l',lwd=2,col='red',
xlab='prop. defectuosas',
main='Probabilidad de Rechazar Lote')
Modelos univariantes
76
Distribución normal multivariante
 σ 12 σ 12
 X1 
 µ1 

 
 
 σ 12 σ 22
 X2 
 µ2 
X =  ; µ = E[ X ] =  ; M = Var[ X ] = 
⋮
⋮
⋮
 ⋮
 
 
X 
µ 
σ
 n
 n
 1n σ 2 n
f ( x1 , x2 ,..., xn ) =
1
(2π ) n / 2 M
1/ 2


⋯ σ 2n 
⋱
⋮ 
⋯ σ n2 
⋯ σ
1n

 1
exp− (x − µ )T M −1 (x − µ ) 

 2
x = ( x1 , x2 ,..., xn )T ∈ ℜ n
µ = ( µ1 , µ 2 ,..., µ n )T ∈ ℜ n
M ∈ Matriz n × n semidefinida positiva
77
Modelos Multivariantes
Distribución normal bivariante
f ( x1 , x2 ) =
1
2π M
1/ 2
 1
 x − µ 
exp− ( x1 − µ1 x2 − µ 2 )M −1  1 1 
 x2 − µ 2  
 2
 σ 12 σ 12   σ 12
ρσ 1σ 2 
=

;
M
=
T
2 
2

µ = ( µ1, µ 2 ) ∈ ℜ
σ 22 
 σ 12 σ 2   ρσ 1σ 2
−ρ 
 1

 2
σ1 σ 2 
1  σ1
−1
2 2
2
M = σ 1 σ 2 (1 − ρ ), M =
1 
(1 − ρ 2 )  − ρ


σ 22 
 σ1 σ 2
x = ( x1, x2 )T ∈ ℜ 2
f ( x1 , x2 ) =
1
2πσ 1σ 2

 x − µ  2  x − µ  2
1

2
 1 1  +  2
exp−

2  σ
2
σ

2
(
1
)
ρ
−
1 
2


1− ρ


 x − µ  x − µ 2  
 
− 2 ρ  1 1  2
 σ 1  σ 2  
Modelos Multivariantes
78
79
Modelos Multivariantes
2
2
2
0
0
0
-2
-2
-2
-2
0
rho= 0
2
-2
0
rho= 0.5
2
2
2
2
0
0
0
-2
-2
-2
-2
0
rho= -0.2
Modelos Multivariantes
2
-2
0
rho= -0.5
2
-2
0
rho= 0.9
2
-2
0
rho= -0.9
2
80
Propiedades
Las dist. marginales son normales N(µi,
σi).
Las dist. condicionadas son normales.
ρ=0 ⇔ Las variables son independientes
Transformaciones lineales:
Y = AX
X es N(µ, M)  Y es N(A µ, AMAT)
81
Modelos Multivariantes
Ejemplo
Sea la (X 1 , X 2 , X 3 ) normal tridimens ional de media (10, 20, 30) y matriz de varianzas
1

M = 0
0

0
1
0
0

0 .
4 
¿ P(X 1 + X 2 ≥ X 3 + 1 ) ?
E [Y ] = 10 + 20 − 30 = 0


Y = X 1 + X 2 − X 3 → Normal 
Var [Y ] = Var ( X ) + Var ( X ) + Var ( X ) = 6
1
2
3

P(X 1 + X 2 ≥ X 3 + 1 ) = P(X 1 + X 2 − X 3 ≥ 1 )
= P (Y ≥ 1)
= P(
Y −0
≥ 1 )
6
6
(
= 1− Φ 1
Modelos Multivariantes
6
)
82
Distribuciones de Probabilidad en R
Cada distribución de probabilidad tiene cuatro funciones. Cada una tiene un nombre que
la identifica, por ejemplo en el caso de la distribución normal, el nombre es norm. Al
nombre se le añade un prefijo de una letra:
p para probabilidad p=pnorm(x), = ( ≤ )
q para la inversa, q = qnorm(p) si = ( ≤ )
d para la función de densidad fx = dnorm(x)
r para generar valores aleatorios x=rnorm(n) genera n valores aleatorios
pnorm(x) se utiliza para la normal estándar, para otra normal hay que indicarles los
parámetros, por ejemplo, p=pnorm(x, mean = 100, sd= 5). Lo mismo para las otras tres
funciones.
Para las distribuciones dicretas, por ejemplo la binomial,
p=pbinom(x,size=100,prob=.5) proporciona ( = ).
Y k=qbinom(q,size=100,prob=.5)es mínimo valor k tal que ( ≤ b)] ≥ .
Modelos univariantes
83
Principales Funciones de
Distribución
Beta
pbeta qbeta dbeta rbeta
Binomial
pbinom qbinom dbinom rbinom
Cauchy
pcauchy qcauchy dcauchy rcauchy
Chi-Square
pchisq qchisq dchisq rchisq
Exponential
pexp qexp dexp rexp
F
pf qf df rf
Gamma
pgamma qgamma dgamma rgamma
Geometric
pgeom qgeom dgeom rgeom
Hypergeometric phyper qhyper dhyper rhyper
Logistic
plogis qlogis dlogis rlogis
Log Normal
plnorm qlnorm dlnorm rlnorm
Negative Binomial pnbinom qnbinom dnbinom rnbinom
Normal
pnorm qnorm dnorm rnorm
Poisson
ppois qpois dpois rpois
Student t
pt qt dt rt
Uniform
punif qunif dunif runif
Weibull
pweibull qweibull dweibull rweibull
Modelos univariantes
84
Capı́tulo 3: Ejercicios propuestos
1. Si las llamadas telefónicas a una centralita siguen una distribución de Poisson de parámetro λ = 3
llamadas/cinco minutos, calcular la probabilidad de:
(a) Seis llamadas en cinco minutos.
(b) Tres llamadas en diez minutos.
(c) Más de 15 en un cuarto de hora.
(d) Dos en un minuto.
2. La variable aleatoria X tiene distribución exponencial con media 1. Obtener la función de distribución y la función de densidad de
W = aX 1/b ,
a > 0, b > 0
3. El número de averı́as diarias de una máquina sigue una distribución de Poisson de media 0.4 averı́as.
Calcular la probabilidad de que haya tres dı́as sucesivos sin averı́as.
4. A un puesto de servicio llegan de manera inedependiente, por término medio, 10 clientes/hora.
Calcular la probabilidad de que lleguen 8 clientes en la próxima media hora sabiendo que en la
última hora llegaron 14 clientes, y que la variable aleatoria número de clientes que llegan en un
hora siguen una distribución de Poisson.
5. Sean X e Y dos variables independientes con distribucin geomtrica de parmetros 0.4 y 0.6 respectivamente. Calcular P (X + Y = 3).
6. En una planta industrial dos bombas B1 y B2 en paralelo conducen agua desde un pozo a una
depuradora D, y posteriormente otras dos bombas B3 y B4 , también en paralelo, la trasladan a un
depósito como indica la figura.
Los tiempos de vida de la depuradora y de las bombas son variables aleatorias independientes con
distribución exponencial, siendo 20 mil horas la vida media de la depuradora y 30 mil horas la de
cada bomba.
Pozo
- B1
B3 @
R
@
D
Depsito
@ R B4 @
- B2
7. (a) Calcular la probabilidad de que llegue agua al depósito después de 20 mil horas de funcionamiento.
(b) Calcular la probabilidad de que una depuradora que ha trabajado T horas falle antes de las
mil horas siguientes. ¿Es razonable que para evitar fallos de la depuradora se renueve ésta
cada 20 mil horas? ¿Por qué?
1
8. Un laboratorio de análisis realiza pruebas de sangre para detectar la presencia de un tipo de virus.
Se sabe que una de cada 100 personas es portadora del virus. Se va a realizar un estudio en un
colegio, para abaratar las pruebas se realiza un análisis combinado que consiste en: En lugar de
analizar la sangre de cada individuo, se toman las muestras de 50 y se analiza la mezcla. Si el
resultado del análisis es negativo, se concluye que los 50 individuos están sanos. Si el análisis es
positivo, se repite a cada persona de manera individual. El análisis es infalible.
(a) Determinar el número esperado de pruebas (análisis) que se tendrá que realizar si se sigue este
tipo de estrategia.
(b) ¿Cuál es la probabilidad de que un individuo determinado sea portador del virus, si el resultado
del análisis realizado a su grupo de 50 ha resultado positivo?
9. De un lote con una proporción de piezas defectuosas p, se extraen piezas con reposición hasta que
se observa la k−ésima defectuosa. Obtener la distribución de probabilidad de la variable aleatoria
X número total de piezas observadas.
10. La función de densidad de una variable aleatoria X viene dada por la expresión
x/8, si 0 ≤ x ≤ 4
11. f (x) =
0,
en el resto
Se generan secuencialmente valores de esta variable. ¿Cuántos valores de X habrá que generar por
término medio hasta obtener un valor mayor que 3?
12. Una pareja decide tener hijos hasta el nacimiento de la primera niña. Calcular la probabilidad de
que tengan más de 4 hijos. (Supóngase P (niño) = P (niña) = 0.5)
13. La distancia D entre dos vehı́culos consecutivos es una autopista sigue una distribución exponencial
con media 200 metros. ¿Cuál es la probabilidad de que en un tramo de 1 km haya exactamente 5
vehı́culos?
14. Ricardo es un pescador experto que ha comprobado, después de una larga experiencia practicando
su deporte favorito, que el número de peces capturados por la mañana puede ser representado por
una variable aleatoria de Poisson de media 3 peces a la hora. Quiere ir a pescar el sábado próximo,
si empieza a las 7 de la mañana, ¿cuál es la probabilidad de que capture el primer pez antes de las
7 h. 15 min.? ¿Cuál es la probabilidad de que capture 5 peces durante dos horas de pesca?
15. La variable aleatoria T representa la duración de vida de un componente electrónico. En teorı́a de
la fiabilidad la probabilidad de que un componente falle en el instante t sabiendo que ha durado
hasta t se denomina tasa de fallo y se representa por λ(t), siendo su valor en función de t
λ(t) =
f (t)
,
1 − F (t)
donde f y F son, respectivamente, las funciones de densidad y de distribución de la variable aleatoria
T . Obtener la tasa de fallo en caso que T sea una variable aleatoria exponencial de media 1000
horas e interpretar el resultado.
16. Un examen consiste en 25 cuestiones. En cada cuestión, el alumno debe elegir entre 5 soluciones
propuestas, de las que una (y sólo una) es cierta. El número mı́nimo de respuestas correctas que
debe tener un alumno para aprobar es a. El profesor decide fijar a con el siguiente criterio: que
2
la probabilidad de aprobar para un alumno que conteste todas las cuestiones al azar sea menor de
0.05. Obtener a. (Una cuestión es respondida al azar si cada uno de los cinco resultados propuestos
tiene la misma probabilidad de ser escogido).
17. Obtener la función de densidad de una variable aleatoria χ2 con un grado de libertad. (Si X
N (0, 1), Y = X 2 es una χ21 .)
18. Dada una variable aleatoria X, cuya distribución es N (0, σ 2 ), calcular la mediana de la variable
Y = |X|.
19. La longitud L en milı́metros de las piezas fabricadas en un proceso es una variable aleatoria que
se distribuye según una N (32, 0.3), considerándose aceptables aquellas cuya medida se encuentra
dentro del intervalo (31.1, 32.6).
(a) Calcular la probabilidad de que una pieza elegida al azar sea aceptable.
(b) Si se toma al azar una muestra de tres piezas, ¿cuál es la probabilidad de que la primera y la
tercera sean aceptables y la segunda no lo sea?
(c) ¿Cuál es la probabilidad de que en una muestra de tamaño 3 al menos una sea aceptable?
(d) Las piezas se embalan en lotes de 500. Calcular la probabilidad de que un lote tenga más de
15 defectuosas.
20. Un concesionario de automóviles recibe pedidos de un modelo según un proceso de Poisson de media
2 vehı́culos por semana. Los pedidos al fabricante se deben realizar con una antelación mı́nima de
un mes, de forma que el concesionario pide en cada mes los vehı́culos que necesita para el mes
siguiente. ¿Cuántos automóviles disponibles ha de tener a principios de un mes para satisfacer con
probabilidad igual o mayor que 0.95 la demanda mensual? (Se considera que el mes tiene cuatro
semanas).
21. Si la probabilidad de que un disparo impacte una diana es 0.0001, ¿cuál es la probabilidad de
impactar en la diana 4 o más veces en 50000 disparos? Da un resultado numérico empleando la
aproximación que consideres más adecuada. Se supone independencia.
22. En una urna hay 20 bolas, 5 son negras y 15 blancas. Se extraen 4 sin reposición y se define la
variable aleatoria Y como el número de bolas negras.
(a) Demostrar que la distribución de probabilidad de Y es
15 5
P (Y = k) =
k
4−k
20
4
, k = 0, 1, 2, 3, 4
(b) Generalizar el resultado anterior si en la urna hay M bolas blancas, N bolas negras, se extraen
K bolas e interesa conocer la distribución de probabilidad de Y número de bolas negras. La
extracción es sin reposición. (Esta distribución se denomina Hipergeométrica y se utiliza en
los problemas de muestreo sin reposición)
(c) Plantear el problema del número de aciertos en la loterı́a primitiva como un caso particular
de la distribución anterior. Aplicarlo para el caso en el que el participante tacha (elige) 6
números y en el caso en el que tacha 8 números.
3
23. Para controlar la calidad de un proceso textil se cuenta el número de defectos que aparecen en la
tela fabricada. Según el fabricante, cuando el proceso funciona correctamente el número de defectos
en una bobina de 100 metros cuadrados es una variable aleatoria de Poisson con media 4. Se ha
instalado un equipo de visión artificial para realizar el recuento que permite inspeccionar 900 m2
de tela cada hora. ¿Cuál es la probabilidad de que aparezcan más de 50 defectos en una hora si el
proceso funciona bien?
24. Un compañı́a compra chips para montar en placas de ordenadores clónicos. Una empresa de reciclado le ofrece lotes de 10.000 chips a precios muy ventajosos pero con un porcentaje de defectuosos
alto, alrededor del 10%. Para realizar el control de calidad de los lotes recibidos está considerando
dos alternativas: (a) Tomar 100 unidades al azar y rechazar el lote si existen más de 15 defectuosas. (b) Tomar 100 unidades al azar, dividirlas en 10 grupos y si en algún grupo hay más de una
pieza defectuosa rechazar el lote.¿Cuál es la probabilidad de rechazar un lote con el 10% de chips
defectuosos para cada uno de los métodos? ¿Cuál es la probabilidad de aceptar un lote con el 20%
de chips defectuoso para cada método?
25. Una compañı́a para comprobar la calidad de ciertos lotes de 30000 piezas realiza el siguiente control:
toma una muestra al azar de 300 piezas y si tiene 15 o más piezas defectuosas rechaza el lote,
aceptándolo en caso contrario. La compañı́a cada mes aplica este control a 200 lotes, ¿cuál es el
número esperado de lotes rechazados si todos los lotes de un mes tienen exáctamente un 4% de
piezas defectuosas?
26. Un servicio telefónico de urgencias recibe por término medio 10 llamadas cada minuto, ¿cuál es la
probabilidad de recibir más de 550 llamadas en una hora? Se ha diseñado un ”call center” con
capacidad de respuesta de 650 llamadas a la hora, ¿cuál es el número esperado de horas al año con
número de llamadas superior a su capacidad? (Se supone que las llamadas son independientes y
todas las horas son similares)
27. A un congreso de medicina acuden 500 personas. Un laboratorio farmaceútico va a regalar corbatas
a los hombres y pañuelos a las mujeres. Desgraciadamente no conocen el número exacto de cada
sexo, aunque saben de otros congresos que la proporción es similar. Calcula el número mı́nimo de
corbatas y de pañuelos que deben tener disponibles los organizadores para que todos los asistentes
tengan el regalo que les corresponde con probabilidad de 0.99 (es decir ninguna mujer se quede sin
pañuelo y ningún hombre sin corbata). Se supone que la probabilidad de hombre o mujer es igual
a 0.5 y que la probabilidad de que un asistente sea de un determinado sexo es independiente del
sexo de los restantes.
28. Federer y Nadal se encuentran empatados, 40-40 en un juego en el que está sacando Nadal. Según
las estadı́sticas la probabilidad de que Nadal gane un punto determinado cuando tiene el saque
es 0.6. ¿Cuál es la probabilidad de que el juego lo termine ganando Nadal? (Nota. Piensa en
el desempate de la siguiente forma: se juegan dos puntos: si los gana un jugador ese jugador ha
ganado el juego, si cada jugador gana un punto se juegan otros dos puntos y se vuelve a aplicar la
misma regla).
29. ”Cibeles in Concert” es una empresa que organiza viajes en autobus para asistir a actuaciones
musicales. Para un concierto de Bruce Springsteen en Paris ha ofertado 300 plazas que salen de
Madrid y Sevilla. Las reservas se hacen por Internet, el precio del viaje para los de Sevilla es de 60
e y para los de Madrid 50e. Las 300 plazas se cubren con seguridad. Si la probabilidad de que un
asistente salga de Sevilla es 1/3 y de Madrid 2/3, y se acepta independencia entre las 300 reservas,
calcula los ingresos esperados por la compañı́a y la varianza de estos ingresos.
4
30. Una empresa de celulosa tiene dos lı́neas para fabricar pasta de papel en planchas de 1m × 1m.
Una medida de su calidad es la limpieza, que se mide en número de impurezas (partı́culas) por m2 .
La lı́nea I, fabrica con una tasa media de 5 impurezas por m2 y la lı́nea II con 3 impurezas por m2 .
El número de impurezas por plancha es una variable aleatoria con distribución de Poisson. Las
planchas de pasta se empaquetan en balas de 2000 unidades y se almacenan clasificadas según la
lı́nea de procedencia. Cuando por algún motivo se encuentra en el almacén una bala sin clasificar
se adopta el siguiente criterio: tomar una muestra aleatoria de 10 planchas y determinar el número
medio de impurezas. Asignarla al grupo de la lı́nea I si el número medio de impurezas es mayor
que 4 y a la lı́nea II en caso contrario. (Se supone que la probabilidad inicial de pertenecer a una
u otra linea es la misma).
(a) Calcular la probabilidad de clasificar erróneamente una bala.
(b) En un caso concreto, el número de impurezas en cada una de las diez planchas han sido
1, 2, 3, 3, 4, 4, 5, 5, 6, 8. Calcular la probabilidad de que pertenezca a cada una de las lı́neas.
31. Los billetes de banco son fabricados en pliegos. La impresión se realiza por dos máquinas iguales,
una de ellas imprime el anverso y la otra el reverso. Sea X e Y , respectivamente, el número de
defectos de impresión en el anverso y reverso de un pliego. Ambas variables son independientes con
distribución de Poisson de parámetros λ1 y λ2 .
(a) Demostrar que el número total de defectos en un pliego Z = X + Y tiene distribución de
Poisson. (Nota.- Utilizar que
Pr{Z = n} =
n
X
Pr{X = k}Pr{Y = n − k}
k=0
y el desarrollo del binomio de Newton para (λ1 + λ2 )n .)
(b) Si el número total de defectos en un pliego es Z = n, ¿ cuál es la probabilidad de que haya
exáctamente X = k defectos en el anverso? (Obtener la expresión en función de λ1 , λ2 , n y k).
¿ De qué distribución de probabilidad se trata?
32. La llegada de los clientes a un banco se considera un proceso Poisson con parámetro λ. Sabiendo
que en la última hora han llegado 2 clientes, ¿cuál es la probabilidad de que los dos entraran en los
primeros 15 minutos?
33. Un equipo de radio tiene dos partes, el receptor y el amplificador. La duración del receptor es
una variable aleatoria exponencial de media 500 horas y la duración del amplificador una variable
exponencial de media 1000 horas. ¿Cuál es la probabilidad de que el fallo del equipo (cuando se
produzca) sea debido a un fallo del receptor? (Se supone que las variables son independientes)
34. Sea X1 una variable aleatoria N(10,1), X2 una variable aleatoria N(20,1), y X3 una variable aleatoria
N(30,4). Se define
Z1 = X1 + X2 − X3
Z2 = X1 + X2 + X3
Z3 = X1 − X2 − X3
Si X1 , X2 , X3 son independientes, calcular la matriz de varianzas de (Z1 , Z2 , Z3 ).
5
35. Una oficina de correos tiene dos ventanillas de atención al público. Tres personas A,B y C llegan en
el mismo instante a la oficina de correos y encuentran las dos ventanillas desocupadas. Los tiempos
de servicio requeridos por las tres personas son variables aleatorias independientes con distribución
exponencial de parámetro λ. Los tiempos de servicio de A y B comienzan de inmediato, mientras
que C debe esperar a que termine el primero de los dos. ¿Cuál es la probabilidad de que C no sea
el último en salir de la oficina de correos?
36. En cierta fabricación mecánica el 96% de las piezas resultan con longitudes admisibles (dentro
de tolerancias), un 3% son piezas defectuosas cortas y un 1% son defectuosas largas. Calcular la
probabilidad de:
(a) En un lote de 250 piezas sean admisibles 242 o más.
(b) En un lote de 500 sean cortas 10 o menos.
(c) En 1000 piezas haya entre 6 y 12 largas. Todas las aproximaciones se calculan la distribución
normal.
37. La estatura de los ciudadanos varones de un paı́s sigue una distribución normal:
N (µ = 175cm, σ = 5cm);
si se seleccionan al azar 100 ciudadanos, ¿cuál es la probabilidad de que al menos 30 superen los
180cm?
38. En un proceso de fabricación de pelı́cula fotográfica aparecen por término medio 1 defecto de cada
20 metros de pelı́cula. Si la distribución de defectos es Poisson, calcular la probabilidad de 6
defectos en un rollo de 200 metros de pelicula (a) directamente; (b) utilizando la aproximación
normal. Para controlar la recepción de lotes de 10000 unidades de discos compactos se toma una
muestra al azar de n = 200 discos clasificándolos como aceptables y defectuosos. Si el número de
discos defectuosos es igual o inferior a c = 15 se acepta el lote, en caso contrario se rechaza. ¿Cuál
es la probabilidad de aceptar un lote con el 12% de discos defectuosos? ¿Cuál es la probabilidad
de rechazar un lote con el 5% de discos defectuosos? ¿Que valores de n y c deben utilizarse si se
desea que las probabilidades anteriores sean iguales a 0.05?
39. La función de densidad conjunta de las variables aleatorias X, Y es la siguiente normal bidimensional:
1
−1
2
2
f (x, y) =
exp
(x − 2ρxy + y )
2(1 − ρ2 )
2π(1 − ρ2 )1/2
Si ρ = 0.3, calcular Pr(Y ≤ X + 1).
40. Un inversor tiene su dinero repartido en acciones de dos compañı́as. La rentabilidad (% de beneficio)
de las compañı́as pueden ser consideradas como dos variables aleatorias, con media anual igual para
las dos del 10%, aunque el riesgo es muy diferente. Una tiene una desviación tı́pica de 2.5% y la otra
del 1%. Además se sabe que la correlación entre ellas es -0.50. ¿Qué proporción debe invertir en
cada una para que el riesgo sea mı́nimo? (Nota: Mı́nimo riesgo es lo mismo que mı́nima varianza.
X → N (10, 2.5) y Y → N (10, 1), corr(X, Y ) = −0.5).
41. Cierto compuesto metálico se ha sometido durante una hora a una atmósfera de oxı́geno a 200
grados centı́grados. Una medida de su corrosión es la ganancia de peso durante este tiempo. Se
ha comprobado que para un determinado compuesto esta ganancia X1 , en una hora, se distribuye
segúun una normal N (100, 5).
6
(a) Si se realizan los ensayos de manera secuencial, ¿cuántos se tendrán que hacer por término
medio para encontrar una probeta con una ganancia mayor que 105?
(b) Se comprueba que sometiendo la probeta al ensayo durante dos horas, la ganancia en la segunda
hora X2 tiene una distribución normal N (60, 5), siendo el coeficiente de correlación entre las
variables X1 y X2 , ρ = −0.28. Calcular la probabilidad de que una probeta tenga mayor
ganancia de peso en la segunda hora que en la primera.
(c) Se forman los ı́ndices de oxidación Z1 = X1 + X2 y Z1 = X1 − X2 . Calcular la función de
densidad conjunta de estas dos nuevas variables. ¿Son independientes?
(d) Si la ganancia durante las dos horas ha sido 170, ¿cuál es el valor medio de la ganancia en la
primera hora?
42. El abastecimiento de energı́a eléctrica de una comarca depende de tres centrales: una nuclear, una
térmica de carbón y una hidráulica con potencias instaladas de 500 M W , 300 M W y 200 M W ,
respectivamente. Desde el punto de vista de fiabilidad, cada central sólo puede estar en uno de
estos dos estados: disponible (con toda su potencia) o averiada (con potencia cero). En un dı́a, la
probabilidad de averı́a de la central nuclear es 0.10, de la térmica es 0.12 y de la hidráulica 0.05.
Las averı́as son independientes y supondremos como hipótesis simplificadora que a lo largo de un
dı́a la central no cambia de estado.
(a) Para un dı́a, calcular la función de distribución de la variable aleatoria Y =Potencia disponible
en la comarca.
(b) Un pais tiene 30 centrales de cada uno de los tipos del apartado 1. Calcular la probabilidad
de que en un dı́a la potencia disponible en el pais sea menor que24000 M W . (Utilizar la
aproximación normal).
(c) La potencia máxima diaria demandada en el pais es una variable aleatoria con distribución
normal de media 23000 M W y desviación tı́pica 1000 M W . ¿Cuál es la probabilidad de que
en un dı́a la demanda sea superior a la potencia disponible?
43. Una compañı́a desea aplicar un plan de muestreo para controlar la compra de lotes de 10000
unidades. La capacidad de inspección máxima que tienen es de 200 piezas. Determinar c, ”el
número máximo de piezas defectuosas en la muestra que debe tener un lote aceptado” si se desea
que la probabilidad de rechazar un lote con el 10% de piezas defectuosas sea igual 0.02. Un proveedor
estima que sus lotes tienen un 5% de piezas defectuosas, ¿qué probabilidad tiene de que un lote
suyo sea aceptado?
44. Se tienen dos variables aleatorias U y V que se distribuyen según un modelo de probabilidad
uniforme continuo entre (0, 1) independientes. A partir de las anteriores se definen 2 nuevas variables
aleatorias Z y W como función de las anteriores:
√
Z = −2 log U
W = 2πV
(a) Calcular las probabilidades P (Z < z0 ) y P (W < w0 ). Utilizar estos resultados para deducir
la expresión de la función de densidad de probabilidad conjunta fZ,W (z, w) para las variables
aleatorias Z y W, ası́ como el domino donde están definidas.
7
(b) Una vez caracterizadas las variables aleatorias Z y W por su función de densidad de probabilidad conjunta fZ,W (z, w)se vuelve a definir 2 nuevas variables aleatorias X e Y mediante
X = Z · cos W
la siguiente transformación:
Y = Z · senW
Para estas nuevas variables se comprueba que la función de densidad de probabilidad conjunta
es:
1
1
fX,Y (x, y) =
exp − x2 + y 2 , con (x, y) ∈ R2 .
2π
2
Demostrar que las variables aleatorias X e Y son independientes. Calcular la media y la
varianza de las variables y sus funciones de densidad marginal identificando el tipo de variables
de las que se trata.
(c) Con la información del apartado (a) y (b) obtener el valor numérico de las siguientes probabilidades:
• P (−1 < X < 1, −1 < Y < 1)
• P (X 2 + Y 2 < 1)
• P (Y < X)
(d) Finalmente, calcular los coeficientes de la siguiente tansformación lineal
0 X
c 0
a
X
+
=
Y
d e
b
Y0
con c, e > 0, para que las nuevas variables aleatorias (X 0 , Y 0 )T tengan una distribución de
probrobabilidad con vector de medias y matriz de varianzas dadas por:
4 2
1
.
,
S=
µ=
2 5
3
45. Hay un juego muy popular en EEUU que se juega en carnavales en los que un jugador paga 1 dólar,
elige un número del 1 al 6 y lanza tres dados. La banca le paga tantos dólares como veces aparece
el número elegido. En un dı́a de carnaval participan en el juego 500 personas. Obtén la distribución
de probabilidad de las ganancias de la banca para ese dı́a, indicando su media y desviación tı́pica.
46. Se lanzan 100 dados. Obtén la distribución de la suma de los números pares. Calcula la media y
la varianza.
8
Estadística
Parte II. Inferencia
Tema 4.
Estadística
Descriptiva
Datos
Número
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
...
391
Consumo
l/100Km
15
16
24
9
11
17
12
17
18
12
16
12
9
8
7
7
12
13
9
9
...
7
Estadística Descriptiva
Cilindrada
cc
4982
6391
5031
1491
2294
5752
2294
6555
6555
1147
5735
1868
2294
1295
1163
1360
3802
3687
1475
1983
...
1753
Potencia
CV
150
190
200
70
72
153
90
175
190
97
145
91
75
67
65
61
90
95
71
115
...
75
Peso
kg
1144
1283
1458
651
802
1384
802
1461
1474
776
1360
860
847
666
612
667
1070
1261
741
890
...
735
Aceleración
segundos
12
9
15
21
19
14
20
12
13
14
13
14
17
16
21
19
17
19
17
14
...
15
Año
País
Nº Cilindros
70
70
70
71
71
71
72
72
72
72
73
73
74
74
74
74
75
75
75
75
...
82
EEUU
EEUU
EEUU
EEUU
EEUU
EEUU
EEUU
EEUU
EEUU
Japón
EEUU
Europa
EEUU
Europa
Japón
Japón
EEUU
EEUU
Europa
Europa
...
Japón
8
8
8
4
4
8
4
8
8
3
8
4
4
4
4
4
6
6
4
4
...
4
2
Tipos de datos
Cuantitativos
Continuos: consumo, potencia,aceleración, peso
Discretos: nº de cilindros
Cualitativos
Ordinales: categoría
No ordinales: país, gasolina/gasoil
Estadística Descriptiva
3
Lectura de datos
Para leer datos de un achivo de texto organizado en columnas se
utiliza la instrucción read.table().
coches = read.table('coches2.txt',header=TRUE)
head(coches)
##
##
##
##
##
##
##
1
2
3
4
5
6
Consumo
11
11
13
11
17
15
Estadística Descriptiva
CC CV Peso Acel Ano Origen Cilindros
3277 85 862
16 70
1
6
3261 90 882
15 70
1
6
3261 97 924
16 70
1
6
3245 95 944
16 70
1
6
7456 225 1028
10 70
1
8
4982 150 1144
12 70
1
8
4
Descriptiva de variables cualitativas
coches$origen2 = factor(coches$Origen,labels=c('USA','UE','JAP'))
table(coches$origen2)
##
## USA UE JAP
## 246 68 79
barplot(table(coches$origen2),col= terrain.colors(3))
pie(table(coches$origen2),col=terrain.colors(3))
Estadística Descriptiva
5
Distribución de frecuencias:
consumo l/100 km
------------------------------------------------------------Limite
Limite
Punto
Frecuencia
Frecuencia
Clase
Inferior Superior Medio
Absoluta
Relativa
------------------------------------------------------------1
0,0
2,5
1,25
0
0,0000
2
2,5
5,0
3,75
6
0,0153
3
5,0
7,5
6,25
65
0,1662
4
7,5
10,0
8,75
126
0,3223
5
10,0
12,5
11,25
64
0,1637
6
12,5
15,0
13,75
62
0,1586
7
15,0
17,5
16,25
36
0,0921
8
17,5
20,0
18,75
26
0,0665
9
20,0
22,5
21,25
4
0,0102
10
22,5
25,0
23,75
2
0,0051
------------------------------------------------------------Total
391
1,0000
Estadística Descriptiva
6
Histograma
150
120
90
60
30
0
0
5
10
15
20
25
consumo
Estadística Descriptiva
7
Histogramas para coches
Estadística Descriptiva
8
Descriptiva de variables continuas
hist( coches$Consumo, color = 'tomato', probability =TRUE)
9
Estadística Descriptiva
Medidas de centro
x1 , x2 ,..., xn
Media aritmética
x + x + ⋯ + xn
x= 1 2
n
Media geométrica
Media armónica
(si xi > 0 para todo i ) (si xi > 0 para todo i )
n
xG = n x1 x2 ⋯ xn
xH =
1 1
1
+ +⋯+
x1 x2
xn
xH ≤ xG ≤ x
Estadística Descriptiva
10
Medidas de dispersión
x1, x2 ,..., xn
s=2
Desviación Típica
90
95
100
105
110

s=
s = 5.4
90
n
(x
i =1 i
95
100
105
− x )2
n
Varianza : s 2
110
Media 100
11
Estadística Descriptiva
Densidad de la tierra (Cavendish, 1798)
5,5
5,57
5,42
5,61
5,53
4
5,47
4,88
5,62
5,63
4,07
4,4
5,55
5,34
5,3
5,36
5,79
4,8
Media = 5.42
Estadística Descriptiva
5,75
5,29
5,1
5,86
5,58
5,2
densidad
5,29
5,34
5,26
5,44
5,46
5,6
5,27
5,85
5,65
5,39
6
Desv. Típ. = 0.338
12
Desigualdad de Chebychev
fr (| x i − x |≤ ks ) > 1 −
235
240
245
x
x −k×s
s2 =
 n ( xi
i =1
s ≥
− x)
x − x > ks
k2
255
x +k×s

2
n

2
250
1
=
x − x ≤ ks
n
>
n
fr (| xi − x |> ks) ≤
k
k2
x − x > ks
( xi − x ) 2
i
n
2 2
s
x − x > ks
1

+
i
( xi − x ) 2
i
( xi − x ) 2
i
n
= fr (| xi − x |> ks)k 2 s 2
⇔
fr (| xi − x |≤ ks) > 1 −
1
k2
13
Estadística Descriptiva
Mediana y Cuartiles
x1, x2 ,..., xn
Datos ordenados
x(1) ≤ x( 2) ≤ ⋯ ≤ x( n)

x( p )

Mediana 
x +x
 ( p ) ( p +1)

2
Cuartiles
Q1 = x( r )
Q3 = x( s )
p + 1
r = 
s = n − r +1

2


Estadística Descriptiva
n +1
: n impar
2
n
p = : n par
2
p=
14
Mediana y Cuartiles
x1 , x2 ,..., xn
50%
Mediana : ( Med )
fr(xi ≤ Med) = 0.50
25%
25%
235
Cuartiles
240
245
Q1
Med
Q1
Q3
fr(xi ≤ Q1 ) = 0.25
fr(xi ≤ Q3 ) = 0.75
250
255
Q3
15
Estadística Descriptiva
Medidas características
Media
Desv. Típica
Primer Cuartil
Mediana
Tercer Cuartil
Rango Intercuartílico
Consumo
11.2
3.9
8
10
13.5
5.5
Cilindrada Potencia
3181.2
104.2
1714.6
38.3
1721
75
2474
93
4334
125
2613
50
Peso
990.7
281.9
741.5
933
1203.5
462
Aceleración
15.7
2.8
14
16
17
3
summary(coches)
##
##
##
##
##
##
##
##
Consumo
Min.
: 5.00
1st Qu.: 8.00
Median :10.00
Mean
:11.22
3rd Qu.:13.00
Max.
:24.00
CC
Min.
:1114
1st Qu.:1721
Median :2474
Mean
:3179
3rd Qu.:4293
Max.
:7456
Estadística Descriptiva
CV
Min.
: 46.0
1st Qu.: 75.0
Median : 93.0
Mean
:104.2
3rd Qu.:125.0
Max.
:230.0
NA's
:2
Peso
Min.
: 537.0
1st Qu.: 742.0
Median : 935.0
Mean
: 990.6
3rd Qu.:1203.0
Max.
:1713.0
Acel
Min.
: 8.00
1st Qu.:14.00
Median :16.00
Mean
:15.67
3rd Qu.:17.00
Max.
:25.00
16
Diagrama de caja
Q1 Q2
Min {xi : xi ≥ LI}
Q3
Max {xi : xi ≤ LS}
atípicos
0
4
8
12
16
20
24
consumo
LI = Q1 -1.5 RI
LS = Q3+1.5 RI
RI = Q3 - Q1
17
Estadística Descriptiva
Densidad de la tierra (Cavendish, 1798)
5,5
5,57
5,42
5,61
5,53
4
5,47
4,88
5,62
5,63
4,07
4,4
5,55
5,34
5,3
5,36
5,79
4,8
5,75
5,29
5,1
5,86
5,58
5,2
5,29
5,34
5,26
5,44
5,46
5,6
5,27
5,85
5,65
5,39
6
densidad
Media = 5.42
Desv. Típ. = 0.338
Estadística Descriptiva
18
Diagrama de caja múltiple
EEUU
Europa
Japón
0
4
8
12
16
20
24
consumo
19
Estadística Descriptiva
Diagrama de caja múltiple
EEUU
Europa
Japón
500
800
1100
1400
1700
2000
peso
Estadística Descriptiva
20
Consumo según año de fabricación
70
71
72
73
74
75
76
77
78
79
80
81
82
0
4
8
12
16
20
24
consumo
Estadística Descriptiva
21
Box plot en R
coches$origen2 = factor(coches$Origen,labels=c('USA','UE','JAP'))
boxplot(coches$Consumo~coches$origen2,horizontal=TRUE, col=terrain.colors(3))
Estadística Descriptiva
22
Diagrama de Caja Múltiple
EEUU
Grecia
OCDE
Europa Oriental
Japón
Asia/Pacífico
África
Gabón
Oriente Medio
America Latina
Barbados
0
4
8
12
16
20
Producto interior bruto per capita
24
X1000
23
Estadística Descriptiva
Diagrama de tallos y hojas
LO|4,07
1
1
1
1
2
3
12
(9)
8
2
4|
4|
4|
4|
4|8
5|1
5|222233333
5|444455555
5|666677
5|88
Estadística Descriptiva
• Media 5,419
• Des. Típica 0,339
• Mínimo 4,07
• Máximo 5,86
• Cuartil 1 5.3
• Mediana 5.46
• Cuartil 3 5.61
24
Diagrama de tallos y hojas con R
25
Estadística Descriptiva
Medidas características de forma:
asimetría y curtosis
Coeficiente
Coeficiente de curtosis o
de asimetría
m
C AS = 33
s
apuntamiento
m
C AP = 44
s
( xi − x ) 4

=
( xi − x )3

=
ns 3
ns 4
Momento
respecto al origen
xk

i =1 i
=
Momentos
respecto a la media
n
ak
Estadística Descriptiva
n
( x − x )k

i =1 i
=
n
mk
n
26
Modelo ideal
CAP = 3
CAS = 0
1000
frecuencia
800
600
400
200
0
230
235
240
245
250
255
260
30
30
25
frecuencia
25
20
15
10
5
20
15
10
5
0
0
0
100
200
300
400
500
600
700
220
CAS > 0
230
240
250
260
270
280
CAP < 3
Estadística Descriptiva
27
Transformaciones de datos
• Transformaciones Lineales
yi = a + bxi
y = a + bx
s y = b sx
La " forma" de la distribución no cambia
(Asimetría y curtosis no cambia)
• Transformaciones no-lineales
yi = h( xi )
y ≠ h( x )
Cambia la " forma" de la distribución
(coeficientes de asimetría y curtosis cambian)
Estadística Descriptiva
28
Efecto de la transformación de datos
150
240
200
120
160
90
120
60
80
30
40
0
0
-10
10
30
50
70
0
1
2
X
3
4
5
6
Y
yi = log xi
29
Estadística Descriptiva
Transformaciones Box-Cox
1,5
1
0,5
0
-0,5
-1
xip − 1
yi =
p
-1,5
p = 0  yi = log xi
Estadística Descriptiva
30
Datos Multivariantes
Variables
Y1
x11
Y2 ⋯ Yk
x21 ⋯ xk1
2 x12
x22 ⋯ xk 2
1
⋮
⋮
n x1n
⋮
x2 k
⋱
⋮
⋯ xkn
x1
x2
⋮
xn
31
Estadística Descriptiva
Vector de Medias
 x1i 
 
 x2 i 
x i =  ;
⋮
 
x 
 ki 
Estadística Descriptiva
 x1 
 
n
x  x2 

i =1 i
x=
= 
⋮
n
 
x 
 n
32
Covarianza
24
Coche
1
2
⋮
n
consumo
20
16
12
8
4
0
500
800
1100
1400
1700
Peso
x1
x2
Consumo
y1
y2
⋮
xn
⋮
yn
2000
peso
s xy

=
n
(x
i =1 i
− x )( yi − y )
n
33
Estadística Descriptiva
Matriz de Varianzas
 x1i

1  x 2i
2
S = 
n i =1

x
 ki
n
− x1 

− x2 
( x1i − x1
⋮

− x k 
x 2i − x 2
⋯
x ki − x k )

( x1i − x1 ) 2

1 n  ( x − x1 )( x 2i − x 2 )
=   1i
n i =1 
⋮
 ( x − x )( x − x )
ki
k
1
 1i
( x1i − x1 )( x 2i − x 2 )
( x 2i − x 2 ) 2
⋮
⋯
⋯
⋱
( x 2i − x 2 )( x ki − x k )
⋯
 s12

s
=  12
 ⋮
s
 1k
s1k 
s 2k 

⋮ 
s k2 
s12
s 22
⋯
⋯
⋮
⋱
⋯
s 2k
Estadística Descriptiva
( x1i − x1 )( x ki − x k ) 
( x 2i − x 2 )( x ki − x k ) 

⋮

2

( x ki − x k )

34
Gráficos de dispersión: ejemplo coches
pairs(coches[,1:5])
Estadística Descriptiva
35
Matriz de Varianzas
var(coches[,1:5],use="complete.obs")
##
##
##
##
##
##
Consumo
CC
CV
Peso
Acel
Consumo
15.1557
5824.4
127.304
971.53
-5.0073
CC
5824.4404 2939742.5 58965.409 451460.55 -2597.4073
CV
127.3035
58965.4 1465.220
9312.79
-73.5510
Peso
971.5264 451460.5 9312.785 79495.52 -328.0469
Acel
-5.0073
-2597.4
-73.551
-328.05
7.6156
Estadística Descriptiva
36
Propiedades de S2
 x11 − x1

~ =  x12 − x1
X

⋮

x − x
1
 1n
1 ~T~
S2 = X
X
n
x 21 − x 2
x 22 − x 2
⋮
x2n − x2
⋯ x k1 − x k 

⋯ xk 2 − xk 

⋱
⋮

⋯ x kn − x k 
Cuadrada k x k
Simétrica
Semidef. positiva
S 2 es semidefinida positiva :
∀w ∈ ℜ k , w T S 2 w ≥ 0
1 ~T~
1 ~ T ~
w TS 2 w = w T ( X
X)w = (X
w) (Xw)
n
n
~ w,  w T S 2 w = 1 v T v =
v=X
n
i=1 vi2
n
n
≥0
37
Estadística Descriptiva
Correlación
24
consumo
20
16
12
8
4
0
500
800
1100
1400
1700
2000
Obs.
Var − 1
Var − 2
1
2
⋮
x1
x2
y1
y2
⋮
⋮
n
xn
yn
peso
rxy =
s xy
sx s y
i=1 ( xi − x )( yi − y )
n
n
i=1 ( xi − x ) 2 i=1 ( yi − y ) 2
n
=
Estadística Descriptiva
• Adimensional
• -1 ≤ rxy ≤ +1
• |rxy| = 1 ⇔ yi = a + b xi
38
Coef. correlación
2
r =1
r 2 = 0 . 50
r 2 = 0 . 80
r2 = 0
Estadística Descriptiva
39
Matriz de Correlación
cor(coches[,1:5],use="complete.obs")
##
##
##
##
##
##
Consumo
CC
CV
Peso
Consumo 1.00000 0.87259 0.85428 0.88510
CC
0.87259 1.00000 0.89844 0.93389
CV
0.85428 0.89844 1.00000 0.86289
Peso
0.88510 0.93389 0.86289 1.00000
Acel
-0.46609 -0.54895 -0.69628 -0.42161
Estadística Descriptiva
Acel
-0.46609
-0.54895
-0.69628
-0.42161
1.00000
40
library('car')
scatterplotMatrix(coches[1:5])
Estadística Descriptiva
41
scatterplotMatrix(coches[1:5],groups=coches$Origen,
cex=.2,by.groups = TRUE,col= rainbow(3),
main='USA=Rojo, UE=Verde, JAP= Azul')
Estadística Descriptiva
42
Transformaciones Lineales
yi = a1 x1i + a2 x2i + ⋯ + ak xki = (a1

y=
n

=
n
i =1
s
2
y
yi
n

=
n
i =1
( yi − y ) 2
i =1
n
a2
a T ( i =1 x i )
 x1i 
 
x 
⋯ ak ) 2i  = a T x i
⋮
 
x 
 ki 
n
aTxi
=
n

=
n
= aTx
n
( yi − y )( yi − y )
i =1
n

=
n
i =1
(a T x i − a T x)(x Tia − x Ta)
n
 n (x i − x)(x i − x)T 
 a = a T S 2a
= a  i =1


n


T
43
Estadística Descriptiva
 s12

s
S 2 =  12
 ⋮
s
 1k
s12
s22
⋮
s2 k
⋯ s1k 

⋯ s2 k 
⋱ ⋮ 
⋯ sk2 
 s12

s
Var (a T x) = (a1 , a2 ,⋯ , ak ) 12
 ⋮
s
 1k
⋯ s1k  a1 
 
⋯ s2 k  a2 
⋱ ⋮  ⋮ 
 
2 
⋯ sk  ak 
= a12 s12 + a22 s22 + ⋯ + ak2 sk2 + 2a1a2 s12 + 2a1a3 s13 + ⋯ + 2ak −1ak sk −1,k
Estadística Descriptiva
s12
s22
⋮
s2 k
44
Casos particulares
1.
=
+
=
2.
=
+2
(
,
)
+
−2
(
,
)
−
=
3.
+
=
+
=
+
+2
(
,
)
45
Estadística Descriptiva
Transformaciones lineales II
y1i = a11 x1i + a12 x2i + ⋯ + a1k xki
 y1i   a11 a12

 
y
 2i   a21 a22
 ⋮ = ⋮
⋮

 
 y  a
 mi   m1 am 2
y2i = a21 x1i + a22 x2i + ⋯ + amk xki
⋮
ymi = am1 x1i + am 2 x2i + ⋯ + amk xki
⋯ a1k  x1i 
 
⋯ a2 k  x2i 
⋱ ⋮  ⋮ 
 
⋯ amk  xki 
y i = Ax i
i =1 y i
n
y=
n
i =1 Axi
n
=
Estadística Descriptiva
n
A(i =1 x i )
n
=
n
= Ax
46
Transformaciones lineales III
 y1i   a11 a12

 
y
 2i   a21 a22
 ⋮ = ⋮
⋮
 

 y  a
 mi   m1 am 2
S
2
Y

=
n

=
n
i =1
⋯ a1k  x1i 
 
⋯ a2 k  x2i 
⋱ ⋮  ⋮ 
 
⋯ amk  xki 
=
(y i − y )(y i − y )T
n
i =1
( Ax i − Ax)(x Ti A T − x T A T )
n
= AS 2X A T
 n ( x i − x)(x i − x)T
= A i =1

n


 AT


SX2
Estadística Descriptiva
47
Ejercicio:
Notas de Diseño (X1) y Regresión (X2) y Nota Final (Y=X1+X2)
En la tabla siguiente se proporciona las notas de las dos pruebas de evaluación
continua de la asignatura Diseño de Experimentos (X1) y Modelos de
Regresión (X2) y la suma de ambas (Y=X1+X2). Además se proporcionan la
media y la desviación típica de cada una de las tres variables.
1. Calcula la covarianza entre X1 y X2
2. Calcula la correlación entre X1 y X2
3. Proporciona la matriz de varianzas de X1 y X2 y la matriz de correlaciones
de X1 y X2
4. Como las notas de X1 son en general inferiores a X2, se decide utilizar
como nota final Z = 0.8 X1 + 1.2 X2. Calcula la media y la varianza de Z.
5. Calcula la matriz de correlación de las variables (Y y Z).
Estadística Descriptiva
48
Notas de Diseño (X1) y Regresión (X2) y Nota Final (Y=X1+X2)
matrícula
76020
76032
76056
76077
76079
76084
76133
76151
76218
76235
76241
76251
76268
76272
76303
76354
76377
76433
76435
76517
X1
3.3
0.1
3.7
3.0
3.7
1.0
3.0
1.8
2.8
2.4
1.8
2.4
3.7
2.0
0.1
1.2
0.8
0.0
1.6
1.6
X2
4.3
3.4
5.1
4.5
4.3
1.8
5.5
3.3
5.0
3.8
2.6
3.3
3.0
2.4
1.5
3.8
3.0
1.3
3.8
2.4
Y
7.5
3.5
8.8
7.5
7.9
2.8
8.5
5.0
7.8
6.3
4.4
5.7
6.7
4.4
1.6
5.0
3.8
1.3
5.4
4.0
matrícula
76523
76564
76575
76581
76639
76668
76740
76742
76745
76765
76770
76792
76796
76816
76834
76853
76885
76889
76990
76991
Media
DesvTipic
X1
3.5
0.8
3.0
1.4
0.1
0.1
2.8
3.7
1.8
1.6
2.8
4.1
3.5
2.6
3.9
2.8
2.4
1.2
2.0
3.8
2.19
1.21
X2
4.7
2.9
4.3
2.6
1.0
1.2
3.3
4.7
2.6
1.6
5.5
3.8
5.5
3.3
4.2
3.2
3.0
2.5
1.9
5.0
3.37
1.24
Y
8.1
3.7
7.3
4.0
1.1
1.3
6.1
8.3
4.4
3.2
8.3
7.9
9.0
6.0
8.1
6.0
5.4
3.7
3.9
8.8
5.56
2.29
X1 versus X2
06
05
04
03
02
01
00
00
01
01
02
02
03
03
04
04
05
49
Estadística Descriptiva
Solución:
Notas de Diseño (X1) y Regresión (X2) y Nota Final (Y=X1+X2)
1.
=
1, 2 =
2.
3.
1, 2 =
1 +
2 +2
1 +
( )
2
( 1, 2)
( 1)
1
1.45 1.138
=
2
1.138 1.54
Estadística Descriptiva
2 −
1, 2
( 2)
= 1.138
= 0.76
1.
0.76
1
=
0.76 1.
2
50
4. $̅ = 0.8 × 2.19 + 1.2 × 3.37 = 5.79
$ = 0.8
5.
$
=
1 + 1.2
2 + 2 × 0.8 × 1.2 ×
1, 2 = 5.33
1 1
1.45 1.138 1 .8
5.266 5.284
=
.8 1.2 1.138 1.54 1 1.2
5.284 5.331
Z versus Y
$
=
1
.997
.997
1
10,00
9,00
8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
0,00
00
Estadística Descriptiva
02
04
06
08
10
51
Capı́tulo 4: Ejercicios propuestos
1. Para los datos siguientes: 28, 22, 35, 42, 44, 53, 58, 41, 40, 32, 31, 38, 37, 61, 25, 35.
(a) Calcula la mediana y los cuartiles.
(b) Dibuja el box-plot
(c) Construye un diagrama de tallo y hojas
(d) Calcula la media y la desviación tı́pica
(e) Llamando xi a los datos anteriores, calcula la media y la desviación tı́pica para los datos yi
obtenidos como yi = 5 + 10xi .
2. A continuación se proporciona el consumo en millas por galón de 68 coches fabricados en Europa.
29.5
31.9
41.5
26.0
25.0
27.0
43.1
26.0
30.5
37.3
24.0
29.0
30.0
44.3
21.5
29.0
31.5
19.0
16.5
21.0
30.0
25.0
33.0
23.0
24.0
25.0
29.0
19.0
17.0
24.0
35.0
20.0
23.0
30.7
23.0
26.0
26.0
36.0
21.6
25.0
36.4
43.4
24.0
18.0
27.0
16.2
25.0
25.4
44.0
28.0
30.0
29.8
34.3
26.0
28.1
27.2
29.0
22.0
28.0
20.3
22.0
26.0
20.0
29.0
26.0
31.0
36.0
26.0
(a) Construye el histograma con 6 clases
(b) Realiza el diagrama de tallos y hojas
(c) Obtén la mediana y los cuartiles
(d) Dibuja el box-plot. Indica las observaciones atı́picas.
(e) Transforma los datos con la función logarı́tmo: calcula la mediana y los cuartiles y dibuja el
box-plot de los datos transformados.
3. En un departamento cuatro profesores imparten clases en grupos con 10, 18, 22 y 150 alumnos
respectivamente. Si se pregunta a los profesores por el tamaño de su clase ¿cuál serı́a el valor medio
y la desviación tı́pica obtenida? ¿Y si se pregunta a todos los alumnos del departamento?
4. En la figura se presenta el diagrama de tallos y hojas de los residuos obtenidos de un diseño factorial.
Representa el diagrama de caja (box plot) de los datos. (Nota.- La rama -6|91 representa los valores
-0.69 y -0.61).
2
2
4
10
18
29
(16)
36
27
20
14
6
-6
-5
-4
-3
-2
-1
-0
0
1
2
3
4
|
|
|
|
|
|
|
|
|
|
|
|
91
00
766320
98754310
98654321100
9977666554433211
015566677
2333478
134789
23455699
011355
1
5. Para n piezas se han medido dos dimensiones xi e yi . Es posible que la varianza de la variable xi
sea 4, la de yi sea 9 y la de zi = xi + yi sea igual a 2? Justificar la respuesta.
6. Se toman 2 medidas xi e yi de n individuos. Dada dos constantes a y b positivas, demostrar que al
multiplicar xi por a e yi por b, el coeficiente de correlación entre ambas no varı́a.
7. Demostrar que si entre dos variables xi e yi existe una relación lineal exacta yi = a + bxi , con b > 0,
el coeficiente de correlación es uno.
8. Demostrar que el coeficiente de correlación es siempre en valor absoluto menor que uno.
9. En un proceso de fabricación se han medido tres variables y calculado la matriz de varianzas con
el resultado siguiente:


2 3 1
 3 4 2 
1 2 2
(a) ¿Podemos afirmar que hay un error en los cálculos?
(b) ¿Por qué?
10. A la variable x de media x = 100 se le ha aplicado una transformación con el logaritmo decimal
obteniéndose la nueva variable y = log10 (x). La media de la nueva variable es y = 2.5. ¿Es posible
este resultado?
2
Estadística
Parte II. Inferencia
Tema 5.
Estimación
Población
p
% DEFECTUOSA
Probabilidad
¿Conocido p
cuanto vale X ?
Muestra n
X ≡Nº Defectuosa
¿Conocido X
cuanto vale p ?
Estimación puntual
Inferencia
2
Inferencia
X
σ
MUESTRA n
µ
X → N (µ ,σ )
X 1 , X 2 ,..., X n
Parámetros
¿ µ ,σ ?
Datos Conocidos
?
3
Estimación puntual
Espesores de 150 obleas de Silicio (micras)
X
Estimación puntual
240
243
250
253
248
238
242
245
251
247
239
242
246
250
248
235
237
246
249
246
240
241
246
247
249
240
243
244
248
245
240
243
244
249
246
245
250
250
247
248
238
240
245
248
246
240
242
246
249
248
240
243
246
250
248
241
245
243
247
245
247
245
255
250
249
237
239
243
247
246
242
244
245
248
245
237
239
242
247
245
242
244
246
251
248
243
245
247
252
249
243
245
248
251
250
244
246
246
250
246
241
239
244
250
246
242
245
248
251
249
242
245
248
243
246
241
244
245
249
247
236
239
241
246
242
243
246
247
252
247
241
243
245
248
246
239
240
242
243
244
239
240
250
252
250
241
243
249
255
253
4
Histograma y función de densidad Normal
Histograma para Espesor
frecuencia
40
30
20
10
0
230
235
240
245
250
255
260
Espesor
5
Estimación puntual
Distintos problemas de inferencia
Dado un modelo para los datos:
x1 , x 2 ,..., x n
σ
µ
Estimar µ y σ
Dar un intervalo de confianza para µ y σ
Elegir entre (contraste de hipótesis):
µ ≥ 250 o µ < 250
Comprobar la validez del modelo (contraste
de bondad de ajuste).
Estimación puntual
6
Métodos de Estimación
X → f X ( x, θ1 , θ 2 ,..., θ r )
fX
conocida
Parámetros desconocid os
θ1 , θ 2 ,..., θ r
Dada una muestra aleatoria simple de X
x1 , x2 , … , xn
¿θ1 ,θ 2 ,...,θ r ?
→
1. Método de los momentos
2. Método de máxima verosimilitud
7
Estimación puntual
Métodos de los momentos
DATOS
VAR. ALEATORIA
x1 , x2 ,… , xn
a1 =

n
x
i =1 i
n
x2

i =1 i
=
f X ( x,θ1 ,θ 2 ,...,θ r )
α1 = E[ X ] = g1 (θ1,θ 2 ,...,θ r )
n
a2
n
⋮
ar =

n
xr
i =1 i
n
α 2 = E[ X 2 ] = g 2 (θ1,θ 2 ,...,θ r )
⋮
α r = E[ X r ] = g r (θ1,θ 2 ,...,θ r )
 g1 (θˆ1,θˆ2 , … ,θˆr ) = a1

Estimadores  g 2 (θˆ1,θˆ2 , … ,θˆr ) = a2
→
θˆ1 ,θˆ2 , …,θˆr
⋮

 g (θˆ ,θˆ , … ,θˆ ) = a
r
r
 r 1 2
Estimación puntual
8
Método de los momentos: Distribución normal
 1  x − µ  2 
1
exp  − 
 ,
2
σ
2π σ
 


f X ( x) =
σ
Parámetros : ¿ µ , σ ?
µ
x1, x2 ,…, xn
a1 =
a2 =

n
x
i=1 i

n
n 2
x
i=1 i
n
x∈ℜ
f X (x, µ,σ )
µˆ = x
α1 = E[ X ] = µ
σˆ 2 =
α2 = E[ X 2 ] = σ 2 + µ 2
1
xi2 − x 2 = s 2

n i =1
n
9
Estimación puntual
Método de máxima verosimilitud
Una fuente radiactiva emite partículas según un proceso de Poisson con media λ
desconocida. Durante 10 minutos se han contado el número de partículas emitidas:
12, 6, 11, 3, 8, 5, 3, 9, 7, 5
P( X 1 = 12, X 2 = 6,..., X 10 = 5) = e
−λ
=e
12!
−10λ
l (λ ) = e −10λ
Estimación puntual
λ12
×e
−λ
λ6
6!
×⋯× e
λ12+6+⋯+5
12!×6!×⋯× 5!
−λ
=e
λ5
5!
−10λ
λ69
12!×6!×⋯× 5!
λ69
12!×6!×⋯ × 5!
10
Función de verosimilitud
l (λ ) = e
2
4
6
8
10
6,9
λ69
−10λ
12!×6!×⋯ × 5!
λ
λˆ = 6,9
Estimador máximo-verosímil:
11
Estimación puntual
Función de verosimilitud
0
1,6E-11
-5
1,4E-11
-10
1,2E-11
-15
1E-11
-20
8E-12
-25
6E-12
lambda
−10λ
λ69
12!×6!×⋯ × 5!
L(λ) = log l(λ)
10
9,4
6,9
8,8
8,2
7,6
-40
7
0
6,4
-35
5,8
2E-12
5,2
-30
4
4E-12
l (λ ) = e
log probabilidad
1,8E-11
4,6
probabilidad
verosimilitud
Estimador máximo-verosímil: λˆ = 6,9
Estimación puntual
12
Estimación por máxima verosimilitud
X → f X ( x,θ1 , θ 2 ,..., θ r )
fX
conocida
Parámetros desconocidos : θ1 , θ 2 ,..., θ r
Muestra aleatoria simple : x1 , x2 ,..., xn
Distribución conjunta :
f ( x1 , x2 ,..., xn ;θ1 ,..., θ r ) =
= f X ( x1 ,θ1 , θ 2 ,..., θ r ) f X ( x2 , θ1 ,θ 2 ,..., θ r )⋯ f X ( xn ,θ1 , θ 2 ,..., θ r )
n
log f ( x1 , x2 ,..., xn ) =  log f X ( xi , θ1 ,θ 2 ,..., θ r ) = L(θ1 ,θ 2 ,..., θ r )
i =1
θˆ1 ,θˆ2 ,..., θˆr  L(θˆ1 , θˆ2 ,..., θˆr ) = max L(θ1 , θ 2 ,..., θ r )
13
Estimación puntual
Máx. verosimilitud: Distribución normal
 1  x − µ  2 
1
exp− 
f X ( x) =
 , x ∈ ℜ
2π σ
 2  σ  
Parámetros : ¿ µ , σ ?
x1, x2 ,...,xn : muestraaleatoriasimple
1
1
1
1
− 2  ( xi −µ )2
1 − 2σ 2 ( x1 −µ )2 1 − 2σ 2 ( x2 −µ )2
1 − 2σ 2 ( xn −µ )2
1
i=1
f (x1, x2 ,...,xn ) =
e
e
e
e 2σ
=
⋯
n/ 2 n
(2π ) σ
2π σ
2πσ
2πσ
n
n
1
L(µ,σ 2 ) = log f (x1, x2 ,...,xn ) = − log(2π ) − logσ 2 − 2 in=1 (xi − µ)2
2
2
2σ
∂L 1 n


ˆ
µ
x
(
)
0
=
−
=

1
=
i
i


∂µ σ 2

  µˆ = x
max L : 
 2 2
 ∂L
 σˆ = s
n 1
1 n
2
∂σ 2 = − 2 σˆ 2 + 2σˆ 4 i=1 ( xi − µˆ ) = 0


Estimación puntual
n
14
Máx. Verosimilitud: Poisson
P( X = x) = e
−λ
λx
x!
Muestra aleatoria simple : x1 , x2 ,..., xn
, x = 0,1,2,... → Parámetro λ
p ( x1, x2 ,..., xn ) = P( X 1 = x1 , X 2 = x2 ,⋯ , X n = xn )
=e
−λ
λx
1
x1!
e
−λ
λx
2
x2 !
⋯e
−λ
λx
n
xn !
=e
λΣ x
i
−λn
x1! x2!⋯ xn !
L(λ ) = −λn + (Σ xi ) log λ −  log xi !
max L(λ ) :
Σx
dL(λ )
= −n + i = 0  λˆ = x
dλ
λˆ
15
Estimación puntual
Máx. verosimilitud: Binomial(n,p)
Proporción defectuosas = ¿ p ?
Muestra (Bernoulli ) :
x1 , x 2 ,..., x n
n
 0 si es Aceptable
xi = 
1 si es Defectuosa
p( x1 , x 2 ,..., x n ) = P( X 1 = x1 , X 2 = x 2 ,..., X n = x n )
= P( X 1 = x1 ) P ( X 2 = x 2 ) ⋯ P ( X n = x n )
x
n− x
= p  i (1 − p )  i
= p r (1 − p ) n−r
donde r =  xi es el nº de defectuosas
L(p) = r log p + (n − r ) log(1 − p )
dL( p ) r n − r
r
= −
= 0 → pˆ =
dp
pˆ 1 − pˆ
n
Estimación puntual
16
Distribución de media (normal)
X 1 , X 2 ,..., X n
σ
X =
µ
X → N (µ ,σ )
X1 + X 2 + ⋯ + X n
n
E[ X 1 ] + E[ X 2 ] + ⋯ + E[ X n ] µ + µ + ⋯ + µ
=
=µ
n
n
Var[ X 1 ] + Var[ X 2 ] + ⋯ + Var[ X n ] σ 2 + σ 2 + ⋯ + σ 2 σ 2
=
=
Var[ X ] =
n
n2
n2
E[ X ] =
X → N (µ ,
σ
n
)
17
Estimación puntual
Histograma de Espesores
1000
frecuencia
800
600
400
200
0
230
235
240
245
250
255
260
Espesores
Frecuencia/Probabilidad
Distribución de la Media de 5 observaciones
1200
1000
800
600
400
200
0
230
235
240
245
250
255
260
Media
Estimación puntual
18
Distribución de S2 (Normal)
X 1 , X 2 ,..., X n
σ
( X1 − X )2 + ( X 2 − X )2 + ⋯ + ( X n − X )
S =
n
2
µ
X → N (µ ,σ )
S2 =
1 n
1 n
( X i − X ) 2 = 1 X i2 − X 2

1
n
n
E[ S 2 ] =
1
1
n −1 2
σ2
Σ E[ X i2 ] − E[ X 2 ] = Σ (σ 2 + µ 2 ) − (
+ µ2) =
σ
n
n
n
n
( X − X )2 + ( X 2 − X )2 + ⋯ + ( X n − X )2
Sˆ 2 = 1
n −1
n
S 2  E[ Sˆ 2 ] = σ 2
Sˆ 2 =
n −1
19
Estimación puntual
Distribución χ2
Z1, Z2 ,...,Zn → N (0,1) independientes
Z12 + Z22 + ⋯+ Zn2 → χn2
Propiedades
⊗ E[χ n2 ] = n
⊗ Var[χ n2 ] = 2n
⊗ χ n2 + χ m2 = χ n2+ m
Estimación puntual
( χ n2 y χ m2 indep.)
20
Chi-Cuadrado con 4 gl
Distribución Chi-cuadrado con 4 g.l.
0.2
densidad
0.16
0.12
0.08
0.04
0
0
4
8
12
16
20
21
Estimación puntual
Tabla χ2
α
χν,1-α
ν: grados de libertad (g.l.)
EJEMPLO
P(χ9 ≥ 19,02) = 0,025
Estimación puntual
g.l.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
0,995
,00004
,01002
,0717
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,260
9,886
10,520
11,160
11,808
12,461
13,121
13,787
20,707
27,991
35,534
43,275
51,172
59,196
67,328
83,852
0,990
,00016
,0201
0,115
0,297
0,554
0,872
1,239
1,647
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,878
13,565
14,256
14,953
22,164
29,707
37,485
45,442
53,540
61,754
70,065
86,923
0,975
,00098
0,051
0,216
0,484
0,831
1,237
1,690
2,180
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907
9,591
10,283
10,982
11,689
12,401
13,120
13,844
14,573
15,308
16,047
16,791
24,433
32,357
40,482
48,758
57,153
65,647
74,222
91,573
0,950
,00393
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493
26,509
34,764
43,188
51,739
60,391
69,126
77,929
95,705
0,500
0,455
1,386
2,366
3,357
4,351
5,348
6,346
7,344
8,343
9,342
10,341
11,340
12,340
13,339
14,339
15,338
16,338
17,338
18,338
19,337
20,337
21,337
22,337
23,337
24,337
25,336
26,336
27,336
28,336
29,336
39,335
49,335
59,335
69,334
79,334
89,334
99,334
119,334
0,050
3,841
5,991
7,815
9,488
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21,03
22,36
23,68
25,00
26,30
27,59
28,87
30,14
31,41
32,67
33,92
35,17
36,42
37,65
38,89
40,11
41,34
42,56
43,77
55,76
67,50
79,08
90,53
101,88
113,15
124,34
146,57
0,025
5,024
7,378
9,348
11,14
12,83
14,45
16,01
17,53
19,02
20,48
21,92
23,34
24,74
26,12
27,49
28,85
30,19
31,53
32,85
34,17
35,48
36,78
38,08
39,36
40,65
41,92
43,19
44,46
45,72
46,98
59,34
71,42
83,30
95,02
106,63
118,14
129,56
152,21
0,010
6,635
9,210
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,73
26,22
27,69
29,14
30,58
32,00
33,41
34,81
36,19
37,57
38,93
40,29
41,64
42,98
44,31
45,64
46,96
48,28
49,59
50,89
63,69
76,15
88,38
100,43
112,33
124,12
135,81
158,95
0,005
7,879
10,60
12,84
14,86
16,75
18,55
20,28
21,95
23,59
25,19
26,76
28,30
29,82
31,32
32,80
34,27
35,72
37,16
38,58
40,00
41,40
42,80
44,18
45,56
46,93
48,29
49,65
50,99
52,34
53,67
66,77
79,49
91,95
104,21
116,32
128,30
140,17
163,65
22
Distribución de S2 (Normal)
23
Estimación puntual
Distribución de S2 (Normal)
nS 2
σ2
n
X −X
=   i
σ
i =1 
(n − 1) Sˆ 2
σ2
Estimación puntual
n
2

 dist

→ χ n2−1

X −X
=   i
σ
i =1 
2

 dist

→ χ n2−1

24
Histograma de Espesores
1000
frecuencia
800
600
400
200
0
230
235
240
245
250
255
260
Espesores
Histograma para Varianzas
500
frecuencia
400
300
200
100
0
0
20
40
60
80
varianza muestral
25
Estimación puntual
Distribución de la media (general)
X i → f ( x,θ ) : Var[ X i ] < ∞
X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias independientes
X1 + X 2 + ⋯ + X n
n
E[ X 1 ] + E[ X 2 ] + ⋯ + E[ X n ]
E[ X ] =
n
Var[ X 1 ] + Var[ X 2 ] + ⋯ + Var[ X n ]
Var[ X ] =
n2
Si las variables tienen la misma media y varianza
X=
µ = E[X i ] ∀i
σ 2 = Var[X i ] ∀i
n→∞
 E[ X ] = µ
X1 + X 2 + ⋯ + X n
σ


X=
σ 2  X → N (µ , )
n
n
Var[ X ] = n
Estimación puntual
26
Binomial
Binomial : X 1 , X 2 ,..., X n
E[ X i ] = p
0 si es Aceptable
Xi = 

Var[ X i ] = p (1 − p )
1 si es Defectuosa
E[ pˆ ] = p

X1 + X 2 + ⋯ + X n
p (1 − p )
→
pˆ =
Var[ pˆ ] =
n

n
pˆ → N ( p,
n →∞
p (1 − p )
)
n
27
Estimación puntual
Poisson
Poisson : X 1 , X 2 ,..., X n
λk
 E[ X i ] = λ

k!
 Var[ X i ] = λ
 E[λˆ ] = λ
X
X
X
+
+
+
⋯

n
1
2
λˆ =
→
ˆ] = λ
λ
Var
[
n

n
P( X i = k ) = e
−λ
λˆ → N (λ ,
n →∞
Estimación puntual
λ
n
)
28
Propiedades de los estimadores
X 1 , X 2 ,..., X n m.a.s de f ( x ,θ ) : θˆ ≡ θˆ ( X 1 , X 2 ,..., X n )
(Sesgo[θˆ] = E[θˆ] − θ )
Centrados: E[θˆ] = θ
Varianza mínima: ∀θˆ': Var[θˆ] ≤ Var[θˆ' ]
Error cuadrático medio mínimo
ECM[θˆ] = E[(θˆ − θ ) 2 ] = Sesgo 2 (θˆ) + Var (θˆ)
Consistentes
lim E[θˆ] = θ
n →∞
y
lim Var[θˆ] = 0
n →∞
29
Estimación puntual
Ejemplo 1
1 n
X 1 , X 2 ,..., X n m.a.s de N ( µ , σ ) : X =  X i
n i =1
Es centrado : E[ X ] = µ
Es de varianza mínima
Es consistente :
lim E[ X ] = µ y
n →∞
Estimación puntual
lim Var[ X ] = 0
n →∞
30
Ejemplo 2
1 n
X 1 , X 2 ,..., X n m.a.s de N ( µ , σ ) : S =  ( X i − X ) 2
n i =1
n −1 2
σ
No es centrado : E [ S 2 ] =
n
2
2
Sesgo ( S ) = −
σ2
n
Varianza :
 nS 2 
2 ( n − 1) 4
σ
Var  2  = Var χ n2−1 = 2( n − 1)  Var [ S 2 ] =
2
σ
n


[
]
Es consistent e :
lim
n→∞
E[ S 2 ] = σ 2
y
lim
n→∞
Var[ S 2 ] = 0
31
Estimación puntual
Concepto de intervalo de confianza
Se ha realizado una encuesta a 400 personas elegidas al azar para
estimar la proporción p de votantes de un partido político.
¿p?
Intervalos de confianza
Resultado Encuesta
Sí
220
No/Otros 180
32
Introducción
aprox .
X → B (n, p )
pˆ =
X → N ( np , np (1 − p ) )
X
→ N ( p,
n
p (1 − p )
)
n
N(0,1)
pˆ − p
→ N ( 0 ,1)
p (1 − p )
n
33
Intervalos de confianza
Nivel de CONFIANZA
α/2
N(0,1)
α/2
1-α
-zα/2
zα/2
pˆ − p
≤ zα / 2 ) = 1 − α
p(1 − p)
n
pˆ − p
Despejando p de : − zα / 2 ≤
≤ zα / 2
p (1 − p )
n
P(− zα / 2 ≤
Intervalos de confianza
34
− zα / 2 ≤
− zα / 2 ≤
pˆ − zα / 2
pˆ (1 − pˆ )
≤
n
pˆ − p
≤ zα / 2
p(1 − p )
n

pˆ − p
≤ zα / 2
pˆ (1 − pˆ )
n

Nivel de confianza:
(1-α)
Tamaño n
Muestral
Intervalos de confianza
Ejemplo
pˆ =
0,63
0,55× 0,45
400
n = 100
n = 400
0,51
0,67
0.55× 0.45
400
n = 100
n = 400
0,49
Intervalos de confianza
95 %
0,55 0,59
0,43
p ∈ 0.55 ± 2.58
35
220
= 0,55
400
0,47
p ∈ 0,55±1,96
pˆ (1 − pˆ )
n
p ≤ pˆ + zα / 2
0,55
99 %
0,61
36
1. Normal: Intervalo para µ con σ conocido
X 1 , X 2 ,..., X n → N ( µ ,σ )
X → N (µ ,
σ
n
)
N(0,1)
X −µ
→ N (0,1)
σ/ n
X −µ
− zα / 2 ≤
≤z
σ / n α /2
x − zα / 2
σ
n
≤ µ ≤ x + zα / 2
α/2
α/2
-zα/2
σ
n
zα/2
µ ∈ x ± zα / 2
σ
n
37
Intervalos de confianza
2. Normal:Intervalo para µ con σ desconocido
X → N (µ ,
σ
n
)
X 1, X 2 ,..., X n → N ( µ ,σ )
X −µ
tn-1
→ N (0,1)
σ/ n
α/2
X −µ
→ tn −1
Sˆ / n
- tα/2
tα/2
X −µ
− t n −1,α / 2 ≤
≤ tn −1,α / 2
Sˆ / n
sˆ
sˆ
sˆ
≤ µ ≤ x + tn −1,α / 2
x − t n −1,α / 2
µ ∈ x ± tn−1,α / 2
n
n
n
Intervalos de confianza
α/2
38
Distribución t de Student
Z → N (0,1)
V → χ 2p
Z ,V son independientes
Z
→ tp
V/p
-4,00
-3,00
N(0,1)
t4
t2
t1
-2,00
-1,00
0,00
1,00
2,00
3,00
4,00
39
Intervalos de confianza
3. Normal: Intervalo para σ2
X 1, X 2 ,..., X n → N ( µ ,σ )
2
n
X
−
X
(
)

i
S = i =1
ˆ2
(n − 1) Sˆ 2
σ2
n −1
2
P( χα / 2 ≤
(n − 1) sˆ 2
χ12−α / 2
(n − 1) Sˆ 2
σ2
2
≤σ ≤
Intervalos de confianza
→ χ n2−1
≤ χ12−α / 2 ) = 1 − α
(n − 1) sˆ 2
2
χα / 2
χ n2−1
α/2
χα2 / 2
α/2
χ12−α / 2
40
EJEMPLO 1. La resistencia a la compresión de 15
probetas de acero elegidas al azar es:
40,15 65,10 49,50 22,40 38,20
60,40 43,40 26,35 31,20 55,60
47,25 73,20 35,90 45,25 52,40
X −µ
→ t14
Sˆ / 15
− 2,98 ≤
t14
X −µ
≤ 2,98
Sˆ / 15
0,005
x = 45,75 sˆ = 14,2
14,2
14,2
45,75 − 2,98
≤ µ ≤ 45,75 + 2,98
15
15
99 % confianza:
0,005
- 2,98
2,98
34,8 ≤ µ ≤ 56,7
41
Intervalos de confianza
2
χ 14
0,005
0,005
0,00
5,00
10,00
15,00
20,00
25,00
( n − 1) Sˆ 2
P(4,07 ≤
35,00
31,3
4,07
σ2
30,00
→
χ n2−1
14 Sˆ 2
sˆ 2 = 201,6
σ
2
14 Sˆ 2
σ2
2
→ χ14
≤ 31,3) = 0,99
14 × 201,6
14 × 201,6
≤σ2 ≤
31,3
4,07
99% confianza: 90,2 ≤ σ2 ≤ 693,6
Intervalos de confianza
42
4. Poisson: Intervalo para λ
X 1 , X 2 ,… , X n → Poisson (λ )
aprox
λˆ = X → N(λ ,
λ
n
)
N(0,1)
α/2
α/2
λˆ − λ
-zα/2
zα/2
→ N(0,1)
λ/n
λˆ − λ
P (− zα / 2 ≤
≤ zα / 2 ) = 1 − α
λ/n
λˆ
λˆ
ˆ
ˆ
λ − zα / 2
≤ λ ≤ λ + zα / 2
n
n
43
Intervalos de confianza
α
Tabla
t-Student
α
tν,α
ν: grados de libertad (g.l.)
EJEMPLO
P(t9 ≥ 2,262) = 0,025
Intervalos de confianza
g.l
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
infinito
0,20
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
0,851
0,849
0,848
0,847
0,846
0,846
0,845
0,842
0,20
0,15
1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
1,088
1,083
1,079
1,076
1,074
1,071
1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,050
1,047
1,045
1,044
1,043
1,042
1,042
1,036
0,15
0,10
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,299
1,296
1,294
1,292
1,291
1,290
1,282
0,10
0,05
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,684
1,676
1,671
1,667
1,664
1,662
1,660
1,645
0,05
0,025
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,021
2,009
2,000
1,994
1,990
1,987
1,984
1,960
0,025
0,01
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,403
2,390
2,381
2,374
2,368
2,364
2,327
0,01
0,005
63,656
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,678
2,660
2,648
2,639
2,632
2,626
2,576
0,005
0,0025
127,321
14,089
7,453
5,598
4,773
4,317
4,029
3,833
3,690
3,581
3,497
3,428
3,372
3,326
3,286
3,252
3,222
3,197
3,174
3,153
3,135
3,119
3,104
3,091
3,078
3,067
3,057
3,047
3,038
3,030
2,971
2,937
2,915
2,899
2,887
2,878
2,871
2,808
0,0025
0,001
318,289
22,328
10,214
7,173
5,894
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,307
3,261
3,232
3,211
3,195
3,183
3,174
3,091
0,001
0,0005
636,578
31,600
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,768
3,745
3,725
3,707
3,689
3,674
3,660
3,646
3,551
3,496
3,460
3,435
3,416
3,402
3,390
3,291
0,0005
44
α
Tabla χ2
α
χν,1-α
ν: grados de libertad (g.l.)
EJEMPLO
P(χ9 ≥ 19,02) = 0,025
Intervalos de confianza
g.l.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
0,995
,00004
,01002
,0717
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,260
9,886
10,520
11,160
11,808
12,461
13,121
13,787
20,707
27,991
35,534
43,275
51,172
59,196
67,328
83,852
0,990
,00016
,0201
0,115
0,297
0,554
0,872
1,239
1,647
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,878
13,565
14,256
14,953
22,164
29,707
37,485
45,442
53,540
61,754
70,065
86,923
0,975
,00098
0,051
0,216
0,484
0,831
1,237
1,690
2,180
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907
9,591
10,283
10,982
11,689
12,401
13,120
13,844
14,573
15,308
16,047
16,791
24,433
32,357
40,482
48,758
57,153
65,647
74,222
91,573
0,950
,00393
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493
26,509
34,764
43,188
51,739
60,391
69,126
77,929
95,705
0,500
0,455
1,386
2,366
3,357
4,351
5,348
6,346
7,344
8,343
9,342
10,341
11,340
12,340
13,339
14,339
15,338
16,338
17,338
18,338
19,337
20,337
21,337
22,337
23,337
24,337
25,336
26,336
27,336
28,336
29,336
39,335
49,335
59,335
69,334
79,334
89,334
99,334
119,334
0,050
3,841
5,991
7,815
9,488
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21,03
22,36
23,68
25,00
26,30
27,59
28,87
30,14
31,41
32,67
33,92
35,17
36,42
37,65
38,89
40,11
41,34
42,56
43,77
55,76
67,50
79,08
90,53
101,88
113,15
124,34
146,57
0,025
5,024
7,378
9,348
11,14
12,83
14,45
16,01
17,53
19,02
20,48
21,92
23,34
24,74
26,12
27,49
28,85
30,19
31,53
32,85
34,17
35,48
36,78
38,08
39,36
40,65
41,92
43,19
44,46
45,72
46,98
59,34
71,42
83,30
95,02
106,63
118,14
129,56
152,21
0,010
6,635
9,210
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,73
26,22
27,69
29,14
30,58
32,00
33,41
34,81
36,19
37,57
38,93
40,29
41,64
42,98
44,31
45,64
46,96
48,28
49,59
50,89
63,69
76,15
88,38
100,43
112,33
124,12
135,81
158,95
0,005
7,879
10,60
12,84
14,86
16,75
18,55
20,28
21,95
23,59
25,19
26,76
28,30
29,82
31,32
32,80
34,27
35,72
37,16
38,58
40,00
41,40
42,80
44,18
45,56
46,93
48,29
49,65
50,99
52,34
53,67
66,77
79,49
91,95
104,21
116,32
128,30
140,17
163,65
45
Capı́tulo 5: Ejercicios propuestos
1. La variable aleatoria X tiene distribución binomial con parámetros n y p, ambos desconocidos. Si
{16,18,22,25,27} es una muestra aleatoria simple de la distribución anterior, estimar por el método
de los momentos n y p.
2. Los taxis en servicio de una ciudad están numerados del 1 al N. Se observa una muestra de 10 taxis
y se apuntan sus números. Obtener un estimador de N por el método de los momentos.
3. Una variable aleatoria discreta puede tomar los valores 0, 1 y 2 con probabilidades 1.5/θ, 2.5/θ y
(θ − 4)/θ respectivamente. Se toma una muestra de tamaño 25 con los resultados siguientes (la
segunda fila corresponde a la fracción observada Oi para 0, 1 y 2).
x
Oi
0
17
1
5
2
3
(a) Estimar θ por máxima verosimilitud.
(b) Se ha tomado una muestra de tamaño 10 del tiempo, en minutos, entre el paso de dos autobuses
T en una parada con los siguientes resultados: 9,10,6,4,15,6,1,5,4,10.
(c) Si la función de distribución del tiempo de paso es F (t) = 1−exp(−αt), calcular la probabilidad
estimada de esperar al autobús más de 10 minutos.
4. La función de distribución de una variable aleatoria es

x < 0,
 0
α
(x/β) 0 ≤ x ≤ β,
F (x) =

1
x > β.
donde los parámetros α y β son positivos. Estimar los parámetros de la distribución por el método
de máxima verosimilitud.
5. El club de tiro de una determinada ciudad está estudiando la distancia X del punto de impacto del
proyectil al centro de la diana de sus 13 mejores tiradores.
Sabiendo que la función de densidad de la variable aleatoria presentada es
2x
x2
x ≥ 0, θ ≥ 0,
2 exp[− 2 ],
θ
θ
Estimar θ si la distancia en cm al blanco de 10 tiradores fue
f (x) =
2,1
3,2
6,3
5,4
2,2
6,9
7,1
6,6
2,5
9,1
y la distancia de los otros tres fue mayor que la distancia máxima permitida en su categorı́a que es
de 11cm.
6. Una compañı́a, para determinar el número de consumidores de un determinado producto en Madrid,
ha encuestado a personas elegidas al azar hasta encontrar a 20 que utilicen el producto. Estimar por
máxima verosimilitud la proporción de consumidores en la ciudad si el número total de entrevistados
ha sido 115
1
7. Se supone que el tiempo que tarda un paciente en recuperarse totalmente de una dolencia cuando
se le aplica el tratamiento A es una variable aleatoria exponencial. Si al observar a 20 pacientes, al
cabo de 20 dı́as 15 no se han recuperado, mientras que los 5 restantes tardaron 17, 15, 19, 18 y 17
dı́as en hacerlo, estime por máxima verosimilitud el tiempo medio hasta la recuperación total..
8. El tiempo de duración de ciertos componentes electrónicos es una variable aleatoria con distribución
exponencial. Se ha realizado un ensayo con 10 componentes cuyos tiempos de duración han sido:
37,45,92,104,109,200,295. Despues de 400 horas, tres componentes seguı́an funcionando. Con esta
información, estimar por máxima verosimilitud el parámetro de la distribución exponencial.
9. Sea X1 , X2 , ..., Xn una muestra aleatoria simple de la función de densidad
f (x) = 2(θ − x)/θ2 , 0 ≤ x ≤ θ.
Obtener por el método de los momentos un estimador insesgado de θ y calcular su varianza.
10. Sea X la media aritmética de una muestra aleatoria simple de una distribución N(µ, σ). Se define
X̂ = cX como nuevo estimador para µ. Determinar c (en función de µ y σ) para que el nuevo
estimador tenga Error Cuadrático Medio (ECM) mı́nimo. Calcular c si se sabe que el coeficiente
de variación σ/µ = 2.
11. x1 , x2 , ..., xn es una muestra aleatoria simple de una distribución normal con parámetros desconocidos. Para estimar la varianza se propone el siguiente estimador
S2 = k
n−1
X
n
X
(xi − xj )2 .
i=1 j=i+1
Determinar k para que el estimador sea centrado.
12. Para estimar la media σ 2 de una población normal se utiliza el estimador σ
b2 = kb
s2 , siendo sb2
la varianza muestral corregida y k una constante. Calcular el valor de k que minimiza el error
cuadrático medio. (Utilizar V ar[χ2g ] = 2g, siendo g el número de grados de libertad).
13. Los tiempos de funcionamiento de dos componentes electrónicos distintos siguen distribuciones
exponenciales con esperanzas µ y 2µ. Se han obtenido los tiempos de fallo de una muestra de cada
tipo de componente, en ambos casos de tamaño n. Obtener el estimador de máxima verosimilitud
de µ, calcular su media y su varianza.
14. Un sistema de lectura telemática de consumo de energı́a eléctrica emplea un mensaje de 128bit. Ocasionalmente las interferencias aleatorias provocan que un bit se invierta produciéndose un
error de transmisión. Se acepta que la probabilidad de que cada bit cambie en una transmisión
es constante e igual a p, y que los cambios son independientes. Estima el valor de p si se ha
comprobado que de las últimas 10000 lecturas efectuadas (todas de 128-bit) 340 eran erróneas.
15. Un estudiante ha realizado el siguiente ejercicio de simulación. Ha generado con STATGRAPHICS
100 observaciones de una normal de media 10 y desviación tı́pica 1. Para estos 100 datos ha obtenido
la mediana y la ha denominado M1 . Ha repetido el mismo proceso n= 10000 veces. De forma que
ha obtenido M1 , M2 , ..., Mn . En el gráfico se muestra el histograma de estos 10000 valores, que
tienen media 10.002 y desviación tı́pica 0.1266.
2
A partir de esta simulación, explica qué propiedades tiene la mediana como estimador de la media
de una distribución normal, sus ventajas e inconvenientes.
16. Se han tomado 12 valores de una variable fı́sica X, que se supone sigue una distribucin Normal,
resultando
30.2, 30.8, 29.3, 29, 30.9, 30.8, 29.7, 28.9, 30.5, 31.2, 31.3, 28.5.
(a) Construir un intervalo de confianza para la media de la población al 95% de confianza.
(b) Construir un intervalo de confianza para la varianza de la población con el mismo nivel de
confianza del apartado anterior.
17. En la lista adjunta se indica la edad y el área cientı́fica en que trece importantes cientı́ficos de
diversas áreas descubrieron la teorı́a que les ha dado la fama. Construir con estos datos un intervalo
de confianza para la edad a la que los cientı́ficos realizan su contribución más importante: Galileo
(34, astronomı́a), Franklin (40, electricidad), Lavoisier (31, quı́mica), Lyell (33, geologı́a), Darwin
(49, biologı́a), Maxwell (33, ecuaciones de la luz), Curie (34, radiactividad), Plank (43, teorı́a
cuántica), Marx (30, socialismo cientı́fico), Freud (31, psicoanálisis), Bohr (26, modelo del átomo),
Einstein (26, relatividad), Keynes (36, macroeconomı́a).
18. Una muestra de 12 estaciones de servicio de una cadena de gasolineras proporciona un ingreso medio
por persona al mes de 2340 euros con una desviación tı́pica de 815 euros. Calcular un intervalo de
confianza para el ingreso medio por trabajador en esta empresa. Calcular el número de estaciones
que debemos estudiar para que el intervalo tenga una amplitud máxima de 500 euros.
19. Se han escogido al azar 15 probetas de un determinado acero, cuya resistencia a la compresión se
supone que se distribuye normalmente, y se ha medido ésta en las unidades adecuadas, habiéndose
observado los resultados siguientes
40.15, 65.10, 49.5, 22.4, 38.2, 60.4, 43.4, 26.35, 31.2, 55.6, 47.25, 73.2, 35.9, 45.25, 52.4
(a) Estimar la resistencia media del acero y su varianza.
3
(b) Hallar un intervalo de confianza del 99% para la resistencia media.
(c) Hallar un intervalo de confianza del 99% para la varianza.
(d) Cuántas probetas deberı́an haberse utilizado en el estudio si se quisiera estimar la resistencia
media del acero con una precisión de ±6 unidades y una confianza del 95%?.
20. Una compañı́a de comida precocinada desea lanzar al mercado un nuevo producto. Para conocer la
aceptación del mismo realiza previamente una encuesta entre 200 personas elegidas al azar, de las
que 37 manifiestan su disposición a comprarlo. Obtener un intervalo de confianza (α = 0.05) para
la proporción p de compradores potenciales de este nuevo producto. ¿Cúal deberı́a ser el tamaño
muestral si se quisiera reducir la longitud del intervalo a la mitad.
21. Se desea estimar la proporción de niños entre 0 y 14 años que se encuentran adecuadamente vacunados contra la poliomielitis. Si se quiere que la diferencia en valor absoluto entre la estimación
final y el verdadero valor de la proporción sea menor que 0.05 con probabilidad 0.95, ¿ Cúal es el
tamaño muestral mı́nimo requerido?.
22. Una roca lunar es enviada a un laboratorio para determinar su nivel de radiactividad θ, nivel que se
mide por el número medio de partı́culas emitidas por hora. Después de 15 horas, el equipo Geiger
ha contabilizado un total de 3.547 partı́culas emitidas. Aceptando que el número de partı́culas
emitidas sigue una distribución de Poisson, dar un intervalo con 95% de confianza para el nivel
de radiactividad de la roca. (Nota.- Utilizar que si Z tiene distribución N(0,1), entonces P (Z ≤
1.96) = 0.975).
23. Teniendo en cuenta que si X1 , X2 , . . . , Xn es una muestra aleatoria simple de una variable aleatoria
exponencial con función de densidad, f (x) = λ1 e−x/λ , x ≥ 0, λ > 0; el estadı́stico U = 2nX/λ
tiene distribución χ22n , donde X = (X1 +X2 +· · ·+Xn )/n; resolver la cuestión siguiente: El tiempo de
funcionamiento de un equipo electrónico es una variable aleatoria con distribución exponencial. Se
han tomado los tiempos de funcionamiento hasta el fallo de 30 equipos elegidos al azar, obteniéndose
6.2 × 103 horas de media. Calcular un intervalo con 95 % de confianza para la vida media de un
equipo.
24. En una centralita ha habido 180 llamadas durante las últimas dos horas. Obtenga un intervalo de
confianza para la esperanza del número de llamadas por hora suponiendo que el número de llamadas
durante un periodo de duración T cualquiera sigue una distribución de Poisson.
25. La velocidad de una molécula según el modelo de Maxwell, es una variable aleatoria con función
de densidad

 √4 × 1 x2 exp −(x/α)2 , x ≥ 0
f (x) =
π α3
 0, x ≤ 0.
donde α > 0, es el parámetro de la distribución y se verifica que
2α
3 4
E(X) = √ y V ar(X) = − α2 .
2 π
π
(a) Calcular el estimador máximo verosı́mil de α y su varianza asintótica.
(b) Calcular el estimador por momentos de α y la varianza de dicho estimador.
4
(c) Para una muestra de tamaño n=100, para la que se verifica que
100
P
i=1
xi = 342 y que
100
P
i=1
x2i = 1339,
hallar un intervalo de confianza de α con el 95% de confianza utilizando ambos estimadores.
26. Los núcleos (radionucleidos) del elemento radiactivo Carbono 14 (C 14 ) se desintegran aleatoriamente. El tiempo que tarda en desintegrarse cada radionucleido es una variable aleatoria con
distribución exponencial de media 8, 27 × 103 años.
(a) Si inicialmente habı́a 1012 radionucleidos, obtener el número esperado de los radionucleidos
sin desintegrar al cabo de los 20.000 años.
(b) Obtener, para la variable aleatoria número de radionucleidos sin desintegrar al cabo de 20.000
años, un intervalo que contenga al valor de esa variable con probabilidad 0, 95 e interpretar el
resultado.
(c) Una pieza arqueológica ha estado enterrada durante 20.000 años al cabo de los cuales se han
observado 1010 radionucleidos de C 14 . Estimar por el método de los momentos el número
inicial de radionucleidos N y calcular la media y la varianza del estimador obtenido.
(d) Determinar el tiempo que debe transcurrir para que el número de radionucleidos iniciales se
reduzca a la mitad.
5
Estadística
Parte II. Inferencia
Tema 6.
Contraste de
Hipótesis
Karl Pearson
(1857-1936)
Contraste de Hipótesis
Se ha realizado una encuesta a 400 personas elegidas al azar
Llamando p a la proporción de votantes del partido político A.
Podemos afirmar que p > 0.5.
¿p?
Resultado Encuesta
Sí
No/Otros
Contrastes de hipótesis
220
180
2
Contraste de hipótesis
H0 :
p ≤ 0.5
H1 :
p > 0.5
Pˆ → N ( p,
H0 :
p = 0 .5
H1 :
p > 0 .5
p (1 − p )
)
n
Si H 0 es cierto p = 0.5
Pˆ − 0.5
→ N (0,1)
0.5 × 0.5
400
3
Contrastes de hipótesis
Nivel de significación α
α = P( rechazar H0 | H0 es cierta)
Región de
Aceptación de Ho
N(0,1)
Región de
Rechazo Ho
α
zα
Contrastes de hipótesis
4
0.55 − 0.5
=2
0.5 × 0.5
400
Elegido el nivel de significación α = 0.05
Muestra pˆ = 0.55  z0 =
R.R. H0
R.A. Ho
0.05
0
1.64
2
z0 = 2 > zα = 1.64  Se rechaza H 0
Con un nivel de significación de α = 0.05  p > 0.5
5
Contrastes de hipótesis
Probabilidad de
Aceptar Ho
H0 CIERTA
α Error I
p=0.5
0.5
H0 FALSA
Error II
p = 0.6
c
Probabilidad de
Rechazar Ho
β
c 0.6
Rechazar Ho
Aceptar Ho
c
Contrastes de hipótesis
6
Tipos de errores
RESULTADO CONTRASTE
Se Rechaza Ho
REALIDAD
Se Acepta Ho
Ho
CIERTA
Ho
FALSA
Ok
Error tipo I
Error tipo II
Ok
α
β
7
Contrastes de hipótesis
Tipos de Contrastes
H0 :
p = 0 .5
H0 :
p = 0 .5
H1 :
p > 0 .5
H1 :
p ≠ 0 .5
BILATERAL
UNILATERAL
R.R.Ho
R.R.Ho
R.A. Ho
α
zα
α/2
R.R.Ho
α/2
R.A. Ho
-zα/2
zα/2
Nivel de significación α
Contrastes de hipótesis
8
Nivel crítico o p-valor
H0 :
p = p0
H1 :
p > p0
Pˆ → N ( p,
p (1 − p )
)
n
p − valor = Pr ( Pˆ > pˆ | H 0 es cierto)
Pˆ − p0
pˆ − p0
>
= Pr(
)
p0 (1 − p0 )
p0 (1 − p0 )
n
n
= Pr( Z > z0 )
9
Contrastes de hipótesis
Ejemplo
Datos:
pˆ =
220
= 0.55
400
R.R. H0
Región de
Aceptación
Ho
0
α = 0.05
p − valor
0.0228
2
1.64
Contrastes de hipótesis
10
Relación entre p-valor y α
R.R. H0
p-valor < α
α
p − valor < α
0
Se rechaza H0
zα
R.R. H0
p-valor ≥ α
α
p − valor ≥ α
No se rechaza H0
0
zα
11
Contrastes de hipótesis
1. Normal: Contraste para µ con σ conocido
X1, X 2 ,..., X n → N (µ,σ )
H 0 : µ = µ0
X → N (µ ,
σ
n
)
X −µ
→ N (0,1)
σ/ n
x − µ0
z0 =
σ/ n
Contrastes de hipótesis
R.R
R.R.
H1 : µ ≠ µ 0
1-α
α/2
N(0,1)
α/2
R. Acept.
-zα/2
zα/2
z0 ≤ zα / 2  No se rechaza H 0
z0 > zα / 2  Se rechaza H 0
12
2. Normal: Contraste para µ con σ
desconocido
X 1, X 2 ,..., X n → N ( µ ,σ )
H 0 : µ = µ0
X → N (µ ,
σ
n
R.R
R.R.
H1 : µ ≠ µ 0
)
1-α
α/2
X −µ
→ tn−1
ˆ
S/ n
x − µ0
t0 =
sˆ / n
tn-1
α/2
R. Acept.
-tα/2
tα/2
t0 ≤ tα / 2  No se rechaza H 0
t0 > tα / 2  Se rechaza H 0
13
Contrastes de hipótesis
3. Normal: Contraste para σ2
X 1 , X 2 ,..., X n → N ( µ ,σ )
H 0 : σ 2 = σ 02
H0 : σ
2
χ n2−1
RRHo
α/2
≠ σ 02
R. A. Ho
RRHo
α/2
1
2
n
2
2
χ
χ
−
(
)
Sˆ 2 =
X
X
1
−α / 2
α
/
2

i
n − 1 i =1
(n − 1) Sˆ 2
2
P( χα2 / 2 ≤ χ n2−1 ≤ χ12−α / 2 ) = 1 − α
→
χ
n
−
1
2
σ
Datos: ŝ2
(n − 1) sˆ 2
2
χ0 =
2
σ0
Contrastes de hipótesis
[
∉ [χα
χ 02 ∈ χα2 / 2 , χ12−α / 2
χ 02
2
2
/ 2 , χ1−α / 2
]
]
 No rechazo H 0
 Rechazo H 0
14
EJEMPLO 1. La resistencia a la compresión de 15 probetas de
acero elegidas al azar es:
40,15 65,10 49,50 22,40 38,20
60,40 43,40 26,35 31,20 55,60
47,25 73,20 35,90 45,25 52,40
H 0 : µ = 60
t14
α = 0.01
H1 : µ ≠ 60
0,005
X −µ
→ t14
ˆ
S / 15
P(−2,98 ≤ t14 ≤ 2,98) = 0.99
Datos:
0,005
- 2,98
2,98
45,75 − 60
= −3.88
14,2 / 15
Como 3.88 > 2.98  Se rechaza H0 con α=0.01
x = 45,75 sˆ = 14,2 
t0 =
15
Contrastes de hipótesis
H 0 : σ 2 = 200
( n − 1) Sˆ 2
H1 : σ 2 ≠ 200
σ
2
→
14 Sˆ 2
χ n2−1
σ
2
2
→ χ14
2
P (4,07 ≤ χ14
≤ 31,3) = 0,99
2
χ 14
0,005
0,00
Datos:
0,005
5,00
10,00
15,00
20,00
25,00
30,00
35,00
31,3
4,07
14 × 201,6
= 14.1
200
Como 4,07 ≤ 14,1 ≤ 31,3  No se rechaza H0
sˆ 2 = 201,6
Contrastes de hipótesis
χ 02 =
16
4. Poisson: Contraste para λ
X1, X 2 ,…, X n → Poisson (λ )
aprox
λ
ˆ
λ = X → N(λ ,
)
n
λˆ − λ
Z=
→ N(0,1)
λ
H 0 : λ = λ0
H1 : λ ≠ λ0
P(− zα / 2 ≤ Z ≤ zα / 2 ) = 1 − α
λˆ − λ0
z0 =
λ0
R.R
R.R.
1-α
α/2
n
nivel de significación α
N(0,1)
α/2
R. Acept.
-zα/2
zα/2
z0 ≤ zα / 2  No se rechaza H 0
z0 > zα / 2  Se rechaza H 0
n
17
Contrastes de hipótesis
Comparación de dos tratamientos
A
51,3
39,4
26,3
39,0
48,1
34,2
69,8
31,3
45,2
46,4
B
29,6
47,0
25,9
13,0
33,1
22,1
34,1
19,5
43,8
24,9
Contrastes de hipótesis
Sea desea comparar dos
tratamientos para reducir el
nivel de colesterol en la
sangre. Se seleccionan 20
individuos y se asignan al
azar a dos tipos de dietas A
y B. La tabla muestra la
reducción conseguida
después de dos meses.
18
Método: 4 pasos
Definición del modelo de distribución de
probabilidad:
Hipótesis
Parámetros
Estimación de los parámetros
Diagnosis de las hipótesis
Aplicación
19
Contrastes de hipótesis
Modelo
σ
σ
µ1
µ2
y11
y12
y 21
⋮
y1n1
Contrastes de hipótesis
y 22
⋮
y 2 n2
M
O
D
E
L
O
D
A
T
O
S
20
Modelo: Hipótesis y Parámetros
Hipótesis básicas:
Normalidad
Parámetros
µ1
µ2
yij  N(µi,σ2)
Homocedasticidad
σ2
Var [yij] = σ2
Independencia
Cov [yij, ykl] = 0
21
Contrastes de hipótesis
Modelo
yij = µ i + uij ,
uij → N (0, σ 2 )
Las observaciones se descomponen en:
Parte predecible
µi
Parte aleatoria
uij
σ
0
Contrastes de hipótesis
22
Estimación medias:
n1
A
51,3
39,4
26,3
39,0
48,1
34,2
69,8
31,3
45,2
46,4
43,1
 y1 j
µ1 : → y1• =
j =1
n1
n2
 y2 j
µ 2 : → y2• =
j =1
n2
B
29,6
47,0
25,9
13,0
33,1
22,1
34,1
19,5
43,8
24,9
29,3
23
Contrastes de hipótesis
Estimación varianza (residuos)
yij = µ i + uij , uij → N (0, σ 2 )
Residuos
A
8,2
-3,7
-16,8
-4,1
5,0
-8,9
26,7
-11,8
2,1
3,3
0,0
uij = yij − µ i
eij = yij − yi•
eij : RESIDUO
2 ni
 eij2
σ 2 : → sˆR2 =
i =1 j =1
n−2
n
i

j =1
Contrastes de hipótesis
B
0,3
17,7
-3,4
-16,3
3,8
-7,2
4,8
-9,8
14,5
-4,4
0,0
eij = 0;sˆ R2 = 130 .95
24
2
ˆ
s
Varianza residual: R
σ
σ
µ1
y11 
y12  2
sˆ =
⋮  1
y1 n1 
µ2
 ( y1 j − y1• )
y 21 
y 22  2
sˆ =
⋮  2
y 2 n 2 
2
n1 − 1
2
ni
 e
sˆR2 =
2
ij
i =1 j =1
=
n−2
 ( y 2 j − y 2• ) 2
n2 − 1
n1 − 1 2 n2 − 1 2
sˆ1 +
sˆ2
n−2
n−2
25
Contrastes de hipótesis
Diferencia de medias: y1• − y2•
σ
σ
µ1
y11 
y12 
⋮ 
y1 n1 
µ2
y1• → N ( µ 1 ,
σ2
σ
2
n1
σ2
)


n1 n2

( y1• − y2• ) − ( µ1 − µ 2 )

→ N (0,1) 

1 1
+
σ

n1 n2

y1• − y2• → N ( µ1 − µ 2 ,
Contrastes de hipótesis
+
y 21 
y 22 
⋮ 
y 2 n 2 
y 2• → N ( µ 2 ,
σ
2
n2
)
)
( y1• − y2• ) − ( µ1 − µ 2 )
→ tn−2
1 1
+
sˆR
n1 n2
26
Contraste de igualdad de medias
H 0 : µ1 = µ 2
H1 : µ1 ≠ µ 2
y − y2•
t0 = 1•
→ tn−2
1 1
sˆR
+
n1 n2
R.R
R.R.
tn-2
1-α
α/2
R. Acept.
-tα/2
α/2
tα/2
t0 ≤ tα / 2  No se rechaza H 0
t0 > tα / 2  Se rechaza H 0
27
Contrastes de hipótesis
Ejemplo: α = 0.05
H 0 : µ1 = µ 2
H1 : µ1 ≠ µ 2
43.1 − 29.3
t0 =
= 2.69
1 1
11.44
+
10 10
R.R.
t18
R.R
0.025
0.025
-2.10
2.10
2.69 > 2.10  Se rechaza H 0
Contrastes de hipótesis
28
Ejemplo: α = 0.01
H 0 : µ1 = µ 2
H1 : µ1 ≠ µ 2
43.1 − 29.3
t0 =
= 2.69
1 1
11.44
+
10 10
R.R
R.R.
0.005
0.99
t18
0.005
α/2
-2.88
2.88
2.69 ≤ 2.88  No se rechaza H 0
29
Contrastes de hipótesis
Nivel crítico (bilateral)
H 0 : µ1 = µ 2
t18
H 1 : µ1 ≠ µ 2
43.1 − 29.3
t0 =
= 2.69
1 1
11.44
+
10 10
0.0074
-2.69
0.0074
2.69
p − valor = Pr( t18 > 2.69) = 0.0147
•α = 0.05 > p-valor  Se rechaza H0
•α = 0.01 < p-valor  No se rechaza H0
Contrastes de hipótesis
30
Conclusiones (fijado α)
Si |to| > tα/2 se dice que
la diferencia de medias
es significativa. O
simplemente que los
tratamientos son
distintos (tienen medias
distintas)
Contrastes de hipótesis
Si |to| ≤ tα/2 se dice
que la diferencia de
medias no es
significativa. No hay
evidencia suficiente
para afirmar que las
medias de los
tratamientos sean
diferentes.
31
No rechazar Ho, no implica que Ho sea cierta
El resultado |to| ≤ tα/2, (no se rechaza Ho) no
debe interpretarse como que “se ha
demostrado que las dos medias son iguales”.
No-rechazar la hipótesis nula implica que la
diferencia entre las medias µ1 - µ2 no es lo
suficientemente grande como para ser detectada
con el tamaño muestral dado.
Contrastes de hipótesis
32
Intervalo de confianza para la
diferencia de medias: µ1 − µ 2
( y1• − y2• ) − ( µ1 − µ 2 )
→ tn−2
1 1
sˆR
+
α/2
n1 n2
tn-2
α/2
1-α
-tα/2
Pr { − tα / 2 ≤
tα/2
( y1• − y2• ) − ( µ1 − µ 2 )
≤ tα / 2 } = 1 − α
1 1
sˆR
+
n1 n2
µ1 − µ 2 ∈ ( y1• − y2• ) ± tα / 2 sˆR
1 1
+
n1 n2
33
Contrastes de hipótesis
Ejemplo: intervalo de confianza µ1 − µ 2
t18
0.025
0.025
-2.10
2.10
1
1
µ1 − µ 2 ∈ ( y1• − y 2 • ) ± tα / 2 sˆ R
+
n1 n 2
µ1 − µ 2 ∈ ( 43 .1 − 29 .3) ± 2 .10 × 11 .44 ×
1
1
+
10 10
µ1 − µ 2 ∈ 13 .8 ± 10 .74
Contrastes de hipótesis
34
Hipótesis de homocedasticidad
σ1
σ2
µ1
y11 
y12  2
sˆ =
⋮  1
y1 n1 
µ2
y 21 
y 22  2
sˆ =
⋮  2
y 2 n 2 
 ( y1 j − y1• ) 2
n1 − 1
 ( y 2 j − y 2• ) 2
n2 − 1
H 0 : σ 12 = σ 22
H1 : σ 12 ≠ σ 22
35
Contrastes de hipótesis
Distribución F
y11 
y12  2
sˆ =
⋮  1
y1n1 
y 21 
y 22  2
sˆ =
⋮  2
y 2 n2 
 ( y1 j − y1• ) 2
n1 − 1
( n1 − 1) sˆ12
σ 12
→
1
F=
Contrastes de hipótesis
( n2 − 1) sˆ22
χ n21 −1
χ n2 −1
χ n22 −1
 ( y 2 j − y 2• ) 2
σ 22
n2 − 1
→ χ n22 −1
sˆ12
( n1 − 1)
( n2 − 1)
=
σ 12
sˆ22
σ 22
→ Fn1 −1,n2 −1
36
Distribución F
F40,40
F20,40
F10,40
F5,40
37
Contrastes de hipótesis
Algunas distribuciones F
F10,80
F10,40
F10,20
F10,10
Contrastes de hipótesis
38
Contraste de igualdad de varianzas
H 0 : σ 12 = σ 22
H1 : σ 12 ≠ σ 22
Si H 0 es cierto σ 12 = σ 22 ,
sˆ12
F0 = 2 → Fn1 −1,n2 −1
sˆ1
RR
α/2
RR
1-α
R.A. Ho
F1-α/2
α/2
Fα/2
Si F0 ∈ [F1−α / 2 , Fα / 2 ]  No se rechaza H 0
Si F0 ∉ [F1−α / 2 , Fα / 2 ]  Se rechaza H 0
39
Contrastes de hipótesis
Ejemplo: Contraste de igualdad de varianzas
H 0 : σ 12 = σ 22
H1 : σ 12 ≠ σ 22
sˆ12 = 154.02 sˆ22 = 111.7
154.02
F0 =
= 1.37
111.7
RR
0.025
0.248 1.37
RR
0.025
4.03
1.37 ∈ [0.248,4.03]  No se rechaza H 0
Contrastes de hipótesis
40
Tabla F
Fν1 ,ν 2 ,α
 P ( Fν1 ,ν 2 ≥ Fν1 ,ν 2 ,α ) = α
Grados de libertad del denominador: ν2
α=0.05
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
1
161,4
18,51
10,13
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45
4,41
4,38
4,35
4,32
4,30
4,28
4,26
4,24
4,23
4,21
4,20
4,18
4,17
4,08
4,03
4,00
3,98
3,96
3,95
3,94
3,92
3,84
1
2
199,5
19,00
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,89
3,81
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3,47
3,44
3,42
3,40
3,39
3,37
3,35
3,34
3,33
3,32
3,23
3,18
3,15
3,13
3,11
3,10
3,09
3,07
3,00
2
3
215,7
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
3,07
3,05
3,03
3,01
2,99
2,98
2,96
2,95
2,93
2,92
2,84
2,79
2,76
2,74
2,72
2,71
2,70
2,68
2,60
3
4
224,6
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
2,84
2,82
2,80
2,78
2,76
2,74
2,73
2,71
2,70
2,69
2,61
2,56
2,53
2,50
2,49
2,47
2,46
2,45
2,37
4
5
230,2
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,68
2,66
2,64
2,62
2,60
2,59
2,57
2,56
2,55
2,53
2,45
2,40
2,37
2,35
2,33
2,32
2,31
2,29
2,21
5
6
234,0
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,53
2,51
2,49
2,47
2,46
2,45
2,43
2,42
2,34
2,29
2,25
2,23
2,21
2,20
2,19
2,18
2,10
6
7
236,8
19,35
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71
2,66
2,61
2,58
2,54
2,51
2,49
2,46
2,44
2,42
2,40
2,39
2,37
2,36
2,35
2,33
2,25
2,20
2,17
2,14
2,13
2,11
2,10
2,09
2,01
7
8
238,9
19,37
8,85
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55
2,51
2,48
2,45
2,42
2,40
2,37
2,36
2,34
2,32
2,31
2,29
2,28
2,27
2,18
2,13
2,10
2,07
2,06
2,04
2,03
2,02
1,94
8
9
240,5
19,38
8,81
6,00
4,77
4,10
3,68
3,39
3,18
3,02
2,90
2,80
2,71
2,65
2,59
2,54
2,49
2,46
2,42
2,39
2,37
2,34
2,32
2,30
2,28
2,27
2,25
2,24
2,22
2,21
2,12
2,07
2,04
2,02
2,00
1,99
1,97
1,96
1,88
9
10
241,9
19,40
8,79
5,96
4,74
4,06
3,64
3,35
3,14
2,98
2,85
2,75
2,67
2,60
2,54
2,49
2,45
2,41
2,38
2,35
2,32
2,30
2,27
2,25
2,24
2,22
2,20
2,19
2,18
2,16
2,08
2,03
1,99
1,97
1,95
1,94
1,93
1,91
1,83
10
12
243,9
19,41
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38
2,34
2,31
2,28
2,25
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,00
1,95
1,92
1,89
1,88
1,86
1,85
1,83
1,75
12
15
245,9
19,43
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,18
2,15
2,13
2,11
2,09
2,07
2,06
2,04
2,03
2,01
1,92
1,87
1,84
1,81
1,79
1,78
1,77
1,75
1,67
15
20
248,0
19,45
8,66
5,80
4,56
3,87
3,44
3,15
2,94
2,77
2,65
2,54
2,46
2,39
2,33
2,28
2,23
2,19
2,16
2,12
2,10
2,07
2,05
2,03
2,01
1,99
1,97
1,96
1,94
1,93
1,84
1,78
1,75
1,72
1,70
1,69
1,68
1,66
1,57
20
24
249,1
19,45
8,64
5,77
4,53
3,84
3,41
3,12
2,90
2,74
2,61
2,51
2,42
2,35
2,29
2,24
2,19
2,15
2,11
2,08
2,05
2,03
2,01
1,98
1,96
1,95
1,93
1,91
1,90
1,89
1,79
1,74
1,70
1,67
1,65
1,64
1,63
1,61
1,52
24
30
250,1
19,46
8,62
5,75
4,50
3,81
3,38
3,08
2,86
2,70
2,57
2,47
2,38
2,31
2,25
2,19
2,15
2,11
2,07
2,04
2,01
1,98
1,96
1,94
1,92
1,90
1,88
1,87
1,85
1,84
1,74
1,69
1,65
1,62
1,60
1,59
1,57
1,55
1,46
30
40
251,1
19,47
8,59
5,72
4,46
3,77
3,34
3,04
2,83
2,66
2,53
2,43
2,34
2,27
2,20
2,15
2,10
2,06
2,03
1,99
1,96
1,94
1,91
1,89
1,87
1,85
1,84
1,82
1,81
1,79
1,69
1,63
1,59
1,57
1,54
1,53
1,52
1,50
1,39
40
60
252,2
19,48
8,57
5,69
4,43
3,74
3,30
3,01
2,79
2,62
2,49
2,38
2,30
2,22
2,16
2,11
2,06
2,02
1,98
1,95
1,92
1,89
1,86
1,84
1,82
1,80
1,79
1,77
1,75
1,74
1,64
1,58
1,53
1,50
1,48
1,46
1,45
1,43
1,32
60
100
253,0
19,49
8,55
5,66
4,41
3,71
3,27
2,97
2,76
2,59
2,46
2,35
2,26
2,19
2,12
2,07
2,02
1,98
1,94
1,91
1,88
1,85
1,82
1,80
1,78
1,76
1,74
1,73
1,71
1,70
1,59
1,52
1,48
1,45
1,43
1,41
1,39
1,37
1,24
100
120
253,3
19,49
8,55
5,66
4,40
3,70
3,27
2,97
2,75
2,58
2,45
2,34
2,25
2,18
2,11
2,06
2,01
1,97
1,93
1,90
1,87
1,84
1,81
1,79
1,77
1,75
1,73
1,71
1,70
1,68
1,58
1,51
1,47
1,44
1,41
1,39
1,38
1,35
1,22
120
Inf.
254,3
19,50
8,53
5,63
4,37
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,81
1,78
1,76
1,73
1,71
1,69
1,67
1,65
1,64
1,62
1,51
1,44
1,39
1,35
1,32
1,30
1,28
1,25
1,00
Inf.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
Ejemplo : P ( F7,8 ≥ 3.50) = 0.05
Tabla F
Fν1 ,ν 2 ,α
 P ( Fν1 ,ν 2 ≥ Fν1 ,ν 2 ,α ) = α
Grados de libertad del denominador: ν2
α=0.025
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
1
647,8
38,51
17,44
12,22
10,01
8,81
8,07
7,57
7,21
6,94
6,72
6,55
6,41
6,30
6,20
6,12
6,04
5,98
5,92
5,87
5,83
5,79
5,75
5,72
5,69
5,66
5,63
5,61
5,59
5,57
5,42
5,34
5,29
5,25
5,22
5,20
5,18
5,15
5,02
1
2
799,5
39,00
16,04
10,65
8,43
7,26
6,54
6,06
5,71
5,46
5,26
5,10
4,97
4,86
4,77
4,69
4,62
4,56
4,51
4,46
4,42
4,38
4,35
4,32
4,29
4,27
4,24
4,22
4,20
4,18
4,05
3,97
3,93
3,89
3,86
3,84
3,83
3,80
3,69
2
3
864,2
39,17
15,44
9,98
7,76
6,60
5,89
5,42
5,08
4,83
4,63
4,47
4,35
4,24
4,15
4,08
4,01
3,95
3,90
3,86
3,82
3,78
3,75
3,72
3,69
3,67
3,65
3,63
3,61
3,59
3,46
3,39
3,34
3,31
3,28
3,26
3,25
3,23
3,12
3
4
899,6
39,25
15,10
9,60
7,39
6,23
5,52
5,05
4,72
4,47
4,28
4,12
4,00
3,89
3,80
3,73
3,66
3,61
3,56
3,51
3,48
3,44
3,41
3,38
3,35
3,33
3,31
3,29
3,27
3,25
3,13
3,05
3,01
2,97
2,95
2,93
2,92
2,89
2,79
4
5
921,8
39,30
14,88
9,36
7,15
5,99
5,29
4,82
4,48
4,24
4,04
3,89
3,77
3,66
3,58
3,50
3,44
3,38
3,33
3,29
3,25
3,22
3,18
3,15
3,13
3,10
3,08
3,06
3,04
3,03
2,90
2,83
2,79
2,75
2,73
2,71
2,70
2,67
2,57
5
6
937,1
39,33
14,73
9,20
6,98
5,82
5,12
4,65
4,32
4,07
3,88
3,73
3,60
3,50
3,41
3,34
3,28
3,22
3,17
3,13
3,09
3,05
3,02
2,99
2,97
2,94
2,92
2,90
2,88
2,87
2,74
2,67
2,63
2,59
2,57
2,55
2,54
2,52
2,41
6
7
948,2
39,36
14,62
9,07
6,85
5,70
4,99
4,53
4,20
3,95
3,76
3,61
3,48
3,38
3,29
3,22
3,16
3,10
3,05
3,01
2,97
2,93
2,90
2,87
2,85
2,82
2,80
2,78
2,76
2,75
2,62
2,55
2,51
2,47
2,45
2,43
2,42
2,39
2,29
7
Ejemplo : P ( F7,8 ≥ 4.53) = 0.025
8
956,6
39,37
14,54
8,98
6,76
5,60
4,90
4,43
4,10
3,85
3,66
3,51
3,39
3,29
3,20
3,12
3,06
3,01
2,96
2,91
2,87
2,84
2,81
2,78
2,75
2,73
2,71
2,69
2,67
2,65
2,53
2,46
2,41
2,38
2,35
2,34
2,32
2,30
2,19
8
9
963,3
39,39
14,47
8,90
6,68
5,52
4,82
4,36
4,03
3,78
3,59
3,44
3,31
3,21
3,12
3,05
2,98
2,93
2,88
2,84
2,80
2,76
2,73
2,70
2,68
2,65
2,63
2,61
2,59
2,57
2,45
2,38
2,33
2,30
2,28
2,26
2,24
2,22
2,11
9
10
968,6
39,40
14,42
8,84
6,62
5,46
4,76
4,30
3,96
3,72
3,53
3,37
3,25
3,15
3,06
2,99
2,92
2,87
2,82
2,77
2,73
2,70
2,67
2,64
2,61
2,59
2,57
2,55
2,53
2,51
2,39
2,32
2,27
2,24
2,21
2,19
2,18
2,16
2,05
10
12
976,7
39,41
14,34
8,75
6,52
5,37
4,67
4,20
3,87
3,62
3,43
3,28
3,15
3,05
2,96
2,89
2,82
2,77
2,72
2,68
2,64
2,60
2,57
2,54
2,51
2,49
2,47
2,45
2,43
2,41
2,29
2,22
2,17
2,14
2,11
2,09
2,08
2,05
1,94
12
15
984,9
39,43
14,25
8,66
6,43
5,27
4,57
4,10
3,77
3,52
3,33
3,18
3,05
2,95
2,86
2,79
2,72
2,67
2,62
2,57
2,53
2,50
2,47
2,44
2,41
2,39
2,36
2,34
2,32
2,31
2,18
2,11
2,06
2,03
2,00
1,98
1,97
1,94
1,83
15
20
993,1
39,45
14,17
8,56
6,33
5,17
4,47
4,00
3,67
3,42
3,23
3,07
2,95
2,84
2,76
2,68
2,62
2,56
2,51
2,46
2,42
2,39
2,36
2,33
2,30
2,28
2,25
2,23
2,21
2,20
2,07
1,99
1,94
1,91
1,88
1,86
1,85
1,82
1,71
20
24
30
40
60
100
120
Inf.
997,3 1001,4 1005,6 1009,8 1013,2 1014,0 1018,3
39,46 39,46 39,47 39,48 39,49 39,49 39,50
14,12 14,08 14,04 13,99 13,96 13,95 13,90
8,51
8,46
8,41
8,36
8,32
8,31
8,26
6,28
6,23
6,18
6,12
6,08
6,07
6,02
5,12
5,07
5,01
4,96
4,92
4,90
4,85
4,41
4,36
4,31
4,25
4,21
4,20
4,14
3,95
3,89
3,84
3,78
3,74
3,73
3,67
3,61
3,56
3,51
3,45
3,40
3,39
3,33
3,37
3,31
3,26
3,20
3,15
3,14
3,08
3,17
3,12
3,06
3,00
2,96
2,94
2,88
3,02
2,96
2,91
2,85
2,80
2,79
2,72
2,89
2,84
2,78
2,72
2,67
2,66
2,60
2,79
2,73
2,67
2,61
2,56
2,55
2,49
2,70
2,64
2,59
2,52
2,47
2,46
2,40
2,63
2,57
2,51
2,45
2,40
2,38
2,32
2,56
2,50
2,44
2,38
2,33
2,32
2,25
2,50
2,44
2,38
2,32
2,27
2,26
2,19
2,45
2,39
2,33
2,27
2,22
2,20
2,13
2,41
2,35
2,29
2,22
2,17
2,16
2,09
2,37
2,31
2,25
2,18
2,13
2,11
2,04
2,33
2,27
2,21
2,14
2,09
2,08
2,00
2,30
2,24
2,18
2,11
2,06
2,04
1,97
2,27
2,21
2,15
2,08
2,02
2,01
1,94
2,24
2,18
2,12
2,05
2,00
1,98
1,91
2,22
2,16
2,09
2,03
1,97
1,95
1,88
2,19
2,13
2,07
2,00
1,94
1,93
1,85
2,17
2,11
2,05
1,98
1,92
1,91
1,83
2,15
2,09
2,03
1,96
1,90
1,89
1,81
2,14
2,07
2,01
1,94
1,88
1,87
1,79
2,01
1,94
1,88
1,80
1,74
1,72
1,64
1,93
1,87
1,80
1,72
1,66
1,64
1,55
1,88
1,82
1,74
1,67
1,60
1,58
1,48
1,85
1,78
1,71
1,63
1,56
1,54
1,44
1,82
1,75
1,68
1,60
1,53
1,51
1,40
1,80
1,73
1,66
1,58
1,50
1,48
1,37
1,78
1,71
1,64
1,56
1,48
1,46
1,35
1,76
1,69
1,61
1,53
1,45
1,43
1,31
1,64
1,57
1,48
1,39
1,30
1,27
1,00
24
30
40
60
100
120
Inf.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
Tabla F
Fν1 ,ν 2 ,α
 P ( Fν1 ,ν 2 ≥ Fν1 ,ν 2 ,α ) = α
Grados de libertad del denominador: ν2
α=0.01
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
1
4052,2
98,50
34,12
21,20
16,26
13,75
12,25
11,26
10,56
10,04
9,65
9,33
9,07
8,86
8,68
8,53
8,40
8,29
8,18
8,10
8,02
7,95
7,88
7,82
7,77
7,72
7,68
7,64
7,60
7,56
7,31
7,17
7,08
7,01
6,96
6,93
6,90
6,85
6,63
1
2
4999,3
99,00
30,82
18,00
13,27
10,92
9,55
8,65
8,02
7,56
7,21
6,93
6,70
6,51
6,36
6,23
6,11
6,01
5,93
5,85
5,78
5,72
5,66
5,61
5,57
5,53
5,49
5,45
5,42
5,39
5,18
5,06
4,98
4,92
4,88
4,85
4,82
4,79
4,61
2
3
5403,5
99,16
29,46
16,69
12,06
9,78
8,45
7,59
6,99
6,55
6,22
5,95
5,74
5,56
5,42
5,29
5,19
5,09
5,01
4,94
4,87
4,82
4,76
4,72
4,68
4,64
4,60
4,57
4,54
4,51
4,31
4,20
4,13
4,07
4,04
4,01
3,98
3,95
3,78
3
4
5624,3
99,25
28,71
15,98
11,39
9,15
7,85
7,01
6,42
5,99
5,67
5,41
5,21
5,04
4,89
4,77
4,67
4,58
4,50
4,43
4,37
4,31
4,26
4,22
4,18
4,14
4,11
4,07
4,04
4,02
3,83
3,72
3,65
3,60
3,56
3,53
3,51
3,48
3,32
4
5
5764,0
99,30
28,24
15,52
10,97
8,75
7,46
6,63
6,06
5,64
5,32
5,06
4,86
4,69
4,56
4,44
4,34
4,25
4,17
4,10
4,04
3,99
3,94
3,90
3,85
3,82
3,78
3,75
3,73
3,70
3,51
3,41
3,34
3,29
3,26
3,23
3,21
3,17
3,02
5
6
5859,0
99,33
27,91
15,21
10,67
8,47
7,19
6,37
5,80
5,39
5,07
4,82
4,62
4,46
4,32
4,20
4,10
4,01
3,94
3,87
3,81
3,76
3,71
3,67
3,63
3,59
3,56
3,53
3,50
3,47
3,29
3,19
3,12
3,07
3,04
3,01
2,99
2,96
2,80
6
7
5928,3
99,36
27,67
14,98
10,46
8,26
6,99
6,18
5,61
5,20
4,89
4,64
4,44
4,28
4,14
4,03
3,93
3,84
3,77
3,70
3,64
3,59
3,54
3,50
3,46
3,42
3,39
3,36
3,33
3,30
3,12
3,02
2,95
2,91
2,87
2,84
2,82
2,79
2,64
7
8
5981,0
99,38
27,49
14,80
10,29
8,10
6,84
6,03
5,47
5,06
4,74
4,50
4,30
4,14
4,00
3,89
3,79
3,71
3,63
3,56
3,51
3,45
3,41
3,36
3,32
3,29
3,26
3,23
3,20
3,17
2,99
2,89
2,82
2,78
2,74
2,72
2,69
2,66
2,51
8
9
6022,4
99,39
27,34
14,66
10,16
7,98
6,72
5,91
5,35
4,94
4,63
4,39
4,19
4,03
3,89
3,78
3,68
3,60
3,52
3,46
3,40
3,35
3,30
3,26
3,22
3,18
3,15
3,12
3,09
3,07
2,89
2,78
2,72
2,67
2,64
2,61
2,59
2,56
2,41
9
10
6055,9
99,40
27,23
14,55
10,05
7,87
6,62
5,81
5,26
4,85
4,54
4,30
4,10
3,94
3,80
3,69
3,59
3,51
3,43
3,37
3,31
3,26
3,21
3,17
3,13
3,09
3,06
3,03
3,00
2,98
2,80
2,70
2,63
2,59
2,55
2,52
2,50
2,47
2,32
10
12
6106,7
99,42
27,05
14,37
9,89
7,72
6,47
5,67
5,11
4,71
4,40
4,16
3,96
3,80
3,67
3,55
3,46
3,37
3,30
3,23
3,17
3,12
3,07
3,03
2,99
2,96
2,93
2,90
2,87
2,84
2,66
2,56
2,50
2,45
2,42
2,39
2,37
2,34
2,18
12
15
6157,0
99,43
26,87
14,20
9,72
7,56
6,31
5,52
4,96
4,56
4,25
4,01
3,82
3,66
3,52
3,41
3,31
3,23
3,15
3,09
3,03
2,98
2,93
2,89
2,85
2,81
2,78
2,75
2,73
2,70
2,52
2,42
2,35
2,31
2,27
2,24
2,22
2,19
2,04
15
20
6208,7
99,45
26,69
14,02
9,55
7,40
6,16
5,36
4,81
4,41
4,10
3,86
3,66
3,51
3,37
3,26
3,16
3,08
3,00
2,94
2,88
2,83
2,78
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,37
2,27
2,20
2,15
2,12
2,09
2,07
2,03
1,88
20
24
6234,3
99,46
26,60
13,93
9,47
7,31
6,07
5,28
4,73
4,33
4,02
3,78
3,59
3,43
3,29
3,18
3,08
3,00
2,92
2,86
2,80
2,75
2,70
2,66
2,62
2,58
2,55
2,52
2,49
2,47
2,29
2,18
2,12
2,07
2,03
2,00
1,98
1,95
1,79
24
30
6260,4
99,47
26,50
13,84
9,38
7,23
5,99
5,20
4,65
4,25
3,94
3,70
3,51
3,35
3,21
3,10
3,00
2,92
2,84
2,78
2,72
2,67
2,62
2,58
2,54
2,50
2,47
2,44
2,41
2,39
2,20
2,10
2,03
1,98
1,94
1,92
1,89
1,86
1,70
30
40
6286,4
99,48
26,41
13,75
9,29
7,14
5,91
5,12
4,57
4,17
3,86
3,62
3,43
3,27
3,13
3,02
2,92
2,84
2,76
2,69
2,64
2,58
2,54
2,49
2,45
2,42
2,38
2,35
2,33
2,30
2,11
2,01
1,94
1,89
1,85
1,82
1,80
1,76
1,59
40
60
6313,0
99,48
26,32
13,65
9,20
7,06
5,82
5,03
4,48
4,08
3,78
3,54
3,34
3,18
3,05
2,93
2,83
2,75
2,67
2,61
2,55
2,50
2,45
2,40
2,36
2,33
2,29
2,26
2,23
2,21
2,02
1,91
1,84
1,78
1,75
1,72
1,69
1,66
1,47
60
100
6333,9
99,49
26,24
13,58
9,13
6,99
5,75
4,96
4,41
4,01
3,71
3,47
3,27
3,11
2,98
2,86
2,76
2,68
2,60
2,54
2,48
2,42
2,37
2,33
2,29
2,25
2,22
2,19
2,16
2,13
1,94
1,82
1,75
1,70
1,65
1,62
1,60
1,56
1,36
100
120
6339,5
99,49
26,22
13,56
9,11
6,97
5,74
4,95
4,40
4,00
3,69
3,45
3,25
3,09
2,96
2,84
2,75
2,66
2,58
2,52
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,17
2,14
2,11
1,92
1,80
1,73
1,67
1,63
1,60
1,57
1,53
1,32
120
Inf.
6365,6
99,50
26,13
13,46
9,02
6,88
5,65
4,86
4,31
3,91
3,60
3,36
3,17
3,00
2,87
2,75
2,65
2,57
2,49
2,42
2,36
2,31
2,26
2,21
2,17
2,13
2,10
2,06
2,03
2,01
1,80
1,68
1,60
1,54
1,49
1,46
1,43
1,38
1,00
Inf.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
Ejemplo : P ( F7,8 ≥ 6.18) = 0.01
Contraste χ2 de bondad de ajuste
POBLACIÓN
X
σ
MUESTRA n
¿Tienen los
datos
distribución
Normal?
x1, x2 ,..., xn
µ
¿ X → N (µ , σ ) ?
Datos Conocidos
µˆ = x
σˆ = sˆ
Contrastes de hipótesis
44
Espesores de 150 obleas de Silicio (micras)
240
243
250
253
248
238
242
245
251
247
239
242
246
250
248
X
235
237
246
249
246
240
241
246
247
249
240
243
244
248
245
240
243
244
249
246
245
250
250
247
248
238
240
245
248
246
240
242
246
249
248
240
243
246
250
248
241
245
243
247
245
247
245
255
250
249
237
239
243
247
246
242
244
245
248
245
237
239
242
247
245
242
244
246
251
248
243
245
247
252
249
243
245
248
251
250
244
246
246
250
246
241
239
244
250
246
242
245
248
251
249
242
245
248
243
246
241
244
245
249
247
236
239
241
246
242
243
246
247
252
247
241
243
245
248
246
239
240
242
243
244
239
240
250
252
250
241
243
249
255
253
45
Contrastes de hipótesis
¿Tiene distribución normal?
Histograma para Espesor
frecuencia
40
30
20
10
0
230
235
240
245
250
255
260
Espesor
Contrastes de hipótesis
46
Contraste χ2 de bondad de ajuste
H 0 : X i , ∀i = 1,2,..., n → f X
H1 : X i , ∀i = 1,2,..., n →
/ fX
Si H 0 es cierto :
Clases
Fr. Observada Fr. Esperada
co ≤ xi < c1
c1 ≤ xi < c2
O1
O2
E1
E2
⋮
ck −1 ≤ xi < ck
⋮
Ok
⋮
Ek
⋮
cK −1 ≤ xi < cK
⋮
OK
⋮
EK
Ek = npk
pk = Pr(ck −1 ≤ X < ck )
K
K
k =1
k =1
 Ok =  Ek = n
(Ok − Ek ) 2
→ χ K2 − r −1

Ek
k =1
K
47
Contrastes de hipótesis
Justificación del contraste χ2
n →∞
Ok → B (n, pk ) → Ok → N (npk , npk (1 − pk ) )
Ek = npk
Ok − npk
→ N (0,1)
npk (1 − pk )
≅1
 Ok − Ek
Ok − Ek
→ N (0,1)   
Ek
Ek
k =1
K
K ≡ Nº de CLASES
Contrastes de hipótesis
2

2
 aprox


→
χ
K
− r −1


r ≡ Nº de parámetro estimados
48
Obleas: Frecuencias Observadas
Clase
-inf
238
240
242
244
246
248
250
252
Fr. Observada
Oi
7
16
17
21
34
24
20
7
4
150
238
240
242
244
246
248
250
252
+inf
Total
x = 245.1 micras
sˆ = 4 micras
49
Contrastes de hipótesis
Frecuencias esperadas N(245.1;4)
Clase
-inf
238
240
242
244
246
248
250
252
238
240
242
244
246
248
250
252
+inf
Total
Fr. Observada
Oi
7
16
17
21
34
24
20
7
4
150
Fr. Esperada
Ei
5,88
9,58
17,71
25,71
29,35
26,34
18,58
10,3
6,54
150
p4 = Pr( 242 ≤ X ≤ 244)
242 − 245.1 X − 245.1 244 − 245.1
≤
≤
)
4
4
4
= P (−0.275 ≤ Z ≤ −0.775)
= 0.1714
= Pr(
E4 = np4 = 150 × 0.1714 = 25.71
Contrastes de hipótesis
50
Contraste de Normalidad
H 0 : xi → Normal
H1 : xi →
/ Normal
χ 02
(7 − 5.88) 2 (16 − 9,58) 2
(4 − 6.54) 2
=
+
+⋯+
= 8.5
5.88
9.58
6.54
0,160
0,140
0,120
p − valor = 0.2037
0,100
0,080
0,060
α = 0.05
0,040
0,020
0,000
0,00
5,00
Pr( χ 62 ≤ 12.59) = 0.95
10,00
12,59
15,00
20,00
χ 02 = 8.5 < 12.59  No se rechaza la hipótesis de normalidad
51
Contrastes de hipótesis
Se ha lanzado 300 veces un dado y se han obtenido los resultados:
Resultados Observadas
1
49
2
59
3
49
4
51
5
43
6
49
Total
300
¿Se puede afirmar con α=0.05 que el dado está desequilibrado?
Contrastes de hipótesis
52
Pr( X = i) = 1 / 6, ∀i = 1,2,...,6
H o : xi → Equiprobable
H1 : xi → No equiprobable
χ 02 =
Resultados Observados Esperados
1
49
50
2
59
50
3
49
50
4
51
50
5
43
50
6
49
50
Total
300
300
(49 − 50) 2 (59 − 50) 2
(49 − 50) 2
+
+⋯+
= 2.68
50
50
50
Pr( χ 52 ≤ 11.07) = 0.95  χ 02 = 2.68 < 11.07  No se Rechaza H 0
0,180
0,160
χ 52
0,140
p-valor = 0.749
0,120
0,100
0,080
0,060
α=0.05
0,040
0,020
0,000
0,00
Contrastes de hipótesis
2.68
5,00
10,00
11.07
15,00
53
Capı́tulo 6: Ejercicios propuestos
1. Un proceso industrial fabrica piezas cuya longitud en mm se distribuye según una N (190, 10). Una
muestra de 5 piezas proporciona los resultados siguientes:
187, 212, 195, 208, 192
(a) Contrastar la hipótesis de que la media del proceso µ es efectivamente 190.
(b) Contrastar la hipótesis de que la varianza del proceso σ 2 es 100
(c) Admitiendo que la varianza del proceso es 100, construir la curva de potencia para un contraste
de la media con 5 observaciones. Tómese α = 0.05 en todos los contrastes.
2. Para contrastar unilateralmente que la esperanza µ de una variable aleatoria normal es 10, se toma
una muestra de tamaño 16 y se rechaza la hipótesis en el caso en que la media muestral sea mayor
que 11, aceptándose en el caso contrario. Sabiendo que la desviación tı́pica de la población es σ = 2,
¿cúal es la probabilidad de error de tipo I de este contraste?. ¿Cúal serı́a la probabilidad de error
de tipo II del contraste si el valor verdadero de la esperanza fuese 12?.
3. Una medicina estándar es efectiva en el 75% de los casos en los que se aplica. Se ha comprobado
un nuevo medicamento en 100 pacientes, observándose su efectividad en 85 de ellos. ¿ Es la nueva
medicina más efectiva que la estándar ? (Contrastar con α = 0.05).
4. Un empresario quiere comprar una empresa que fabrica cojinetes. Durante los 5 últimos años la
proporción de cojinetes defectuosos se ha mantenido en un 3%. Para verificar esto, se toma una
muestra de 200 cojinetes y obtiene que 9 son defectuosos. ¿Se puede concluir que la proporción de
cojinetes defectuosos ha aumentado? Calcular la potencia del contraste planteado anteriormente en
función de p. Calcular la probabilidad de error de tipo II cuando la hipótesis alternativa es p = 0.06,
siendo p la proporción de defectuosos.(Nota: Utilı́cese la aproximación normal y α = 0, 05.).
5. Teniendo en cuenta que si X1 , X2 , . . . , Xn es una muestra aleatoria simple de una variable aleatoria
exponencial con función de densidad, f (x) = λ1 e−x/λ , x ≥ 0, λ > 0; el estadı́stico U = 2nX/λ
tiene distribución χ22n , donde X = (X1 + X2 + · · · + Xn )/n; resolver las cuestiones siguientes:
(a) El tiempo de funcionamiento de un equipo electrónico es una variable aleatoria con distribución
exponencial. Se han tomado los tiempos de funcionamiento hasta el fallo de 30 equipos elegidos
al azar, obteniéndose 6.2 × 103 horas de media. Contrastar con nivel de significación igual a
0.05, H0 : λ = 5 × 103 horas, frente a H1 : λ > 5 × 103 horas; indicando: (a) el valor crı́tico, y
(b) la probabilidad de error tipo II cuando λ = 7 × 103 horas. (Es suficiente con proporcionar
el valor más proximo obtenido en las tablas del libro de texto).
(b) Se va a realizar un ensayo con 15 equipos fabricados por una segunda empresa. Si el tiempo
de funcionamiento de estos tiene también distribución exponencial. ¿ Cuál es el valor máximo
de la media muestral de estos quince equipos que permitirı́a concluir con α = 0.05 que son
peores que los de la primera empresa? Después de 6000 horas de ensayo han fallado 6 equipos,
siendo el promedio de estos seis valores igual a 2350 horas. ¿Es necesario seguir el ensayo para
tomar una decisión ?
1
6. En la tabla se reproducen los valores para la velocidad de la luz en el aire que obtuvieron Michelson
y Newcomb en 1879 y 1992 respectivamente, utilizando métodos distintos . A los datos originales
en km/s se les ha restado 299000 para facilitar su tratamiento matemático.
Mic.
New.
1
850
883
Mic.
New.
11
1000
578
2
740
816
12
980
796
3
900
778
13
930
774
4
1070
796
5
930
682
6
850
711
7
950
611
14
650
820
15
760
772
y
896,6
763,2
8
980
599
9
980
1051
10
880
781
sb
119,47
111,91
(a) Contraste la hipótesis de que la variabilidad es la misma en los experimentos de Michelson y
Newcomb. (α = 0, 05)
(b) Sabiendo que la velocidad de la luz en el vacio es 299.792,5 km/s (792,5 si se le resta 299.000), y
que en aire debe ser igual o menor que en el vacio, contraste la hipótesis de que los experimentos
no tienen error sistemático, es decir la medida obtenida es igual al verdadero valor más un
error aleatorio de media cero.(α = 0, 05)
7. Se estudian dos tipos de neumáticos con los resultados siguientes:
Tipo
A
B
ni
121
121
xi (Km)
27465
27572
sbi (Km)
2500
3000
(a) Calcular, con α = 0.01, un intervalo de confianza para
σ 21
.
σ 22
(b) Obtener un intervalo de confianza para µ1 − µ2 .
8. Se dispone de rendimientos de dos máquinas. Los resultados de la máquina A son 137.5; 140.7;
106.9; 175.1; 177.3; 120.4; 77.9 y 104.2, mientras que los reultados para la B son: 103.3; 121.7; 98.4;
161.5; 167.8 y 67.3. ¿Son las máquinas iguales? (Suponer que los rendimientos de ambas máquinas
siguen distribuciones normales).
9. Un fabricante de automóviles debe elegir entre un determinado tipo de piezas de acero suministradas
por un proveedor A y otras suministradas por otro proveedor B. Para proceder a la elección se ha
analizado la resistencia a la tracción de las piezas suministradas por ambos proveedores, tomando
una muestra de tamaño 10 de las piezas del primero, y otra de tamaño 12 del segundo. La resistencia
media de la muestra de A es de 54000 unidades y la de la muestra de B es de 49000 unidades, siendo
las desviaciones tı́picas muestrales corregidas sbA = 2100 y sbB = 1900. Las resistencias de las piezas
de ambos proveedores se distribuyen normalmente. Las piezas del proveedor B son más baratas
que las del proveedor A, por lo que estas últimas sólo son rentables si tienen una resistencia media
al menos 2000 unidades mayor que las de B, y la misma variabilidad.
(a) ¿A qué proveedor habrı́a que comprar las piezas a la vista de los resultados muestrales?
(b) Obtener un intervalo de confianza del 90\%
10. La estatura de 60 niños de una escuela infantil se resume en la siguiente tabla de frecuencias, dónde
la última columna muestra la frecuencia esperada bajo la hipótesis de normalidad.
2
Intervalo
41,5-43,5
43,5-45,5
45,5-47,5
47,5-49,5
49,5-51,5
51,5-53,5
53,5-55,5
55,5-57,5
Total
Frecuencia
Observada
4
7
12
8
6
11
9
3
60
Frecuencia
Esperada
4,08
5,58
9,06
11,27
11,27
9,08
5,58
4,08
60
¿Se puede aceptar la hipótesis de normalidad de los datos (α = 0.05) ?
11. Se tira 120 veces un dado y se obtienen los resultados de la tabla
VALOR
FRECUENCIA
1
20
2
14
3
23
4
12
5
26
6
25
Contrastar la hipótesis de que el dado está equilibrado y que, por tanto, sus caras son equiprobables.
(Tómese α = 0.05).
12. Un modelo sı́smico indica que la distribución de los epicentros de sismos en una región deberı́a seguir
una distribución de Poisson en el plano. Un grupo de expertos pretende contrastar si ese modelo
se cumple, para ello ha representado un mapa de la región dividido en cuadrı́culas de tamaño 100
km2 , y ha señalado con puntos las posiciones de los epicentros (véase figura adjunta). Realizar el
contraste χ2 de bondad de ajuste con nivel de significación α = 0, 05 proporcionando el nivel crı́tico
aproximado del contraste.
13. El Ministerio de defensa está considerando un nuevo sistema de apoyo para el lanzamiento de
misiles de corto alcance. El sistema existente tiene errores en el 7% de los lanzamientos y se desea
comprobar si el nuevo sistema tiene una probabilidad de fallo menor. El ensayo va a consistir
3
en realizar 20 lanzamientos y se concluirá que el nuevo sistema es mejor si no se produce ningún
fallo. Llamando p a la probabilidad de fallo del sistema nuevo y aceptando independencia entre los
resultados del lanzamiento, obtenga y represente gráficamente la probabilidad de error de tipo II
del contraste
H0 : p = 0.07
H1 : p < 0.07
Obtenga la probabilidad de error tipo I. Interprete el resultado y valore si el método de decisión es
adecuado.
14. El tiempo de duración T de un componente electrodinámico es una variable aleatoria con distribución exponencial de media µ. Veinte componentes han sido sometidos a un ensayo y el número
de horas que han durado ha sido:
10.99 15.79 24.14 34.43 43.72 51.72 56.12 60.27 77.20 88.47
91.07 117.58 130.40 133.12 152.90 159.00 193.62 208.71 308.82 316.07
Teniendo en cuenta que 2T /µ tiene distribución χ2 con dos grados de libertad, realiza el siguiente
contraste
H0 : µ = 200 horas,
H1 : µ < 200 horas,
con α = 0.05.
4
EXÁMENES
CURSO 2016/17
Evaluación Continua 1
Estadı́stica
17 de octubre de 2016
Problema (45 minutos)
Para una sesión de juegos de azar existen dos dados: el primero está equilibrado (es decir,
todos los resultados son equiprobables), y para el otro, las probabilidades de los cinco primeros
resultados son 0.2, 0.13, 0.16, 0.15 y 0.19.
1. Calcular la media, mediana y varianza del resultado de lanzar cada uno de los dos dados.
2. De un cubilete se extrae al azar uno de los dos dados y se lanza dos veces:
a) ¿Cuál es la probabilidad de que la suma de los dos lanzamientos sea mayor que dos?
b) La suma ha resultado mayor que dos, ¿cuál es la probabilidad de que se haya lanzado
el segundo dado?
3. Se lanza el segundo dado seis veces:
a) ¿Cuál es la probabilidad de obtener dos veces el 3?
b) ¿Cuál es la probabilidad de que salga dos veces el 3 y cuatro veces el 4?
Evaluación Continua 1
Estadı́stica
17 de octubre de 2016
Solución del problema
1.
Para el dado equilibrado
6
P
E[X] =
i × 1/6 = 3, 5
i=1
var[X] = E[X 2 ] − (E[X])2 =
6
P
i2 × 1/6 − (3, 52 ) = 2, 91
i=1
mediana = 3 (la probabilidad acumulada 0,5 se alcanza en 3).
Para el dado no equlibrado:
6
P
E[X] =
i × P (X = i) = 3, 51
i=1
var[X] = E[X 2 ] − (E[X])2 =
6
P
i2 × P (X = i) − (3, 512) = 3, 11
i=1
mediana = 4 (la probabilidad acumulada 0,5 se alcanza en 4).
2.
3.
a) Por el teorema de la probabilidad total:
P [S > 2] = P [dadoeq] ∗ P [S > 2|dadoeq] + P [dadoNoeq] ∗ P [S > 2|dadoNoeq]
= (1/2) ∗ (1 − (1/6)2) + (1/2) ∗ (1 − (0, 2)2 ) = 0, 9667
ya que la suma será mayor que 2 cuando la pareja de resultados sea distinta
de la (1,1)
b) Por el teorema de Bayes
P [dadoNoeq|S > 2] = P [dadoNoeq] ∗ P [S > 2|dadoNoeq]/P [S > 2] = 0, 497
a) Hay 62 combinaciones para las cuales dos de los resultados son el 3
P [2 veces el 3] = 62 0, 1620, 844 = 0, 191
b) También hay 62 combinaciones para las cuales dos de los resultados son
el 3 y 4 veces el 4
P[2 veces el 3 y 4 veces el 4] = 62 0, 1620, 144 = 1, 94 · 10−4
Corrected
Parcial 1
GITI, GIQ y GIO
17-10-2016
Tiempo: 60 minutos.
No se permite realizar esquemas, dibujos o anotaciones en este documento, sólo marcar la
opción elegida. Para marcar su respuesta, rellene todo el cuadrado de la opción seleccionada. Para
corregir, emplee un corrector sin reconstruir el cuadrado original. Las preguntas correctas suman
1 punto. Las preguntas sin respuesta, preguntas incorrectas o preguntas con más de una respuesta
suman 0 puntos.
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
←− Marque su número de matrícula con los dígitos en los re-
cuadros (con ceros a la izquierda si es necesario). En el recuadro
de aquí abajo escriba apellidos y nombre.
Apellidos, Nombre:
...............................................................
Pregunta 1 Se sabe que E[X ]=4 y E[X 2 ]=25. Determinar los intervalos alrededor de la media
de esta variable aleatoria que contengan al menos el 75 % de la probabilidad.
(-2, 10)
N/A
(-1, 11)
(-3, 9)
(0, 12)
Pregunta 2 En una universidad hay un 20 % de estudiantes de humanidades, un 30 % de
económicas y empresariales, un 20 % de ciencias y un 30 % de ingeniería. Las proporciones de
estudiantes extranjeros en cada rama son del 30 %, 50 %, 60 % y 70 % respectivamente. Si se elige
un alumno al azar y es extranjero, ¾cuál es la probabilidad de que sea de ciencias?
0.22
Pregunta 3
N/A
0.17
0.33
0.51
Una variable aleatoria continua X tiene como función de densidad
fX (x) =
x
1
exp(− ),
4
4
si x ≥ 0
Se obtienen de manera independiente cinco valores de dicha variable. ¾Cuál es la probabilidad de
que ninguno los valores esté comprendido entre 1 y 4?
0.52
0.21
N/A
0.48
0.83
Pregunta 4 La baraja francesa es un conjunto de cartas formado por 52 unidades repartidas en
cuatro palos: corazones, diamantes, tréboles y picas. Cada uno de estos palos está compuesto por
13 cartas: AS, Dos, Tres, Cuatro, Cinco, Seis, Siete, Ocho, Nueve, Diez, y las tres guras, que se
llaman Valet (V), Dame (D) y Roi (R). Se reparten al azar las 52 cartas de una de estas barajas
a dos jugadores, 26 a cada uno. ¾Cuál es la probabilidad de que uno de los jugadores tenga los
cuatro ases?
4!(48
22)
52
26
( )
N/A
4(48
22)
52
26
( )
48!52!
22!26!
(48
22)
(52
26)
Corrected
Pregunta 5 Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se extraen
al azar 3 bolas sin reposición. Calcular la probabilidad de que la primera sea azul, y las otras dos
verdes.
1/6
Pregunta 6
2/18
3/83
N/A
1/18
Sea X una variable aleatoria con función de densidad
x ∈ (0, 1]
fX (x) = 1,
Calcular la esperanza de U = − ln X .
0.0
1.5
1.0
0.5
N/A
Pregunta 7 El número de horas dedicadas al estudio de una asignatura y la calicación nal
obtenida en el correspondiente examen de ocho personas vienen dados en la siguiente tabla:
X: Horas de estudio
Y: Calicación de examen
20
6.5
16
6.0
34
8.5
23
7.0
27
9.0
32
9.5
18
7.5
22
8.0
Calcular la covarianza.
N/A
Pregunta 8
5.75
5.60
5.50
5.85
La función de densidad de la variable aleatoria X es
fX (x) = kx2 ,
si x ∈ [1, 7]
Calcular P (X ≥ 3|X ≤ 4).
0.74
N/A
0.43
0.52
0.38
Pregunta 9 Sea el circuito de la gura. La probabilidad de que un elemento tipo X falle es 0,10
y la probabilidad de que un elemento tipo Y falle es 0,05. ¾Cuál es la probabilidad de que pase
corriente del punto A al punto B?
0.77
0.99
0.88
N/A
0.66
Pregunta 10 Sean A y B dos sucesos de un experimento aleatorio tales que P (A) = 1/2,
P (B) = 1/3, P (A ∩ B) = 1/4. Calcular P (Ā|B̄ ).
1/8
5/8
1/6
N/A
3/8
𝑃(𝑋𝑚 = 1) = 0.3 𝑒 −0.3 = 0.222
𝑃(𝑋𝑀 = 1) = 0.02 𝑒 −0.02 = 0.020
120
0.405 ∗ 370
𝑃(𝑋𝑚 = 1|𝑚)𝑃(𝑚)
𝑃(𝑚 | 𝑋 = 1) =
=
𝑃(𝑋𝑚 = 1|𝑚)𝑃(𝑚) + 𝑃(𝑋𝑀 = 1|𝑀)𝑃(𝑀) 0.405 ∗ 120 + 0.0204 ∗ 250
370
370
= 0.8421
𝑓𝑋𝑌 (𝑥, 𝑦) =
1
6
−2<𝑥 <0
𝑃(|𝑋 − 𝑌| > 3) =
0<𝑦<3
∬ 𝑓𝑋𝑌 (𝑥, 𝑦)𝑑𝑥𝑑𝑦 =
|𝑋−𝑌|>3
1
3
𝑃(𝑋 > 0.9 | 𝑋 ~𝑁(0.9, 0.1))) = 0.5
0.53 = 0.031
𝑃(99.6 < 𝑋 < 100.4 | 𝑋 ~𝑁(100, 0.25))) = 0.89
1
𝐸[𝑌] = = 9.09
𝑝
𝐸[𝑋] = 3.5 𝑉𝑎𝑟[𝑋] = 2.92
𝑌~𝑁(100 · 3.5, √100 · 2.92) = 𝑁(350, 17.09 )
𝑃(𝑌 > 365) = 0.19
𝑍 = 𝑋1 − 𝑋2 − 𝑋3
𝑃(𝑋1 > 𝑋2 + 𝑋3 ) = 𝑃(𝑍 > 0)
𝑋1
𝑋1
𝑧 = [ 1 − 1 − 1 ] [𝑋2 ] = 𝐴 [𝑋2 ]
𝑋3
𝑋3
𝜇𝑧 = −10 𝜎𝑧2 = 10
𝑃(𝑍 > 0 | 𝑍~𝑁(−10, √10)) = 0.001
𝑉𝑎𝑟𝑌 = [
1/𝜎1
1/𝜎1
𝜎2
1/𝜎2
][ 1
−1/𝜎2 𝜌𝜎1 𝜎2
𝜌𝜎1 𝜎2 1/𝜎1
][
1/𝜎2
𝜎22
1/𝜎1
2 + 2𝜌
] =[
0
−1/𝜎2
0
]
2 − 2𝜌
𝑃(𝑋 > 52 | 𝑋 ~𝑁(45, 4))) = 0.0401
10
𝑃(𝑌 = 3 | 𝑌~𝐵𝑖𝑛𝑜𝑚(𝑛 = 10, 𝑝 = 0.04)) = ( ) 0.043 0.967 = 0.006
3
𝜆 = 25
𝑃(𝑋 = 20) =
𝑐𝑜𝑐ℎ𝑒𝑠
500 𝑚
2520 −25
𝑒
= 0.0519
20!
2
𝑧𝛼 √𝑝𝐴 · (1 − 𝑝𝐴 ) − 𝑧𝛽 √𝑝𝐵 · (1 − 𝑝𝐵 )
𝑛=(
)
𝑝𝑅 − 𝑝𝐴
2
1.64√0.02 · (1 − 0.02) + 1.64√0.04 · (1 − 0.04)
=(
) = 762
0.04 − 0.02
21 de noviembre de 2016
Problema (45 minutos, 5 puntos)
El examen MIR para acceder a la formación de especialistas médicos en España consta de 225 preguntas
tipo test con 4 opciones de las que solo una es válida.
La valoración del examen se calcula multiplicando el número de preguntas correctas por 3 y restando
las preguntas erróneas. Por lo tanto, si el aspirante responde r preguntas (r ≤ 225) y denominando X al
número de preguntas correctamente respondidas por el aspirante de un total de 225, entonces la valoración
será:
V = 3X − (r − X).
Con esta información responda a las siguientes preguntas:
1. En los cuestionarios similares realizados para preparar el examen, un aspirante responde a las 225
preguntas (r = 225) con una probabilidad de acertar la respuesta de 0.9 ¿Cuál es la probabilidad de
que la valoración del aspirante en un examen supere los 600 puntos?
Solución:
V = 3X − (r − X) = 4X − r
√
r = 225 =⇒ X −→ B(n = 225, p = 0,9) =⇒ X N(225 ∗ 0,9; 225 ∗ 0,9 ∗ 0,1) =⇒
X N(202,5, 4,5)
E[V ] = 4E[X] − 225 = 4 ∗ 202,5 − 225 = 585
V ar[V ] = 42 V ar[X] = 16 ∗ 4,52 = 322,4 =⇒ σ V = 18 =⇒
V N(585, 18)
Por lo tanto:
600 − 585
) = P (Z > 0,83) = 1 − Φ(0,83) = 0,2033.
P (V > 600|V N(585, 18)) = P (Z >
18
2 Un grupo de 10 aspirantes de la academia A contestan a todas las preguntas y tienen una probabilidad
de acertar la respuesta de 0.9 ¿Cuál es la probabilidad de que la valoración media de los 10 aspirantes
supere los 590 puntos? ¿Cuál es la probabilidad de que la valoración de un aspirante de la academia
B, con una probabilidad de acertar la respuesta de 0.7, supere el 80 % de la valoracion media de los
aspirantes de la academia A?
Solución:
a)
V =
V1 + V2 + V3 + .... + V10
.
10
Piden P (V > 590).
E[V ] = E[V ] = 585 y
V ar[V ] =
V ar[V ]
322,4
=
=⇒ σV = 5,69. =⇒
10
10
V N(585, 5,69).
P (V > 590|V N(585, 5,69)) = P (
V − 585
590 − 585
>
) = P (Z > 0,8784) = 1−Φ(0,88) = 0,1894 .
5,69
5,69
21 de noviembre de 2016
b)
Piden P (VB > 0,8 ∗ V ) = P (VB − 0,8 ∗ V > 0) =⇒
Se sabe que VB = 3XB − (r − XB ) = 4XB − 225, siendo XB −→ B(n = 225, p = 0,7) =⇒
√
XB N(225 ∗ 0,7, 225 ∗ 0,7 ∗ 0,3) =⇒
√
XB N(157,5, 47,25).
Por lo tanto
E[VB ] = 4 ∗ E[XB ] − 225 = 4 ∗ 157,5 − 225 = 405
y V ar[VB ] = 16 ∗ V ar[XB ] = 16 ∗ 47,25 = 756 =⇒ σV B = 27,5.
VB N(405, 27,5).
Denominando W = VB − 0,8 ∗ V =⇒La probabilidad pedida se puede escribir como P (W > 0).
Se calcula E[W ] = E[VB ] − 0,8E[V ] = 405 − 0,8 ∗ 585 = −63,0;
V ar[W ] = V ar[VB ] + 0,82 ∗ V ar[V ] = 756 + 0,64 ∗ 32,24 = 776,63 =⇒ σW = 27,87 =⇒
W N(−63, 27,87)
P (W > 0|W −→ N(−63, 27,87)) =⇒ P (Z >
63
) = P (Z > 2,26) = 1 − Φ(2,26) = 0,0119.
27,87
3. ¿Cuál es la probabilidad de que la valoración máxima alcanzada por alguno de los 10 aspirantes de la
academia A supere los 590 puntos?
Solución
Piden: P(Valoracion de alguno de los 10 alumnos >590)=1-P(Valoración de todos<590)=
= 1 − [P (V1 < 590.V2 < 590.......V10 < 590)] =
= 1 − [P (V1 < 590)]10 = 1 − [0,6103]10 = 0,9928.
Esta probabilidad se ha calculado sabiendo que V1 , V2 ..V10 tienen todos la misma distribución calculada
en el primer apartado
V N(585, 18).
P (V < 590) = P (Z <
590 − 585
5
) = P (Z < ) = P (Z < 0,28) = 0,6103.
18
18
Corrected
Parcial 3
GITI, GIQ y GIO
19-12-2016
Tiempo: 60 minutos.
No escribir nada en este documento, sino marcar una única opción en cada pregunta. Rellenar todo el
cuadrado (no es válido marcarlo con una cruz o un tick), con bolígrafo azul o negro (no lápiz). Para corregir,
emplee un corrector sin reconstruir el cuadrado original. Las preguntas correctas suman 1 punto. Las preguntas
sin respuesta, preguntas incorrectas o preguntas con más de una respuesta suman 0 puntos.
El incumplimiento de las normas anteriores podría anular la totalidad de la nota correspondiente a esta parte del examen.
0
0
0
0
0
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
4
5
5
5
5
5
6
6
6
6
6
7
7
7
7
7
8
8
8
8
8
9
9
9
9
9
←− Marque su número de matrícula con los dígitos en los recuadros
(con ceros a la izquierda si es necesario). En el recuadro de aquí abajo
escriba apellidos y nombre.
Apellidos, Nombre:
.......................................................................
Pregunta 1
de densidad es:
La longitud de una molécula fragmentada en un proceso de químico es una variable cuya función
fX (x) = β(1 − x)β−1 ,
0 < x < 1,
donde β > 0 es un parámetro desconocido. La medida de la molécula es muy difícil de obtener, pero en un
experimento se ha observado que de las 180 moléculas obtenidas, 64 eran menores o iguales que 0.5 y el resto
mayores. La función de verosimilitud para el parámetro β en este caso es:
l(β) = (1 − 0,5β )64 ·0,5116·β
l(β) = β 180 (1 − x)180(β−1)
l(β) = β 180 (1 − x1 )β−1 (1 − x2 )β−1 · · · (1 − x180 )β−1
l(β) = β 180 (1 − 0,5)180(β−1)
l(β) = (1 − 0,5β )180 ·0,5180·β
Sea X una variable aleatoria con función de densidad fX (x) = (1 + θ)xθ , 0 < x < 1, θ > 0.
Determine el estimador de θ por el método de los momentos para la muestra (0.25 ,0.6, 0.1, 0.65, 0.5).
Pregunta 2
0.276
NDLA
0.42
-0.276
0.42
Corrected
La duración de las bombillas de 100 W que fabrica una empresa sigue una distribución normal
con una desviación típica de 120 horas de duración. Se sabe que su vida media es de 800 horas. Se escoge al azar
una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una vida media de 750 horas.
¾Habría que rechazar el lote por no cumplir la garantía?
Pregunta 3
NDLA
Se acepta H0 tanto para α = 0,05 como para α = 0,01.
Con α = 0,05 se acepta H0 , pero con α = 0,01 no.
Rechazamos la hipótesis nula tanto para α = 0,05 como para α = 0,01. correcta
Con α = 0,01 se acepta H0 , pero con α = 0,05 no.
Pregunta 4
Determine el tamaño n de la muestra para estimar la media µ de una población con σ = 5, si
se quiere tener una conanza del 95 % de que el error cometido en la estimación sea como mucho ±0, 5.
n = 38383
n = 38416
n = 35500
n = 39416
n = 37996
Se desea estimar la media y la varianza de una distribución normal. Para ello, se toma una
muestra de n datos y se calculan su media y varianza muestrales. Calcule el sesgo de estos estimadores de la
media y varianza poblacionales, respectivamente.
Pregunta 5
Depende de los datos de la muestra.
sesgo(b
µ = x) 6= 0 y sesgo( σ
b2 = s2 ) 6= 0
2
2
sesgo(b
µ = x) 6= 0 y sesgo( σ
b =s )=0
NDLA
2
2
sesgo(b
µ = x) = 0 y sesgo( σ
b = s ) 6= 0
Pregunta 6
Se toma una muestra de tres valores x1 , x2 y x3 de una variable aleatoria con función de densidad
fX (x) = 1,
θ − 0,5 < x < 0,5 + θ,
donde θ es un parámetro desconocido. El Error Cuadrático Medio (ECM) del estimador por el método de los
momentos de θ es:
θ4 /2
Pregunta 7
0,52 /12
θ2 /12
θ2 /36
1/36
Una encuesta sobre la Constitución Europea tuvo en un país los siguientes resultados:
A favor
En contra
Indecisos
Abstenciones
810
520
250
120
Calcule un intervalo de conanza al 95 % para la proporción de indecisos.
0,130 ≤ p ≤ 0,230
0,130 ≤ p ≤ 0,164
0,164 ≤ p ≤ 0,190
0,106 ≤ p ≤ 0,214
0,250 ≤ p ≤ 0,520
Sea X una variable aleatoria con función de densidad fX (x) = θ3 x2 e−x /θ , x > 0, θ > 0. Dada
una muestra aleatoria simple de tamaño n de X , determinar θ̂M V ,la estimación máximo verosimil de θ.
3
Pregunta 8
θ̂M V = x3
θ̂M V =
1
n
P
x3i +
1
n
P
x2i
NDLA
θ̂M V =
1
n
P
x3i
θ̂M V = s3/2 /n
Corrected
Para un determinada fuente radiactiva, se han detectado 20 desintegraciones en 3 minutos,
calcule el intervalo de conanza del 95 % para la tasa de desintegraciones (en desintegraciones/minuto)
Pregunta 9
3.56 - 7.68
3.74 - 9.59
4.74 - 8.58
NDLA
2.33 - 4.89
Pregunta 10
Una empresa fabrica cables cuya resistencia media a la rotura es de 300 kg con desviación típica
24 kg. Se toma una muestra de 64 cables producidos mediante un nuevo método obteniendo una resistencia
media de 310kg . Plantee las hipótesis para realizar el contraste para estudiar si efectivamente el nuevo método
proporciona mejores resultados que el antiguo.
H0 : µ = 300; H1 : µ > 300
NDLA
H0 : µ = 310; H1 : µ < 310
H0 : x = 310; H1 : x < 310
H0 : x = 300; H1 : x > 300
Examen de ESTADÍSTICA, GITI, GIQ y GIO
18 de enero de 2017
Problema (60 minutos, 10 puntos)
Se tiene una muestra con n = 15 datos correspondientes a los tiempos de vida de un componente eléctrico
(en miles de horas):
(0.016; 0.027; 0.03; 0.048; 0.055; 0.072; 0.103; 0.123; 0.136; 0.143; 0.189; 0.238; 0.244; 0.274; 0.311)
1) Se pide realizar el diagrama de cajas y explicar las características más relevantes del
mismo. (2 puntos)
Con n = 15 datos, el Q1 es el que ocupa la posición 4 con los datos ordenados de forma creciente, es decir
Q1 = 0;048, y por ello el Q3 = 0;238, el cuarto valor mayor para que Q1 y Q3 tengan posiciones simétricas.
Q2 o mediana es 0.123.
RI = Q3 Q1 = 0;238 0;048 = 0;19:
LS = Q3 + 1;5 RI = 0;523 ! Entonces el bigote superior es el mayor valor muestral: 0.311
LI = Q1 1;5 RI = 0;237 ! Entonces el bigote inferior es el menor valor muestral: 0.016
2) Los tiempos de vida de los componentes eléctricos de la marca A se ditribuyen como
una Uniforme en el intervalo [0, 3]. Se pide escribir la expresión de la función de densidad de
dicha variable aleatoria a la que se denomina Y . (1 punto)
Una distribución uniforme en el intervalo indicado, [0, 3] tiene esta función de densidad:
fY (y) = 1=3 si 0 y 3 y 0 en el resto.
Se sabe además que los tiempos de vida de componentes eléctricos iguales pero de la marca
B tienen un tiempo de vida (en miles de horas, como los de la marca A) con la siguiente función
de densidad:
Si se tiene la misma cantidad de componentes de las marcas A y B, se pide:
3) Calcular la probabilidad de que un componente elegido al azar dure más de 500 horas.
(2 puntos)
Sea C: tiempo de vida de un componente es > 500h. Entonces , si mA es: marca A, y de forma análoga
mB es: marca B, por el teorema de la probabilidad total:
Examen de ESTADÍSTICA, GITI, GIQ y GIO
18 de enero de 2017
pr(C) = pr(C \ mA) + pr(C \ mA) =
= pr(CjmA) pr(mA) + pr(CjmB) pr(mB)
Calculamos pr(CjmB) = pr(X > 0;5) = 1 pr(X 0;5) = 1
R3
pr(CjmA) = pr(Y > 0;5) = 0;5 13 dy = 5=6
Entonces, como pr(mA) = pr(mB) = 1=2 se tiene que:
pr(C) = 56 12 + 78 12 = 41
48 = 0;8541
R 0;5
0
x dx = 7=8
4) Si un componente eléctrico ha durado más de 500 horas, calcula la probabilidad de que
sea de la marca B. (2.5 puntos)
Por el Teorema de Bayes, y el denominador (probabilidad total) se tiene del apartado anterior.
pr(mBjC) =
pr(CjmB) pr(mB)
pr(C)
=
7 1
8 2
5 1
+ 78 12
6 2
=
21
41
= 0;5122
5) Si se tienen 10 componentes de la marca B, calcula la probabilidad de que al menos 9
de ellos duren más de 500 horas. (2.5 puntos)
Sea W : Número de componentes de la marca B que duran más de 500 horas.
Entonces W ! Binomial(n = 10; p = 7=8):
Hay que calcular pr(W 9) = pr(W = 9) + pr(W = 10); donde:
10 7 9 1 1
pr(W = 9) =
8
8
9
10 7 10 1 0
pr(W = 10) =
8
10 8
Estadística
Modelos univariantes y multivariantes
18 de enero de 2017
ESTADÍSTICA
Problema (60 minutos)
La empresa NECE, S.L. fabrica planchas de celulosa. Se está realizando un estudio piloto
sobre el número de manchas que aparecen en las planchas de celulosa de 4m2 . Estudios
anteriores veri…can que por termino medio aparecen 3 manchas por m2 .
1. Calcule la probabilidad de que al observar tres planchas elegidas de manera aleatoria
de 4m2 cada una, ninguna de las tres tenga más de 6 manchas.(2 .5 puntos)
NECE, S.L. tiene tres fábricas en enclaves distintos. Las producciones de las planchas de
celulosa en millones de m2 en cada uno de los enclaves son respectivamente X1 ; X2 y X3 . La
distribución conjunta de las tres producciones sigue una normal tridimensional con vector
T
de medias X = 0:7 0:8 0:9 y matriz de varianzas y covarianzas MX
2
3
2
1 0
MX = 4 1 2 0 5 :
0
0 1
Se considera una producción media para las tres sucursales, W; que se obtiene como el
promedio de ellos:
W =
X1 + X2 + X3
3
2. Calcule la distribución del nivel de fabricación medio W (calculando la media y la
varianza). (2 .5 puntos)
3. Calcule la covarianza entre X2 y W:¿Son independientes? (2 .5 puntos)
4. Se calculan dos nuevos índicadores Y1 e Y2 con la producción de los dos primeros
enclaves Y1 = X1 + X2 e Y2 = X1 X2 . Calcule y escriba la función de densidad
conjunta de estas dos nuevas variables. ¿Cuánto vale el coe…ciente de correlación entre
Y1 e Y2 ? (2 .5 puntos)
Solución al Problema
1. Calcule la probabilidad de que al observar tres planchas elegidas de manera aleatoria
de 4m2 cada una, ninguna de las tres tenga más de 6 manchas.(2 .5 puntos)
Sea M la variable aleatoria número de manchas por unidad de observación, así M sigue
una distribución de Poisson P ( = 12 manchas por 4m2 ):
La probabilidad pedida es:
p = P (M1
6 \ M2
6 \ M3
6) = (P (Mi
6))3
La probabilidad de que una plancha de 4m2 tenga como mucho 6 manchas se puede
abordar desde la Poisson o haciendo una aproximación a la normal.
Estadística
(a) P (Mi
(b) P (Mi
Modelos univariantes y multivariantes
6jMi ! P ( = 12)) =
6jMi ! N ( = 12;
6
X
e
m=0
=
p
m
12 12
m!
18 de enero de 2017
= 0:046
12)) = P (Z
6 12
p
) = 0:043
12
La probabilidad pedida es:
p = (P (Mi
6))3 = 9; 62110
5
NECE, S.L. tiene tres fábricas en enclaves distintos. Las producciones de las planchas
de celulosa en millones de m2 en cada uno de los enclaves son respectivamente X1 ; X2 y
X3 . La distribución conjunta de las tres producciones sigue una normal tridimensional
T
con vector de medias X = 0:7 0:8 0:9 y matriz de varianzas y covarianzas MX
2
2
4
1
MX =
0
3
1 0
2 0 5:
0 1
Se considera una producción media para las tres sucursales, W; que se obtiene como el
promedio de ellos:
W =
X1 + X2 + X3
3
2. Calcule la distribución del nivel de fabricación medio W (calculando la media y la
varianza).
La variable aleatoria W es combinación lineal de variables aleatorias normales, por lo
que seguirá una distribución normal univariante. Se calcula a continuación la esperanza
y la varianza de dicha variable.
1
0:7 + 0:8 + 0:9
E[W ] = [E[X1 ] + E[X2 ] + E[X3 ]] =
= 0:8
3
3
V ar[W ] = V ar[
X1 + X2 + X3
1
3
1
] = [V ar[X1 ]+V ar[X2 ]+V ar[X3 ]+2Cov(X1 ; X2 )] = =
3
9
9
3
1
Por lo tanto W ! N (0:8; p ); con función de
3
p
3
fW (w) = p exp[
2
densidad:
1 w
(
2
0:8
p1
3
)2 ]
Modelos univariantes y multivariantes
Estadística
18 de enero de 2017
3. Calcule la covarianza entre X2 y W:¿Son independientes?
3 2 1
X1
4 X2 5 = 6
4 0
1
W
3
2
V N ! N (A
X ; AMX A
T
T
3
0 2 X 3
1
0 7
4
5 X2 5 ! V N = AX
1
X3
3
0
1
1
3
),
siendo AMX A la matriz de nueva variable vectorial V N: Así:
VN
MV N
=A
2
1
6
= AMX AT = 4 0
1
3
X
2
1
6 0
=4
1
3
0
1
1
3
32
0
1
1
3
0
2
0 7
54 1
1
0
3
3
0 2 0:7 3 2 0:7 3
0 7
5 4 0:8 5 = 4 0:8 5 ;
1
0:9
0:9
3
32 1
1 0
6
2 0 54 0
1
0 1
3
0
1
1
3
3T
2
0
6 2
6
0 7
5 =6
6 1
1
4 1
3
3
1
2
1
3
1
3
1
3
1
3
3
7
7
7:
7
5
1
y claramente no son independientes.
3
4. Se calculan dos nuevos índicadores Y1 e Y2 con la producción de los dos primeros
enclaves Y1 = X1 + X2 e Y2 = X1 X2 . Calcule y escriba la función de densidad
conjunta de estas dos nuevas variables. ¿Cuánto vale el coe…ciente de correlación entre
Y1 e Y2 ?
Por lo que Cov( X2 ,W ) =
Y1
Y2
Y =
siendo
X12 ;
X1
X2
=B
=
1
1
1
1
X1
X2
;
X1
X2
MX12 el vector de medias y la matriz de varianzas de X12 =
respectivamente, así:
X12
=
0:7
0:8
y MX12 =
1
1
1
1
0:7
0:8
2
1
1
2
:
Por lo tanto:
Y
MY
= B
X12
=
= BMX12 B T =
1
1
1
1
=
2
1
1:5
0:1
1
2
;
1
1
1
1
T
=
2 0
0 6
:
Examen Final de Estadística
18 de enero de 2017
Problema 3 (60 minutos – 10 puntos)
Según la normativa legal vigente, para construir una vivienda es necesario realizar previamente un
estudio geotécnico del terreno. En este estudio, entre otras variables, se mide el contenido de sulfatos
solubles (contenido de SO4 medido en mg/kg) para determinar la agresividad del suelo.
En una parcela se realiza un estudio geotécnico tomando seis muestras, obteniendo los resultados
siguientes para el contenido de sulfatos solubles (en mg/kg):
1.850 1.950 2.010 2.100 1.960 1.890
Las mediciones anteriores siguen una distribución normal. Para los tres primeros apartados asumir
que, según la documentación técnica del aparato medidor, la precisión de las mediciones es de 𝜎𝜎 = 100
fmg/kg.
Emplear α = 0.05 en todos los apartados.
a) Indicar un intervalo de confianza del contenido de sulfatos solubles (𝜇𝜇). Calcular el número de
muestras que serían necesarias para que este intervalo tenga una longitud máxima de
100 mg/kg.
b) Se sabe que si el contenido en sulfatos solubles del terreno es mayor que 2.000 mg/kg, es
necesario emplear cementos sulforesistentes en la estructura de la vivienda, encareciendo el
presupuesto.
Contrastar si para la construcción de la casa es necesario el uso de cementos sulforesistentes.
Indicar el p-valor obtenido.
c) Calcular la probabilidad del error tipo II del contraste del ‘apartado b’ en función del contenido
de sulfatos solubles (𝜇𝜇), y evaluarla para los valores de 𝜇𝜇 iguales a 1.800, 2.000, 2.200 mg/kg.
d) En base a las observaciones anteriores, el ingeniero que está realizando el estudio geotécnico
desea comprobar si efectivamente la varianza de las mediciones es de 𝜎𝜎 2 = 1002 mg2/kg2, o si
es superior.
Realizar el contraste de hipótesis necesario para determinar si varianza del aparato medidor
cumple con las especificaciones técnicas.
Examen Final de Estadística
18 de enero de 2017
SOLUCIÓN
Apartado a)
En este apartado se pide calcular un intervalo de confianza para la media de una distribución normal,
con un nivel de confianza del 95%. En el enunciado nos indican la desviación típica poblacional.
𝐼𝐼𝐼𝐼(𝜇𝜇) = 𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2
𝜎𝜎
√𝑛𝑛
= [2040, 1880]
𝛼𝛼/2
El número de muestras necesarias para que el intervalo tenga una
longitud máxima de 100 es:
Apartado b)
2 · �𝑧𝑧𝛼𝛼/2
𝜎𝜎
√𝑛𝑛
� = 100 → 𝑛𝑛 = 15.3 ≈ 16
1.96
En este apartado se pide realizar un contraste de hipótesis unilateral sobre la media, conocida la
desviación típica poblacional de la distribución.
Si 𝐻𝐻0 es cierto:
𝐻𝐻 : 𝜇𝜇 = 𝜇𝜇0 = 2000
� 0
𝜇𝜇 > 2000
𝐻𝐻1 :
𝑧𝑧0 =
1960 − 2000
2
�100
6
= −0.163
𝛼𝛼 = 0.05
Como se puede observar, el valor z0 < 1.64. Por tanto, no
rechazamos la hipótesis nula. Es decir, no sería necesario emplear
cementos sulforesistentes en la edificación.
1.64
El p-valor se calcula como P(Z > z0) = 0.564. Es decir, desde el punto de vista gráfico, corresponde
con el área que está a la derecha del valor z0.
Apartado c:
El error del tipo II es la probabilidad de aceptar la hipótesis nula cuando, en realidad, es falsa.
𝑃𝑃(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼𝐼𝐼) = 𝑃𝑃(𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝐻𝐻0 | 𝐻𝐻0 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓)
𝜎𝜎
𝜎𝜎
� 𝑋𝑋� ~𝑁𝑁 �𝜇𝜇, ��
√𝑛𝑛
√𝑛𝑛
𝜎𝜎
𝜇𝜇0 + 𝑧𝑧𝛼𝛼
− 𝜇𝜇
√𝑛𝑛
= 𝑃𝑃 �𝑍𝑍 <
�
𝜎𝜎
√𝑛𝑛
= 𝑃𝑃 �𝑋𝑋� < 𝜇𝜇0 + 𝑧𝑧𝛼𝛼
Examen Final de Estadística
18 de enero de 2017
H0 cierto:
𝛼𝛼 = 0.05
H0 falso:
2000 + 1.64 · 100/√6
2000
𝛽𝛽 = P(error II)
µ
Ahora evaluamos esta probabilidad para diversos valores de p:
𝑃𝑃(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼𝐼𝐼 | 𝜇𝜇 = 1800) ≈ 1
𝑃𝑃(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼𝐼𝐼 | 𝑝𝑝 = 2000) = 0.95
𝑃𝑃(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼𝐼𝐼 | 𝑝𝑝 = 2200) ≈ 0
Apartado d:
Hemos de realizar el siguiente contraste unilateral:
𝐻𝐻 : 𝜎𝜎 2 = 10000
� 0 2
𝐻𝐻1 : 𝜎𝜎 > 10000
Sabemos que
(𝑛𝑛 − 1)𝑠𝑠̂ 2
2
→ 𝜒𝜒𝑛𝑛−1
𝜎𝜎 2
(6 − 1) · 7840
10000
2
De las tablas obtenemos que P( 𝜒𝜒5 < 11.07) = 0.95.
𝜒𝜒02 =
Como se cumple que ‘𝜒𝜒02 < 11.07’, se deduce que no hay evidencia estadística para rechazar
H0 con un nivel de confianza del 95%. Aceptamos H0.
3 de julio de 2017
Problema (60 minutos, 10 puntos)
En el primer cuatrimestre de una carrera universitaria hay 3 asignaturas, correspondientes a cada uno
de los 3 departamentos A, B y C.
Habitualmente las notas en cada examen de cada asignatura siguen una distribución normal con parámetros conocidos:
Asignatura
µ
σ
A
5
1.1
B
6
1.2
C
7
1.3
Se desprecian las probabilidades de que la nota sea negativa o mayor que 10.
1. En una promoción hay 400 alumnos. Suponiendo independencia entre las calificaciones obtenidas por
los alumnos y entre las calificaciones obtenidas por un mismo alumno en las tres asignaturas, ¿cuál
es la probabilidad de que en cada asignatura hayan aprobado más de la mitad de los alumnos?. Se
considera que una asignatura está aprobada cuando la calificación de un alumno es igual o superior a
5.
2. Se ha reducido el programa de la asignatura del Departamento A y se piensa que puede haber influido
en la proporción de aprobados. En el último examen han aprobado 300 alumnos de los 400 de la
promoción. ¿Existe evidencia estadística para afirmar que la proporción de alumnos aprobados ha
aumentado?
3. Un análisis detallado de las calificaciones muestra que en realidad existe correlación entre las notas
que obtiene un alumno en las tres asignaturas, siendo el coeficiente de correlación para cada pareja de
asignaturas igual a 0 4. ¿Cuál es la probabilidad de que el valor medio de las tres notas de un alumno
elegido al azar sea mayor que 5?
4. Se considera ahora que 1/ 3 de los alumnos tiene probabilidades 0.4, 0.5 y 0.6 de aprobar las asignaturas
de A, B y C respectivamente; para otro tercio las probabilidades son 0.5, 0.6 y 0.7 y, para el último
tercio 0.6, 0.7 y 0.8. ¿Cuál es la probabilidad de que de 100 alumnos elegidos al azar de entre los 400,
30 o más hayan aprobado las tres asignaturas?
Nota.- En todo el problema utilice α = 0,05.
Todos los apartados valen 2.5 puntos.
3 de julio de 2017
Solución:
1) XA = v.a num. de alumnos q aprueban asignatura de dep A;
5−5
) = 0,5
1,1
XA → B(n = 400, pA = 0,5) ∼ N(µ = 400 · 0,5, σ2 = 400 · 0,5 · 0,5) ∼ N(200, 100)
200 − 200
P (XA > 200|XA → N(200, 100) = P (Z > √
) = 0,5.
100
XB = v.a num. de alumnos q aprueban asignatura de dep B ;
5−6
) = P (Z > −0,833) =
La probabilidad de aprobar la asignatura B: pB = P (NB > 5) = P (Z >
1,2
0,7967
XB → B(n = 400, pB = 0,7967) ∼ N(µ = 319,68, σ2 = 64,79).
200 − 319,68
√
P (XB > 200|XB → N(319,68, 64,79) = P (Z >
) = 1.
64,79
La probabilidad de aprobar la asignatura A: pA = P (NA > 5) = P (Z >
XC = v.a num. de alumnos q aprueban asignatura de dep C ;
La probabilidad de aprobar la asignatura C: pC = P (NC > 5) = P (Z >
5−7
) = P (Z > −1,54) =
1,3
0,9382
XC → B(n = 400, pC = 0,9382) ∼ N(µ = 375,28, σ2 = 23,19).
200 − 375,28
√
P (XC > 200|XC → N(375,28, 23,19) = P (Z >
) = 1.
23,19
La probabilidad pedida es:
P (XA > 200, XB > 200, XC > 200) =independencia= P (XA > 200)P (XB > 200)P (XC > 200) =
0,7967
2)
El contraste:
H0 : p = 0,5
H1 : p > 0,5
Si H0 cierta:
p − 0,5
∼ N(0, 1)
0,5 ∗ 0,5
400
Z0 = ((300/400) − 0,50)/ 0,05(1 − 0,5)/400 = 10 =⇒ Se rechaza H0, hay evidencia estadística para
afirmar que la proporción de aprobados ha aumentado.
3) Sea Y: v.a valor medio de las tres notas de un alumno

 
N
1
5
Y = 1/3 1/3 1/3  N2  , E[Y ] = 1/3 1/3 1/3  6  = 6
N3
7



2
1/3
1, 1 1,1 × 1,22× 0,4 1,1 × 1,3 × 0,4
var[Y ] = 1/3 1/3 1/3 
1, 2
1,2 × 1,3 × 0,4   1/3  = 0,8653
1, 32
1/3

5−6
P (Y > 5|Y ∼ N(6, 0,8653)) = P (Z > √
) = P (Z > −1,07) = 0,8577.
0,8653
3 de julio de 2017
4) La probabilidad de aprobar las 3 asignaturas para un alumno elegido al azar es, aplicando el teorema
de la probabilidad total:
PT (aprobar) = P (aprobar|primertercio)∗P (primertercio)+P (aprobar|segundotercio)∗P (segundotercio)+
P (aprobar|tercertercio) ∗ P (tercertercio) =
1/3 ∗ 0,4 ∗ 0,5 ∗ 0,6 + 1/3 ∗ 0,5 ∗ 0,6 ∗ 0,7 + 1/3 ∗ 0,6 ∗ 0,7 ∗ 0,8 = 0,222
XT =v.a no de alumnos del total de 100 que han aprobado las 3 asignaturas ∼ B(n = 100, p = 0,222) ∼
N(µ = 100 ∗ 0,222, σ2 = 100 ∗ 0,222(1 − 0,222)) ∼ N(22,2, 17,27)
30 − 22,2
P (XT > 30) = P (Z > √
) = P (Z > 1,88) = 0,03.
17,27
+1/1/60+
y
Examen extraordinario de Estadística
GITI, GIQ y GIO
y
03-07-2017
Tiempo: 60 minutos.
No se permite realizar esquemas, dibujos o anotaciones en este documento, sólo marcar la
opción elegida. Para marcar su respuesta, rellene todo el cuadrado de la opción seleccionada. Para
corregir, emplee un corrector sin reconstruir el cuadrado original. Las preguntas correctas suman
1 punto. Las preguntas sin respuesta, preguntas incorrectas o preguntas con más de una respuesta
suman 0 puntos.
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
←− Marque su número de matrícula con los dígitos en los re-
cuadros (con ceros a la izquierda si es necesario). En el recuadro
de aquí abajo escriba apellidos y nombre.
Apellidos, Nombre:
...............................................................
Pregunta 1 Los usuarios de una biblioteca se dividen en tres grupos: Grupo A: hasta 14 años
de edad; Grupo B: entre 14 y 40 años; Grupo C: más de 40 años. El grupo A representa el 35 % de
los usuarios, el grupo B el 25 % y el grupo C el 40 %. Además se sabe que el 45 % de los usuarios
del grupo A, el 20 % del grupo B y el 60 % del grupo C acceden a la zona de audiovisuales. Si se
elige un usuario al azar que está en la zona de audiovisuales ¾cuál es la probabilidad de que sea
del grupo C?
0.54
0.19
0.92
0.43
0.65
Pregunta 2 El número de vehículos que llegan a una gasolinera sigue una distribución de Poisson
con parámetro λ = 3 vehículos por minuto. Calcular la probabilidad de que en 120 segundos llegue
al menos un vehículo.
0.99
0.05
0.85
0.62
0.41
Pregunta 3 En un contenedor disponemos de miles de piezas que pueden ser del calibre A, B
o C, con una probabilidad del 50 %, 30 % y 20 % respectivamente. Si se extraen 10 piezas, ¾cuál es
la probabilidad de obtener exáctamente cinco piezas del calibre A?
0.83
0.11
0.25
0.95
0.40
Pregunta 4 Sea X una variable aleatoria con función de densidad fX (x) = (1 + θ)xθ ,
0 < x < 1. Determínese el estimador de θ por el método de los momentos para la muestra
(0.25, 0.6, 0.1, 0.65, 0.5).
0.22
y
0.64
-0.53
0.08
-0.28
y
+1/2/59+
y
y
Pregunta 5 Dada fXY (x, y) = 2x, con 0 < y < x, 0 < x < 1, obtener la distribución condicionada fX|Y (x|y).
y 2 /(2x)
2/(1 − y)
x/(1 − y)
2x/(1 − y 2 )
y/(2x)
Pregunta 6 Se dispone de seis bolas, cuatro de ellas Blancas y dos Negras, que se reparten
aleatoriamente en tres urnas U1, U2 y U3 de la siguiente forma: Se coloca al azar una bola en U1,
luego dos bolas en U2 y las tres restantes en U3. ¾Cuál es la probabilidad de que en U2 haya una
bola de cada color?
2/9
3/5
8/15
1/4
5/11
Pregunta 7 Sea {X1 , X2 , X3 } una muestra aleatoria simple de tamaño 3 de la variable aleatoria
X → N (µ = 1, σ 2 = 3). Se dene el siguiente estimador para la esperanza de X , µ̂ = 0.6X1 +
0.2X2 + 0.2X3 . Calcular el error cuadrático medio de este estimador.
-5.85
1.32
0.28
3.14
2.11
Pregunta 8 La variable aleatoria X tiene una distribución uniforme en (0,10). Calcular la
probabilidad de que Y > 32, sabiendo que Y = 2X .
1/3
1/2
1/5
1/4
3/5
Pregunta 9 Se toma una muestra aleatoria de 100 personas que fallecieron el año pasado, y se
observa que tenían una edad promedio de 71.8 años y una desviación típica de 8.9 años. Calcular
un intervalo de conanza para la edad media de fallecimiento ( α = 0.05).
(47.90, 95.70)
(70.05, 73.55)
(68.66, 74.94)
(60.57, 83.03)
(66.03, 77.97)
Pregunta 10 El número de visitas que tiene la página web de una empresa se ha modelado como
una variable aleatoria de Poisson de parámetro 5 visitas por hora. Recientemente se ha contratado
los servicios de una empresa de publicidad para mejorar el número de visitas. Para comprobar
la ecacia de la campaña publicitaria se ha tomado una muestra aleatoria simple, resultando
3, 6, 9, 4, 3, 7, 5, 7, 10 visitas en una hora, y se realiza el contraste H0 : λ ≤ 5; H1 : λ > 5. Calcular
la probabilidad tipo II cuando λ = 5.5 (α = 0.05).
0.31
y
0.89
0.15
0.68
0.43
y
Corrected
Examen extraordinario de Estadística
GITI, GIQ y GIO
03-07-2017
Tiempo: 60 minutos.
No se permite realizar esquemas, dibujos o anotaciones en este documento, sólo marcar la
opción elegida. Para marcar su respuesta, rellene todo el cuadrado de la opción seleccionada. Para
corregir, emplee un corrector sin reconstruir el cuadrado original. Las preguntas correctas suman
1 punto. Las preguntas sin respuesta, preguntas incorrectas o preguntas con más de una respuesta
suman 0 puntos.
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
←− Marque su número de matrícula con los dígitos en los re-
cuadros (con ceros a la izquierda si es necesario). En el recuadro
de aquí abajo escriba apellidos y nombre.
Apellidos, Nombre:
...............................................................
Pregunta 1 Los usuarios de una biblioteca se dividen en tres grupos: Grupo A: hasta 14 años
de edad; Grupo B: entre 14 y 40 años; Grupo C: más de 40 años. El grupo A representa el 35 % de
los usuarios, el grupo B el 25 % y el grupo C el 40 %. Además se sabe que el 45 % de los usuarios
del grupo A, el 20 % del grupo B y el 60 % del grupo C acceden a la zona de audiovisuales. Si se
elige un usuario al azar que está en la zona de audiovisuales ¾cuál es la probabilidad de que sea
del grupo C?
0.54
0.19
0.92
0.43
0.65
Pregunta 2 El número de vehículos que llegan a una gasolinera sigue una distribución de Poisson
con parámetro λ = 3 vehículos por minuto. Calcular la probabilidad de que en 120 segundos llegue
al menos un vehículo.
0.99
0.05
0.85
0.62
0.41
Pregunta 3 En un contenedor disponemos de miles de piezas que pueden ser del calibre A, B
o C, con una probabilidad del 50 %, 30 % y 20 % respectivamente. Si se extraen 10 piezas, ¾cuál es
la probabilidad de obtener exáctamente cinco piezas del calibre A?
0.83
0.11
0.25
0.95
0.40
Pregunta 4 Sea X una variable aleatoria con función de densidad fX (x) = (1 + θ)xθ ,
0 < x < 1. Determínese el estimador de θ por el método de los momentos para la muestra
(0.25, 0.6, 0.1, 0.65, 0.5).
0.22
0.64
-0.53
0.08
-0.28
Pregunta 5 Dada fXY (x, y) = 2x, con 0 < y < x, 0 < x < 1, obtener la distribución condicionada fX|Y (x|y).
y 2 /(2x)
2/(1 − y)
x/(1 − y)
y/(2x)
2x/(1 − y 2 )
Corrected
Pregunta 6 Se dispone de seis bolas, cuatro de ellas Blancas y dos Negras, que se reparten
aleatoriamente en tres urnas U1, U2 y U3 de la siguiente forma: Se coloca al azar una bola en U1,
luego dos bolas en U2 y las tres restantes en U3. ¾Cuál es la probabilidad de que en U2 haya una
bola de cada color?
2/9
3/5
8/15
1/4
5/11
Pregunta 7 Sea {X1 , X2 , X3 } una muestra aleatoria simple de tamaño 3 de la variable aleatoria
X → N (µ = 1, σ 2 = 3). Se dene el siguiente estimador para la esperanza de X , µ̂ = 0.6X1 +
0.2X2 + 0.2X3 . Calcular el error cuadrático medio de este estimador.
-5.85
1.32
0.28
3.14
2.11
Pregunta 8 La variable aleatoria X tiene una distribución uniforme en (0,10). Calcular la
probabilidad de que Y > 32, sabiendo que Y = 2X .
1/3
1/2
1/5
1/4
3/5
Pregunta 9 Se toma una muestra aleatoria de 100 personas que fallecieron el año pasado, y se
observa que tenían una edad promedio de 71.8 años y una desviación típica de 8.9 años. Calcular
un intervalo de conanza para la edad media de fallecimiento ( α = 0.05).
(47.90, 95.70)
(70.05, 73.55)
(68.66, 74.94)
(60.57, 83.03)
(66.03, 77.97)
Pregunta 10 El número de visitas que tiene la página web de una empresa se ha modelado como
una variable aleatoria de Poisson de parámetro 5 visitas por hora. Recientemente se ha contratado
los servicios de una empresa de publicidad para mejorar el número de visitas. Para comprobar
la ecacia de la campaña publicitaria se ha tomado una muestra aleatoria simple, resultando
3, 6, 9, 4, 3, 7, 5, 7, 10 visitas en una hora, y se realiza el contraste H0 : λ ≤ 5; H1 : λ > 5. Calcular
la probabilidad tipo II cuando λ = 5.5 (α = 0.05).
0.31
0.89
0.15
0.68
0.43
Examen extraordinario de estadísti a. 3 de julio de 2017
Solu ión del test
1. Los usuarios de una bibliote a se dividen en tres grupos: Grupo A: hasta 14 años de edad;
Grupo B: entre 14 y 40 años; Grupo C: más de 40 años. El grupo A representa el 35%
de los usuarios, el grupo B el 25% y el grupo C el 40%. Además se sabe que el 45% de
los usuarios del grupo A, el 20% del grupo B y el 60% del grupo C a eden a la zona de
audiovisuales. Si se elige un usuario al azar que está en la zona de audiovisuales ¾ uál es
la probabilidad de que sea del grupo C?
Solu ión
Sean las variables aleatorias A, B, C : usuario del grupo A, B o C respe tivamente; AV :
usuario a ede a la zona de audiovisuales. La probabilidad que nos piden es
P (AV ∩ C)
P (AV |C)P (C)
=
=
P (AV )
P (AV |A)P (A) + P (AV |B)P (B) + P (AV |C)P (C)
P (C|AV ) =
=
0.60 · 0.4
= 0.54
0.45 · 0.35 + 0.20 · 0.25 + 0.60 · 0.4
2. El número de vehí ulos que llegan a una gasolinera sigue una distribu ión de Poisson on
parámetro λ = 3 vehí ulos por minuto. Cal ular la probabilidad de que en 120 segundos
llegue al menos un vehí ulo.
Solu ión
X: "número de vehí ulos en 2 minutos", X → Poisson(6)
P (X ≥ 1) = 1 − P (X = 0) = 1 − e−6 = 0.99
3. En un ontenedor disponemos de miles de piezas que pueden ser del alibre A, B o C, on
una probabilidad del 50%, 30% y 20% respe tivamente. Si se extraen 10 piezas, ¾ uál es
la probabilidad de obtener exá tamente in o piezas del alibre A?
Solu ión
X: "número de piezas del alibre A de un total de 10", X → Binomial(10,0.50)
P (X = 5) =
10
0.52 0.52 = 0.25
5
4. Sea X una variable aleatoria on fun ión de densidad fX (x) = (1 + θ)xθ , 0 < x < 1. Determínese el estimador de θ por el método de los momentos para la muestra (0.25, 0.6, 0.1, 0.65, 0.5).
Solu ión
E(X) =
Z
1
x(1 + θ)xθ dx =
0
1 + θ̂
2 + θ̂
= x̄ ⇒ θ̂ =
1+θ
2+θ
2x̄ − 1
= −0.28
1 − x̄
1
5. Dada fXY (x, y) = 2x, on 0 < y < x, 0 < x < 1, obtener la distribu ión ondi ionada
fX|Y (x|y).
Solu ión
fY (y) =
Z
x=1
fXY (x, y)dx =
x=y
fX|Y (x|y) =
Z
x=1
2xdx = 1 − y 2
x=y
fXY (x, y)
2x
=
fY (y)
1 − y2
6. Se dispone de seis bolas, uatro de ellas Blan as y dos Negras, que se reparten aleatoriamente en tres urnas U1, U2 y U3 de la siguiente forma: Se olo a al azar una bola en U1,
luego dos bolas en U2 y las tres restantes en U3. ¾Cuál es la probabilidad de que en U2
haya una bola de ada olor?
Solu ión
Sean los su esos: Bi : la bola i-ésima es blan a; Ni : la bola i-ésima es negra. La probabilidad
que nos piden es
P (B1 ∩ B2 ∩ N3 ) + P (B1 ∩ N2 ∩ B3 ) + P (N1 ∩ B2 ∩ N3 ) + P (N1 ∩ N2 ∩ B3 ) =
=
8
4 3 2 4 2 3 2 4 1 2 1
· · + · · + · · + · ·1=
6 5 4 6 5 4 6 5 4 6 5
15
7. Sea {X1 , X2 , X3 } una muestra aleatoria simple de tamaño 3 de la variable aleatoria X →
N (µ = 1, σ 2 = 3). Se dene el siguiente estimador para la esperanza de X , µ̂ = 0.6X1 +
0.2X2 + 0.2X3 . Cal ular el error uadráti o medio de este estimador.
Solu ión
E(µ̂) = E(0.6X1 + 0.2X2 + 0.2X3 ) = 0.6µ + 0.2µ + 0.2µ = µ ⇒ sesgo(µ̂) = 0
var(µ̂) = var(0.6X1 + 0.2X2 + 0.2X3 ) = 0.62 σ 2 + 0.22 σ 2 + 0.22 σ 2 = 0.44σ 2 = 1.32
ECM(µ̂) = sesgo(µ̂)2 + var(µ̂) = 1.32
8. La variable aleatoria X tiene una distribu ión uniforme en (0,10). Cal ular la probabilidad
de que Y > 32, sabiendo que Y = 2X .
Solu ión
P (Y > 32) = P (2X > 25 ) = P (X > 5) = 1/2
9. Se toma una muestra aleatoria de 100 personas que falle ieron el año pasado, y se observa
que tenían una edad promedio de 71.8 años y una desvia ión típi a de 8.9 años. Cal ular
un intervalo de onanza para la edad media de falle imiento (α = 0.05).
Solu ión
X: "edad de falle imiento", X̄ → N (µ, σ 2 /n)
#
Ŝ
Ŝ
= [70.05, 73.55]
µ ∈ x̄ − tn−1 √ , x̄ + tn−1 √
n
n
"
2
10. El número de visitas que tiene la página web de una empresa se ha modelado omo una
variable aleatoria de Poisson de parámetro 5 visitas por hora. Re ientemente se ha ontratado los servi ios de una empresa de publi idad para mejorar el número de visitas.
Para omprobar la e a ia de la ampaña publi itaria se ha tomado una muestra aleatoria simple, resultando 3, 6, 9, 4, 3, 7, 5, 7, 10 visitas en una hora, y se realiza el ontraste
H0 : λ ≤ 5; H1 : λ > 5. Cal ular la probabilidad tipo II uando λ = 5.5 (α = 0.05).
Solu ión
X: "número de visitas", X → P oisson(λ), λ̂ → N (λ, λ/n)
λ̂ → N (λ, λ/n) ⇒ P
!
λ̂ − λ
p
≤ 1.96|λ = 5 = 0.95 ⇒ λ̂ = 6.46
λ/n
P (error II) = P λ̂ ≤ 6.46|λ̂ → N (5.5, 5.5/9) = 0.89
3
z
P (Z ≤ z)
Ejemplo.
P(Z ≤ 1.96) = 0.9750
N(0,1)
Normal
Estandar
TABLA
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
0
.5000
.5398
.5793
.6179
.6554
.6915
.7257
.7580
.7881
.8159
.8413
.8643
.8849
.9032
.9192
.9332
.9452
.9554
.9641
.9713
.9772
.9821
.9861
.9893
.9918
.9938
.9953
.9965
.9974
.9981
.9987
0,01
.5040
.5438
.5832
.6217
.6591
.6950
.7291
.7611
.7910
.8186
.8438
.8665
.8869
.9049
.9207
.9345
.9463
.9564
.9649
.9719
.9778
.9826
.9864
.9896
.9920
.9940
.9955
.9966
.9975
.9982
.9987
0,02
.5080
.5478
.5871
.6255
.6628
.6985
.7324
.7642
.7939
.8212
.8461
.8686
.8888
.9066
.9222
.9357
.9474
.9573
.9656
.9726
.9783
.9830
.9868
.9898
.9922
.9941
.9956
.9967
.9976
.9982
.9987
0,03
.5120
.5517
.5910
.6293
.6664
.7019
.7357
.7673
.7967
.8238
.8485
.8708
.8907
.9082
.9236
.9370
.9484
.9582
.9664
.9732
.9788
.9834
.9871
.9901
.9925
.9943
.9957
.9968
.9977
.9983
.9988
0,04
.5160
.5557
.5948
.6331
.6700
.7054
.7389
.7704
.7995
.8264
.8508
.8729
.8925
.9099
.9251
.9382
.9495
.9591
.9671
.9738
.9793
.9838
.9875
.9904
.9927
.9945
.9959
.9969
.9977
.9984
.9988
0,05
.5199
.5596
.5987
.6368
.6736
.7088
.7422
.7734
.8023
.8289
.8531
.8749
.8944
.9115
.9265
.9394
.9505
.9599
.9678
.9744
.9798
.9842
.9878
.9906
.9929
.9946
.9960
.9970
.9978
.9984
.9989
0,06
.5239
.5636
.6026
.6406
.6772
.7123
.7454
.7764
.8051
.8315
.8554
.8770
.8962
.9131
.9279
.9406
.9515
.9608
.9686
.9750
.9803
.9846
.9881
.9909
.9931
.9948
.9961
.9971
.9979
.9985
.9989
0,07
.5279
.5675
.6064
.6443
.6808
.7157
.7486
.7794
.8078
.8340
.8577
.8790
.8980
.9147
.9292
.9418
.9525
.9616
.9693
.9756
.9808
.9850
.9884
.9911
.9932
.9949
.9962
.9972
.9979
.9985
.9989
0,08
.5319
.5714
.6103
.6480
.6844
.7190
.7517
.7823
.8106
.8365
.8599
.8810
.8997
.9162
.9306
.9429
.9535
.9625
.9699
.9761
.9812
.9854
.9887
.9913
.9934
.9951
.9963
.9973
.9980
.9986
.9990
0,09
.5359
.5753
.6141
.6517
.6879
.7224
.7549
.7852
.8133
.8389
.8621
.8830
.9015
.9177
.9319
.9441
.9545
.9633
.9706
.9767
.9817
.9857
.9890
.9916
.9936
.9952
.9964
.9974
.9981
.9986
.9990
z
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
0,00
.9990323
.9993128
.9995165
.9996630
.9997673
.9998409
.9998922
.9999276
.9999519
.9999683
0,01
.9990645
.9993363
.9995335
.9996751
.9997759
.9998469
.9998963
.9999305
.9999538
.9999696
0,04
.9991552
.9994023
.9995811
.9997091
.9997999
.9998636
.9999080
.9999385
.9999592
.9999733
0,05
.9991836
.9994229
.9995959
.9997197
.9998073
.9998688
.9999116
.9999409
.9999609
.9999744
0,06
.9992111
.9994429
.9996102
.9997299
.9998145
.9998739
.9999150
.9999433
.9999625
.9999755
0,07
.9992377
.9994622
.9996241
.9997397
.9998215
.9998787
.9999184
.9999456
.9999640
.9999765
σ = np (1 − p)
n→∞
p → 1/ 2
µ = np
Normal
µ,σ
λ = np
n → ∞, p → 0
σ= λ
λ →∞
µ =λ
λ
Poisson
Relación entre Binomial,
Poisson y Normal
0,03
.9991259
.9993810
.9995657
.9996982
.9997922
.9998583
.9999042
.9999359
.9999575
.9999721
Binomial
n,p
0,02
.9990957
.9993590
.9995499
.9996868
.9997842
.9998527
.9999004
.9999333
.9999557
.9999709
Distribución normal estándar (continuación)
0,08
.9992636
.9994809
.9996375
.9997492
.9998282
.9998834
.9999216
.9999478
.9999655
.9999775
N(0,1)
z
0,09
.9992886
.9994990
.9996505
.9997584
.9998346
.9998878
.9999247
.9999499
.9999669
.9999784
P (Z ≤ z)
α
P(χ9 ≥ 19,02) = 0,025
EJEMPLO
ν: grados de libertad (g.l.)
χ ν, α
Tabla χ2
g.l.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
0,995
,00004
,01002
,0717
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,260
9,886
10,520
11,160
11,808
12,461
13,121
13,787
20,707
27,991
35,534
43,275
51,172
59,196
67,328
83,852
0,990
,00016
,0201
0,115
0,297
0,554
0,872
1,239
1,647
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,878
13,565
14,256
14,953
22,164
29,707
37,485
45,442
53,540
61,754
70,065
86,923
0,975
,00098
0,051
0,216
0,484
0,831
1,237
1,690
2,180
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907
9,591
10,283
10,982
11,689
12,401
13,120
13,844
14,573
15,308
16,047
16,791
24,433
32,357
40,482
48,758
57,153
65,647
74,222
91,573
0,950
,00393
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493
26,509
34,764
43,188
51,739
60,391
69,126
77,929
95,705
α
0,500
0,455
1,386
2,366
3,357
4,351
5,348
6,346
7,344
8,343
9,342
10,341
11,340
12,340
13,339
14,339
15,338
16,338
17,338
18,338
19,337
20,337
21,337
22,337
23,337
24,337
25,336
26,336
27,336
28,336
29,336
39,335
49,335
59,335
69,334
79,334
89,334
99,334
119,334
0,050
3,841
5,991
7,815
9,488
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21,03
22,36
23,68
25,00
26,30
27,59
28,87
30,14
31,41
32,67
33,92
35,17
36,42
37,65
38,89
40,11
41,34
42,56
43,77
55,76
67,50
79,08
90,53
101,88
113,15
124,34
146,57
0,025
5,024
7,378
9,348
11,14
12,83
14,45
16,01
17,53
19,02
20,48
21,92
23,34
24,74
26,12
27,49
28,85
30,19
31,53
32,85
34,17
35,48
36,78
38,08
39,36
40,65
41,92
43,19
44,46
45,72
46,98
59,34
71,42
83,30
95,02
106,63
118,14
129,56
152,21
0,010
6,635
9,210
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,73
26,22
27,69
29,14
30,58
32,00
33,41
34,81
36,19
37,57
38,93
40,29
41,64
42,98
44,31
45,64
46,96
48,28
49,59
50,89
63,69
76,15
88,38
100,43
112,33
124,12
135,81
158,95
0,005
7,879
10,60
12,84
14,86
16,75
18,55
20,28
21,95
23,59
25,19
26,76
28,30
29,82
31,32
32,80
34,27
35,72
37,16
38,58
40,00
41,40
42,80
44,18
45,56
46,93
48,29
49,65
50,99
52,34
53,67
66,77
79,49
91,95
104,21
116,32
128,30
140,17
163,65
α
P(t9 ≥ 2,262) = 0,025
EJEMPLO
ν: grados de libertad (g.l.)
tν,α
t-Student
Tabla
g.l
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
infinito
0,20
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
0,851
0,849
0,848
0,847
0,846
0,846
0,845
0,842
0,20
0,15
1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
1,088
1,083
1,079
1,076
1,074
1,071
1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,050
1,047
1,045
1,044
1,043
1,042
1,042
1,036
0,15
0,10
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,299
1,296
1,294
1,292
1,291
1,290
1,282
0,10
0,05
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,684
1,676
1,671
1,667
1,664
1,662
1,660
1,645
0,05
α
0,025
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,021
2,009
2,000
1,994
1,990
1,987
1,984
1,960
0,025
0,01
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,403
2,390
2,381
2,374
2,368
2,364
2,327
0,01
0,005
63,656
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,678
2,660
2,648
2,639
2,632
2,626
2,576
0,005
0,0025
127,321
14,089
7,453
5,598
4,773
4,317
4,029
3,833
3,690
3,581
3,497
3,428
3,372
3,326
3,286
3,252
3,222
3,197
3,174
3,153
3,135
3,119
3,104
3,091
3,078
3,067
3,057
3,047
3,038
3,030
2,971
2,937
2,915
2,899
2,887
2,878
2,871
2,808
0,0025
0,001
318,289
22,328
10,214
7,173
5,894
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,307
3,261
3,232
3,211
3,195
3,183
3,174
3,091
0,001
0,0005
636,578
31,600
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,768
3,745
3,725
3,707
3,689
3,674
3,660
3,646
3,551
3,496
3,460
3,435
3,416
3,402
3,390
3,291
0,0005
α=0.05
1
161,4
18,51
10,13
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45
4,41
4,38
4,35
4,32
4,30
4,28
4,26
4,24
4,23
4,21
4,20
4,18
4,17
4,08
4,03
4,00
3,98
3,96
3,95
3,94
3,92
3,84
1
2
199,5
19,00
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,89
3,81
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3,47
3,44
3,42
3,40
3,39
3,37
3,35
3,34
3,33
3,32
3,23
3,18
3,15
3,13
3,11
3,10
3,09
3,07
3,00
2
3
215,7
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
3,07
3,05
3,03
3,01
2,99
2,98
2,96
2,95
2,93
2,92
2,84
2,79
2,76
2,74
2,72
2,71
2,70
2,68
2,60
3
4
224,6
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
2,84
2,82
2,80
2,78
2,76
2,74
2,73
2,71
2,70
2,69
2,61
2,56
2,53
2,50
2,49
2,47
2,46
2,45
2,37
4
6
234,0
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,53
2,51
2,49
2,47
2,46
2,45
2,43
2,42
2,34
2,29
2,25
2,23
2,21
2,20
2,19
2,18
2,10
6
7
236,8
19,35
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71
2,66
2,61
2,58
2,54
2,51
2,49
2,46
2,44
2,42
2,40
2,39
2,37
2,36
2,35
2,33
2,25
2,20
2,17
2,14
2,13
2,11
2,10
2,09
2,01
7
8
238,9
19,37
8,85
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55
2,51
2,48
2,45
2,42
2,40
2,37
2,36
2,34
2,32
2,31
2,29
2,28
2,27
2,18
2,13
2,10
2,07
2,06
2,04
2,03
2,02
1,94
8
9
240,5
19,38
8,81
6,00
4,77
4,10
3,68
3,39
3,18
3,02
2,90
2,80
2,71
2,65
2,59
2,54
2,49
2,46
2,42
2,39
2,37
2,34
2,32
2,30
2,28
2,27
2,25
2,24
2,22
2,21
2,12
2,07
2,04
2,02
2,00
1,99
1,97
1,96
1,88
9
10
241,9
19,40
8,79
5,96
4,74
4,06
3,64
3,35
3,14
2,98
2,85
2,75
2,67
2,60
2,54
2,49
2,45
2,41
2,38
2,35
2,32
2,30
2,27
2,25
2,24
2,22
2,20
2,19
2,18
2,16
2,08
2,03
1,99
1,97
1,95
1,94
1,93
1,91
1,83
10
12
243,9
19,41
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38
2,34
2,31
2,28
2,25
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,00
1,95
1,92
1,89
1,88
1,86
1,85
1,83
1,75
12
15
245,9
19,43
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,18
2,15
2,13
2,11
2,09
2,07
2,06
2,04
2,03
2,01
1,92
1,87
1,84
1,81
1,79
1,78
1,77
1,75
1,67
15
20
248,0
19,45
8,66
5,80
4,56
3,87
3,44
3,15
2,94
2,77
2,65
2,54
2,46
2,39
2,33
2,28
2,23
2,19
2,16
2,12
2,10
2,07
2,05
2,03
2,01
1,99
1,97
1,96
1,94
1,93
1,84
1,78
1,75
1,72
1,70
1,69
1,68
1,66
1,57
20
24
249,1
19,45
8,64
5,77
4,53
3,84
3,41
3,12
2,90
2,74
2,61
2,51
2,42
2,35
2,29
2,24
2,19
2,15
2,11
2,08
2,05
2,03
2,01
1,98
1,96
1,95
1,93
1,91
1,90
1,89
1,79
1,74
1,70
1,67
1,65
1,64
1,63
1,61
1,52
24
⇒ P ( Fν 1 ,ν 2 ≥ Fν 1 ,ν 2 ,α ) = α
Grados de libertad del numerador: ν1
5
230,2
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,68
2,66
2,64
2,62
2,60
2,59
2,57
2,56
2,55
2,53
2,45
2,40
2,37
2,35
2,33
2,32
2,31
2,29
2,21
5
Fν 1 ,ν 2 ,α
Ejemplo : P ( F7,8 ≥ 3.50) = 0.05
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
Tabla F
Grados de libertad del denominador: ν2
30
250,1
19,46
8,62
5,75
4,50
3,81
3,38
3,08
2,86
2,70
2,57
2,47
2,38
2,31
2,25
2,19
2,15
2,11
2,07
2,04
2,01
1,98
1,96
1,94
1,92
1,90
1,88
1,87
1,85
1,84
1,74
1,69
1,65
1,62
1,60
1,59
1,57
1,55
1,46
30
40
251,1
19,47
8,59
5,72
4,46
3,77
3,34
3,04
2,83
2,66
2,53
2,43
2,34
2,27
2,20
2,15
2,10
2,06
2,03
1,99
1,96
1,94
1,91
1,89
1,87
1,85
1,84
1,82
1,81
1,79
1,69
1,63
1,59
1,57
1,54
1,53
1,52
1,50
1,39
40
60
252,2
19,48
8,57
5,69
4,43
3,74
3,30
3,01
2,79
2,62
2,49
2,38
2,30
2,22
2,16
2,11
2,06
2,02
1,98
1,95
1,92
1,89
1,86
1,84
1,82
1,80
1,79
1,77
1,75
1,74
1,64
1,58
1,53
1,50
1,48
1,46
1,45
1,43
1,32
60
100
253,0
19,49
8,55
5,66
4,41
3,71
3,27
2,97
2,76
2,59
2,46
2,35
2,26
2,19
2,12
2,07
2,02
1,98
1,94
1,91
1,88
1,85
1,82
1,80
1,78
1,76
1,74
1,73
1,71
1,70
1,59
1,52
1,48
1,45
1,43
1,41
1,39
1,37
1,24
100
120
253,3
19,49
8,55
5,66
4,40
3,70
3,27
2,97
2,75
2,58
2,45
2,34
2,25
2,18
2,11
2,06
2,01
1,97
1,93
1,90
1,87
1,84
1,81
1,79
1,77
1,75
1,73
1,71
1,70
1,68
1,58
1,51
1,47
1,44
1,41
1,39
1,38
1,35
1,22
120
Inf.
254,3
19,50
8,53
5,63
4,37
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,81
1,78
1,76
1,73
1,71
1,69
1,67
1,65
1,64
1,62
1,51
1,44
1,39
1,35
1,32
1,30
1,28
1,25
1,00
Inf.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
1
647,8
38,51
17,44
12,22
10,01
8,81
8,07
7,57
7,21
6,94
6,72
6,55
6,41
6,30
6,20
6,12
6,04
5,98
5,92
5,87
5,83
5,79
5,75
5,72
5,69
5,66
5,63
5,61
5,59
5,57
5,42
5,34
5,29
5,25
5,22
5,20
5,18
5,15
5,02
1
2
799,5
39,00
16,04
10,65
8,43
7,26
6,54
6,06
5,71
5,46
5,26
5,10
4,97
4,86
4,77
4,69
4,62
4,56
4,51
4,46
4,42
4,38
4,35
4,32
4,29
4,27
4,24
4,22
4,20
4,18
4,05
3,97
3,93
3,89
3,86
3,84
3,83
3,80
3,69
2
3
864,2
39,17
15,44
9,98
7,76
6,60
5,89
5,42
5,08
4,83
4,63
4,47
4,35
4,24
4,15
4,08
4,01
3,95
3,90
3,86
3,82
3,78
3,75
3,72
3,69
3,67
3,65
3,63
3,61
3,59
3,46
3,39
3,34
3,31
3,28
3,26
3,25
3,23
3,12
3
4
899,6
39,25
15,10
9,60
7,39
6,23
5,52
5,05
4,72
4,47
4,28
4,12
4,00
3,89
3,80
3,73
3,66
3,61
3,56
3,51
3,48
3,44
3,41
3,38
3,35
3,33
3,31
3,29
3,27
3,25
3,13
3,05
3,01
2,97
2,95
2,93
2,92
2,89
2,79
4
5
921,8
39,30
14,88
9,36
7,15
5,99
5,29
4,82
4,48
4,24
4,04
3,89
3,77
3,66
3,58
3,50
3,44
3,38
3,33
3,29
3,25
3,22
3,18
3,15
3,13
3,10
3,08
3,06
3,04
3,03
2,90
2,83
2,79
2,75
2,73
2,71
2,70
2,67
2,57
5
⇒ P ( Fν 1 ,ν 2 ≥ Fν 1 ,ν 2 ,α ) = α
6
937,1
39,33
14,73
9,20
6,98
5,82
5,12
4,65
4,32
4,07
3,88
3,73
3,60
3,50
3,41
3,34
3,28
3,22
3,17
3,13
3,09
3,05
3,02
2,99
2,97
2,94
2,92
2,90
2,88
2,87
2,74
2,67
2,63
2,59
2,57
2,55
2,54
2,52
2,41
6
7
948,2
39,36
14,62
9,07
6,85
5,70
4,99
4,53
4,20
3,95
3,76
3,61
3,48
3,38
3,29
3,22
3,16
3,10
3,05
3,01
2,97
2,93
2,90
2,87
2,85
2,82
2,80
2,78
2,76
2,75
2,62
2,55
2,51
2,47
2,45
2,43
2,42
2,39
2,29
7
8
956,6
39,37
14,54
8,98
6,76
5,60
4,90
4,43
4,10
3,85
3,66
3,51
3,39
3,29
3,20
3,12
3,06
3,01
2,96
2,91
2,87
2,84
2,81
2,78
2,75
2,73
2,71
2,69
2,67
2,65
2,53
2,46
2,41
2,38
2,35
2,34
2,32
2,30
2,19
8
9
963,3
39,39
14,47
8,90
6,68
5,52
4,82
4,36
4,03
3,78
3,59
3,44
3,31
3,21
3,12
3,05
2,98
2,93
2,88
2,84
2,80
2,76
2,73
2,70
2,68
2,65
2,63
2,61
2,59
2,57
2,45
2,38
2,33
2,30
2,28
2,26
2,24
2,22
2,11
9
10
968,6
39,40
14,42
8,84
6,62
5,46
4,76
4,30
3,96
3,72
3,53
3,37
3,25
3,15
3,06
2,99
2,92
2,87
2,82
2,77
2,73
2,70
2,67
2,64
2,61
2,59
2,57
2,55
2,53
2,51
2,39
2,32
2,27
2,24
2,21
2,19
2,18
2,16
2,05
10
12
976,7
39,41
14,34
8,75
6,52
5,37
4,67
4,20
3,87
3,62
3,43
3,28
3,15
3,05
2,96
2,89
2,82
2,77
2,72
2,68
2,64
2,60
2,57
2,54
2,51
2,49
2,47
2,45
2,43
2,41
2,29
2,22
2,17
2,14
2,11
2,09
2,08
2,05
1,94
12
15
984,9
39,43
14,25
8,66
6,43
5,27
4,57
4,10
3,77
3,52
3,33
3,18
3,05
2,95
2,86
2,79
2,72
2,67
2,62
2,57
2,53
2,50
2,47
2,44
2,41
2,39
2,36
2,34
2,32
2,31
2,18
2,11
2,06
2,03
2,00
1,98
1,97
1,94
1,83
15
20
993,1
39,45
14,17
8,56
6,33
5,17
4,47
4,00
3,67
3,42
3,23
3,07
2,95
2,84
2,76
2,68
2,62
2,56
2,51
2,46
2,42
2,39
2,36
2,33
2,30
2,28
2,25
2,23
2,21
2,20
2,07
1,99
1,94
1,91
1,88
1,86
1,85
1,82
1,71
20
24
30
40
60
100
120
Inf.
997,3 1001,4 1005,6 1009,8 1013,2 1014,0 1018,3
39,46 39,46 39,47 39,48 39,49 39,49 39,50
14,12 14,08 14,04 13,99 13,96 13,95 13,90
8,51
8,46
8,41
8,36
8,32
8,31
8,26
6,28
6,23
6,18
6,12
6,08
6,07
6,02
5,12
5,07
5,01
4,96
4,92
4,90
4,85
4,41
4,36
4,31
4,25
4,21
4,20
4,14
3,95
3,89
3,84
3,78
3,74
3,73
3,67
3,61
3,56
3,51
3,45
3,40
3,39
3,33
3,37
3,31
3,26
3,20
3,15
3,14
3,08
3,17
3,12
3,06
3,00
2,96
2,94
2,88
3,02
2,96
2,91
2,85
2,80
2,79
2,72
2,89
2,84
2,78
2,72
2,67
2,66
2,60
2,79
2,73
2,67
2,61
2,56
2,55
2,49
2,70
2,64
2,59
2,52
2,47
2,46
2,40
2,63
2,57
2,51
2,45
2,40
2,38
2,32
2,56
2,50
2,44
2,38
2,33
2,32
2,25
2,50
2,44
2,38
2,32
2,27
2,26
2,19
2,45
2,39
2,33
2,27
2,22
2,20
2,13
2,41
2,35
2,29
2,22
2,17
2,16
2,09
2,37
2,31
2,25
2,18
2,13
2,11
2,04
2,33
2,27
2,21
2,14
2,09
2,08
2,00
2,30
2,24
2,18
2,11
2,06
2,04
1,97
2,27
2,21
2,15
2,08
2,02
2,01
1,94
2,24
2,18
2,12
2,05
2,00
1,98
1,91
2,22
2,16
2,09
2,03
1,97
1,95
1,88
2,19
2,13
2,07
2,00
1,94
1,93
1,85
2,17
2,11
2,05
1,98
1,92
1,91
1,83
2,15
2,09
2,03
1,96
1,90
1,89
1,81
2,14
2,07
2,01
1,94
1,88
1,87
1,79
2,01
1,94
1,88
1,80
1,74
1,72
1,64
1,93
1,87
1,80
1,72
1,66
1,64
1,55
1,88
1,82
1,74
1,67
1,60
1,58
1,48
1,85
1,78
1,71
1,63
1,56
1,54
1,44
1,82
1,75
1,68
1,60
1,53
1,51
1,40
1,80
1,73
1,66
1,58
1,50
1,48
1,37
1,78
1,71
1,64
1,56
1,48
1,46
1,35
1,76
1,69
1,61
1,53
1,45
1,43
1,31
1,64
1,57
1,48
1,39
1,30
1,27
1,00
24
30
40
60
100
120
Inf.
Grados de libertad del numerador: ν1
Fν 1 ,ν 2 ,α
Ejemplo : P ( F7,8 ≥ 4.53) = 0.025
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
α=0.025
Tabla F
Grados de libertad del denominador: ν2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
1
4052,2
98,50
34,12
21,20
16,26
13,75
12,25
11,26
10,56
10,04
9,65
9,33
9,07
8,86
8,68
8,53
8,40
8,29
8,18
8,10
8,02
7,95
7,88
7,82
7,77
7,72
7,68
7,64
7,60
7,56
7,31
7,17
7,08
7,01
6,96
6,93
6,90
6,85
6,63
1
2
4999,3
99,00
30,82
18,00
13,27
10,92
9,55
8,65
8,02
7,56
7,21
6,93
6,70
6,51
6,36
6,23
6,11
6,01
5,93
5,85
5,78
5,72
5,66
5,61
5,57
5,53
5,49
5,45
5,42
5,39
5,18
5,06
4,98
4,92
4,88
4,85
4,82
4,79
4,61
2
3
5403,5
99,16
29,46
16,69
12,06
9,78
8,45
7,59
6,99
6,55
6,22
5,95
5,74
5,56
5,42
5,29
5,19
5,09
5,01
4,94
4,87
4,82
4,76
4,72
4,68
4,64
4,60
4,57
4,54
4,51
4,31
4,20
4,13
4,07
4,04
4,01
3,98
3,95
3,78
3
4
5624,3
99,25
28,71
15,98
11,39
9,15
7,85
7,01
6,42
5,99
5,67
5,41
5,21
5,04
4,89
4,77
4,67
4,58
4,50
4,43
4,37
4,31
4,26
4,22
4,18
4,14
4,11
4,07
4,04
4,02
3,83
3,72
3,65
3,60
3,56
3,53
3,51
3,48
3,32
4
5
5764,0
99,30
28,24
15,52
10,97
8,75
7,46
6,63
6,06
5,64
5,32
5,06
4,86
4,69
4,56
4,44
4,34
4,25
4,17
4,10
4,04
3,99
3,94
3,90
3,85
3,82
3,78
3,75
3,73
3,70
3,51
3,41
3,34
3,29
3,26
3,23
3,21
3,17
3,02
5
6
5859,0
99,33
27,91
15,21
10,67
8,47
7,19
6,37
5,80
5,39
5,07
4,82
4,62
4,46
4,32
4,20
4,10
4,01
3,94
3,87
3,81
3,76
3,71
3,67
3,63
3,59
3,56
3,53
3,50
3,47
3,29
3,19
3,12
3,07
3,04
3,01
2,99
2,96
2,80
6
7
5928,3
99,36
27,67
14,98
10,46
8,26
6,99
6,18
5,61
5,20
4,89
4,64
4,44
4,28
4,14
4,03
3,93
3,84
3,77
3,70
3,64
3,59
3,54
3,50
3,46
3,42
3,39
3,36
3,33
3,30
3,12
3,02
2,95
2,91
2,87
2,84
2,82
2,79
2,64
7
8
5981,0
99,38
27,49
14,80
10,29
8,10
6,84
6,03
5,47
5,06
4,74
4,50
4,30
4,14
4,00
3,89
3,79
3,71
3,63
3,56
3,51
3,45
3,41
3,36
3,32
3,29
3,26
3,23
3,20
3,17
2,99
2,89
2,82
2,78
2,74
2,72
2,69
2,66
2,51
8
9
6022,4
99,39
27,34
14,66
10,16
7,98
6,72
5,91
5,35
4,94
4,63
4,39
4,19
4,03
3,89
3,78
3,68
3,60
3,52
3,46
3,40
3,35
3,30
3,26
3,22
3,18
3,15
3,12
3,09
3,07
2,89
2,78
2,72
2,67
2,64
2,61
2,59
2,56
2,41
9
10
6055,9
99,40
27,23
14,55
10,05
7,87
6,62
5,81
5,26
4,85
4,54
4,30
4,10
3,94
3,80
3,69
3,59
3,51
3,43
3,37
3,31
3,26
3,21
3,17
3,13
3,09
3,06
3,03
3,00
2,98
2,80
2,70
2,63
2,59
2,55
2,52
2,50
2,47
2,32
10
12
6106,7
99,42
27,05
14,37
9,89
7,72
6,47
5,67
5,11
4,71
4,40
4,16
3,96
3,80
3,67
3,55
3,46
3,37
3,30
3,23
3,17
3,12
3,07
3,03
2,99
2,96
2,93
2,90
2,87
2,84
2,66
2,56
2,50
2,45
2,42
2,39
2,37
2,34
2,18
12
15
6157,0
99,43
26,87
14,20
9,72
7,56
6,31
5,52
4,96
4,56
4,25
4,01
3,82
3,66
3,52
3,41
3,31
3,23
3,15
3,09
3,03
2,98
2,93
2,89
2,85
2,81
2,78
2,75
2,73
2,70
2,52
2,42
2,35
2,31
2,27
2,24
2,22
2,19
2,04
15
20
6208,7
99,45
26,69
14,02
9,55
7,40
6,16
5,36
4,81
4,41
4,10
3,86
3,66
3,51
3,37
3,26
3,16
3,08
3,00
2,94
2,88
2,83
2,78
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,37
2,27
2,20
2,15
2,12
2,09
2,07
2,03
1,88
20
24
6234,3
99,46
26,60
13,93
9,47
7,31
6,07
5,28
4,73
4,33
4,02
3,78
3,59
3,43
3,29
3,18
3,08
3,00
2,92
2,86
2,80
2,75
2,70
2,66
2,62
2,58
2,55
2,52
2,49
2,47
2,29
2,18
2,12
2,07
2,03
2,00
1,98
1,95
1,79
24
⇒ P ( Fν 1 ,ν 2 ≥ Fν 1 ,ν 2 ,α ) = α
Grados de libertad del numerador: ν1
Fν 1 ,ν 2 ,α
Ejemplo : P ( F7,8 ≥ 6.18) = 0.01
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
α=0.01
Tabla F
Grados de libertad del denominador: ν2
30
6260,4
99,47
26,50
13,84
9,38
7,23
5,99
5,20
4,65
4,25
3,94
3,70
3,51
3,35
3,21
3,10
3,00
2,92
2,84
2,78
2,72
2,67
2,62
2,58
2,54
2,50
2,47
2,44
2,41
2,39
2,20
2,10
2,03
1,98
1,94
1,92
1,89
1,86
1,70
30
40
6286,4
99,48
26,41
13,75
9,29
7,14
5,91
5,12
4,57
4,17
3,86
3,62
3,43
3,27
3,13
3,02
2,92
2,84
2,76
2,69
2,64
2,58
2,54
2,49
2,45
2,42
2,38
2,35
2,33
2,30
2,11
2,01
1,94
1,89
1,85
1,82
1,80
1,76
1,59
40
60
6313,0
99,48
26,32
13,65
9,20
7,06
5,82
5,03
4,48
4,08
3,78
3,54
3,34
3,18
3,05
2,93
2,83
2,75
2,67
2,61
2,55
2,50
2,45
2,40
2,36
2,33
2,29
2,26
2,23
2,21
2,02
1,91
1,84
1,78
1,75
1,72
1,69
1,66
1,47
60
100
6333,9
99,49
26,24
13,58
9,13
6,99
5,75
4,96
4,41
4,01
3,71
3,47
3,27
3,11
2,98
2,86
2,76
2,68
2,60
2,54
2,48
2,42
2,37
2,33
2,29
2,25
2,22
2,19
2,16
2,13
1,94
1,82
1,75
1,70
1,65
1,62
1,60
1,56
1,36
100
120
6339,5
99,49
26,22
13,56
9,11
6,97
5,74
4,95
4,40
4,00
3,69
3,45
3,25
3,09
2,96
2,84
2,75
2,66
2,58
2,52
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,17
2,14
2,11
1,92
1,80
1,73
1,67
1,63
1,60
1,57
1,53
1,32
120
Inf.
6365,6
99,50
26,13
13,46
9,02
6,88
5,65
4,86
4,31
3,91
3,60
3,36
3,17
3,00
2,87
2,75
2,65
2,57
2,49
2,42
2,36
2,31
2,26
2,21
2,17
2,13
2,10
2,06
2,03
2,01
1,80
1,68
1,60
1,54
1,49
1,46
1,43
1,38
1,00
Inf.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf
Descargar