T3. Contrastes de bondad de ajuste de variables discretas

Anuncio
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
Estadística
T3. Contrastes de bondad de ajuste de variables
discretas
Departamento de Ciencias del Mar y Biología Aplicada
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
Variable aleatoria y su ajuste a una distribución
Oi= Frecuencia absoluta Observada
Ei= Frecuencia absoluta Esperada
0
2
4
6
8
10
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
2
χ
Método de chi-cuadrado ( )
Ejemplo
En una empresa de acuicultura se quiere hacer un estudio sobre el
nivel de parásitos en la producción de doradas. Para ello, se tomó una
muestra de 5 individuos cada día, repitiendo el experimento durante
550 días. De cada muestra se analizaron los peces determinando
cuantos de ellos contenían parásitos. ¿Se ajusta a un modelo de
distribución Binomial?
X
0
1
Oi
17
81
2
3
152 180
• X = Nº de individuos con parásitos
• n = 5 individuos
• P = ?
4
5
104
16
X ≡ B(n, p)
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
2
χ
Método de chi-cuadrado ( )
n
X ≡ B(n, π )
µ = nπ
x = np
x
p=
n
X
0
1
Oi
17
81
pi
0.026
0.141 0.301
Ei
14.30
77.55 165.6
∑X F
i
x=
i =1
¡¡¡Ojo, esta N hace referencia
al tamaño muestral!!!
(n=550)
N
2
i
3
4
5
104
16
0.322
0.173
0.037
177.1
95.15
20.35
152 180
• X = Nº de individuos con parásitos
• n = 5 individuos
• P = ?
x 2.584
p= =
= 0.517
n
5
X ≡ B(5,0.517)
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
2
χ
Método de chi-cuadrado ( )
X ≡ B(n, π )
X ≡ B(5,0.517)
Calcular las probabilidades asociadas a cada valor de X (pi)
X
0
1
Oi
17
81
pi
0.026
0.141 0.301
Ei
14.30
77.55 165.6
⎛ n ⎞ k n − k
P( X = k ) = ⎜⎜ ⎟⎟ p q
⎝ k ⎠
2
3
4
5
104
16
0.322
0.173
0.037
177.1
95.15
20.35
152 180
o bien usando Tabla Binomial
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
2
χ
Método de chi-cuadrado ( )
X ≡ B(n, π )
X ≡ B(5,0.517)
Calcular los valores esperados (Ei)
X
0
1
Oi
17
81
pi
0.026
0.141 0.301
Ei= N pi
14.30
77.55 165.6
¡¡¡Ojo, esta N hace referencia
al tamaño muestral!!!
(n=550)
2
3
4
5
104
16
0.322
0.173
0.037
177.1
95.15
20.35
152 180
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
2
χ
Método de chi-cuadrado ( )
X ≡ B(n, π )
X ≡ B(5,0.517)
Comprobar condición Ei>5, si no se cumple hay que agrupar clases
X
0
1
2
Oi
17
81
pi
0.026
0.141 0.301
Ei= N pi
14.30
77.55 165.6
3
4
5
104
16
0.322
0.173
0.037
177.1
95.15
20.35
152 180
¿Ei > 5?
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
2
χ
Método de chi-cuadrado ( )
X ≡ B(n, π )
X ≡ B(5,0.517)
¿Cómo difieren Oi y Ei? Calcular chi-cuadrado
χ
2
exp
2
(Oi − Ei )
k
=∑
Ei
i =1
X
0
1
Oi
17
81
pi
0.026
0.141 0.301
Ei= N pi
14.30
77.55 165.6
2
χ
2
exp
2
χ exp
(
17 − 14.30 )
=
14.30
= 3.187
2
3
4
5
104
16
0.322
0.173
0.037
177.1
95.15
20.35
152 180
2
(
81 − 77.55)
+
77.55
2
(
16 − 20.35)
+ ... +
20.35
¿Esta diferencia es grande o pequeña?
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
2
χ
Método de chi-cuadrado ( )
Punto crítico c
χ
2
K −m −1,α
Obtenido de la Tabla Chi-cuadrado
• K = Nº de intervalos
• m = Nº de parámetros de la distribución estimados con datos de la muestra
Región de aceptación: No rechazo
Región crítica: Rechazo
1 − α = 0.95
α = 0.05
Estadístico
2
exp
χ
Umbral:
2
K −m −1,α
χ
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
2
χ
Método de chi-cuadrado ( )
χ
Punto crítico c
2
K −m−1,α
=χ
2
6−1−1, 0.05
=χ
2
4, 0.05
El número de doradas con
parásitos
se ajusta a una distribución
Binomial
1 − α = 0.95
α = 0.05
Estadístico
2
χexp
t = 3.187
Umbral:
χ62−1−1,0.05 = 9.488
Región de aceptación: No rechazo
Región crítica: Rechazo
Estadística :: T3. Contrastes de bondad de ajuste de variables discretas
2
χ
Método de chi-cuadrado ( )
H0= La muestra se ajusta a la distribución hipotética
H1= La muestra NO se ajusta a la distribución hipotética
χ
Rechazamos H0 si:
2
k
2
exp
=∑
(Oi − Ei )
>c
Ei
2
2
p − valor = P( χ > χ exp ) < α
i =1
Punto crítico c
χ
2
K −m −1,α
• K = Nº de intervalos
• m = Nº de parámetros de la distribución estimados con datos de la muestra
Restricciones:
• Mín Ei ≥ 5 . En caso contrario se debe agrupar en clases
• Si k ≤ 4 se debe aplicar el estadístico de corrección de Yates:
k
χ2 = ∑
i =1
(O − E
i
i
Ei
2
− 0.5)
Descargar