Estadística :: T3. Contrastes de bondad de ajuste de variables discretas Estadística T3. Contrastes de bondad de ajuste de variables discretas Departamento de Ciencias del Mar y Biología Aplicada Estadística :: T3. Contrastes de bondad de ajuste de variables discretas Variable aleatoria y su ajuste a una distribución Oi= Frecuencia absoluta Observada Ei= Frecuencia absoluta Esperada 0 2 4 6 8 10 Estadística :: T3. Contrastes de bondad de ajuste de variables discretas 2 χ Método de chi-cuadrado ( ) Ejemplo En una empresa de acuicultura se quiere hacer un estudio sobre el nivel de parásitos en la producción de doradas. Para ello, se tomó una muestra de 5 individuos cada día, repitiendo el experimento durante 550 días. De cada muestra se analizaron los peces determinando cuantos de ellos contenían parásitos. ¿Se ajusta a un modelo de distribución Binomial? X 0 1 Oi 17 81 2 3 152 180 • X = Nº de individuos con parásitos • n = 5 individuos • P = ? 4 5 104 16 X ≡ B(n, p) Estadística :: T3. Contrastes de bondad de ajuste de variables discretas 2 χ Método de chi-cuadrado ( ) n X ≡ B(n, π ) µ = nπ x = np x p= n X 0 1 Oi 17 81 pi 0.026 0.141 0.301 Ei 14.30 77.55 165.6 ∑X F i x= i =1 ¡¡¡Ojo, esta N hace referencia al tamaño muestral!!! (n=550) N 2 i 3 4 5 104 16 0.322 0.173 0.037 177.1 95.15 20.35 152 180 • X = Nº de individuos con parásitos • n = 5 individuos • P = ? x 2.584 p= = = 0.517 n 5 X ≡ B(5,0.517) Estadística :: T3. Contrastes de bondad de ajuste de variables discretas 2 χ Método de chi-cuadrado ( ) X ≡ B(n, π ) X ≡ B(5,0.517) Calcular las probabilidades asociadas a cada valor de X (pi) X 0 1 Oi 17 81 pi 0.026 0.141 0.301 Ei 14.30 77.55 165.6 ⎛ n ⎞ k n − k P( X = k ) = ⎜⎜ ⎟⎟ p q ⎝ k ⎠ 2 3 4 5 104 16 0.322 0.173 0.037 177.1 95.15 20.35 152 180 o bien usando Tabla Binomial Estadística :: T3. Contrastes de bondad de ajuste de variables discretas 2 χ Método de chi-cuadrado ( ) X ≡ B(n, π ) X ≡ B(5,0.517) Calcular los valores esperados (Ei) X 0 1 Oi 17 81 pi 0.026 0.141 0.301 Ei= N pi 14.30 77.55 165.6 ¡¡¡Ojo, esta N hace referencia al tamaño muestral!!! (n=550) 2 3 4 5 104 16 0.322 0.173 0.037 177.1 95.15 20.35 152 180 Estadística :: T3. Contrastes de bondad de ajuste de variables discretas 2 χ Método de chi-cuadrado ( ) X ≡ B(n, π ) X ≡ B(5,0.517) Comprobar condición Ei>5, si no se cumple hay que agrupar clases X 0 1 2 Oi 17 81 pi 0.026 0.141 0.301 Ei= N pi 14.30 77.55 165.6 3 4 5 104 16 0.322 0.173 0.037 177.1 95.15 20.35 152 180 ¿Ei > 5? Estadística :: T3. Contrastes de bondad de ajuste de variables discretas 2 χ Método de chi-cuadrado ( ) X ≡ B(n, π ) X ≡ B(5,0.517) ¿Cómo difieren Oi y Ei? Calcular chi-cuadrado χ 2 exp 2 (Oi − Ei ) k =∑ Ei i =1 X 0 1 Oi 17 81 pi 0.026 0.141 0.301 Ei= N pi 14.30 77.55 165.6 2 χ 2 exp 2 χ exp ( 17 − 14.30 ) = 14.30 = 3.187 2 3 4 5 104 16 0.322 0.173 0.037 177.1 95.15 20.35 152 180 2 ( 81 − 77.55) + 77.55 2 ( 16 − 20.35) + ... + 20.35 ¿Esta diferencia es grande o pequeña? Estadística :: T3. Contrastes de bondad de ajuste de variables discretas 2 χ Método de chi-cuadrado ( ) Punto crítico c χ 2 K −m −1,α Obtenido de la Tabla Chi-cuadrado • K = Nº de intervalos • m = Nº de parámetros de la distribución estimados con datos de la muestra Región de aceptación: No rechazo Región crítica: Rechazo 1 − α = 0.95 α = 0.05 Estadístico 2 exp χ Umbral: 2 K −m −1,α χ Estadística :: T3. Contrastes de bondad de ajuste de variables discretas 2 χ Método de chi-cuadrado ( ) χ Punto crítico c 2 K −m−1,α =χ 2 6−1−1, 0.05 =χ 2 4, 0.05 El número de doradas con parásitos se ajusta a una distribución Binomial 1 − α = 0.95 α = 0.05 Estadístico 2 χexp t = 3.187 Umbral: χ62−1−1,0.05 = 9.488 Región de aceptación: No rechazo Región crítica: Rechazo Estadística :: T3. Contrastes de bondad de ajuste de variables discretas 2 χ Método de chi-cuadrado ( ) H0= La muestra se ajusta a la distribución hipotética H1= La muestra NO se ajusta a la distribución hipotética χ Rechazamos H0 si: 2 k 2 exp =∑ (Oi − Ei ) >c Ei 2 2 p − valor = P( χ > χ exp ) < α i =1 Punto crítico c χ 2 K −m −1,α • K = Nº de intervalos • m = Nº de parámetros de la distribución estimados con datos de la muestra Restricciones: • Mín Ei ≥ 5 . En caso contrario se debe agrupar en clases • Si k ≤ 4 se debe aplicar el estadístico de corrección de Yates: k χ2 = ∑ i =1 (O − E i i Ei 2 − 0.5)