Estadı́stica (Q) 1 Resumen de Tests Test para comparar medias de dos poblaciones normales independientes Sean X1 , . . . , Xn1 ∼ N µ1 , σ12 , e Y1 , . . . , Yn2 ∼ N µ2 , σ22 dos muestras aleatorias independientes entre sı́. Se quiere testear H0 : µ1 − µ2 = δ versus alguna de las alternativas siguientes H1 : µ1 − µ2 6= δ 1.1 H1 : µ1 − µ2 > δ H1 : µ1 − µ2 < δ Caso varianzas conocidas Estadı́stico del test X −Y −δ q 2 σ22 σ1 n1 + n2 1.2 ∼ N (0, 1) ↑ bajo H0 Caso varianzas desconocidas pero iguales Estadı́stico del test X −Y −δ r s2p n11 + n12 ∼ tn1 +n2 −2 ↑ bajo H0 donde s21 (n1 − 1) + s22 (n2 − 1) n1 + n2 − 2 ! n1 n2 X X 1 2 2 (Xi − X) + = (Yi − Y ) n1 + n2 − 2 i=1 i=1 s2p = y s21 y s22 son las varianzas muestrales de las X´s y las Y´s respectivamente, es decir n s21 1 1 X (Xi − X)2 = n1 − 1 i=1 (1) n s22 = 1.3 2 1 X (Yi − Y )2 n2 − 1 i=1 Caso varianzas desconocidas y no necesariamente iguales En este caso tenemos el test de Welch que tiene nivel aproximado. Estadı́stico del test X −Y −δ q 2 s1 s22 n1 + n2 donde K= aprox ∼ tK ↑ bajo H0 2 s1 n1 s2 2 n2 s22 s21 n1 + n2 2 2 n1 −1 y s21 y s22 están definidos en (1) y (2) respectivamente. 1 + 2 n2 −1 (2) 2 Test para comparar varianzas de dos poblaciones normales independientes Sean X1 , . . . , Xn1 ∼ N µ1 , σ12 , e Y1 , . . . , Yn2 ∼ N µ2 , σ22 dos muestras aleatorias independientes entre sı́. Se quiere testear H0 : σ12 = σ22 versus alguna de las alternativas siguientes H1 : σ12 6= σ22 Estadı́stico del test s21 s22 H1 : σ12 > σ22 H1 : σ12 < σ22 ∼ Fn1 −1 ,n2 −1 ↑ bajo H0 donde s21 y s22 están definidos en (1) y (2) respectivamente. 3 Test para comparar medias de dos muestras apareadas Sean (X1 , Y1 ) , . . . , (Xn , Yn ) una muestra aleatoria de los resultados de dos mediciones realizadas sobre la misma unidad experimental (o que puede considerarse la misma unidad experimental). Supongamos que las diferencias Di = Xi − Yi ∼ 2 son independientes entre sı́. Se quiere testear N µD , σD H0 : µD = δ versus alguna de las alternativas siguientes H1 : µD 6= δ H1 : µD > δ H1 : µD < δ Estadı́stico del test X −Y −δ q 2 sD n ∼ tn−1 ↑ bajo H0 donde sD es el desvı́o estándar de las Di , es decir n s2D = 4 1 X (Di − D)2 . n − 1 i=1 Test asintótico (o aproximado) para comparar medias de dos poblaciones Sean X1 , . . . , Xn1 v.a. i.i.d. y sean µ1 = E(X1 ) y σ12 = V (X1 ), e Y1 , . . . , Yn2 v.a. i.i.d. e independientes de las anteriores, y sean µ2 = E(Y1 ) y σ22 = V (Y1 ), donde n1 y n2 son números suficientemente grandes. Se quiere testear H0 : µ1 − µ2 = δ versus alguna de las alternativas siguientes H1 : µ1 − µ2 6= δ H1 : µ1 − µ2 > δ H1 : µ1 − µ2 < δ Estadı́stico del test X −Y −δ q 2 s22 s1 n1 + n2 aprox ∼ N (0, 1) ↑ bajo H0 y s21 y s22 son las varianzas muestrales de las X 0 s y las Y 0 s respectivamente, y están dadas por (1) y (2). 2 5 Test asintótico (o aproximado) para comparar dos proporciones Sean X1 , . . . , Xn1 ∼ Bi(1, p1 ) v.a. i.i.d. e Y1 , . . . , Yn2 ∼ Bi(1, p2 ) v.a. i.i.d. e independientes de las anteriores, con n1 y n2 suficientemente grandes. Se quiere testear H0 : p1 − p2 = δ versus alguna de las alternativas siguientes H1 : p1 − p2 6= δ Estadı́stico del test q H1 : p1 − p2 > δ pb1 − pb2 − δ p b1 (1−b p1 ) n1 + H1 : p1 − p2 < δ aprox p b2 (1−b p2 ) n2 ∼ N (0, 1) ↑ bajo H0 donde pb1 = X y pb2 = Y son, respectivamente, las proporciones de éxitos en la primer y segunda muestra. 6 6.1 Tests no paramétricos para una y dos muestras Test del signo para la mediana de una población Sea X1 , . . . , Xn ∼ F una muestra aleatoria donde F es una función de distribución continua. Sea θ la mediana de F. Se quiere testear H0 : θ = θ0 versus alguna de las alternativas siguientes H1 : θ 6= θ0 H1 : θ > θ0 H1 : θ < θ0 Sean Di = Xi − θ0 . El estadı́stico del test es U = la cantidad de Di positivos. 1 U ∼ Bi n − k, . 2 ↑ bajo H0 donde k es la cantidad de Di iguales a cero que hay en la muestra. 6.2 Test de rangos signados de Wilcoxon para la mediana de una población Sea X1 , . . . , Xn ∼ F una muestra aleatoria y F una distribución continua y simétrica. Sea θ la mediana de F. Se quiere testear H0 : θ = θ0 versus alguna de las alternativas siguientes H1 : θ 6= θ0 H1 : θ > θ0 H1 : θ < θ0 Sean Di = Xi − θ0 . Luego se ordenan en orden creciente las observaciones |Di | y se las ranquea. El estadı́stico del test es W = suma de los rangos de las Di positivas. Cuando se tiene una muestra apareada (X1 , Y1 ) , . . . , (Xn , Yn ) para testear si las medianas de ambas poblaciones coinciden se puede aplicar el test de rangos signados de Wilcoxon o el test del signo sobre las Di = Xi − Yi . 6.3 6.3.1 Test de Mann-Whitney-Wilcoxon para dos muestras independientes Modelo 1: Sean X1 , . . . , Xn1 ∼ F, e Y1 , . . . , Yn2 ∼ G dos muestras aleatorias independientes entre sı́, donde F y G son dos ditribuciones continuas que satisfacen que G(x) = F (x + c). Sean θX la mediana de F y θY la mediana de G. Se quiere testear H0 : θX = θY versus alguna de las alternativas siguientes H1 : θX 6= θY H1 : θX > θY 3 H1 : θX < θY 6.3.2 Modelo 2: Sean X1 , . . . , Xn1 ∼ F, e Y1 , . . . , Yn2 ∼ G dos muestras aleatorias independientes entre sı́, donde F y G son dos distribuciones continuas cualesquiera. Se quiere testear H0 : F (x) = G(x) ∀x vs. H1 : ∃x / F (x) 6= G(x) 6.3.3 Estadı́stico del test Para construirlo se juntan ambas muestras y se ranquean las observaciones, a esos números se los llaman rangos de las observaciones. El estadı́stico del test es la suma de los rangos del grupo con menor cantidad de observaciones. 6.4 Test de la Mediana para dos muestras independientes Sean X1 , . . . , Xn1 ∼ F , e Y1 , . . . , Yn2 ∼ G dos muestras aleatorias independientes entre sı́, donde F y G son dos distribuciones continuas cualesquiera. Sean θX la mediana de F y θY la mediana de G. Se quiere testear H0 : θX = θY vs. H1 : θX 6= θY Si T es el estadı́stico correspondiente, entonces T ∼ χ21 . ↑ bajo H0 4