Test para dos muestras independientes Test de Mann

Anuncio
Métodos No Paramétricos I
Elena J. Martínez
81
2do cuat. 2013
Test para dos muestras independientes
Test de Mann-Whitney-Wilcoxon
Consideremos una situación en la cual un investigador ha obtenido dos muestras aleatorias
independientes de poblaciones posiblemente diferentes y desea testear la hipótesis nula de
que ambas poblaciones son idénticas. Es decir, el investigador desea detectar diferencias entre
las dos poblaciones en base a muestras aleatorias de ambas.
Intuitivamente se podría pensar en combinar ambas muestras, asignar rangos a las
observaciones y definir el estadístico del test como la suma de los rangos de las observaciones
en una de las dos poblaciones. Si la suma es demasiado pequeña o demasiado grande, ésto
sería evidencia de que los valores de una de las poblaciones tienden a ser más pequeños o
más grandes que los de la otra y se rechazaría la hipótesis nula.
Tal como lo presentamos se trataría de un test para diferencia entre distribuciones, es decir que
la hipótesis nula sería Ho: F(x) = G(x) ∀ x, siendo F la distribución de la m.a. X1,...,Xn y G la de
la m.a. Y1,..., Ym. Sin embargo, nosotros lo trataremos como un test para el parámetro de
posición, para lo cual supondremos que G(x)=F(x-∆), para algún ∆.
Datos: Sea F ∈Ωo y sean X1,...,Xn una m.a. de una distribución F(x) e Y1,...,Ym una m.a. de una
distribución F(x-∆), independiente de la primera, es decir que sólo suponemos que F es
absolutamente continua con única mediana y que las dos distribuciones tienen la misma forma
(en particular, igual varianza).
Hipótesis a testear:
A. Ho: ∆ = 0
vs
H1: ∆ ≠ 0
B. Ho: ∆ = 0
vs
H1: ∆ < 0
C. Ho: ∆ = 0
vs
H1: ∆ > 0
Estadístico del test y zona de rechazo: Consideremos el caso C. Wilcoxon (1945) propuso el
siguiente procedimiento. Se ordenan los datos de las dos muestras combinadas de menor a
mayor y se define el estadístico U como la suma de los rangos de la m.a. Y1,...,Ym. Se rechaza
Ho si U es grande.
Si hubiésemos considerado las hipótesis B rechazaríamos Ho para valores pequeños de U, o
equivalentemente para valores grandes del estadístico T definido como la suma de los rangos
de la m.a. X1,...,Xn en la muestra combinada.
Sea N=n+m, y llamemos R(Yi) y R(Xi) a los rangos de Yi y Xi respectivamente, en la muestra
ordenada de los datos combinados. Si hay empates se asigna a los valores empatados el
promedio de los rangos que les corresponderían si no hubiese empates. Se definen los
estadísticos
Métodos No Paramétricos I
Elena J. Martínez
82
2do cuat. 2013
m
n
U = ∑ R(Yi )
T = ∑ R( X i )
i =1
que verifican U + T =
i =1
N ( N + 1)
.
2
Mann y Whitney (1947) consideraron, por analogía con el test del signo, el siguiente
estadístico:
W = ∑ s (Yi − X j )
i, j
donde ahora las variables que intervienen en la suma no son independientes.
Si no hay empates,
R(Yi ) =# { X j < Yi 1 ≤ j ≤ n}+ # {Yk ≤ Yi 1 ≤ k ≤ m}
entonces,
U =W +
m(m + 1)
2
Teorema: Bajo Ho: ∆ = 0, F ∈ Ωo,
P(R(Yi ) = k ) =
a)
1
N
1≤ k ≤ N
1


P (R(Yi ) = k , R(Y j ) = l ) =  N ( N − 1)
 0
N +1
b) E( R( Yi )) =
2
Corolario: E (U ) = m
N 2 −1
V ( R( Yi )) =
12
N +1
2
E (T ) = n
V (U ) = V (T ) = V (W ) = n m
N +1
2
N +1
12
si k ≠ l , i ≠ j
en caso contrario
cov( R( Yi ), R( Y j )) = −
E (W ) =
( N + 1)
si i ≠ j
12
nm
2
(2)
Métodos No Paramétricos I
Elena J. Martínez
83
2do cuat. 2013
Si hay empates, la esperanza de U no cambia pero sí la varianza. Si s es el número de grupos
de empates y dj es el número de valores empatados en el grupo j, entonces:
s
V (U / d 1 ,..., d s ) = m n
N +1
−
12
m n∑ (d i3 − d i )
i =1
12 N ( N − 1)
donde el segundo sumando se denomina “corrección por empates”. La varianza de U se puede
estimar en este caso mediante
N
mn( N + 1) 2
mn
2
V (U ) =
∑ Ri − 4( N − 1)
N ( N − 1) i =1
^
(3)
siendo
 R( X i )
Ri = 
 R(Yi − n )
1≤ i ≤ n
n +1≤ i ≤ n + m
Volviendo a los tests planteados inicialmente, las zonas de rechazo serán las siguientes:
A. Ho: ∆ = 0
vs
H1: ∆ ≠ 0
mn
Se rechaza Ho si U ≤ wαmn/ 2 ó U > w1mn
−α / 2 , siendo w β el cuantil β de la distribución exacta del
estadístico de Wilcoxon para tamaños de muestra m y n. La Tabla A7 de Conover da los
cuantiles inferiores de la distribución exacta para 2 ≤ m,n ≤ 20.
N ( N + 1)
, los cuantiles superiores pueden obtenerse mediante la relación:
2
N ( N + 1)
=
− wβnm . Si n y m son suficientemente grandes o hay empates, se utiliza la
2
Como U + T =
w1mn
−β
aproximación Normal. En este caso, el cuantil aproximado es
wp ≅
^
m( N + 1)
+ z p V (U )
2
La expresión del estimador de la varianza de U se reemplaza por (2) si no hay empates o por
(3) si hay empates.
Métodos No Paramétricos I
Elena J. Martínez
B. Ho: ∆ = 0
vs
o, si las muestras son grandes o hay empates si
^
m( N + 1)
− zα V (U ) .
2
C. Ho: ∆ = 0
Se rechaza Ho
U>
H1: ∆ < 0
si U ≤ wαmn
Se rechaza Ho
U≤
84
2do cuat. 2013
vs
H1: ∆ > 0
si U > w 1mn− α
o, si las muestras son grandes o hay empates si
^
m( N + 1)
+ z α V (U ) .
2
Distribución exacta bajo Ho: Consideremos, a modo de ejemplo, el caso n=m=2 sin empates,
con lo cual los rangos toman valores 1, 2, 3 y 4. En la siguiente tabla se presentan todas las
configuraciones posibles y los correspondientes valores de los estadísticos:
1
y
y
y
x
x
x
Rangos
2 3 4
y x x
x y x
x x y
y y x
y x y
x y y
W
U
T
0
1
2
2
3
4
3
4
5
5
6
7
7
6
5
5
4
3
La distribución exacta del estadístico U, por ejemplo, será:
U
pU
3
1/6
4
1/6
5
2/6
6
1/6
7
1/6
Hay una fórmula recursiva que permite obtener la distribución exacta. (Hettmansperger, pag.
137)
Distribución asintótica bajo Ho: ∆ = 0: Supongamos que n y m tienden a infinito, de modo tal
que
m
→λ
n+m
entonces, bajo Ho,
0 < λ <1
Métodos No Paramétricos I
Elena J. Martínez
85
2do cuat. 2013
W − E (W )
V (W )
U − E (U )
V (U )
d
→
N (0,1)
W =
W
p
→
1/ 2
nm
T − E (T )
d
N (0,1)
→
V (T )
d
→
N (0,1)
Estimador puntual e intervalo de confianza: El test para Ho: ∆ = ∆o vs H1: ∆ ≠ ∆o se puede
~
obtener trabajando con Yi = Yi − ∆ o que tiene mediana nula bajo Ho , y el estadístico del test se
basará en
W (∆ o ) = ∑ s (Y j − X i − ∆ o ) =# {(i, j ) / 1 ≤ i ≤ n, 1 ≤ j ≤ m, Y j − X i > ∆ 0 }
i, j
De esta forma del estadístico del test se deduce el estimador de Hodges-Lehmann de ∆,
∆ˆ = med (Y j − X i )
i, j
Como bajo Ho , la distribución de W es simétrica alrededor de su media nm/2, si k satisface
PH o (W ≤ k ) = α , entonces
2
[ D ( k +1) , D ( nm − k ) )
será un intervalo de confianza de nivel 1 - α para ∆, siendo D (1) ≤ .... ≤ D ( mn ) los estadísticos de
orden de las diferencias Dij = Y j − X i .
Como U = W +
m(m + 1)
, el valor de k se puede obtener, a partir de la tabla del libro de
2
Conover, como
k = wαmn/ 2 −
m(m + 1)
2
o bien, en forma aproximada,
k≅
^
mn 1
− − zα / 2 V (U )
2
2
^
con V (U ) reemplazada por (3) o (2) según haya o no empates.
Métodos No Paramétricos I
Elena J. Martínez
86
2do cuat. 2013
Ejemplo: En una clase de una escuela de enseñanza superior hay 48 alumnos varones, de los
cuáles 12 viven en el campo y 36 en la ciudad. Se desarrolló un test para determinar la
condición física de los alumnos. Se aplicó este test a los 48 alumnos y se asignó a cada uno
una puntuación. Una puntuación baja indica mala condición física. Los resultados obtenidos
son los siguientes:
Campo (Xi)
14.8 10.6
7.3
12.5
5.6
12.9
6.3
16.1
9.0
11.4
4.2
2.7
12.7
14.2
12.6
2.1
17.7
11.8
Ciudad (Yi)
7.6
2.4
11.3 6.4
8.3
9.1
6.7
6.7
3.6
18.6
1.0
3.2
16.9
7.9
16.0
10.6
5.6
5.6
6.2
6.1
15.3
10.6
1.8
5.9
9.9
10.6
14.8
5.0
2.6
4.0
Se desea testear
Ho: los alumnos que viven en el campo y los que viven en la ciudad tienen la misma condición
física
H1: los alumnos que viven en el campo tiene mejor condición física que los que viven en la
ciudad.
O, equivalentemente, si se supone que ambas poblaciones tienen igual distribución, excepto
quizás en la posición, que
Ho: ∆ = 0
H1: ∆ < 0
vs
donde ∆ = med (Yi) – med (Xi).
Se ordenan las puntuaciones de ambos grupos y se les asigna el correspondiente rango:
X
Y
1.0
1.8
2.1
2.4
2.6
2.7
3.2
3.6
4.0
4.2
5.0
5.6
5.6
5.6
5.9
6.1
Rango
1
2
3
4
5
6
7
8
9
10
11
13
13
13
15
16
X
Y
6.2
6.3
6.4
6.7
6.7
7.3
7.6
7.9
8.3
9.0
9.1
9.9
10.6
10.6
10.6
10.6
Rango
17
18
19
20.5
20.5
22
23
24
25
26
27
28
30.5
30.5
30.5
30.5
X
Y
11.3
11.4
11.8
12.5
12.6
12.7
12.9
14.2
14.8
14.8
15.3
16.0
16.1
16.9
17.7
18.6
Rango
33
34
35
36
37
38
39
40
41.5
41.5
43
44
45
46
47
48
Métodos No Paramétricos I
Elena J. Martínez
87
2do cuat. 2013
n
∑ R( X
Calculamos el valor del estadístico T =
i =1
N
necesitamos calcular
∑R
i =1
2
i
i
) = 321 . Para utilizar la aproximación normal,
= 38016 y por lo tanto el valor del estadístico standarizado será:
N +1
2
=
N
mn( N + 1) 2
mn
2
∑ Ri − 4( N − 1)
N ( N − 1) i =1
T −n
49
2
= 0.6431
12 ⋅ 36
12 ⋅ 36 ⋅ 49 2
38016 −
48 ⋅ 47
4 ⋅ 47
321 − 12
Rechazaríamos Ho a nivel 0.05 si el valor del estadístico fuese mayor que 1.65, entonces, no
rechazamos Ho . El p-valor es 0.26.
Lo procesamos en R usando la función wilcox.test:
campo<-c(14.8,10.6,7.3,12.5,5.6,12.9,6.3,16.1,9.0,11.4,4.2,2.7)
ciudad<-c(12.7,16.9,7.6,2.4,6.2,9.9,14.2,7.9,11.3,6.4,6.1,10.6,12.6,16.0,
8.3,9.1,15.3,14.8,2.1,10.6,6.7,6.7,10.6,5.0,17.7,5.6,3.6,18.6,1.8,2.6,11.8,
5.6,1.0,3.2,5.9,4.0)
wilcox.test(campo,ciudad,alternative="greater",paired=FALSE)
y obtenemos la siguiente salida:
Wilcoxon rank sum test with continuity correction
data: campo and ciudad
W = 243, p-value = 0.2639
alternative hypothesis: true location shift is greater than 0
Mensajes de aviso perdidos
In wilcox.test.default(campo, ciudad, alternative = "greater", paired
= FALSE) :
cannot compute exact p-value with ties
Distribución del estadístico bajo la alternativa: Sean X1,...,Xn e Y1,...,Ym m.a. de dos
distribuciones arbitrarias continuas G(x) y H(y) respectivamente. Recordemos que el estadístico
del test de Mann Whitney es equivalente a
W = ∑ s (Yi − X j )
i, j
que podemos escribir en la forma
Métodos No Paramétricos I
Elena J. Martínez
88
2do cuat. 2013
W = ∑ ∑ Tij
i
Tij = 1 si
donde
j
Yi − X j > 0
y definamos, análogamente a lo que hicimos en el caso del test de Wilcoxon,
∞
∞
−∞
−∞
p1 = P(Y > X ) = ∫ G ( y ) h( y ) dy =
p 2 = P(Y1 > X 1 , Y2 > X 1 ) =
∫ [1 − H ( x)] g ( x) dx
∞
∫ [1 − H ( x)] g ( x) dx
2
−∞
∞
p 3 = P(Y1 > X 1 , Y1 > X 2 ) = ∫ G 2 ( y ) h( y ) dy
−∞
Teorema:
E (W ) = m n p1
V (W ) = m n( p1 − p12 ) + m n (m − 1)( p 2 − p12 ) + m n (n − 1)( p 3 − p12 )
Demostración: E (W ) = m n E (T11 ) = m n P (Y > X ) = m n p1 . Por otro lado, expresando
2




E (W ) = E ∑∑ Tij  = E ∑∑∑∑ Tij Tkl 
 i j

 i j k l

2
se obtiene
E (W 2 ) = mnE (T112 ) + mn(m − 1) E (T11T12 ) + mn(n − 1) E (T12 T22 ) + mn(m − 1)(n − 1) E (T11T22 )
Pero, por ejemplo, E (T11T12 ) = P (Y1 > X 1 , Y2 > X 1 ) = p 2 y, operando con los otros términos en la
misma forma, y calculando V (W ) = E (W 2 ) − [E (W )] se obtiene la expresión dada.
2
Cuando m, n → ∞ , de manera que n / N → λ , 0 < λ < 1 , usando el método de las proyecciones
puede probarse que, si 0 < p1 < 1,
W − E (W )
V (W )
d
→
N (0,1)
Métodos No Paramétricos I
Elena J. Martínez
89
2do cuat. 2013
Más precisamente, si W = W / mn ,
d
N (W − p1 ) →
N (0, ( p 2 − p12 ) / λ + ( p 3 − p12 ) /(1 − λ ))
Consistencia: Sea µ (G , H ) = E (W ) = p1 y sea ΩM la clase de funciones de distribución
continuas definida como
ΩM ={(G,H) tales que G(x) ≥ H(x) ∀ x con desigualdad estricta en al menos un x}
Entonces,
 1/ 2
µ (G, H ) = 
> 1 / 2
si G ( x) = H ( x)
si (G, H ) ∈ Ω M
y, por lo tanto W provee un test consistente para la clase de alternativas ΩM , en particular para
alternativas de posición, como las planteadas por nosotros.
Eficacia: Puede hacerse una deducción rigurosa de la eficacia, verificando las condiciones de
Pitman, pero daremos sólo su expresión. Consideremos G(x)=F(x) y H(x) = F(x-∆). Sabemos
que la varianza asintótica es
σ 2 = ( p 2 − p12 ) / λ + ( p 3 − p12 ) /(1 − λ )
Bajo Ho, σ 2 (0) =
1
. Además,
12 λ (1 − λ )
µ (∆) = p1 =
∞
∫ [1 − F ( x − ∆)] f ( x)dx
⇒
−∞
µ ' (0) =
∞
∫f
2
( x)dx
−∞
y por lo tanto la eficacia del test es
c=
µ ' (0)
= 12λ (1 − λ ) ∫ f 2 ( x)dx
σ (0)
λ (1 − λ ) veces la eficacia del test de Wilcoxon para muestras
apareadas y es máxima cuando λ = 1 / 2 o sea cuando las dos muestras son de igual tamaño.
Observemos que la eficacia es
Métodos No Paramétricos I
Elena J. Martínez
90
2do cuat. 2013
De aquí podemos deducir cuál es la distribución asintótica del estimador de Hodges-Lehmann
de ∆, ya que
d
N (∆ˆ − ∆) →
N (0,1 / c 2 )
Respecto a la eficiencia asintótica relativa del test de Mann-Whitney respecto al test de t, fue
estudiada bajo la hipótesis de que las distribuciones de ambas poblaciones difieren sólo en su
media. Si ambas poblaciones son normales la eficiencia es 0.955, si son uniformes es 1.0 y si
tienen distribución doble exponencial es 1.5. Bajo la hipótesis mencionada sobre las
distribuciones, la eficiencia nunca es inferior a 0.864.
Witting (1960) estudió la eficiencia del test de Mann-Whitney relativa al test de t para dos
muestras independientes pequeñas. Usando aproximaciones numéricas, Witting mostró que
aún para tamaños de muestra pequeños (m=n=10, por ejemplo), la eficiencia, bajo normalidad
nunca era menor que 0.94.
Problema de Fisher-Behrens: Hasta ahora supusimos que ambas distribuciones tienen la
misma forma y difieren a lo sumo en la posición. Ahora supongamos que X1,...,Xn es una m.a.
de una distribución G(x), G ∈ Ωo e Y1,...,Ym es una m.a. de una distribución H(y-∆), H ∈ Ωo y
que deseamos testear
Ho: ∆ = 0
vs
H1: ∆ > 0
Cuando G y H son normales con diferentes varianzas usamos el test de Welch.
La idea es usar la distribución límite de W para G y H arbitrarias e introducir un estimador
consistente de la varianza de W. Sabemos que, E (W ) = nmp1 y
V (W ) = m n( p1 − p12 ) + m n (m − 1)( p 2 − p12 ) + m n (n − 1)( p 3 − p12 )
Buscamos un estimador consistente de la varianza y lo haremos a partir de las siguientes
expresiones
p1 − p12 =
(∫ G(t )h(t )dt )(∫ H (t ) g (t )dt )
p 2 − p12 = ∫ H 2 (t ) g (t )dt −
p 3 − p12 = ∫ G 2 (t )h(t )dt −
(∫ H (t ) g (t )d (t ))
2
(∫ G(t )h(t )d (t ))
2
Métodos No Paramétricos I
Elena J. Martínez
91
2do cuat. 2013
La idea es reemplazar en estas ecuaciones las funciones de distribución por las
correspondientes funciones de distribución empíricas.
Sin embargo, estos estimadores se expresan en forma más simple usando las denominadas
ubicaciones, que definimos a continuación.
Definición: Dados X1,...,Xn e Y1,...,Ym, la ubicación de Xi entre Y1,...,Ym es
ρ i ( x) =# {j / Y j ≤ X i }
y la ubicación de Yj entre X1,...,Xn es
ρ j ( y ) = # {i / X i ≤ Y j }
∫
Entonces, un estimador de 1 − p1 = H (t ) g (t )dt es
∫ H m (t )dGn (t ) =
1 n
1 n
1
H
(
X
)
=
ρ i ( x) = ρ ( x)
∑
∑
m
i
n i =1
nm i =1
m
De la misma forma se expresan todos los otros estimadores, y llamando
n
s 2 ( x) = ∑ (ρ i ( x) − ρ ( x) )
2
i =1
s 2 ( y ) = ∑ (ρ j ( y ) − ρ ( y ) )
m
2
j =1
el estimador de la varianza de W será
^
V (W ) = ρ ( x) ρ ( y ) + s 2 ( x) + s 2 ( y )
y, como las ubicaciones son funciones de los rangos, el estadístico
^
W=
W − mn / 2
^
V (W )
es un estadístico de rangos. El test rechazará Ho: ∆ = 0 a favor de H1: ∆ > 0 a nivel α cuando
^
W > zα .
Métodos No Paramétricos I
Elena J. Martínez
92
2do cuat. 2013
Si ∆ = 0 y G = H, Ŵ es distribución libre y su distribución ha sido tabulada para algunos
^
tamaños de muestra por Fligner y Policello (1981). Sin embargo, para asegurar que W siga
siendo al menos asintóticamente distribución libre cuando ∆ = 0 y G ≠ H, debe suponerse que
G, H ∈ Ωs.
En la tabla que sigue (Fligner y Policello (1981)) se presentan los niveles empíricos, para un
^
nivel nominal 0.05, basados en 10000 simulaciones para W , W , t y tW , siendo este último el
estadístico de Welch. Los tamaños de muestra son n=11 y m=10 y las distribuciones
consideradas son la distribución Normal y la Normal contaminada con ε = 0.1, con H de la
forma H(t)=G(t/σ) para diferentes valores de σ.
Distribución
Normal
Normal contaminada
σ
W
0.1
0.25
1
4
10
0.1
0.25
1
4
10
0.081
0.069
0.050
0.071
0.082
0.076
0.065
0.048
0.068
0.083
^
W
0.048
0.054
0.048
0.054
0.062
0.051
0.052
0.046
0.052
0.063
t
tW
0.048
0.050
0.048
0.060
0.069
0.033
0.033
0.035
0.043
0.050
0.048
0.052
0.047
0.047
0.052
0.034
0.033
0.033
0.032
0.035
^
Se observa que el test basado en W es el más estable, superando al test de Welch en el caso
contaminado. Los mismos autores simularon otras distribuciones subyacentes e incluyeron un
^
estudio de la potencia de los tests, concluyendo que el test basado en W es superior en el
sentido de que conserva su nivel y al mismo tiempo alcanza alta potencia.
Scores generales:
Definición: Sean N=n+m, a(1) ≤ .... ≤ a(N) una sucesión no constante y definamos
V = ∑ a (R j )
m
j =1
donde R j = R (Y j ) es el rango de Y j en la muestra combinada. V se denomina estadístico de
scores generales con scores a(i).
Métodos No Paramétricos I
Elena J. Martínez
93
2do cuat. 2013
Teorema: Bajo Ho: ∆ = 0,
E (V ) =
m N
∑ a(i) = m a
N i =1
Var (V ) =
Demostración: E (V ) =
N
nm
(a(i ) − a )2
∑
N ( N − 1) i =1
m
N
i =1
s =1
∑ E (a( R j )) = mE (a( R1 )) = m∑ a(s)
N
E (a 2 ( R1 )) = ∑ a 2 ( s )
s =1
1
N
N
entonces, Var (a ( R1 )) =
N
∑a
s =1
2
(s)
1
−a2 =
N
1
=ma.
N
∑ (a(s) − a )
2
s =1
N
Además,
cov(a ( R1 ), a ( R2 )) = E ((a ( R1 ) − a )(a ( R2 ) − a ) ) = ∑
1
(a (i ) − a )(a ( j ) − a ) =
i ≠ j N ( N − 1)
N
N
1
1
=
(a(i ) − a )∑ (a( j ) − a ) = −
(a (i ) − a ) 2
∑
∑
N ( N − 1) i =1
N ( N − 1) i =1
j ≠i
Entonces,
m(m − 1)
cov(a ( R1 ), a ( R2 )) =
2
j =1
N
m(m − 1) N
m N
m
= ∑ (a( s) − a ) 2 −
(a( s) − a ) 2 =
(a( s ) − a ) 2 ( N − 1 − m + 1) =
∑
∑
N s =1
N ( N − 1) s =1
N ( N − 1) s =1
m
Var (V ) = Var ∑ a ( R j ) = m Var (a ( R1 )) + 2
=
N
mn
(a ( s) − a ) 2
∑
N ( N − 1) s =1
Métodos No Paramétricos I
Elena J. Martínez
94
2do cuat. 2013
Más aún, puede probarse que si a ( j ) + a ( N + 1 − j ) = K (constante) para todo j, entonces bajo
Ho, V tiene distribución simétrica alrededor de m a .
Definición: Sea ψ(u), 0 < u < 1, una función no decreciente. Supongamos además que
1
1
0 < ∫ (ψ (u) -ψ ) du < ∞
2
ψ = ∫ ψ (u )du
con
0
0
 i 
 , definimos el estadístico generado por la función generadora de scores ψ,
 N + 1
Si a (i ) = ψ 
como:
V =
1
N
∑ a(R(Y ))
m
j
j =1
Distribución asintótica bajo Ho: En el caso de una muestra, el estadístico V era asintóticamente
normal y el resultado se obtenía aplicando el TCL. En este caso, V no es suma de v.a.
independientes y es necesario usar el teorema de proyecciones para obtener su distribución
asintótica. Hajek y Sidak (1967) prueban que si min(n, m) → ∞ , entonces bajo Ho,
V − E (V )
d
→
N (0,1)
Var (V )
Supongamos que
n
→ λ , 0 < λ < 1, es decir que ninguno de los tamaños de muestra domina
N
asintóticamente, entonces
E (V ) =
m
m 1
a=
N
N N
N

i

∑ψ  N + 1  → (1 − λ ) ψ
i =1
1
N
mn
N Var (V ) = 2
(a (i ) − a ) 2 → λ (1 − λ ) ∫ (ψ (u ) − ψ ) 2 du
∑
N ( N − 1) i =1
0
y, bajo Ho
N
V − (1 − λ ) ψ
1


λ
(1
λ
)
(ψ (u) - ψ ) 2 du 

∫
0


1/ 2
d

→
N (0,1)
Métodos No Paramétricos I
Elena J. Martínez
95
2do cuat. 2013
Algunos ejemplos de funciones de scores:
ψ (u ) = Φ −1 (u ) , entonces el estadístico de
1) Scores normales de Van der Waerden: Sea
scores normales se define como
1
N
V =
1
∫
En este caso, ψ = Φ −1 (u )du = 0 y
0
m
∑Φ
−1
j =1
 Rj 


 N + 1


1
∫ (ψ (u) − ψ ) du = 1 . Para probarlo basta hacer el cambio
2
0
de variable Φ −1 (u ) = t .
 N3 


 mn 
n
m
≅ λ , 1 − λ ≅ y bajo Ho,
Luego si
N
N
1/ 2
d
V →
N (0,1)
2) Estadístico de Mood: Sea
1/2 < u < 1
0 < u ≤ 1/2
1
ψ (u ) = 
0
entonces el estadístico de Mood, que es el número de Yi’s que superan a la mediana de la
muestra combinada (test de la mediana) se puede escribir como
m
 Rj 

V+* = ∑ψ 

j =1
 N + 1
1
∫
Es fácil verificar que ψ (u )du = 1 / 2 y
0
1
∫ (ψ (u) − ψ )
2
du = 1 / 4 .
0
Supongamos que N = n+m = 2 r y m ≤ n, entonces
 i  0
a(i ) = ψ 
=
 N + 1  1
1≤ i ≤ r
r +1≤ i ≤ N
Métodos No Paramétricos I
Elena J. Martínez
96
2do cuat. 2013
E (V+* ) = m a = m
r m
= = mψ
N 2
1
Var (V+* ) =
mn
(a(s ) − a )2 = mn = mn ∫ (ψ (u ) − ψ ) 2 du
∑
N ( N − 1)
4( N − 1) N − 1 0
V+*
,
Por lo tanto, si denotamos V =
N
*
+
1− λ
d
2 →
N (0,1)
λ (1 − λ )
4
V+* −
N
3) ¿Cómo construir scores para el problema de dos muestras a partir de los de una
muestra?: Sea ψ + (u ), 0 < u < 1 , una función generadora de scores para el problema de
una muestra y el correspondiente estadístico
V
+
=
1 n +  Rj 
∑ψ   s ( X j )
n j =1  n + 1 
Consideremos ahora la siguiente extensión de ψ + al (-1,1):
ψ + (−u ) = −ψ + (u )
si u ∈ (0,1)
Sea
ψ (u ) = ψ + (2u − 1)
− ψ + (1 − 2u )
ψ (u ) =  +
 ψ (2u − 1)
si
0 < u <1
0 < u <1/ 2
1/2 < u < 1
Métodos No Paramétricos I
Elena J. Martínez
97
2do cuat. 2013
Se define el estadístico para el test de dos muestras en la forma V =
En este caso, ψ = 0 y
1
1
0
0
(
1
N
m
 R(Y j ) 
j =1

∑ψ  N + 1  .

)
2
+
∫ (ψ (u) − ψ ) du = ∫ ψ (v) dv y se puede demostrar que la eficacia del
test correspondiente a ψ es
2
λ (1 − λ ) veces la del test para una muestra generado por ψ + .
Ejemplos: 3.1) Si ψ + (u ) = u , 0 < u < 1 , el estadístico V + es el del test de rangos signados de
Wilcoxon. La función generadora ψ (u ) = 2u − 1, 0 < u < 1 produce el test de Mann-Whitney para
dos muestras.
3.2) Si ψ + (u ) = 1, 0 < u < 1 , el estadístico V + es el del test del signo. La función generadora
− 1
ψ (u ) = 
1
0 < u < 1/ 2
produce el test de medianas de Mood para dos muestras.
1/ 2 < u < 1
 u +1
+
, 0 < u < 1 , el estadístico V es el correspondiente al test de scores
2


normales. La función generadora ψ (u ) = Φ −1 (u ) produce el test de scores normales de Van der
3.3) Si ψ + (u ) = Φ −1 
Waerden para dos muestras.
Eficiencia de scores generales: La eficacia del test de dos muestras generado por la función
 u + 1
 multiplicada por
 2 
de scores Ψ es la del test de una muestra generado por ψ + (u ) = ψ 
λ (1 − λ ) y por lo tanto se preservan las eficiencias relativas.
Descargar