Problema 2.7

Anuncio
Problema del examen final de enero de 2010:
Se desea comparar la cantidad de nitrógeno (en kgT por año) que se vierte en las aguas
costeras del Reino Unido a través de descargas de agua dulce (por ejemplo, de ríos) y a
través de puntos de desagüe directos (como tuberías). Se observan las siguientes cantidades
de nitrógeno:
Región
Mar del
Mar del Norte
Atlántica
Norte
Celta
Irlandesa
(Costa Este)
(Canal)
Ríos
28
93
17
30
42
Ruta
Directo
10
77
12
11
6
a) Especifica qué modelo utilizarías para analizar estos datos. Estima sus parámetros.
b) ¿Existen diferencias entre las regiones? ¿Influye la ruta sobre la cantidad de nitrógeno? Utiliza
nivel de significación α=0,05.
c) Compara la cantidad vertida de nitrógeno por parejas de regiones con un nivel conjunto de
confianza del 95%. ¿Qué conclusiones extraes? ¿Es coherente con lo obtenido en (b)?
Observación: Quizá necesites alguno de los siguientes cuantiles:
t 4;0.0025 = 5,60 , t10;0.0025 = 3,58 ,
t 5;0.0025 = 4,77 .
Solución:
a) Modelo:
j= μ
Yij =Cantidad de nitrógeno vertida a través de ruta tipo i en la región
+ α i + β j + U ij , donde i=1,2=I, j=1,…,5=J, U ij ~
2
5
i =1
j =1
∑α i = 0 = ∑ β j
N(0, σ ) independientes y
2
. Se trata de un modelo de análisis de la varianza con dos factores sin interacción.
El primer factor es la ruta y
αi
μ
representa su efecto incremental respecto a la cantidad media
nitrógeno vertida globalmente. El segundo factor es la región.
El tamaño muestral es n = I ⋅ J
Estimación de los parámetros:
= 10 .
μˆ = y •• = 32,6
αˆ 1 = y1• − y •• = 42 − 32,6 = 9,4 = −αˆ 2
βˆ1 = y •1 − y •• = 19 − 32,6 = −13,6
βˆ 2 = y •2 − y•• = 85 − 32,6 = 52,4
βˆ3 = y •3 − y •• = 14,5 − 32,6 = −18,1
βˆ 4 = y •4 − y•• = 20,5 − 32,6 = −12,1
βˆ5 = y •5 − y •• = 24 − 32,6 = −8,6
Residuos:
eij = y ij − ( μˆ + αˆ i + βˆ j )
Atlántica
Ríos
Directo
Ruta
2
5
VNE = ∑∑ e 2 ij = 247,4
i =1 j =1
-0,4
0,4
Región
Mar del Norte
(Canal)
-6,9
6,9
Mar del Norte
(Costa Este)
-1,4
1,4
→ Varianza residual
Celta
Irlandesa
0,1
-0,1
8,6
-8,6
s R = VNE / 4 = 61,85
2
= estimación de
σ2
de
b) Tabla ANOVA:
Fuente
SC
gl
CM
F
I-1=1
883,6
F (1) = 14,28
J-1=4
1739,35
F ( 2 ) = 28,12
(I-1)(J-1)=4
IJ-1=9
61,85
2
VE(α) =
Ruta
5∑ αˆ i2
= 883,6
i =1
5
Región
VE(β) =
2∑ βˆ j2 =
6957,4
j =1
Residual
Total
VNE = 247,4
VT = 8088,4
Contrastes:
Como
F (1) = 14,28 > F1; 4;0.05 = 7,71 , rechazamos “ H 0(1) : α 1 = α 2 = 0
(la ruta no influye sobre la
cantidad de nitrógeno vertida)” al nivel de significación α=0,05.
Como
F ( 2) = 28,12 > F4; 4;0.05 = 6,39 , rechazamos “ H 0( 2) : β 1 = K β 5 = 0
(no existen diferencias
entre las regiones)” al nivel de significación α=0,05.
⎛J⎞
⎛ 5⎞
c) El número de comparaciones entre regiones que queremos hacer es c = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = 10 . Por
2
2
⎝ ⎠
tanto, el nivel individual de confianza con el que calcularemos los intervalos de
αT
⎝ ⎠
β j − βl
es 1-α, siendo
0,05
= 0,005 .
c
10
En general, para todo j , l = 1, K ,5 , tenemos que
α=
=
⎛
2⎞
⎟ = ( y • j − y •l m 44,04 )
IC 0.995 ( β j − β l ) = ⎜⎜ y • j − y •l m t ( I −1)( J −1);α / 2 ⋅ s R ⋅
⎟
I
⎝
⎠
Por tanto,
IC 0.995 ( β 1 − β 2 ) =
(-110,04 , -21,96)
IC 0.995 ( β 1 − β 3 ) =
(-39,54 , 48,54)
⇒ β1 = β 3
IC 0.995 ( β 1 − β 4 ) =
(-45,54 , 42,54)
⇒ β1 = β 4
IC 0.995 ( β 1 − β 5 ) =
(-49,04 , 39,04)
⇒ β1 = β 5
IC 0.995 ( β 2 − β 3 ) =
(26,46 , 114,54)
⇒ β 2 > β3
IC 0.995 ( β 2 − β 4 ) =
(20,46 , 108,54)
⇒ β2 > β4
IC 0.995 ( β 2 − β 5 ) =
(16,96 , 105,04)
⇒ β 2 > β5
IC 0.995 ( β 3 − β 4 ) =
(-50,04 , 38,04)
⇒ β3 = β4
IC 0.995 ( β 3 − β 5 ) =
(-53,54 , 34,54)
⇒ β3 = β5
IC 0.995 ( β 4 − β 5 ) =
(-47,54 , 40,54)
⇒ β4 = β5
Resumiendo, obtenemos que
⇒ β1 < β 2
β1 = β 3 = β 4 = β 5 < β 2 ,
es decir, la cantidad de nitrógeno que se
vierte en el Mar del Norte (Costa Este) es mayor que en las restantes regiones. Y en las regiones
atlántica, Mar del Norte (Canal), celta e irlandesa se pueden considerar iguales. Esto es coherente con
haber rechazado
H 0( 2) : β 1 = K β 5 = 0
en (b).
Descargar