Estos son datos acerca de sı las personas creen o no en una vida

Anuncio
Estos son datos acerca de sı́ las personas creen o no en una vida después de
la muerte.
believe
race
no yes
ather
22
88
black
55 260
white 300 1339
Ajusto un modelo de INDEPENDENCIA
> modindepen<-glm(counts~race+believe,family=poisson ,data=creencia )
> summary(modindepen)
Call:
glm(formula = counts ~ race + believe, family = poisson, data = creencia)
Deviance Residuals:
1
2
3
-0.01717
0.15781 -0.20194
4
0.03631
5
-0.33688
6
0.41917
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.00032
0.10611
28.28
<2e-16 ***
raceblack
1.05209
0.11075
9.50
<2e-16 ***
racewhite
2.70136
0.09849
27.43
<2e-16 ***
believeyes
1.49846
0.05697
26.30
<2e-16 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 2849.21758
Residual deviance:
0.35649
AIC: 49.437
on 5
on 2
degrees of freedom
degrees of freedom
Number of Fisher Scoring iterations: 3
>
Después de ver el valor de la deviance decimos que el modelo se ajusta muy
bien, ası́ que hay independencia entre creer en el más allá y la raza de la persona.
Como la variable creer tiene sólo dos categorı́as podemos interpretar con
momios. Entonces el momio de creer en la vida después de la muerte es
> exp(modindepen$coefficients[4])
believeyes
4.474801
1
Es el mismo para todas las razas, no depende de las razas. La probabilidad de
creer es más del cuadruple que la de no creer. Esto es muy claro en la siguiente
figura:
[width=50mm]
> mosaicplot(~ race+believe, data = tabla, color = TRUE)
tabla
black
white
yes
believe
no
ather
race
Figura 1: mosaicplot datos originales de tabla
El modelo saturado es el siguiente:
> moddepen<-glm(counts~race*believe,family=poisson ,data=creencia )
> summary(moddepen)
Call:
glm(formula = counts ~ race * believe, family = poisson, data = creencia)
Deviance Residuals:
[1] 0 0 0 0 0 0
Coefficients:
Estimate Std. Error z value
(Intercept)
3.0910
0.2132 14.498
raceblack
0.9163
0.2523
3.632
racewhite
2.6127
0.2209 11.829
believeyes
1.3863
0.2384
5.816
raceblack:believeyes
0.1671
0.2808
0.595
racewhite:believeyes
0.1096
0.2468
0.444
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05
Pr(>|z|)
< 2e-16
0.000281
< 2e-16
6.03e-09
0.551889
0.656946
'.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
2
***
***
***
***
Null deviance: 2.8492e+03
Residual deviance: -1.8785e-13
AIC: 53.081
on 5
on 0
degrees of freedom
degrees of freedom
Number of Fisher Scoring iterations: 3
El cociente de momios de creer del grupo black vs ather son ( OJO coeficientes
asociados a raza=ather son cero)
> exp(moddepen$coefficients[5])
raceblack:believeyes
1.181818
El cociente de momios de creer del grupo white vs ather
> exp(moddepen$coefficients[6])
racewhite:believeyes
1.115833
El cociente de momios de creer del del grupo black vs white
> exp(moddepen$coefficients[5]-moddepen$coefficients[6])
raceblack:believeyes
1.059135
Estos tres valores no son muy lejanos a 1, es por eso que el modelo de
independencia no se rechaza.
Ahora si modificacmos los datos, para romper la independencia, modificando
el grupo más grande:
> tabla2
believe
race
no yes
ather 22 88
black 55 260
white 969 970
> summary(modindepen2<-glm(counts~race+believe,family=poisson ,data=creencia2 ))
Call:
glm(formula = counts ~ race + believe, family = poisson, data = creencia2)
Deviance Residuals:
3
> mosaicplot(~ race+believe, data = tabla2, color = TRUE)
tabla2
black
white
yes
believe
no
ather
race
Figura 2: mosaicplot datos modificando el grupo white es decir el más grande
1
-3.438
2
5.938
3
3.195
4
3.714
5
-8.153
6
-4.290
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.88510
0.09810 39.603 < 2e-16 ***
raceblack
1.05209
0.11075
9.500 < 2e-16 ***
racewhite
2.86945
0.09801 29.276 < 2e-16 ***
believeyes
0.23114
0.04141
5.582 2.38e-08 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 2668.35
Residual deviance: 155.96
AIC: 205.89
on 5
on 2
degrees of freedom
degrees of freedom
Number of Fisher Scoring iterations: 5
Vemos que la deviance crece mucho.
Ahora si modificamos los datos, para romper la independencia modificando
el grupo más pequeño:
> tabla3
believe
race
no yes
ather
55
55
4
black
white
55 260
300 1339
> mosaicplot(~ race+believe, data = tabla3, color = TRUE)
tabla3
black
white
yes
believe
no
ather
race
Figura 3: mosaicplot datos modificando el grupo ather es decir el más pequeño.
> summary(modindepen3<-glm(counts~race+believe,family=poisson ,data=creencia3 ))
Call:
glm(formula = counts ~ race + believe, family = poisson, data = creencia3)
Deviance Residuals:
1
2
3
0.7035
0.4743 -3.7963
4
-1.4367
5
-0.9777
6
5.9365
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.08424
0.10510
29.35
<2e-16 ***
raceblack
1.05209
0.11075
9.50
<2e-16 ***
racewhite
2.70136
0.09849
27.43
<2e-16 ***
believeyes
1.39479
0.05517
25.28
<2e-16 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 2806.814
Residual deviance:
53.394
AIC: 102.92
on 5
on 2
degrees of freedom
degrees of freedom
Number of Fisher Scoring iterations: 5
5
La deviance crece pero bastante menos que que modificando el grupo white.
6
Descargar