Descripción de tablas de contingencia

Anuncio
GoBack
Descripción de tablas de contingencia
Guillermo Ayala Gallego
Universidad de Valencia
15 de octubre de 2008
1 / 40
Un ejemplo
Probabilidad y tablas de
contingencia
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
2 / 40
Distribución conjunta y tabla de contingencia
X e Y dos variables categóricas con I y J categorı́as.
Un sujeto puede venir clasificado en una de I × J categorı́as.
Dada una muestra podemos construir la siguiente tabla donde
consideramos X= toma aspirina o placebo (I = 2) e Y = sufre
ataque cardı́aco o no (J = 2).
Ataque fatal Ataque no fatal No ataque
Placebo
18
171
10845
Aspirina
5
99
10933
Esta tabla recibe el nombre de tabla de contingencia o tabla de
clasificación cruzada.
3 / 40
Su distribución conjunta viene dada por
πij = P (X = i, Y = j),
con i = 1, . . . , I y j = 1, . . . , J.
Las distribuciones marginales son
πi+ = P (X = i) =
π+j = P (Y = j) =
J
X
πij
j=1
J
X
I
X
I
X
πij
i=1
P (X = i, Y = j) =
j=1
P (X = i, Y = j) =
i=1
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
4 / 40
Distribución condicional
Habitualmente una variable, por ejemplo Y , es
una variable respuesta y la otra, X es explicativa o
predictora.
En esta situación no tiene sentido hablar de
distribución conjunta.
Distribución condicionada de Y a X
P (Y = j|X = i) = πj|i
πij
=
πi+
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
5 / 40
Independencia y homogeneidad
Son independientes si
πij = πi+ π+j .
En particular, la condicionada es igual a la
marginal.
πj|i = π+j con j = 1, . . . , J.
Si X e Y son variables respuesta entonces
hablamos de independencia.
Si Y es respuesta y X explicativa hablamos de
homogeneidad.
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
6 / 40
Tablas de contingencia
Test positivo
Enfermo
n11
No enfermo
n21
Total
n+1
Test negativo Total
n11
n1+
n22
n2+
n+2
n
Distribución conjunta estimada.
Test positivo Test negativo Total
π̂ij
Enfermo
n11 /n
n11 /n
n1+ /n
No enfermo
n21 /n
n22 /n
n2+ /n
Total
n+1 /n
n+2 /n
1
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
7 / 40
Tablas de contingencia
Test positivo
Enfermo
n11
No enfermo
n21
Total
n+1
Test negativo Total
n11
n1+
n22
n2+
n+2
n
Test positivo
π̂j|i
Enfermo
n11 /n1+
n21 /n2+
No enfermo
Test negativo Total
n11 /n1+
1
n22 /n2+
1
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
8 / 40
Sensibilidad y especificidad
π̂j|i
Test positivo
Enfermo
n11 /n1+
No enfermo
n21 /n2+
Test negativo Total
n11 /n1+
1
n22 /n2+
1
Un ejemplo: en filas indicamos si tiene o no cáncer y
en columnas el resultado del test.
π̂j|i
Test positivo
Enfermo
0,82
No enfermo
0,01
Test negativo Total
0,18
1
0,99
1
Sensibilidad Proporción de enfermos
correctamente diagnósticados.
π1|1 = P (Y = 1|X = 1).
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
9 / 40
Sensibilidad y especificidad
π̂j|i
Test positivo
Enfermo
n11 /n1+
No enfermo
n21 /n2+
Test negativo Total
n11 /n1+
1
n22 /n2+
1
Un ejemplo: en filas indicamos si tiene o no cáncer y
en columnas el resultado del test.
π̂j|i
Test positivo
Enfermo
0,82
No enfermo
0,01
Test negativo Total
0,18
1
0,99
1
Sensibilidad Proporción de enfermos
correctamente diagnósticados.
π1|1 = P (Y = 1|X = 1).
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
9 / 40
Tipo de muestreo
¿Cómo hemos obtenido la muestra?
Muestreo de Poisson: Los conteos Yij son
variables Poisson independientes con medias µij .
Muestreo multinomial: Fijamos el tamaño total
n pero no los totales de fila y columna.
Muestreo multinomial independiente:
Fijamos los totales de fila considerando Y como
variable respuesta y X como explicativa.
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
10 / 40
Tipo de muestreo: verosimilitud
Muestreo de Poisson
n
YY
i
j
ij
µ
ij
e−µij
nij !
Muestreo multinomial
n!
Q Q
i
j
nij !
YY
i
nij
πij .
j
Muestreo multinomial independiente
Y ni+ ! Y n
Q
πj|iij .
j nij ! j
i
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
11 / 40
Un ejemplo
Accidente mortal Accidente no mortal
Con cinturón
Sin cinturón
Vamos a recoger todos los accidentes del próximo mes. No
fijamos el número total. Muestreo de Poisson.
Tomamos un muestra aleatoria de 200 accidentes que tuvieron
lugar el mes pasado. Fijamos el tamaño total de la muestra.
Muestreo multinomial.
Tomamos una muestra de 100 accidentes donde hubo muertos y
otros 100 en los que no hubo muertos. Fijamos los totales de
columna. Muestreo multinomial (binomial aquı́) independiente.
12 / 40
Probabilidad y
tablas de
contingencia
Comparación de dos proporciones
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
13 / 40
Comparación de dos proporciones
Muchos estudios se diseñan para comparar grupos
basándonos en una respuesta binaria, Y .
Con dos grupos tenemos una tabla de
contingencia 2 × 2.
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
14 / 40
Comparación de dos proporciones
Muchos estudios se diseñan para comparar grupos
basándonos en una respuesta binaria, Y .
Con dos grupos tenemos una tabla de
contingencia 2 × 2.
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
14 / 40
Comparación de dos proporciones
Muchos estudios se diseñan para comparar grupos
basándonos en una respuesta binaria, Y .
Con dos grupos tenemos una tabla de
contingencia 2 × 2.
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
14 / 40
Comparación de dos proporciones
Muchos estudios se diseñan para comparar grupos
basándonos en una respuesta binaria, Y .
Con dos grupos tenemos una tabla de
contingencia 2 × 2.
1
2
1
π1|1
π1|2
2
π2|1
π2|2
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
14 / 40
Comparación de dos proporciones
Muchos estudios se diseñan para comparar grupos
basándonos en una respuesta binaria, Y .
Con dos grupos tenemos una tabla de
contingencia 2 × 2.
Grupo 1
Grupo 2
Éxito
π1|1
π1|2
Fracaso
π2|1
π2|2
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
14 / 40
Comparación de dos proporciones
Muchos estudios se diseñan para comparar grupos
basándonos en una respuesta binaria, Y .
Con dos grupos tenemos una tabla de
contingencia 2 × 2.
Grupo 1
Grupo 2
Éxito
π1|1
π1|2
Fracaso
π2|1
π2|2
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
π1|i = πi
π2|i = 1 − π1|i = 1 − πi
14 / 40
Comparación de dos proporciones
Muchos estudios se diseñan para comparar grupos
basándonos en una respuesta binaria, Y .
Con dos grupos tenemos una tabla de
contingencia 2 × 2.
Grupo 1
Grupo 2
Éxito
π1
π2
Fracaso
1 − π1
1 − π2
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
14 / 40
Comparación de dos proporciones
Muchos estudios se diseñan para comparar grupos
basándonos en una respuesta binaria, Y .
Con dos grupos tenemos una tabla de
contingencia 2 × 2.
Grupo 1
Grupo 2
Éxito
π1
π2
Queremos comparar π1 con π2 .
Fracaso
1 − π1
1 − π2
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
14 / 40
¿Cómo comparamos?
Podemos estudiar la diferencia de las proporciones
π1 − π2 .
O el riesgo relativo:
π1
.
π2
O bien el cociente de odds (odds ratio)
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
π1 /(1 − π1 )
.
θ=
π2 /(1 − π2 )
15 / 40
Odds y odds ratio
Si π es la probabilidad de éxito entonces los odds
se definen como
π
Ω=
.
1−π
Equivalentemente
Ω
.
π=
Ω+1
En una tabla 2 × 2 tenemos los odds en la fila i
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
πi
.
Ωi =
1 − πi
16 / 40
El cociente de los odds de las dos filas será el odds
ratio.
π1 /(1 − π1 )
.
θ=
π2 /(1 − π2 )
Se tiene fácilmente que
π11 π22
.
θ=
π12 π21
Por ello también se le llama el cociente de los
productos cruzados.
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
17 / 40
Propiedades del odds ratio
Puede ser cualquier valor positivo.
θ = 1 significa que no hay asociación entre X e
Y.
Valores de θ alejados de 1 indican una asociación
mayor.
Se suele trabajar con log θ pues entonces el valor
que tenemos es simétrico respecto a cero.
El odds ratio no cambia cuando intercambiamos
filas y columnas.
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
18 / 40
Nota de R
notaR/notaR004.pdf
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio
Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
19 / 40
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial en tablas 2 × 2
estratificadas
Asociación parcial
en tablas 2 × 2
estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea
Tablas I × J
20 / 40
El problema
Cuando estudiamos el efecto de X sobre Y
debemos de controlar las covariables que pueden
influir en la relación.
Lo mejor es mantener las covariables relevantes
constantes.
Un efecto de X sobre Y puede representar un
efecto de la (o las) covariables sobre las variables
X e Y.
Esto no es fácil en estudios observacionales.
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea
Tablas I × J
21 / 40
Un ejemplo
Consideramos los procesamientos por asesinatos
múltiples en Florida entre 1976 y 1987.
Pena de muerte
Vı́ctima Acusado Si
No % Sı́
Blanco
Negro
Total
Blanco
Negro
Blanco
Negro
53
11
0
4
414
37
16
139
11,3
22,9
0,0
2,8
Blanco
Negro
53
15
430
176
11,0
7,9
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea
Tablas I × J
22 / 40
Se condena a muerte más a los blancos que a los negros en
Estados Unidos. En el paı́s de la igualdad se discrimina a los
blancos.
23 / 40
Se condena a muerte más a los blancos que a los negros en
Estados Unidos. En el paı́s de la igualdad se discrimina a los
blancos.
23 / 40
Se condena a muerte más a los blancos que a los negros en
Estados Unidos. En el paı́s de la igualdad se discrimina a los
blancos.
Consideramos como covariable la raza de la vı́ctima.
23 / 40
Se condena a muerte más a los blancos que a los negros en
Estados Unidos. En el paı́s de la igualdad se discrimina a los
blancos.
Pena de muerte
Si
No
% Sı́
Blanco
Negro
Blanco
Negro
53
11
0
4
414
37
16
139
11,3
22,9
0,0
2,8
Blanco
Negro
53
15
430
176
11,0
7,9
Vı́ctima Acusado
Blanco
Negro
Total
23 / 40
Se condena a muerte más a los blancos que a los negros en
Estados Unidos. En el paı́s de la igualdad se discrimina a los
blancos.
En el paı́s de la igualdad se condena más a los negros.
23 / 40
¿Por qué?
La explicación tiene que venir de la asociación existente entre la
raza de la vı́ctima y las variables que cruzamos marginalmente.
Hay una gran asociación entre raza de vı́ctima y raza del
acusado (odds ratio de 87)
Vı́ctima vs acusado
Blanco Negro
Blanco
467
48
Negro
16
143
Vı́ctima vs veredicto
Si No
Blanco 64 451
Negro
4 155
24 / 40
Los blancos tienden a matar más a blancos.
Si matas a un blanco tienes una mayor
probabilidad de que te condenen.
Esto es un ejemplo de la paradoja de Simpson
(1951).
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea
Tablas I × J
25 / 40
Nota de R
Datos de asesinatos múltiples en Florida:
notaR/notaR007.pdf
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea
Tablas I × J
26 / 40
Odds ratios condicionales y marginales
Las asociaciones marginales y condicionales
pueden ser descritas mediante el odds ratio.
Supongamos una tabla 2 × 2 × K.
Tenemos µijk , frecuencia esperada en la celda
correspondiente.
Fijamos Z = k, y tenemos
θXY (k)
µ11k µ22k
=
µ12k µ21k
que serı́an los odds ratio condicionales.
Los odds ratio marginales serı́an
θXY
µ11+ µ22+
=
µ12+ µ21+
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea
Tablas I × J
27 / 40
Sustituyendo los µijk por las frecuencias
observadas tenemos los odds ratio muestrales.
Un valor de uno en un odds ratio supone
independencia bien marginal (si θXY =) o bien
condicionada a que Z = k (si θXY (k) = 1).
notaR/notaR010.pdf
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea
Tablas I × J
28 / 40
Independencia marginal e independencia
condicionada
La independencia condicionada a Z = k significa
P (Y = j|X = i, Z = k) = P (Y = j|Z = k),
para todo i, j.
Si lo anterior es cierto para todo valor de Z entonces se dice que
X e Y son condicionalmente independientes dada Z y se
verifica:
πi+k π+jk
πijk =
π++k
para cualquier i, j, k.
La independencia condicional no implica la independencia
marginal.
29 / 40
Asociación homogénea
Una tabla 2 × 2 × K tiene una asociación XY
homogénea cuando
θXY (1) = . . . = θXY (K) .
El tipo de asociación entre X e Y es el mismo
para las distintas categorı́as de Z.
Si existe una asociación XY homogénea entonces
también tenemos una asociación XZ homogénea
y una asociación Y Z homogénea.
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea
Tablas I × J
30 / 40
Un ejemplo
X = fumador (si, no)
Y = cáncer de pulmón (si, no)
Z = edad (< 45, 45 − 65, > 65)
Los odds ratio observados son
θXY (1) = 1,2 θXY (2) = 3,9 θXY (3) = 8,8
El efecto de fumar se acentúa conforme la edad es
mayor.
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea
Tablas I × J
31 / 40
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
Tablas I × J
Medidas resumen de
asociación
Un ejemplo:
Theil,1970
Tendencias
ordinales: pares
concordantes y
discordantes
32 / 40
Medidas resumen de asociación
Los ı́ndices más interpretables son del estilo del
coeficiente de determinación R2 .
Sea V (Y ) una medida de variación de la
distribución marginal de Y (dada por
{π+1 , . . . , π+J }).
Sea V (Y |i) la misma medida para la distribución
condicionada de Y a X = i, {π1|i , . . . , πJ|i }.
Este tipo de ı́ndices consideran
V (Y ) − E[V (Y |X)]
V (Y )
con
E[V (Y |X)] =
X
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
Medidas resumen de
asociación
Un ejemplo:
Theil,1970
Tendencias
ordinales: pares
concordantes y
discordantes
πi+ V (Y |i).
i
33 / 40
Un ejemplo: Theil,1970
Utilizamos la entropı́a
V (Y ) =
Probabilidad y
tablas de
contingencia
X
π+j log π+j
j
Obtenemos el coeficiente de incertidumbre
P P
i
j πij log(πij /πi+ π+j )
P
U =−
j π+j log π+j
U = 0 significa que X e Y son independientes.
U = 1 significa que para cada i, πj|i = 1 para
algún j.
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
Medidas resumen de
asociación
Un ejemplo:
Theil,1970
Tendencias
ordinales: pares
concordantes y
discordantes
34 / 40
Tendencias ordinales: pares concordantes y
discordantes
Ingresos
Dólares
< 15000
15000 − 25000
25000 − 40000
> 40000
Muy
insatisfecho
1
2
1
0
Satisfacción en el trabajo
Poco
Moderadamente
insatisfecho
satisfecho
3
3
6
1
10
10
14
9
Muy
satisfecho
6
7
12
11
35 / 40
Tenemos dos medidas ordinales. Cabe esperar una
tendencia monótona.
Consideramos pares concordantes si un valor
mayor de X va asociado a un valor mayor de Y .
Un par es discordante cuando un valor mayor de
X va asociado a un valor menor de Y .
Un par está empatado cuando coinciden en la
clasificación de X e Y .
En el ejemplo tenemos
C = 1331,
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
Medidas resumen de
asociación
Un ejemplo:
Theil,1970
Tendencias
ordinales: pares
concordantes y
discordantes
D = 849.
Parece que hay una tendencia de mayor ingreso
mayor satisfacción.
36 / 40
Si X e Y son independientes entonces la
probabilidades de concordancia y discordancia son:
XX XX
Πc = 2
πij
πhk ,
i
j
h>i k>j
y
Πd = 2
XX
i
j
πij
XX
h>i k<j
πhk
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
Medidas resumen de
asociación
Un ejemplo:
Theil,1970
Tendencias
ordinales: pares
concordantes y
discordantes
37 / 40
Condicionado a que no hay empate las
probabilidades de concordancia y discordancia son
Πc / Πc + Πd y Πd / Πc + Πd
La diferencia de las probabilidades es la gamma
(Goodman y Kruskal, 1954):
Πc − Πd
γ=
Πc + Πd
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
Medidas resumen de
asociación
Un ejemplo:
Theil,1970
Tendencias
ordinales: pares
concordantes y
discordantes
38 / 40
La versión muestral serı́a
C −D
γ̂ =
C+D
La gamma trata simétricamente a las variables
(como el coeficiente de correlación).
−1 ≤ γ ≤ 1.
Si invertimos las categorı́as de una variable la
gamma cambia de signo.
|γ| = 1 significa que hay una relación
perfectamente monótona.
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
Medidas resumen de
asociación
Un ejemplo:
Theil,1970
Tendencias
ordinales: pares
concordantes y
discordantes
39 / 40
γ = 1 si Πd = 0.
γ = −1 si Πc = 0.
Independencia implica γ = 0. El recı́proco no es
cierto.
Ejemplo de satisfacción con el trabajo:
γ̂ = 0,221.
Una ligera tendencia se observa de que unos
ingresos mayores suponen una mayor satisfacción.
notaR/notaR011.pdf
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Tablas I × J
Medidas resumen de
asociación
Un ejemplo:
Theil,1970
Tendencias
ordinales: pares
concordantes y
discordantes
40 / 40
Descargar