GoBack Descripción de tablas de contingencia Guillermo Ayala Gallego Universidad de Valencia 15 de octubre de 2008 1 / 40 Un ejemplo Probabilidad y tablas de contingencia Probabilidad y tablas de contingencia Distribución conjunta y tabla de contingencia Distribución condicional Independencia y homogeneidad Tablas de contingencia Tablas de contingencia Sensibilidad y especificidad Tipo de muestreo Tipo de muestreo: verosimilitud Un ejemplo Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 2 / 40 Distribución conjunta y tabla de contingencia X e Y dos variables categóricas con I y J categorı́as. Un sujeto puede venir clasificado en una de I × J categorı́as. Dada una muestra podemos construir la siguiente tabla donde consideramos X= toma aspirina o placebo (I = 2) e Y = sufre ataque cardı́aco o no (J = 2). Ataque fatal Ataque no fatal No ataque Placebo 18 171 10845 Aspirina 5 99 10933 Esta tabla recibe el nombre de tabla de contingencia o tabla de clasificación cruzada. 3 / 40 Su distribución conjunta viene dada por πij = P (X = i, Y = j), con i = 1, . . . , I y j = 1, . . . , J. Las distribuciones marginales son πi+ = P (X = i) = π+j = P (Y = j) = J X πij j=1 J X I X I X πij i=1 P (X = i, Y = j) = j=1 P (X = i, Y = j) = i=1 Probabilidad y tablas de contingencia Distribución conjunta y tabla de contingencia Distribución condicional Independencia y homogeneidad Tablas de contingencia Tablas de contingencia Sensibilidad y especificidad Tipo de muestreo Tipo de muestreo: verosimilitud Un ejemplo Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 4 / 40 Distribución condicional Habitualmente una variable, por ejemplo Y , es una variable respuesta y la otra, X es explicativa o predictora. En esta situación no tiene sentido hablar de distribución conjunta. Distribución condicionada de Y a X P (Y = j|X = i) = πj|i πij = πi+ Probabilidad y tablas de contingencia Distribución conjunta y tabla de contingencia Distribución condicional Independencia y homogeneidad Tablas de contingencia Tablas de contingencia Sensibilidad y especificidad Tipo de muestreo Tipo de muestreo: verosimilitud Un ejemplo Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 5 / 40 Independencia y homogeneidad Son independientes si πij = πi+ π+j . En particular, la condicionada es igual a la marginal. πj|i = π+j con j = 1, . . . , J. Si X e Y son variables respuesta entonces hablamos de independencia. Si Y es respuesta y X explicativa hablamos de homogeneidad. Probabilidad y tablas de contingencia Distribución conjunta y tabla de contingencia Distribución condicional Independencia y homogeneidad Tablas de contingencia Tablas de contingencia Sensibilidad y especificidad Tipo de muestreo Tipo de muestreo: verosimilitud Un ejemplo Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 6 / 40 Tablas de contingencia Test positivo Enfermo n11 No enfermo n21 Total n+1 Test negativo Total n11 n1+ n22 n2+ n+2 n Distribución conjunta estimada. Test positivo Test negativo Total π̂ij Enfermo n11 /n n11 /n n1+ /n No enfermo n21 /n n22 /n n2+ /n Total n+1 /n n+2 /n 1 Probabilidad y tablas de contingencia Distribución conjunta y tabla de contingencia Distribución condicional Independencia y homogeneidad Tablas de contingencia Tablas de contingencia Sensibilidad y especificidad Tipo de muestreo Tipo de muestreo: verosimilitud Un ejemplo Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 7 / 40 Tablas de contingencia Test positivo Enfermo n11 No enfermo n21 Total n+1 Test negativo Total n11 n1+ n22 n2+ n+2 n Test positivo π̂j|i Enfermo n11 /n1+ n21 /n2+ No enfermo Test negativo Total n11 /n1+ 1 n22 /n2+ 1 Probabilidad y tablas de contingencia Distribución conjunta y tabla de contingencia Distribución condicional Independencia y homogeneidad Tablas de contingencia Tablas de contingencia Sensibilidad y especificidad Tipo de muestreo Tipo de muestreo: verosimilitud Un ejemplo Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 8 / 40 Sensibilidad y especificidad π̂j|i Test positivo Enfermo n11 /n1+ No enfermo n21 /n2+ Test negativo Total n11 /n1+ 1 n22 /n2+ 1 Un ejemplo: en filas indicamos si tiene o no cáncer y en columnas el resultado del test. π̂j|i Test positivo Enfermo 0,82 No enfermo 0,01 Test negativo Total 0,18 1 0,99 1 Sensibilidad Proporción de enfermos correctamente diagnósticados. π1|1 = P (Y = 1|X = 1). Probabilidad y tablas de contingencia Distribución conjunta y tabla de contingencia Distribución condicional Independencia y homogeneidad Tablas de contingencia Tablas de contingencia Sensibilidad y especificidad Tipo de muestreo Tipo de muestreo: verosimilitud Un ejemplo Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 9 / 40 Sensibilidad y especificidad π̂j|i Test positivo Enfermo n11 /n1+ No enfermo n21 /n2+ Test negativo Total n11 /n1+ 1 n22 /n2+ 1 Un ejemplo: en filas indicamos si tiene o no cáncer y en columnas el resultado del test. π̂j|i Test positivo Enfermo 0,82 No enfermo 0,01 Test negativo Total 0,18 1 0,99 1 Sensibilidad Proporción de enfermos correctamente diagnósticados. π1|1 = P (Y = 1|X = 1). Probabilidad y tablas de contingencia Distribución conjunta y tabla de contingencia Distribución condicional Independencia y homogeneidad Tablas de contingencia Tablas de contingencia Sensibilidad y especificidad Tipo de muestreo Tipo de muestreo: verosimilitud Un ejemplo Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 9 / 40 Tipo de muestreo ¿Cómo hemos obtenido la muestra? Muestreo de Poisson: Los conteos Yij son variables Poisson independientes con medias µij . Muestreo multinomial: Fijamos el tamaño total n pero no los totales de fila y columna. Muestreo multinomial independiente: Fijamos los totales de fila considerando Y como variable respuesta y X como explicativa. Probabilidad y tablas de contingencia Distribución conjunta y tabla de contingencia Distribución condicional Independencia y homogeneidad Tablas de contingencia Tablas de contingencia Sensibilidad y especificidad Tipo de muestreo Tipo de muestreo: verosimilitud Un ejemplo Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 10 / 40 Tipo de muestreo: verosimilitud Muestreo de Poisson n YY i j ij µ ij e−µij nij ! Muestreo multinomial n! Q Q i j nij ! YY i nij πij . j Muestreo multinomial independiente Y ni+ ! Y n Q πj|iij . j nij ! j i Probabilidad y tablas de contingencia Distribución conjunta y tabla de contingencia Distribución condicional Independencia y homogeneidad Tablas de contingencia Tablas de contingencia Sensibilidad y especificidad Tipo de muestreo Tipo de muestreo: verosimilitud Un ejemplo Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 11 / 40 Un ejemplo Accidente mortal Accidente no mortal Con cinturón Sin cinturón Vamos a recoger todos los accidentes del próximo mes. No fijamos el número total. Muestreo de Poisson. Tomamos un muestra aleatoria de 200 accidentes que tuvieron lugar el mes pasado. Fijamos el tamaño total de la muestra. Muestreo multinomial. Tomamos una muestra de 100 accidentes donde hubo muertos y otros 100 en los que no hubo muertos. Fijamos los totales de columna. Muestreo multinomial (binomial aquı́) independiente. 12 / 40 Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 13 / 40 Comparación de dos proporciones Muchos estudios se diseñan para comparar grupos basándonos en una respuesta binaria, Y . Con dos grupos tenemos una tabla de contingencia 2 × 2. Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 14 / 40 Comparación de dos proporciones Muchos estudios se diseñan para comparar grupos basándonos en una respuesta binaria, Y . Con dos grupos tenemos una tabla de contingencia 2 × 2. Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 14 / 40 Comparación de dos proporciones Muchos estudios se diseñan para comparar grupos basándonos en una respuesta binaria, Y . Con dos grupos tenemos una tabla de contingencia 2 × 2. Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 14 / 40 Comparación de dos proporciones Muchos estudios se diseñan para comparar grupos basándonos en una respuesta binaria, Y . Con dos grupos tenemos una tabla de contingencia 2 × 2. 1 2 1 π1|1 π1|2 2 π2|1 π2|2 Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 14 / 40 Comparación de dos proporciones Muchos estudios se diseñan para comparar grupos basándonos en una respuesta binaria, Y . Con dos grupos tenemos una tabla de contingencia 2 × 2. Grupo 1 Grupo 2 Éxito π1|1 π1|2 Fracaso π2|1 π2|2 Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 14 / 40 Comparación de dos proporciones Muchos estudios se diseñan para comparar grupos basándonos en una respuesta binaria, Y . Con dos grupos tenemos una tabla de contingencia 2 × 2. Grupo 1 Grupo 2 Éxito π1|1 π1|2 Fracaso π2|1 π2|2 Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J π1|i = πi π2|i = 1 − π1|i = 1 − πi 14 / 40 Comparación de dos proporciones Muchos estudios se diseñan para comparar grupos basándonos en una respuesta binaria, Y . Con dos grupos tenemos una tabla de contingencia 2 × 2. Grupo 1 Grupo 2 Éxito π1 π2 Fracaso 1 − π1 1 − π2 Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 14 / 40 Comparación de dos proporciones Muchos estudios se diseñan para comparar grupos basándonos en una respuesta binaria, Y . Con dos grupos tenemos una tabla de contingencia 2 × 2. Grupo 1 Grupo 2 Éxito π1 π2 Queremos comparar π1 con π2 . Fracaso 1 − π1 1 − π2 Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 14 / 40 ¿Cómo comparamos? Podemos estudiar la diferencia de las proporciones π1 − π2 . O el riesgo relativo: π1 . π2 O bien el cociente de odds (odds ratio) Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J π1 /(1 − π1 ) . θ= π2 /(1 − π2 ) 15 / 40 Odds y odds ratio Si π es la probabilidad de éxito entonces los odds se definen como π Ω= . 1−π Equivalentemente Ω . π= Ω+1 En una tabla 2 × 2 tenemos los odds en la fila i Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J πi . Ωi = 1 − πi 16 / 40 El cociente de los odds de las dos filas será el odds ratio. π1 /(1 − π1 ) . θ= π2 /(1 − π2 ) Se tiene fácilmente que π11 π22 . θ= π12 π21 Por ello también se le llama el cociente de los productos cruzados. Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 17 / 40 Propiedades del odds ratio Puede ser cualquier valor positivo. θ = 1 significa que no hay asociación entre X e Y. Valores de θ alejados de 1 indican una asociación mayor. Se suele trabajar con log θ pues entonces el valor que tenemos es simétrico respecto a cero. El odds ratio no cambia cuando intercambiamos filas y columnas. Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 18 / 40 Nota de R notaR/notaR004.pdf Probabilidad y tablas de contingencia Comparación de dos proporciones Comparación de dos proporciones ¿Cómo comparamos? Odds y odds ratio Propiedades del odds ratio Nota de R Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J 19 / 40 Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Asociación parcial en tablas 2 × 2 estratificadas El problema Un ejemplo ¿Por qué? Nota de R Odds ratios condicionales y marginales Independencia marginal e independencia condicionada Asociación homogénea Tablas I × J 20 / 40 El problema Cuando estudiamos el efecto de X sobre Y debemos de controlar las covariables que pueden influir en la relación. Lo mejor es mantener las covariables relevantes constantes. Un efecto de X sobre Y puede representar un efecto de la (o las) covariables sobre las variables X e Y. Esto no es fácil en estudios observacionales. Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas El problema Un ejemplo ¿Por qué? Nota de R Odds ratios condicionales y marginales Independencia marginal e independencia condicionada Asociación homogénea Tablas I × J 21 / 40 Un ejemplo Consideramos los procesamientos por asesinatos múltiples en Florida entre 1976 y 1987. Pena de muerte Vı́ctima Acusado Si No % Sı́ Blanco Negro Total Blanco Negro Blanco Negro 53 11 0 4 414 37 16 139 11,3 22,9 0,0 2,8 Blanco Negro 53 15 430 176 11,0 7,9 Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas El problema Un ejemplo ¿Por qué? Nota de R Odds ratios condicionales y marginales Independencia marginal e independencia condicionada Asociación homogénea Tablas I × J 22 / 40 Se condena a muerte más a los blancos que a los negros en Estados Unidos. En el paı́s de la igualdad se discrimina a los blancos. 23 / 40 Se condena a muerte más a los blancos que a los negros en Estados Unidos. En el paı́s de la igualdad se discrimina a los blancos. 23 / 40 Se condena a muerte más a los blancos que a los negros en Estados Unidos. En el paı́s de la igualdad se discrimina a los blancos. Consideramos como covariable la raza de la vı́ctima. 23 / 40 Se condena a muerte más a los blancos que a los negros en Estados Unidos. En el paı́s de la igualdad se discrimina a los blancos. Pena de muerte Si No % Sı́ Blanco Negro Blanco Negro 53 11 0 4 414 37 16 139 11,3 22,9 0,0 2,8 Blanco Negro 53 15 430 176 11,0 7,9 Vı́ctima Acusado Blanco Negro Total 23 / 40 Se condena a muerte más a los blancos que a los negros en Estados Unidos. En el paı́s de la igualdad se discrimina a los blancos. En el paı́s de la igualdad se condena más a los negros. 23 / 40 ¿Por qué? La explicación tiene que venir de la asociación existente entre la raza de la vı́ctima y las variables que cruzamos marginalmente. Hay una gran asociación entre raza de vı́ctima y raza del acusado (odds ratio de 87) Vı́ctima vs acusado Blanco Negro Blanco 467 48 Negro 16 143 Vı́ctima vs veredicto Si No Blanco 64 451 Negro 4 155 24 / 40 Los blancos tienden a matar más a blancos. Si matas a un blanco tienes una mayor probabilidad de que te condenen. Esto es un ejemplo de la paradoja de Simpson (1951). Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas El problema Un ejemplo ¿Por qué? Nota de R Odds ratios condicionales y marginales Independencia marginal e independencia condicionada Asociación homogénea Tablas I × J 25 / 40 Nota de R Datos de asesinatos múltiples en Florida: notaR/notaR007.pdf Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas El problema Un ejemplo ¿Por qué? Nota de R Odds ratios condicionales y marginales Independencia marginal e independencia condicionada Asociación homogénea Tablas I × J 26 / 40 Odds ratios condicionales y marginales Las asociaciones marginales y condicionales pueden ser descritas mediante el odds ratio. Supongamos una tabla 2 × 2 × K. Tenemos µijk , frecuencia esperada en la celda correspondiente. Fijamos Z = k, y tenemos θXY (k) µ11k µ22k = µ12k µ21k que serı́an los odds ratio condicionales. Los odds ratio marginales serı́an θXY µ11+ µ22+ = µ12+ µ21+ Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas El problema Un ejemplo ¿Por qué? Nota de R Odds ratios condicionales y marginales Independencia marginal e independencia condicionada Asociación homogénea Tablas I × J 27 / 40 Sustituyendo los µijk por las frecuencias observadas tenemos los odds ratio muestrales. Un valor de uno en un odds ratio supone independencia bien marginal (si θXY =) o bien condicionada a que Z = k (si θXY (k) = 1). notaR/notaR010.pdf Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas El problema Un ejemplo ¿Por qué? Nota de R Odds ratios condicionales y marginales Independencia marginal e independencia condicionada Asociación homogénea Tablas I × J 28 / 40 Independencia marginal e independencia condicionada La independencia condicionada a Z = k significa P (Y = j|X = i, Z = k) = P (Y = j|Z = k), para todo i, j. Si lo anterior es cierto para todo valor de Z entonces se dice que X e Y son condicionalmente independientes dada Z y se verifica: πi+k π+jk πijk = π++k para cualquier i, j, k. La independencia condicional no implica la independencia marginal. 29 / 40 Asociación homogénea Una tabla 2 × 2 × K tiene una asociación XY homogénea cuando θXY (1) = . . . = θXY (K) . El tipo de asociación entre X e Y es el mismo para las distintas categorı́as de Z. Si existe una asociación XY homogénea entonces también tenemos una asociación XZ homogénea y una asociación Y Z homogénea. Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas El problema Un ejemplo ¿Por qué? Nota de R Odds ratios condicionales y marginales Independencia marginal e independencia condicionada Asociación homogénea Tablas I × J 30 / 40 Un ejemplo X = fumador (si, no) Y = cáncer de pulmón (si, no) Z = edad (< 45, 45 − 65, > 65) Los odds ratio observados son θXY (1) = 1,2 θXY (2) = 3,9 θXY (3) = 8,8 El efecto de fumar se acentúa conforme la edad es mayor. Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas El problema Un ejemplo ¿Por qué? Nota de R Odds ratios condicionales y marginales Independencia marginal e independencia condicionada Asociación homogénea Tablas I × J 31 / 40 Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J Tablas I × J Medidas resumen de asociación Un ejemplo: Theil,1970 Tendencias ordinales: pares concordantes y discordantes 32 / 40 Medidas resumen de asociación Los ı́ndices más interpretables son del estilo del coeficiente de determinación R2 . Sea V (Y ) una medida de variación de la distribución marginal de Y (dada por {π+1 , . . . , π+J }). Sea V (Y |i) la misma medida para la distribución condicionada de Y a X = i, {π1|i , . . . , πJ|i }. Este tipo de ı́ndices consideran V (Y ) − E[V (Y |X)] V (Y ) con E[V (Y |X)] = X Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J Medidas resumen de asociación Un ejemplo: Theil,1970 Tendencias ordinales: pares concordantes y discordantes πi+ V (Y |i). i 33 / 40 Un ejemplo: Theil,1970 Utilizamos la entropı́a V (Y ) = Probabilidad y tablas de contingencia X π+j log π+j j Obtenemos el coeficiente de incertidumbre P P i j πij log(πij /πi+ π+j ) P U =− j π+j log π+j U = 0 significa que X e Y son independientes. U = 1 significa que para cada i, πj|i = 1 para algún j. Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J Medidas resumen de asociación Un ejemplo: Theil,1970 Tendencias ordinales: pares concordantes y discordantes 34 / 40 Tendencias ordinales: pares concordantes y discordantes Ingresos Dólares < 15000 15000 − 25000 25000 − 40000 > 40000 Muy insatisfecho 1 2 1 0 Satisfacción en el trabajo Poco Moderadamente insatisfecho satisfecho 3 3 6 1 10 10 14 9 Muy satisfecho 6 7 12 11 35 / 40 Tenemos dos medidas ordinales. Cabe esperar una tendencia monótona. Consideramos pares concordantes si un valor mayor de X va asociado a un valor mayor de Y . Un par es discordante cuando un valor mayor de X va asociado a un valor menor de Y . Un par está empatado cuando coinciden en la clasificación de X e Y . En el ejemplo tenemos C = 1331, Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J Medidas resumen de asociación Un ejemplo: Theil,1970 Tendencias ordinales: pares concordantes y discordantes D = 849. Parece que hay una tendencia de mayor ingreso mayor satisfacción. 36 / 40 Si X e Y son independientes entonces la probabilidades de concordancia y discordancia son: XX XX Πc = 2 πij πhk , i j h>i k>j y Πd = 2 XX i j πij XX h>i k<j πhk Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J Medidas resumen de asociación Un ejemplo: Theil,1970 Tendencias ordinales: pares concordantes y discordantes 37 / 40 Condicionado a que no hay empate las probabilidades de concordancia y discordancia son Πc / Πc + Πd y Πd / Πc + Πd La diferencia de las probabilidades es la gamma (Goodman y Kruskal, 1954): Πc − Πd γ= Πc + Πd Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J Medidas resumen de asociación Un ejemplo: Theil,1970 Tendencias ordinales: pares concordantes y discordantes 38 / 40 La versión muestral serı́a C −D γ̂ = C+D La gamma trata simétricamente a las variables (como el coeficiente de correlación). −1 ≤ γ ≤ 1. Si invertimos las categorı́as de una variable la gamma cambia de signo. |γ| = 1 significa que hay una relación perfectamente monótona. Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J Medidas resumen de asociación Un ejemplo: Theil,1970 Tendencias ordinales: pares concordantes y discordantes 39 / 40 γ = 1 si Πd = 0. γ = −1 si Πc = 0. Independencia implica γ = 0. El recı́proco no es cierto. Ejemplo de satisfacción con el trabajo: γ̂ = 0,221. Una ligera tendencia se observa de que unos ingresos mayores suponen una mayor satisfacción. notaR/notaR011.pdf Probabilidad y tablas de contingencia Comparación de dos proporciones Asociación parcial en tablas 2 × 2 estratificadas Tablas I × J Medidas resumen de asociación Un ejemplo: Theil,1970 Tendencias ordinales: pares concordantes y discordantes 40 / 40