Contenido Apl.1 Apl.2 Apl.3 Apl.4 Aplicaciones estadı́sticas en genómica Luis E. Nieto-Barajas Departamento de Estadı́stica, ITAM, México Instituto Nacional de Medicina Genómica, INMEGEN 24 octubre de 2013 Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Contenido Aplicación 1: Perfiles proteı́nicos Aplicación 2: Número de copias en el ADN Otras Aplicaciones: Transplante de corazón Pacientes con leucemia que se curan con transplante de médula osea Incidencias en cáncer de mama Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Proteómica: Estudio de proteı́nas en gran escala, enfocándose en sus estructuras y funciones. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Proteómica: Estudio de proteı́nas en gran escala, enfocándose en sus estructuras y funciones. Caracterı́sticas: Tı́picamente, una forma de estı́mulo o droga se le da a un sistema biológico. El sistema es observado en el tiempo y se mide el nivel de expresión de todas las proteı́nas relacionadas con la enfermedad. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Proteómica: Estudio de proteı́nas en gran escala, enfocándose en sus estructuras y funciones. Caracterı́sticas: Tı́picamente, una forma de estı́mulo o droga se le da a un sistema biológico. El sistema es observado en el tiempo y se mide el nivel de expresión de todas las proteı́nas relacionadas con la enfermedad. RPPA (reverse phase protein arrays): Tecnologı́a de alta capacidad para el estudio del nivel de expresión de proteı́nas usando simultáneamente un gran número de muestras biológicas grandes. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Proteómica: Estudio de proteı́nas en gran escala, enfocándose en sus estructuras y funciones. Caracterı́sticas: Tı́picamente, una forma de estı́mulo o droga se le da a un sistema biológico. El sistema es observado en el tiempo y se mide el nivel de expresión de todas las proteı́nas relacionadas con la enfermedad. RPPA (reverse phase protein arrays): Tecnologı́a de alta capacidad para el estudio del nivel de expresión de proteı́nas usando simultáneamente un gran número de muestras biológicas grandes. Los datos RPPA con los que contamos son datos observados en el tiempo, después de una intervención inicial. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Estudio: Experimento RPPA para medir la inhibición en secuencia de proteinas mediante la droga Lapatinib en lı́neas celulares de cáncer de ovario Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Estudio: Experimento RPPA para medir la inhibición en secuencia de proteinas mediante la droga Lapatinib en lı́neas celulares de cáncer de ovario Lapatinib es un inhibidor receptor de factor de crecimiento epidérmico (EGFR) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Estudio: Experimento RPPA para medir la inhibición en secuencia de proteinas mediante la droga Lapatinib en lı́neas celulares de cáncer de ovario Lapatinib es un inhibidor receptor de factor de crecimiento epidérmico (EGFR) Una lı́nea celular es tratada inicialmente con Lapatinib, luego estimulada con EGFR en el tiempo Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Estudio: Experimento RPPA para medir la inhibición en secuencia de proteinas mediante la droga Lapatinib en lı́neas celulares de cáncer de ovario Lapatinib es un inhibidor receptor de factor de crecimiento epidérmico (EGFR) Una lı́nea celular es tratada inicialmente con Lapatinib, luego estimulada con EGFR en el tiempo D = 8 puntos temporales de medición, td = 0, 5, 15, 30, 60, 90, 120, and 240 minutos, Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Estudio: Experimento RPPA para medir la inhibición en secuencia de proteinas mediante la droga Lapatinib en lı́neas celulares de cáncer de ovario Lapatinib es un inhibidor receptor de factor de crecimiento epidérmico (EGFR) Una lı́nea celular es tratada inicialmente con Lapatinib, luego estimulada con EGFR en el tiempo D = 8 puntos temporales de medición, td = 0, 5, 15, 30, 60, 90, 120, and 240 minutos, n = 30 proteinas fueron tratadas con RPPA Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Estudio: Experimento RPPA para medir la inhibición en secuencia de proteinas mediante la droga Lapatinib en lı́neas celulares de cáncer de ovario Lapatinib es un inhibidor receptor de factor de crecimiento epidérmico (EGFR) Una lı́nea celular es tratada inicialmente con Lapatinib, luego estimulada con EGFR en el tiempo D = 8 puntos temporales de medición, td = 0, 5, 15, 30, 60, 90, 120, and 240 minutos, n = 30 proteinas fueron tratadas con RPPA Para cada proteina se registraron 3 replicas de intensidades Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Estudio: Experimento RPPA para medir la inhibición en secuencia de proteinas mediante la droga Lapatinib en lı́neas celulares de cáncer de ovario Lapatinib es un inhibidor receptor de factor de crecimiento epidérmico (EGFR) Una lı́nea celular es tratada inicialmente con Lapatinib, luego estimulada con EGFR en el tiempo D = 8 puntos temporales de medición, td = 0, 5, 15, 30, 60, 90, 120, and 240 minutos, n = 30 proteinas fueron tratadas con RPPA Para cada proteina se registraron 3 replicas de intensidades Se construyeron puntajes de diferecia (Ydi ) entre las intensidades post-tratamiento y pre-tratamiento para cada proteina i en el tiempo d Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos Estudio: Experimento RPPA para medir la inhibición en secuencia de proteinas mediante la droga Lapatinib en lı́neas celulares de cáncer de ovario Lapatinib es un inhibidor receptor de factor de crecimiento epidérmico (EGFR) Una lı́nea celular es tratada inicialmente con Lapatinib, luego estimulada con EGFR en el tiempo D = 8 puntos temporales de medición, td = 0, 5, 15, 30, 60, 90, 120, and 240 minutos, n = 30 proteinas fueron tratadas con RPPA Para cada proteina se registraron 3 replicas de intensidades Se construyeron puntajes de diferecia (Ydi ) entre las intensidades post-tratamiento y pre-tratamiento para cada proteina i en el tiempo d Pre-procesamiento: mediana comun, transformación a escala logarı́tmica, y SAM Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 t=15 t=30 Figure 1. Histograms of expression scores t=5 0.0 3 2.0 1 −3.0 −1.5 0.0 0 −3.0 −1.5 0.0 −3.0 −1.5 Y Y Y Y t=60 t=90 t=120 t=240 3.0 0.0 −1.5 Y 0.0 −3.0 −1.5 0.0 Y Luis E. Nieto-Barajas 2.0 1.5 Histogram 0.0 0.5 0.5 0.0 −3.0 0.0 0.5 1.0 1.0 Histogram 1.5 2.5 2.0 2.0 1.5 1.0 Histogram 2.0 1.5 1.0 0.5 0.0 Histogram 2 Histogram 1.5 Histogram 0.5 0.0 0.5 0.0 2 0 −1.5 2.5 −3.0 1.0 2.0 1.0 1.5 Histogram 6 4 Histogram 8 2.5 10 3.0 2.5 4 12 t=0 −3.0 −1.5 0.0 Y Aplicaciones INMEGEN −3.0 −1.5 Y 0.0 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 −1.0 −1.5 −2.0 −2.5 Difference scores −0.5 0.0 Figure 2. Time series of expression scores 0 50 100 150 200 Time Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Figure 3. EGFR/PI3K pathway Secuencia molecular concensuada: Lapatinib activa EGFR, el cual a su vez inicia una activación secuencial ' EGFR PP q STAT3/5 @ PP PKC / R @ Y H H PI3K RAS PTEN ? RAF ? ? LKB1 AKT MEK ? ? ? AMPK TSC2 MAPK ? MTOR ? & p70S6 j HH FEBP ? S6 PP P q cyclinB1/E/D1 P Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Perfiles proteı́nicos El análisis desea alcanzar 3 objectivos: Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.4 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos El análisis desea alcanzar 3 objectivos: 1 Caracterizar la distribución cambiante en el tiempo de la activación de las proteinas Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos El análisis desea alcanzar 3 objectivos: 1 2 Caracterizar la distribución cambiante en el tiempo de la activación de las proteinas Reconocer la interacción entre proteinas en la secuencia Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos El análisis desea alcanzar 3 objectivos: 1 2 3 Caracterizar la distribución cambiante en el tiempo de la activación de las proteinas Reconocer la interacción entre proteinas en la secuencia Identificar las proteinas que son son suprimidas debido a la inhibición de la secuencia por Lapatinib Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos El análisis desea alcanzar 3 objectivos: 1 2 3 Caracterizar la distribución cambiante en el tiempo de la activación de las proteinas Reconocer la interacción entre proteinas en la secuencia Identificar las proteinas que son son suprimidas debido a la inhibición de la secuencia por Lapatinib Proponemos un modelo de efectos aleatorios ydi = xdi + ui + di Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos El análisis desea alcanzar 3 objectivos: 1 2 3 Caracterizar la distribución cambiante en el tiempo de la activación de las proteinas Reconocer la interacción entre proteinas en la secuencia Identificar las proteinas que son son suprimidas debido a la inhibición de la secuencia por Lapatinib Proponemos un modelo de efectos aleatorios ydi = xdi + ui + di iid Efectos temporales: xdi ∼ Fd y (F1 , . . . , Fd ) ∼ tsDDP(c, G , m), con m = {mdh } y marginalmente Fd ∼ DP(c, G ) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos El análisis desea alcanzar 3 objectivos: 1 2 3 Caracterizar la distribución cambiante en el tiempo de la activación de las proteinas Reconocer la interacción entre proteinas en la secuencia Identificar las proteinas que son son suprimidas debido a la inhibición de la secuencia por Lapatinib Proponemos un modelo de efectos aleatorios ydi = xdi + ui + di iid Efectos temporales: xdi ∼ Fd y (F1 , . . . , Fd ) ∼ tsDDP(c, G , m), con m = {mdh } y marginalmente Fd ∼ DP(c, G ) Efecto espacial (en secuencia): ui s.t. (u1 , . . . , un ) ∼ CAR Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Perfiles proteı́nicos El análisis desea alcanzar 3 objectivos: 1 2 3 Caracterizar la distribución cambiante en el tiempo de la activación de las proteinas Reconocer la interacción entre proteinas en la secuencia Identificar las proteinas que son son suprimidas debido a la inhibición de la secuencia por Lapatinib Proponemos un modelo de efectos aleatorios ydi = xdi + ui + di iid Efectos temporales: xdi ∼ Fd y (F1 , . . . , Fd ) ∼ tsDDP(c, G , m), con m = {mdh } y marginalmente Fd ∼ DP(c, G ) Efecto espacial (en secuencia): ui s.t. (u1 , . . . , un ) ∼ CAR iid Error de medición: di ∼ N(0, τd ) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Efectos temporales xdi tsDDP: F = {F1 , F2 , . . . , FD }. Comenzamos con Fd = ∞ X wdh δµdh h=1 Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.4 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Efectos temporales xdi tsDDP: F = {F1 , F2 , . . . , FD }. Comenzamos con Fd = ∞ X wdh δµdh h=1 Dependencia entre (Fd , Fd+1 ) is definida como Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.4 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Efectos temporales xdi tsDDP: F = {F1 , F2 , . . . , FD }. Comenzamos con Fd = ∞ X wdh δµdh h=1 Dependencia entre (Fd , Fd+1 ) is definida como iid µdh = µh ∼ G for all d = 1, . . . , D Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.4 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Efectos temporales xdi tsDDP: F = {F1 , F2 , . . . , FD }. Comenzamos con Fd = ∞ X wdh δµdh h=1 Dependencia entre (Fd , Fd+1 ) is definida como iid µdh = µh ∼ G for all d = 1, . . . , D zdh Ligando los pesos no normalizados vdh → vd+1,h Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.4 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Efectos temporales xdi tsDDP: F = {F1 , F2 , . . . , FD }. Comenzamos con Fd = ∞ X wdh δµdh h=1 Dependencia entre (Fd , Fd+1 ) is definida como iid µdh = µh ∼ G for all d = 1, . . . , D zdh Ligando los pesos no normalizados vdh → vd+1,h v1h ∼ Be(1, c), zdh | vdh ∼ Bin(mdh , vdh ), vd+1,h | zdh ∼ Be(1 + zdh , c + mdh − zdh ) Escribimos (F1 , . . . , Fd ) ∼ tsDDP(c, G , m), con m = {mdh } marginalmente Fd ∼ DP(c, G ) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Efectos espaciales ui Sea u = (u1 , . . . , un ), con ui ’s el efecto especı́ficos de cada proteı́na Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Efectos espaciales ui Sea u = (u1 , . . . , un ), con ui ’s el efecto especı́ficos de cada proteı́na La interacción entre proteı́nas se representa con un modelo espacial CAR (Besag, 1974) u ∼ N (0, Dλ (I − αB)) Dλ = λI and B = W, Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Efectos espaciales ui Sea u = (u1 , . . . , un ), con ui ’s el efecto especı́ficos de cada proteı́na La interacción entre proteı́nas se representa con un modelo espacial CAR (Besag, 1974) u ∼ N (0, Dλ (I − αB)) Dλ = λI and B = W, W es la matriz de adyacencia entre proteı́nas t.q. wii = 0 y wii 0 = 1 si proteı́nas i y i 0 son vecinas (i ∼ i 0 ) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Efectos espaciales ui Sea u = (u1 , . . . , un ), con ui ’s el efecto especı́ficos de cada proteı́na La interacción entre proteı́nas se representa con un modelo espacial CAR (Besag, 1974) u ∼ N (0, Dλ (I − αB)) Dλ = λI and B = W, W es la matriz de adyacencia entre proteı́nas t.q. wii = 0 y wii 0 = 1 si proteı́nas i y i 0 son vecinas (i ∼ i 0 ) Cómo especificamos W?: Usando el diagrama concensuado: Remover, marginalizar, moralizar. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.6 0.7 0.8 0.9 Figura. Correlaciones ρd (A) = Corr{Fd (A), Fd+1 (A)} ρ1 ρ2 ρ3 Luis E. Nieto-Barajas ρ4 ρ5 ρ6 Aplicaciones INMEGEN ρ7 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Apl.5 0.02 150 100 50 0 −3.0 −2.5 −2.0 −1.5 −1.0 −0.5 0.0 X Luis E. Nieto-Barajas Aplicaciones INMEGEN Time 0.06 0.04 250 200 0.00 c.d.f. 0.08 0.10 0.12 Figura. Plots of Fˆd = E (Fd |data) Contenido Apl.1 Apl.2 Apl.3 Apl.4 Apl.5 200 Time 0.06 250 0.04 c.d.f. 0.08 0.10 0.12 Figura. Plots of Fˆd = E (Fd |data) 0.02 150 100 0.00 50 0 −3.0 −2.5 −2.0 −1.5 −1.0 −0.5 0.0 X Supresión incremental de t1 = 0 a t5 = 60. A partir de t6 = 90 el efecto se desvanece Luis E. Nieto-Barajas Aplicaciones INMEGEN Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.0 0.2 0.4 c.d.f. 0.6 0.8 1.0 Figura. Plots of Fˆd = E (Fd |data) −3 −2 −1 0 x Luis E. Nieto-Barajas Aplicaciones INMEGEN 1 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.0 0.2 0.4 c.d.f. 0.6 0.8 1.0 Figura. Plots of Fˆd = E (Fd |data) −3 −2 −1 0 1 Alrededor del 90 % de las proteinas permaneces sin efecto x Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Números en negritas denotan significancia con 10 % FDR ID 1 2 3 4 5 6 7 8 9 10 11 20 21 22 23 24 25 30 Protein pAKT.S473. pAKT.T308. AKT pGSK3a.b.S9.21. GSK3a.b pmTOR.S2448. mTOR p.p70S6K.T389. p70S6K pS6.S235.236. pS6.S240.244.204769 p38 pJNK.T183.Y185. pc.Jun.S73. C.Jun pEGFRR EGFR p.PKC.S567. Luis E. Nieto-Barajas ûi -0.34 -0.04 0.11 -0.09 -0.06 -0.01 0.05 -0.40 0.13 -0.67 -0.30 0.09 -0.23 0.00 -0.05 0.01 0.14 0.09 P(ui < 0) 1.00 0.71 0.05 0.91 0.80 0.58 0.23 1.00 0.02 0.99 0.95 0.09 1.00 0.52 0.79 0.46 0.02 0.10 Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Figure. Series de tiempo de las primeras 15 proteinas pAKT.T308. pGSK3a.b.S9.21. 100 200 0 GSK3a.b 100 200 100 200 0 Time Time Time pmTOR.S2448. mTOR p.p70S6K.T389. p70S6K pS6.S235.236. 100 200 100 200 0.0 100 200 −3.0 −1.5 Dif.Scores 0.2 Dif.Scores 0 −0.2 0.0 Dif.Scores 0 −1.0 0.2 −0.8 −0.2 0.0 Dif.Scores 0.4 Time −0.4 0 100 200 0 100 200 Time Time Time pS6.S240.244.204769 s6 LKB.1 pAMPK.T172. pTSC2.T172. Time 0 100 200 Time Luis E. Nieto-Barajas 0 100 200 Time −0.4 0.0 Dif.Scores 0.6 0.2 Dif.Scores −0.2 −0.4 −0.4 100 200 0.0 Dif.Scores 0.4 0.4 Dif.Scores −1.0 −2.0 0 0.4 Time 0.0 Time 0.0 Dif.Scores 100 200 Time 0 Dif.Scores 0.0 Dif.Scores 0 −0.4 0.0 Dif.Scores 100 200 −0.4 0.2 Dif.Scores 0 −0.2 0.0 Dif.Scores 0 −0.4 0.0 −0.4 −0.8 Dif.Scores AKT 0.4 pAKT.S473. 0 100 200 Time Aplicaciones INMEGEN 0 100 200 Time Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resumen de resultados Las 9 proteinas significativas corresponden a únicamente 6 proteins distintas (diferencia en fosforilado) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resumen de resultados Las 9 proteinas significativas corresponden a únicamente 6 proteins distintas (diferencia en fosforilado) Las 6 proteinas significativas son: p70S6K, s6, AKT, JNK, GSK3, y cJun. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resumen de resultados Las 9 proteinas significativas corresponden a únicamente 6 proteins distintas (diferencia en fosforilado) Las 6 proteinas significativas son: p70S6K, s6, AKT, JNK, GSK3, y cJun. p70S6K, s6 y AKT pertenecen a la secuencia concensuada Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resumen de resultados Las 9 proteinas significativas corresponden a únicamente 6 proteins distintas (diferencia en fosforilado) Las 6 proteinas significativas son: p70S6K, s6, AKT, JNK, GSK3, y cJun. p70S6K, s6 y AKT pertenecen a la secuencia concensuada JNK, GSK3 y cJun no pertenecen a la secuencia concensuada (diagrama) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resumen de resultados Las 9 proteinas significativas corresponden a únicamente 6 proteins distintas (diferencia en fosforilado) Las 6 proteinas significativas son: p70S6K, s6, AKT, JNK, GSK3, y cJun. p70S6K, s6 y AKT pertenecen a la secuencia concensuada JNK, GSK3 y cJun no pertenecen a la secuencia concensuada (diagrama) Supersión de GSK3 y JNK se deben a supresión de AKT Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resumen de resultados Las 9 proteinas significativas corresponden a únicamente 6 proteins distintas (diferencia en fosforilado) Las 6 proteinas significativas son: p70S6K, s6, AKT, JNK, GSK3, y cJun. p70S6K, s6 y AKT pertenecen a la secuencia concensuada JNK, GSK3 y cJun no pertenecen a la secuencia concensuada (diagrama) Supersión de GSK3 y JNK se deben a supresión de AKT Supresión de cJun es un resultado sorprendente Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El ADN normal de un humano tiene 23 pares de cromosomas. Un par es del sexo y los otros 22 pares son autosomas. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El ADN normal de un humano tiene 23 pares de cromosomas. Un par es del sexo y los otros 22 pares son autosomas. El par de cromosomas autosomas son idénticos, por lo que el número de copias es de 2. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El ADN normal de un humano tiene 23 pares de cromosomas. Un par es del sexo y los otros 22 pares son autosomas. El par de cromosomas autosomas son idénticos, por lo que el número de copias es de 2. Alteraciones en el número de copias (CNA) es causado por algunas enfermedades como el cáncer. La enfermedad produce mutaciones que producen ganancias o pérdidas en segmentos contiguos de ADN. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El ADN normal de un humano tiene 23 pares de cromosomas. Un par es del sexo y los otros 22 pares son autosomas. El par de cromosomas autosomas son idénticos, por lo que el número de copias es de 2. Alteraciones en el número de copias (CNA) es causado por algunas enfermedades como el cáncer. La enfermedad produce mutaciones que producen ganancias o pérdidas en segmentos contiguos de ADN. CGH (Comparative Genomic Hybridization): es una técnica que combinada con microarreglos producen información en miles o millones de sondas, al hibridar muestras enfermas con muestras sanas. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El ADN normal de un humano tiene 23 pares de cromosomas. Un par es del sexo y los otros 22 pares son autosomas. El par de cromosomas autosomas son idénticos, por lo que el número de copias es de 2. Alteraciones en el número de copias (CNA) es causado por algunas enfermedades como el cáncer. La enfermedad produce mutaciones que producen ganancias o pérdidas en segmentos contiguos de ADN. CGH (Comparative Genomic Hybridization): es una técnica que combinada con microarreglos producen información en miles o millones de sondas, al hibridar muestras enfermas con muestras sanas. La información producida es una intensidad del color asociado a cada muestra (sana y enferma). Se forman cocientes de estas intensidades y se transforman con logaritmo base 2. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Apl.5 0.0 x −1.0 −0.5 −0.4 −0.2 x 0.0 0.2 0.5 0.4 Figura. Ejemplo de array-CGH 0 200 400 600 800 1000 0 200 400 600 800 1000 600 800 1000 Index x 0.0 −0.5 −0.4 x 0.0 0.2 0.5 0.4 Index 0 200 400 600 800 1000 0 200 Index 400 Index Luis E. Nieto-Barajas Aplicaciones INMEGEN Contenido Apl.1 Apl.2 Apl.3 Número de copias en el ADN El objetivo del análisis de datos aCGH son: Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.4 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El objetivo del análisis de datos aCGH son: Identificar las regiones contiguas del genoma con igual número de copias Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El objetivo del análisis de datos aCGH son: Identificar las regiones contiguas del genoma con igual número de copias Determinar el número de copias de cada región Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El objetivo del análisis de datos aCGH son: Identificar las regiones contiguas del genoma con igual número de copias Determinar el número de copias de cada región Nuestra propuesta considera además los siguientes objetivos: Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El objetivo del análisis de datos aCGH son: Identificar las regiones contiguas del genoma con igual número de copias Determinar el número de copias de cada región Nuestra propuesta considera además los siguientes objetivos: Combinar la información proveniente de múltiples muestras Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El objetivo del análisis de datos aCGH son: Identificar las regiones contiguas del genoma con igual número de copias Determinar el número de copias de cada región Nuestra propuesta considera además los siguientes objetivos: Combinar la información proveniente de múltiples muestras Comparar el número de copias en subtipos de la enfermedad Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El objetivo del análisis de datos aCGH son: Identificar las regiones contiguas del genoma con igual número de copias Determinar el número de copias de cada región Nuestra propuesta considera además los siguientes objetivos: Combinar la información proveniente de múltiples muestras Comparar el número de copias en subtipos de la enfermedad Estudio: Se cuenta con 122 pacientes con cáncer de mama, con 3 subtipos de enfermedad: ER+ (60 pacientes), PR+ (11 pacientes), y TN (51 pacientes). Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN El objetivo del análisis de datos aCGH son: Identificar las regiones contiguas del genoma con igual número de copias Determinar el número de copias de cada región Nuestra propuesta considera además los siguientes objetivos: Combinar la información proveniente de múltiples muestras Comparar el número de copias en subtipos de la enfermedad Estudio: Se cuenta con 122 pacientes con cáncer de mama, con 3 subtipos de enfermedad: ER+ (60 pacientes), PR+ (11 pacientes), y TN (51 pacientes). Nos concentraremos en comparar los subtipos ER+ y TN Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN Sea Yij el log2 del cociente en la sonda ti de la muestra j. Yij = K X µk,gj I (i ∈ Ωk ) + k=1 Luis E. Nieto-Barajas Lj X mlj I (i ∈ ∆lj ) + ij , l=1 Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN Sea Yij el log2 del cociente en la sonda ti de la muestra j. Yij = K X µk,gj I (i ∈ Ωk ) + k=1 Lj X mlj I (i ∈ ∆lj ) + ij , l=1 µk,gj es la media poblacional, mlj es un efecto aleatorio especı́fico y ij es el error de medición tal que Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN Sea Yij el log2 del cociente en la sonda ti de la muestra j. Yij = K X µk,gj I (i ∈ Ωk ) + k=1 Lj X mlj I (i ∈ ∆lj ) + ij , l=1 µk,gj es la media poblacional, mlj es un efecto aleatorio especı́fico y ij es el error de medición tal que ind iid mkj ∼ N(0, τj2 ), con τj2 ∼ Iga(ατ , βτ ). Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN Sea Yij el log2 del cociente en la sonda ti de la muestra j. Yij = K X µk,gj I (i ∈ Ωk ) + k=1 Lj X mlj I (i ∈ ∆lj ) + ij , l=1 µk,gj es la media poblacional, mlj es un efecto aleatorio especı́fico y ij es el error de medición tal que ind iid mkj ∼ N(0, τj2 ), con τj2 ∼ Iga(ατ , βτ ). iid ij ∼ N(0, σ2 ) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN Definimos µk = (µk1 , µk2 ) el vector del número de copias poblacional para los subtipos 1 y 2. ind µk |G ∼ G , for k = 1, . . . , K G = (1 − π)G0 + πG1 ind Gr |ar ∼ DP(ar , Fr ), r = 0, 1, Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN Definimos µk = (µk1 , µk2 ) el vector del número de copias poblacional para los subtipos 1 y 2. ind µk |G ∼ G , for k = 1, . . . , K G = (1 − π)G0 + πG1 ind Gr |ar ∼ DP(ar , Fr ), r = 0, 1, donde ar y Fr son la precisión y la medida de centralidad, donde F0 (µk ) = N(µk1 | 0, λ20 )I (µk1 = µk2 ) F1 (µk ) = N2 (µk | 0, Λ1 ) con λ20 > 0 y Λ1 una matriz def. pos. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Número de copias en el ADN Definimos µk = (µk1 , µk2 ) el vector del número de copias poblacional para los subtipos 1 y 2. ind µk |G ∼ G , for k = 1, . . . , K G = (1 − π)G0 + πG1 ind Gr |ar ∼ DP(ar , Fr ), r = 0, 1, donde ar y Fr son la precisión y la medida de centralidad, donde F0 (µk ) = N(µk1 | 0, λ20 )I (µk1 = µk2 ) F1 (µk ) = N2 (µk | 0, Λ1 ) con λ20 > 0 y Λ1 una matriz def. pos. Esta construcción nos permite determinar regiones del cromosoma en donde hay diferencias en los números de copias en los dos subtipos. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Apl.5 Figura. Datos simulados T2 pr pr T2 T1 Chromosome 14 T1 Chromosome 11 400 600 800 1000 0 200 400 Probe Probe Chromosome 12 Chromosome 15 600 800 1000 600 800 1000 600 800 1000 T2 pr pr T2 T1 200 T1 0 400 600 800 1000 0 200 400 Probe Probe Chromosome 13 Chromosome 16 T2 pr pr T2 T1 200 T1 0 0 200 400 600 800 1000 Probe Luis E. Nieto-Barajas 0 200 400 Probe Aplicaciones INMEGEN Contenido Apl.1 Apl.2 Apl.3 Apl.4 Figura. Cáncer de mama pr TN ER Chromosome 5 0 500 1000 1500 2000 Probe pr TN ER Chromosome 15 0 200 400 600 800 1000 1200 Probe Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Figura. Cáncer de mama pr TN ER Chromosome 9 0 500 1000 1500 Probe pr TN ER Chromosome 12 0 500 1000 1500 2000 Probe Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Transplante de corazón Estudio: Los pacientes eran aceptados cuando eran juzgados candidatos para transplante. Cuando un donador se presentaba, los médicos seleccionaban el candidato idóneo Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Transplante de corazón Estudio: Los pacientes eran aceptados cuando eran juzgados candidatos para transplante. Cuando un donador se presentaba, los médicos seleccionaban el candidato idóneo T = Tiempo de supervivencia (dı́as) de un paciente con problemas cardiacos Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Transplante de corazón Estudio: Los pacientes eran aceptados cuando eran juzgados candidatos para transplante. Cuando un donador se presentaba, los médicos seleccionaban el candidato idóneo T = Tiempo de supervivencia (dı́as) de un paciente con problemas cardiacos Datos: (Cox & Oakes, 1984) n = 249 pacientes aceptados, de los cuales sólo 184 recibieron transplante (74 %) Tiempo Indicador Superviv. Status espera transplante total final 49 0 49 1 112 0 112 0 50 1 673 1 · · · · 22 1 3716 0 Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Transplante de corazón Existe información de covariables Wi (t) ⇒ mod. regresión Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Transplante de corazón Existe información de covariables Wi (t) ⇒ mod. regresión Cada individuo tiene(Ti , Wi ), i.e., fi (t), Fi (t), hi (t) y Si (t) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Transplante de corazón Existe información de covariables Wi (t) ⇒ mod. regresión Cada individuo tiene(Ti , Wi ), i.e., fi (t), Fi (t), hi (t) y Si (t) Modelo de riesgos proporcionales: (Cox, 1972) 0 hi (t) = h0 (t)e Wi (t) θ θ 0 = (θ1 , . . . , θp ) vector de coeficientes h0 (t) función de riesgo base (común) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Transplante de corazón Existe información de covariables Wi (t) ⇒ mod. regresión Cada individuo tiene(Ti , Wi ), i.e., fi (t), Fi (t), hi (t) y Si (t) Modelo de riesgos proporcionales: (Cox, 1972) 0 hi (t) = h0 (t)e Wi (t) θ θ 0 = (θ1 , . . . , θp ) vector de coeficientes h0 (t) función de riesgo base (común) Inf. Bayesiana: Definir iniciales sobre θ y h0 (t) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Transplante de corazón Existe información de covariables Wi (t) ⇒ mod. regresión Cada individuo tiene(Ti , Wi ), i.e., fi (t), Fi (t), hi (t) y Si (t) Modelo de riesgos proporcionales: (Cox, 1972) 0 hi (t) = h0 (t)e Wi (t) θ θ 0 = (θ1 , . . . , θp ) vector de coeficientes h0 (t) función de riesgo base (común) Inf. Bayesiana: Definir iniciales sobre θ y h0 (t) Como h0 (t) es cualquier función de riesgo ⇒ inicial NP Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Para una v.a. T continua: f (t) = h(t)S(t), S(t) = e − Rt 0 h(s)ds donde h(t) es una función de riesgo: No negativa El área bajo su curva es ∞ Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Para una v.a. T continua: f (t) = h(t)S(t), S(t) = e − Rt 0 h(s)ds donde h(t) es una función de riesgo: No negativa El área bajo su curva es ∞ ⇒ Dist. inicial NP sobre h(t): a través de un proceso estocástico Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Para una v.a. T continua: f (t) = h(t)S(t), S(t) = e − Rt 0 h(s)ds donde h(t) es una función de riesgo: No negativa El área bajo su curva es ∞ ⇒ Dist. inicial NP sobre h(t): a través de un proceso estocástico Inicial: (Nieto-barajas & Walker, 2004). Basada en procesos de Lévy (mezcla) Z h(t) = k(t, s)dL(s) IR Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Especificaciones En particular, la inicial para h0 (t) es de la forma Z h0 (t) = k(t, s)dL(s) dNs (ν) = dν Rs 0 exp{−νβ(u)}dα(u) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.4 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Especificaciones En particular, la inicial para h0 (t) es de la forma Z h0 (t) = k(t, s)dL(s) dNs (ν) = dν k(t, s) = Rs 0 exp{−νβ(u)}dα(u) e −a(t−s) I (s ≤ t) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.4 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Especificaciones En particular, la inicial para h0 (t) es de la forma Z h0 (t) = k(t, s)dL(s) dNs (ν) = dν Rs 0 exp{−νβ(u)}dα(u) e −a(t−s) I (s ≤ t) k(t, s) = Para el ejemplo: Wi (t) = I (t ≥ wi ) α(·) and β(·) t.q. E{h0 (t)} = 0,02 and Var{h0 (t)} = 20 a ∼ Ga(1/2, 1/2) θ ∼ N(0, 9) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Especificaciones En particular, la inicial para h0 (t) es de la forma Z h0 (t) = k(t, s)dL(s) dNs (ν) = dν Rs 0 exp{−νβ(u)}dα(u) e −a(t−s) I (s ≤ t) k(t, s) = Para el ejemplo: Wi (t) = I (t ≥ wi ) α(·) and β(·) t.q. E{h0 (t)} = 0,02 and Var{h0 (t)} = 20 a ∼ Ga(1/2, 1/2) θ ∼ N(0, 9) Resultados: θ̂ = −0,88 ⇒ se reduce el riesgo de morir en casi 60 % si se realiza el transplante de corazón Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.004 0.003 0.002 0.001 0.0 Hazard function 0.005 0.006 Resultados 0 1000 2000 3000 time Figura : Luis E. Nieto-Barajas Funciones de riesgo Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.6 0.4 0.2 0.0 Survival function 0.8 1.0 Resultados 0 1000 2000 3000 time Figura : Funciones de supervivencia Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.6 0.4 0.2 0.0 Survival function 0.8 1.0 Resultados 0 1000 2000 Time Figura : Estimadores de Breslow (wi = ∞ & wi = 0) Luis E. Nieto-Barajas Aplicaciones INMEGEN 3000 Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.6 0.4 0.2 0.0 Survival function 0.8 1.0 Resultados 0 1000 2000 3000 Time Figura : Estimadores de Breslow + estimadores posteriores (wi = ∞ & wi = 0) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Pacientes que se curan Estudio: Pacientes con leucemia eran sometidos a dos tipos de tratamiento BMT Alogénico (infusión de médula de otra persona compatible) Autogénico (reinfusión de la médula del mismo paciente previa extracción y limpieza) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Pacientes que se curan Estudio: Pacientes con leucemia eran sometidos a dos tipos de tratamiento BMT Alogénico (infusión de médula de otra persona compatible) Autogénico (reinfusión de la médula del mismo paciente previa extracción y limpieza) T = Tiempo de supervivencia (dı́as) libre de leucemia Eventos: Inicio=remisión, fin=recaı́da o muerte Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Pacientes que se curan Estudio: Pacientes con leucemia eran sometidos a dos tipos de tratamiento BMT Alogénico (infusión de médula de otra persona compatible) Autogénico (reinfusión de la médula del mismo paciente previa extracción y limpieza) T = Tiempo de supervivencia (dı́as) libre de leucemia Eventos: Inicio=remisión, fin=recaı́da o muerte Datos: n = 43 pacientes, 16- T.Alogénico y 27-T.Autogénico Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Pacientes que se curan Estudio: Pacientes con leucemia eran sometidos a dos tipos de tratamiento BMT Alogénico (infusión de médula de otra persona compatible) Autogénico (reinfusión de la médula del mismo paciente previa extracción y limpieza) T = Tiempo de supervivencia (dı́as) libre de leucemia Eventos: Inicio=remisión, fin=recaı́da o muerte Datos: n = 43 pacientes, 16- T.Alogénico y 27-T.Autogénico Objetivo: Evaluar la diferencia en la supervivencia libre de leucemia de los dos tipos de BMT Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.6 0.4 0.2 0.0 Survival probability 0.8 1.0 Estudio 0 500 1000 1500 2000 Time to death or disease relapse (days) Figura : Estimadores K-M de las supervivencias estratificadas por grupo BMT Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo La gráfica muestra que una parte de los pacientes no presentarán el evento de interés (recaı́da o muerte), por lo que se pueden considerar curados de la enfermedad Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo La gráfica muestra que una parte de los pacientes no presentarán el evento de interés (recaı́da o muerte), por lo que se pueden considerar curados de la enfermedad ⇒ Necesitamos un modelo que permita una tasa de cura (T = ∞) con probabilidad positiva Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo La gráfica muestra que una parte de los pacientes no presentarán el evento de interés (recaı́da o muerte), por lo que se pueden considerar curados de la enfermedad ⇒ Necesitamos un modelo que permita una tasa de cura (T = ∞) con probabilidad positiva Modelo 1: (Berkson & Gage, 1952) Spop (t) = π + (1 − π)S(t), donde π =prop. de cura, y S(t) =función de superv. propia Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Modelo 2: (Yakolev & Tsodikov, 1996) Spop (t) = e −θF (t) , donde e −θ =prop. de cura, y F (t) =fn. de dist. propia Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Modelo 2: (Yakolev & Tsodikov, 1996) Spop (t) = e −θF (t) , donde e −θ =prop. de cura, y F (t) =fn. de dist. propia Estos modelos consideran la prop. de cura pero no el tiempo de cura Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Modelo 2: (Yakolev & Tsodikov, 1996) Spop (t) = e −θF (t) , donde e −θ =prop. de cura, y F (t) =fn. de dist. propia Estos modelos consideran la prop. de cura pero no el tiempo de cura Modelo 3: (Nieto-Barajas & Yin, 2008) hpop (t) = h(t)I (t ≤ τ ), h(t) una R τfunción de riesgo exp{− 0 h(s)ds}=prop. de cura τ =tiempo de cura Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Modelo 3 + covariables: 0 hi (t|xi , zi ) = h(t|zi )e γ xi (t) , Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Modelo 3 + covariables: 0 hi (t|xi , zi ) = h(t|zi )e γ xi (t) , Inicial: Modelamos h(t|zi ) que permita determinar una prop. de cura y un tiempo de cura h(t|zi ) = ∞ X λk I (k ≤ zi )I (τk−1 < t ≤ τk ), k=1 {λk } es un proceso de Markov gamma en tiempo discreto común a todos los individuous zi es un ı́ndice de cura para el individuo i t.q. 0 zi ∼ Po+ (e δ yi ), con δ un vector de coeficientes y yi variables explicativas Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Covariables: X1 =Tipo de transplante (0-autogénico, 1-alogénico) X2 =Tumor Hodgkin (0-ausente, 1-presente) X3 =Coeficiente de Karnofsky (100-muy bien, 0-muerte) X4 =Tiempo de espera al transplante (en meses) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Covariables: X1 =Tipo de transplante (0-autogénico, 1-alogénico) X2 =Tumor Hodgkin (0-ausente, 1-presente) X3 =Coeficiente de Karnofsky (100-muy bien, 0-muerte) X4 =Tiempo de espera al transplante (en meses) Las covariables aparecen en el modelo via dos diferentes caminos: Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Covariables: X1 =Tipo de transplante (0-autogénico, 1-alogénico) X2 =Tumor Hodgkin (0-ausente, 1-presente) X3 =Coeficiente de Karnofsky (100-muy bien, 0-muerte) X4 =Tiempo de espera al transplante (en meses) Las covariables aparecen en el modelo via dos diferentes caminos: 1 En una forma multiplicativa afectando el riesgo base, y Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Covariables: X1 =Tipo de transplante (0-autogénico, 1-alogénico) X2 =Tumor Hodgkin (0-ausente, 1-presente) X3 =Coeficiente de Karnofsky (100-muy bien, 0-muerte) X4 =Tiempo de espera al transplante (en meses) Las covariables aparecen en el modelo via dos diferentes caminos: 1 2 En una forma multiplicativa afectando el riesgo base, y En la media inicial de zi afectando el tiempo de cura Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Covariables: X1 =Tipo de transplante (0-autogénico, 1-alogénico) X2 =Tumor Hodgkin (0-ausente, 1-presente) X3 =Coeficiente de Karnofsky (100-muy bien, 0-muerte) X4 =Tiempo de espera al transplante (en meses) Las covariables aparecen en el modelo via dos diferentes caminos: 1 2 En una forma multiplicativa afectando el riesgo base, y En la media inicial de zi afectando el tiempo de cura Especificaciones: αk = βk = 2, ck = 50 Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Cuadro : Estimaciones del efecto de las covariables en el riesgo base Covariate Trans. type Hodgkin Karnofsky Waiting Mean −0,03 1.17 −0,07 −0,01 Luis E. Nieto-Barajas 95 % CI (−0,92, 0,86) (0.14, 2.15) (−0,08, −0,05) (−0,03, 0,008) Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Cuadro : Estimaciones del efecto de las covariables en el riesgo base Covariate Trans. type Hodgkin Karnofsky Waiting Mean −0,03 1.17 −0,07 −0,01 95 % CI (−0,92, 0,86) (0.14, 2.15) (−0,08, −0,05) (−0,03, 0,008) El tener tumor Hodgkin presente es dos veces más riesgoso Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Cuadro : Estimaciones del efecto de las covariables en el riesgo base Covariate Trans. type Hodgkin Karnofsky Waiting Mean −0,03 1.17 −0,07 −0,01 95 % CI (−0,92, 0,86) (0.14, 2.15) (−0,08, −0,05) (−0,03, 0,008) El tener tumor Hodgkin presente es dos veces más riesgoso Una disminución de 10 unidades del coef. de Karnofsky aumenta el riesgo en 50 % Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Cuadro : Estimaciones del efecto de las covariables en el tiempo de cura Covariate Transplant type Hodgkin’s disease Karnofsky score Waiting time Post. Mean 0.10 −0,74 0.03 0.004 Luis E. Nieto-Barajas 95 % CI (−0,73, 0,88) (−1,70, −0,001) (0.02, 0.04) (−0,01, 0,02) Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Cuadro : Estimaciones del efecto de las covariables en el tiempo de cura Covariate Transplant type Hodgkin’s disease Karnofsky score Waiting time Post. Mean 0.10 −0,74 0.03 0.004 95 % CI (−0,73, 0,88) (−1,70, −0,001) (0.02, 0.04) (−0,01, 0,02) El tener tumor Hodgkin presente disminuye el tiempo de cura a la mitad Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Cuadro : Estimaciones del efecto de las covariables en el tiempo de cura Covariate Transplant type Hodgkin’s disease Karnofsky score Waiting time Post. Mean 0.10 −0,74 0.03 0.004 95 % CI (−0,73, 0,88) (−1,70, −0,001) (0.02, 0.04) (−0,01, 0,02) El tener tumor Hodgkin presente disminuye el tiempo de cura a la mitad Una disminución de 10 unidades del coef. de Karnofsky disminuye el tiempo de cura en 35 % Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Resultados Cuadro : Estimaciones del tiempo de cura y de la prop. de cura para nuevos pacientes con transplante autogénico con y sin enfermedad Hodgkin Patient (x1 , x2 , x3 , x4 ) (0, 0, 90, 36) (0, 1, 90, 36) (0, 0, 60, 36) (0, 1, 60, 36) τz 95 % quantile 34 months 24 months 15 months 10 months Luis E. Nieto-Barajas π Post. Mean 0.64 0.50 0.27 0.15 Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.010 0.0 0.005 Hazard Rate 0.015 0.020 Resultados 0 200 400 600 800 1000 Time Figura : Estimaciones de la función de riesgo para pacientes con covariables (0, 0, 90, 36) linea contı́nua, (0, 1, 90, 36) linea punteada, (0, 0, 60, 36) linea punteada-rayada, y (0, 1, 60, 36) linea rayada Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.6 0.4 0.0 0.2 Survival Function 0.8 1.0 Resultados 0 200 400 600 800 1000 Time Figura : Estimaciones de la función de supervivencia para pacientes con covariables (0, 0, 90, 36) linea contı́nua, (0, 1, 90, 36) linea punteada, (0, 0, 60, 36) linea punteada-rayada, y (0, 1, 60, 36) linea rayada Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Incidencias en cáncer de mama Estudio: Estimar la incidencia de pacientes con cáncer de mama clasificados por etapa (1–4) y por tipo de áncer: ER (+,–), nodal (+,–), HER2-neu (+,–). Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Incidencias en cáncer de mama Estudio: Estimar la incidencia de pacientes con cáncer de mama clasificados por etapa (1–4) y por tipo de áncer: ER (+,–), nodal (+,–), HER2-neu (+,–). Datos: 4 fuentes de información: MDACC, SEER1, SEER2 y SEER3 Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Incidencias en cáncer de mama Estudio: Estimar la incidencia de pacientes con cáncer de mama clasificados por etapa (1–4) y por tipo de áncer: ER (+,–), nodal (+,–), HER2-neu (+,–). Datos: 4 fuentes de información: MDACC, SEER1, SEER2 y SEER3 Problema: Únicamente la fuente MDACC está completa en las 4 × 2 × 2 × 2 categorı́as. Las otras 3 fuentes del SEER están incompletas (colapsadas en al menos una categorı́a). Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Apl.5 Incidencias en cáncer de mama Cuadro : M. D. Anderson dataset. Stage/Status 1 2 3 4 1 2 3 4 5 6 7 8 (0,0,0) (0,0,1) (0,1,0) (0,1,1) (1,0,0) (1,0,1) (1,1,0) (1,1,1) 74 79 26 8 44 48 14 2 0 50 44 17 1 27 29 13 381 124 17 10 38 30 9 2 2 295 117 46 0 51 23 11 Fuente: Department of Breast Medical Oncology, M. D. Anderson Cancer Center, 1997-2005 Luis E. Nieto-Barajas Aplicaciones INMEGEN Contenido Apl.1 Apl.2 Apl.3 Apl.4 Apl.5 Incidencias en cáncer de mama Cuadro : M. D. Anderson dataset. Stage/Status 1 2 3 4 1 2 3 4 5 6 7 8 (0,0,0) (0,0,1) (0,1,0) (0,1,1) (1,0,0) (1,0,1) (1,1,0) (1,1,1) 74 79 26 8 44 48 14 2 0 50 44 17 1 27 29 13 381 124 17 10 38 30 9 2 2 295 117 46 0 51 23 11 Fuente: Department of Breast Medical Oncology, M. D. Anderson Cancer Center, 1997-2005 N = 1, 632 mujeres post-menopausia Luis E. Nieto-Barajas Aplicaciones INMEGEN Contenido Apl.1 Apl.2 Apl.3 Apl.4 Incidencias en cáncer de mama Cuadro : Three SEER datasets. First: ER/Nodal status, second: nodal status only, third: ER status only. Stage/Profile 1 2 3 4 (1,2) (0,0,?) 5114 2355 77 34 SEER 1 (3,4) (5,6) (0,1,?) (1,0,?) 1 25062 3043 6574 966 180 222 99 (7,8) (1,1,?) 3 11339 2460 556 SEER 2 (1,2,5,6) (3,4,7,8) (?,0,?) (?,1,?) 7029 3 1661 2413 66 567 27 253 SEER 3 (1,2,3,4) (5,6,7,8) (0,?,?) (1,?,?) 535 3461 243 976 344 616 525 1425 Fuente: SEER Stat database: Incidence. November 2005 Submission (1973-2003) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Incidencias en cáncer de mama Cuadro : Three SEER datasets. First: ER/Nodal status, second: nodal status only, third: ER status only. Stage/Profile 1 2 3 4 (1,2) (0,0,?) 5114 2355 77 34 SEER 1 (3,4) (5,6) (0,1,?) (1,0,?) 1 25062 3043 6574 966 180 222 99 (7,8) (1,1,?) 3 11339 2460 556 SEER 2 (1,2,5,6) (3,4,7,8) (?,0,?) (?,1,?) 7029 3 1661 2413 66 567 27 253 SEER 3 (1,2,3,4) (5,6,7,8) (0,?,?) (1,?,?) 535 3461 243 976 344 616 525 1425 Fuente: SEER Stat database: Incidence. November 2005 Submission (1973-2003) SEER1 N1 = 58, 085; SEER2 N2 = 12, 019; SEER3 N3 = 8, 125 Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Incidencias en cáncer de mama Sea Yh,i,j,k la v.a. que denota el número de pacientes en etapa h, ER status i, Nodal status j y HER2 status k, con h ∈ {1, 2, 3, 4}, i ∈ {0, 1}, j ∈ {0, 1}, y k ∈ {0, 1} Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Incidencias en cáncer de mama Sea Yh,i,j,k la v.a. que denota el número de pacientes en etapa h, ER status i, Nodal status j y HER2 status k, con h ∈ {1, 2, 3, 4}, i ∈ {0, 1}, j ∈ {0, 1}, y k ∈ {0, 1} Yh,i,j,k ⇐⇒ Yh,r Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Incidencias en cáncer de mama Sea Yh,i,j,k la v.a. que denota el número de pacientes en etapa h, ER status i, Nodal status j y HER2 status k, con h ∈ {1, 2, 3, 4}, i ∈ {0, 1}, j ∈ {0, 1}, y k ∈ {0, 1} Yh,i,j,k ⇐⇒ Yh,r θh,r denota la probabilidad de la celda asociada a la etapa h y al perfil r Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Incidencias en cáncer de mama Sea Yh,i,j,k la v.a. que denota el número de pacientes en etapa h, ER status i, Nodal status j y HER2 status k, con h ∈ {1, 2, 3, 4}, i ∈ {0, 1}, j ∈ {0, 1}, y k ∈ {0, 1} Yh,i,j,k ⇐⇒ Yh,r θh,r denota la probabilidad de la celda asociada a la etapa h y al perfil r Si Y = {Yh,r }, N el número total de pacientes y θ = {θh,r } las probabilidades de celda. Entonces Y ∼ Mult(N, θ) tal que X X θh,r = 1 y Yh,r = N con probabilidad uno (c.p.1). h,r h,r Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo multinomial reparametrizado P Sea Y? = (Y1? , . . . , YH? ), donde Yh? = R r =1 Yh,r es el número de pacientes en etapa h, y P sea θ ? = (θ1? , . . . , θH? ), donde θh? = R r =1 θh,r es la probabilidad marginal de estar en la etapa h, h = 1, . . . , H. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo multinomial reparametrizado P Sea Y? = (Y1? , . . . , YH? ), donde Yh? = R r =1 Yh,r es el número de pacientes en etapa h, y P sea θ ? = (θ1? , . . . , θH? ), donde θh? = R r =1 θh,r es la probabilidad marginal de estar en la etapa h, h = 1, . . . , H. Sea Yh = (Yh,1 , . . . , Yh,R ) el vector de diferentes perfiles en la etapa h. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo multinomial reparametrizado P Sea Y? = (Y1? , . . . , YH? ), donde Yh? = R r =1 Yh,r es el número de pacientes en etapa h, y P sea θ ? = (θ1? , . . . , θH? ), donde θh? = R r =1 θh,r es la probabilidad marginal de estar en la etapa h, h = 1, . . . , H. Sea Yh = (Yh,1 , . . . , Yh,R ) el vector de diferentes perfiles en la etapa h. La distribución de Y se puede re-escribir como: f (y|θ) = MultH×R (y|N, θ) = MultH (y? |N, θ ? ) H Y MultR (yh |yh? , η h ), (1) h=1 θ donde η h = (ηh,1 , . . . , ηh,R ), y ηh,r = θh,r es la probabilidad h? condicional de tener el prefil r dada la etapa h Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo multinomial reparametrizado Usando la re-parametrización θ ⇐⇒ (θ ? , η) y viendo la forma de la verosimilitud (1), podemos hacer inferencia por separado para θ ? y η. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo multinomial reparametrizado Usando la re-parametrización θ ⇐⇒ (θ ? , η) y viendo la forma de la verosimilitud (1), podemos hacer inferencia por separado para θ ? y η. Concentrándonos en η. La variable etapa en una variable ordinal, por lo que podemos considerar una evolución natural en las probabilidades condicionales ηh,r a lo largo de las etapas h = 1, . . . , 4. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Dinámico Proceso de Markov: η 1 ∼ Dir(β 1 ), uh |η h ∼ Mult(ch , η h ), η h+1 |uh ∼ Dir(β h+1 + uh ), donde β h = (βh,1 , . . . , βh,R ) tal que βh,r > 0 y ch ≥ 0, h = 1, . . . , H − 1. Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Dinámico Proceso de Markov: η 1 ∼ Dir(β 1 ), uh |η h ∼ Mult(ch , η h ), η h+1 |uh ∼ Dir(β h+1 + uh ), donde β h = (βh,1 , . . . , βh,R ) tal que βh,r > 0 y ch ≥ 0, h = 1, . . . , H − 1. Si β h = β ∀h ⇒ {η h } es estacionario con marginales η h ∼ Dir(β). Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Dinámico Proceso de Markov: η 1 ∼ Dir(β 1 ), uh |η h ∼ Mult(ch , η h ), η h+1 |uh ∼ Dir(β h+1 + uh ), donde β h = (βh,1 , . . . , βh,R ) tal que βh,r > 0 y ch ≥ 0, h = 1, . . . , H − 1. Si β h = β ∀h ⇒ {η h } es estacionario con marginales η h ∼ Dir(β). En promedio se tiene un modelo lineal a pedazos: E(η h+1 |η h ) = Luis E. Nieto-Barajas β h+1 + ch η h . b + ch Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Modelo Dinámico Proceso de Markov: η 1 ∼ Dir(β 1 ), uh |η h ∼ Mult(ch , η h ), η h+1 |uh ∼ Dir(β h+1 + uh ), donde β h = (βh,1 , . . . , βh,R ) tal que βh,r > 0 y ch ≥ 0, h = 1, . . . , H − 1. Si β h = β ∀h ⇒ {η h } es estacionario con marginales η h ∼ Dir(β). En promedio se tiene un modelo lineal a pedazos: E(η h+1 |η h ) = β h+1 + ch η h . b + ch Adicionalmente θ ? ∼ Dir(δ) Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5 Contenido Apl.1 Apl.2 Apl.3 Apl.4 Apl.5 Resultados Profile 2 Profile 3 0.15 0.20 Profile 4 2 3 4 1 2 3 4 0.0 0.05 0.0 0.02 0.0 0.0 1 2 3 4 1 2 3 Stage Stage Stage Stage Profile 5 Profile 6 Profile 7 Profile 8 4 0.4 1 2 3 Stage Figura : 4 1 2 3 Stage 4 0.0 0.1 0.0 0.0 0.0 0.02 0.2 0.05 0.2 0.04 0.4 0.10 0.3 0.06 0.6 0.08 0.15 0.5 0.10 1 0.05 0.05 0.04 0.10 0.10 0.06 0.10 0.15 0.08 0.15 0.10 Profile 1 1 2 3 4 1 Stage 2 3 4 Stage Estimadores posteriores de ηh,r con el modelo dinámico, usando sólo los datos M. D. Anderson. Luis E. Nieto-Barajas Aplicaciones INMEGEN Contenido Apl.1 Apl.2 Apl.3 Apl.4 Apl.5 Resultados 0.10 0.15 0.10 0.05 0.05 2 3 4 1 2 3 4 0.0 1 2 3 4 1 2 3 Stage Stage Stage Profile 5 Profile 6 Profile 7 Profile 8 0.6 0.15 0.10 0.3 1 2 3 Stage Figura : 4 1 2 3 Stage 4 0.0 0.1 0.0 0.0 0.0 0.02 0.2 0.05 0.2 0.04 0.4 0.06 0.4 0.6 0.08 0.5 0.10 4 0.20 Stage 0.8 1 0.0 0.0 0.0 0.02 0.02 0.04 0.04 0.06 0.08 0.06 0.10 0.15 Profile 4 0.20 Profile 3 0.08 Profile 2 0.12 Profile 1 1 2 3 4 1 Stage 2 3 4 Stage Estimadores posteriores de ηh,r con el modelo dinámico, usando las 4 fuentes de información. Luis E. Nieto-Barajas Aplicaciones INMEGEN Contenido Apl.1 Apl.2 Apl.3 Apl.4 0.0 0.1 0.2 0.3 0.4 0.5 0.6 Resultados 1 2 3 4 Stages Figura : Estimadores posteriores de θ ? con distribución inicial θ ? ∼ Dir(1, 1, 1, 1). Luis E. Nieto-Barajas Aplicaciones INMEGEN Apl.5