Aplicaciones estadísticas en genómica

Anuncio
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Aplicaciones estadı́sticas en genómica
Luis E. Nieto-Barajas
Departamento de Estadı́stica, ITAM, México
Instituto Nacional de Medicina Genómica, INMEGEN
24 octubre de 2013
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Contenido
Aplicación 1: Perfiles proteı́nicos
Aplicación 2: Número de copias en el ADN
Otras Aplicaciones:
Transplante de corazón
Pacientes con leucemia que se curan con transplante de
médula osea
Incidencias en cáncer de mama
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Proteómica: Estudio de proteı́nas en gran escala, enfocándose
en sus estructuras y funciones.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Proteómica: Estudio de proteı́nas en gran escala, enfocándose
en sus estructuras y funciones.
Caracterı́sticas: Tı́picamente, una forma de estı́mulo o droga
se le da a un sistema biológico. El sistema es observado en el
tiempo y se mide el nivel de expresión de todas las proteı́nas
relacionadas con la enfermedad.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Proteómica: Estudio de proteı́nas en gran escala, enfocándose
en sus estructuras y funciones.
Caracterı́sticas: Tı́picamente, una forma de estı́mulo o droga
se le da a un sistema biológico. El sistema es observado en el
tiempo y se mide el nivel de expresión de todas las proteı́nas
relacionadas con la enfermedad.
RPPA (reverse phase protein arrays): Tecnologı́a de alta
capacidad para el estudio del nivel de expresión de proteı́nas
usando simultáneamente un gran número de muestras
biológicas grandes.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Proteómica: Estudio de proteı́nas en gran escala, enfocándose
en sus estructuras y funciones.
Caracterı́sticas: Tı́picamente, una forma de estı́mulo o droga
se le da a un sistema biológico. El sistema es observado en el
tiempo y se mide el nivel de expresión de todas las proteı́nas
relacionadas con la enfermedad.
RPPA (reverse phase protein arrays): Tecnologı́a de alta
capacidad para el estudio del nivel de expresión de proteı́nas
usando simultáneamente un gran número de muestras
biológicas grandes.
Los datos RPPA con los que contamos son datos observados
en el tiempo, después de una intervención inicial.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Estudio: Experimento RPPA para medir la inhibición en
secuencia de proteinas mediante la droga Lapatinib en lı́neas
celulares de cáncer de ovario
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Estudio: Experimento RPPA para medir la inhibición en
secuencia de proteinas mediante la droga Lapatinib en lı́neas
celulares de cáncer de ovario
Lapatinib es un inhibidor receptor de factor de crecimiento
epidérmico (EGFR)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Estudio: Experimento RPPA para medir la inhibición en
secuencia de proteinas mediante la droga Lapatinib en lı́neas
celulares de cáncer de ovario
Lapatinib es un inhibidor receptor de factor de crecimiento
epidérmico (EGFR)
Una lı́nea celular es tratada inicialmente con Lapatinib, luego
estimulada con EGFR en el tiempo
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Estudio: Experimento RPPA para medir la inhibición en
secuencia de proteinas mediante la droga Lapatinib en lı́neas
celulares de cáncer de ovario
Lapatinib es un inhibidor receptor de factor de crecimiento
epidérmico (EGFR)
Una lı́nea celular es tratada inicialmente con Lapatinib, luego
estimulada con EGFR en el tiempo
D = 8 puntos temporales de medición, td = 0, 5, 15, 30, 60,
90, 120, and 240 minutos,
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Estudio: Experimento RPPA para medir la inhibición en
secuencia de proteinas mediante la droga Lapatinib en lı́neas
celulares de cáncer de ovario
Lapatinib es un inhibidor receptor de factor de crecimiento
epidérmico (EGFR)
Una lı́nea celular es tratada inicialmente con Lapatinib, luego
estimulada con EGFR en el tiempo
D = 8 puntos temporales de medición, td = 0, 5, 15, 30, 60,
90, 120, and 240 minutos,
n = 30 proteinas fueron tratadas con RPPA
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Estudio: Experimento RPPA para medir la inhibición en
secuencia de proteinas mediante la droga Lapatinib en lı́neas
celulares de cáncer de ovario
Lapatinib es un inhibidor receptor de factor de crecimiento
epidérmico (EGFR)
Una lı́nea celular es tratada inicialmente con Lapatinib, luego
estimulada con EGFR en el tiempo
D = 8 puntos temporales de medición, td = 0, 5, 15, 30, 60,
90, 120, and 240 minutos,
n = 30 proteinas fueron tratadas con RPPA
Para cada proteina se registraron 3 replicas de intensidades
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Estudio: Experimento RPPA para medir la inhibición en
secuencia de proteinas mediante la droga Lapatinib en lı́neas
celulares de cáncer de ovario
Lapatinib es un inhibidor receptor de factor de crecimiento
epidérmico (EGFR)
Una lı́nea celular es tratada inicialmente con Lapatinib, luego
estimulada con EGFR en el tiempo
D = 8 puntos temporales de medición, td = 0, 5, 15, 30, 60,
90, 120, and 240 minutos,
n = 30 proteinas fueron tratadas con RPPA
Para cada proteina se registraron 3 replicas de intensidades
Se construyeron puntajes de diferecia (Ydi ) entre las
intensidades post-tratamiento y pre-tratamiento para cada
proteina i en el tiempo d
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
Estudio: Experimento RPPA para medir la inhibición en
secuencia de proteinas mediante la droga Lapatinib en lı́neas
celulares de cáncer de ovario
Lapatinib es un inhibidor receptor de factor de crecimiento
epidérmico (EGFR)
Una lı́nea celular es tratada inicialmente con Lapatinib, luego
estimulada con EGFR en el tiempo
D = 8 puntos temporales de medición, td = 0, 5, 15, 30, 60,
90, 120, and 240 minutos,
n = 30 proteinas fueron tratadas con RPPA
Para cada proteina se registraron 3 replicas de intensidades
Se construyeron puntajes de diferecia (Ydi ) entre las
intensidades post-tratamiento y pre-tratamiento para cada
proteina i en el tiempo d
Pre-procesamiento: mediana comun, transformación a escala
logarı́tmica, y SAM
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
t=15
t=30
Figure 1. Histograms of expression scores
t=5
0.0
3
2.0
1
−3.0
−1.5
0.0
0
−3.0
−1.5
0.0
−3.0
−1.5
Y
Y
Y
Y
t=60
t=90
t=120
t=240
3.0
0.0
−1.5
Y
0.0
−3.0
−1.5
0.0
Y
Luis E. Nieto-Barajas
2.0
1.5
Histogram
0.0
0.5
0.5
0.0
−3.0
0.0
0.5
1.0
1.0
Histogram
1.5
2.5
2.0
2.0
1.5
1.0
Histogram
2.0
1.5
1.0
0.5
0.0
Histogram
2
Histogram
1.5
Histogram
0.5
0.0
0.5
0.0
2
0
−1.5
2.5
−3.0
1.0
2.0
1.0
1.5
Histogram
6
4
Histogram
8
2.5
10
3.0
2.5
4
12
t=0
−3.0
−1.5
0.0
Y
Aplicaciones INMEGEN
−3.0
−1.5
Y
0.0
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
−1.0
−1.5
−2.0
−2.5
Difference scores
−0.5
0.0
Figure 2. Time series of expression scores
0
50
100
150
200
Time
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Figure 3. EGFR/PI3K pathway
Secuencia molecular concensuada: Lapatinib activa EGFR, el
cual a su vez inicia una activación secuencial
'
EGFR
PP
q STAT3/5
@ PP
PKC
/
R
@
Y
H
H PI3K
RAS
PTEN ?
RAF
?
?
LKB1 AKT
MEK
?
?
?
AMPK TSC2
MAPK
?
MTOR
?
&
p70S6
j
HH
FEBP ?
S6
PP
P
q cyclinB1/E/D1
P
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Perfiles proteı́nicos
El análisis desea alcanzar 3 objectivos:
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.4
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
El análisis desea alcanzar 3 objectivos:
1
Caracterizar la distribución cambiante en el tiempo de la
activación de las proteinas
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
El análisis desea alcanzar 3 objectivos:
1
2
Caracterizar la distribución cambiante en el tiempo de la
activación de las proteinas
Reconocer la interacción entre proteinas en la secuencia
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
El análisis desea alcanzar 3 objectivos:
1
2
3
Caracterizar la distribución cambiante en el tiempo de la
activación de las proteinas
Reconocer la interacción entre proteinas en la secuencia
Identificar las proteinas que son son suprimidas debido a la
inhibición de la secuencia por Lapatinib
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
El análisis desea alcanzar 3 objectivos:
1
2
3
Caracterizar la distribución cambiante en el tiempo de la
activación de las proteinas
Reconocer la interacción entre proteinas en la secuencia
Identificar las proteinas que son son suprimidas debido a la
inhibición de la secuencia por Lapatinib
Proponemos un modelo de efectos aleatorios
ydi = xdi + ui + di
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
El análisis desea alcanzar 3 objectivos:
1
2
3
Caracterizar la distribución cambiante en el tiempo de la
activación de las proteinas
Reconocer la interacción entre proteinas en la secuencia
Identificar las proteinas que son son suprimidas debido a la
inhibición de la secuencia por Lapatinib
Proponemos un modelo de efectos aleatorios
ydi = xdi + ui + di
iid
Efectos temporales: xdi ∼ Fd y
(F1 , . . . , Fd ) ∼ tsDDP(c, G , m), con m = {mdh } y
marginalmente Fd ∼ DP(c, G )
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
El análisis desea alcanzar 3 objectivos:
1
2
3
Caracterizar la distribución cambiante en el tiempo de la
activación de las proteinas
Reconocer la interacción entre proteinas en la secuencia
Identificar las proteinas que son son suprimidas debido a la
inhibición de la secuencia por Lapatinib
Proponemos un modelo de efectos aleatorios
ydi = xdi + ui + di
iid
Efectos temporales: xdi ∼ Fd y
(F1 , . . . , Fd ) ∼ tsDDP(c, G , m), con m = {mdh } y
marginalmente Fd ∼ DP(c, G )
Efecto espacial (en secuencia): ui s.t. (u1 , . . . , un ) ∼ CAR
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Perfiles proteı́nicos
El análisis desea alcanzar 3 objectivos:
1
2
3
Caracterizar la distribución cambiante en el tiempo de la
activación de las proteinas
Reconocer la interacción entre proteinas en la secuencia
Identificar las proteinas que son son suprimidas debido a la
inhibición de la secuencia por Lapatinib
Proponemos un modelo de efectos aleatorios
ydi = xdi + ui + di
iid
Efectos temporales: xdi ∼ Fd y
(F1 , . . . , Fd ) ∼ tsDDP(c, G , m), con m = {mdh } y
marginalmente Fd ∼ DP(c, G )
Efecto espacial (en secuencia): ui s.t. (u1 , . . . , un ) ∼ CAR
iid
Error de medición: di ∼ N(0, τd )
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Efectos temporales xdi
tsDDP: F = {F1 , F2 , . . . , FD }. Comenzamos con
Fd =
∞
X
wdh δµdh
h=1
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.4
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Efectos temporales xdi
tsDDP: F = {F1 , F2 , . . . , FD }. Comenzamos con
Fd =
∞
X
wdh δµdh
h=1
Dependencia entre (Fd , Fd+1 ) is definida como
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.4
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Efectos temporales xdi
tsDDP: F = {F1 , F2 , . . . , FD }. Comenzamos con
Fd =
∞
X
wdh δµdh
h=1
Dependencia entre (Fd , Fd+1 ) is definida como
iid
µdh = µh ∼ G for all d = 1, . . . , D
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.4
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Efectos temporales xdi
tsDDP: F = {F1 , F2 , . . . , FD }. Comenzamos con
Fd =
∞
X
wdh δµdh
h=1
Dependencia entre (Fd , Fd+1 ) is definida como
iid
µdh = µh ∼ G for all d = 1, . . . , D
zdh
Ligando los pesos no normalizados vdh →
vd+1,h
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.4
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Efectos temporales xdi
tsDDP: F = {F1 , F2 , . . . , FD }. Comenzamos con
Fd =
∞
X
wdh δµdh
h=1
Dependencia entre (Fd , Fd+1 ) is definida como
iid
µdh = µh ∼ G for all d = 1, . . . , D
zdh
Ligando los pesos no normalizados vdh →
vd+1,h
v1h ∼ Be(1, c),
zdh | vdh ∼ Bin(mdh , vdh ),
vd+1,h | zdh ∼ Be(1 + zdh , c + mdh − zdh )
Escribimos (F1 , . . . , Fd ) ∼ tsDDP(c, G , m), con m = {mdh }
marginalmente Fd ∼ DP(c, G )
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Efectos espaciales ui
Sea u = (u1 , . . . , un ), con ui ’s el efecto especı́ficos de cada
proteı́na
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Efectos espaciales ui
Sea u = (u1 , . . . , un ), con ui ’s el efecto especı́ficos de cada
proteı́na
La interacción entre proteı́nas se representa con un modelo
espacial CAR (Besag, 1974)
u ∼ N (0, Dλ (I − αB))
Dλ = λI and B = W,
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Efectos espaciales ui
Sea u = (u1 , . . . , un ), con ui ’s el efecto especı́ficos de cada
proteı́na
La interacción entre proteı́nas se representa con un modelo
espacial CAR (Besag, 1974)
u ∼ N (0, Dλ (I − αB))
Dλ = λI and B = W,
W es la matriz de adyacencia entre proteı́nas t.q. wii = 0 y
wii 0 = 1 si proteı́nas i y i 0 son vecinas (i ∼ i 0 )
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Efectos espaciales ui
Sea u = (u1 , . . . , un ), con ui ’s el efecto especı́ficos de cada
proteı́na
La interacción entre proteı́nas se representa con un modelo
espacial CAR (Besag, 1974)
u ∼ N (0, Dλ (I − αB))
Dλ = λI and B = W,
W es la matriz de adyacencia entre proteı́nas t.q. wii = 0 y
wii 0 = 1 si proteı́nas i y i 0 son vecinas (i ∼ i 0 )
Cómo especificamos W?: Usando el diagrama concensuado:
Remover, marginalizar, moralizar.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.6
0.7
0.8
0.9
Figura. Correlaciones ρd (A) = Corr{Fd (A), Fd+1 (A)}
ρ1
ρ2
ρ3
Luis E. Nieto-Barajas
ρ4
ρ5
ρ6
Aplicaciones INMEGEN
ρ7
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Apl.5
0.02
150
100
50
0
−3.0
−2.5
−2.0
−1.5
−1.0
−0.5
0.0
X
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Time
0.06
0.04
250
200
0.00
c.d.f.
0.08
0.10
0.12
Figura. Plots of Fˆd = E (Fd |data)
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Apl.5
200
Time
0.06
250
0.04
c.d.f.
0.08
0.10
0.12
Figura. Plots of Fˆd = E (Fd |data)
0.02
150
100
0.00
50
0
−3.0
−2.5
−2.0
−1.5
−1.0
−0.5
0.0
X
Supresión incremental de t1 = 0 a t5 = 60. A partir de
t6 = 90 el efecto se desvanece
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.0
0.2
0.4
c.d.f.
0.6
0.8
1.0
Figura. Plots of Fˆd = E (Fd |data)
−3
−2
−1
0
x
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
1
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.0
0.2
0.4
c.d.f.
0.6
0.8
1.0
Figura. Plots of Fˆd = E (Fd |data)
−3
−2
−1
0
1
Alrededor del 90 % de las proteinas
permaneces sin efecto
x
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Números en negritas denotan significancia con 10 % FDR
ID
1
2
3
4
5
6
7
8
9
10
11
20
21
22
23
24
25
30
Protein
pAKT.S473.
pAKT.T308.
AKT
pGSK3a.b.S9.21.
GSK3a.b
pmTOR.S2448.
mTOR
p.p70S6K.T389.
p70S6K
pS6.S235.236.
pS6.S240.244.204769
p38
pJNK.T183.Y185.
pc.Jun.S73.
C.Jun
pEGFRR
EGFR
p.PKC.S567.
Luis E. Nieto-Barajas
ûi
-0.34
-0.04
0.11
-0.09
-0.06
-0.01
0.05
-0.40
0.13
-0.67
-0.30
0.09
-0.23
0.00
-0.05
0.01
0.14
0.09
P(ui < 0)
1.00
0.71
0.05
0.91
0.80
0.58
0.23
1.00
0.02
0.99
0.95
0.09
1.00
0.52
0.79
0.46
0.02
0.10
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Figure. Series de tiempo de las primeras 15 proteinas
pAKT.T308.
pGSK3a.b.S9.21.
100 200
0
GSK3a.b
100 200
100 200
0
Time
Time
Time
pmTOR.S2448.
mTOR
p.p70S6K.T389.
p70S6K
pS6.S235.236.
100 200
100 200
0.0
100 200
−3.0
−1.5
Dif.Scores
0.2
Dif.Scores
0
−0.2
0.0
Dif.Scores
0
−1.0
0.2
−0.8
−0.2
0.0
Dif.Scores
0.4
Time
−0.4
0
100 200
0
100 200
Time
Time
Time
pS6.S240.244.204769
s6
LKB.1
pAMPK.T172.
pTSC2.T172.
Time
0
100 200
Time
Luis E. Nieto-Barajas
0
100 200
Time
−0.4
0.0
Dif.Scores
0.6
0.2
Dif.Scores
−0.2
−0.4
−0.4
100 200
0.0
Dif.Scores
0.4
0.4
Dif.Scores
−1.0
−2.0
0
0.4
Time
0.0
Time
0.0
Dif.Scores
100 200
Time
0
Dif.Scores
0.0
Dif.Scores
0
−0.4
0.0
Dif.Scores
100 200
−0.4
0.2
Dif.Scores
0
−0.2
0.0
Dif.Scores
0
−0.4
0.0
−0.4
−0.8
Dif.Scores
AKT
0.4
pAKT.S473.
0
100 200
Time
Aplicaciones INMEGEN
0
100 200
Time
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resumen de resultados
Las 9 proteinas significativas corresponden a únicamente 6
proteins distintas (diferencia en fosforilado)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resumen de resultados
Las 9 proteinas significativas corresponden a únicamente 6
proteins distintas (diferencia en fosforilado)
Las 6 proteinas significativas son: p70S6K, s6, AKT, JNK,
GSK3, y cJun.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resumen de resultados
Las 9 proteinas significativas corresponden a únicamente 6
proteins distintas (diferencia en fosforilado)
Las 6 proteinas significativas son: p70S6K, s6, AKT, JNK,
GSK3, y cJun.
p70S6K, s6 y AKT pertenecen a la secuencia concensuada
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resumen de resultados
Las 9 proteinas significativas corresponden a únicamente 6
proteins distintas (diferencia en fosforilado)
Las 6 proteinas significativas son: p70S6K, s6, AKT, JNK,
GSK3, y cJun.
p70S6K, s6 y AKT pertenecen a la secuencia concensuada
JNK, GSK3 y cJun no pertenecen a la secuencia concensuada
(diagrama)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resumen de resultados
Las 9 proteinas significativas corresponden a únicamente 6
proteins distintas (diferencia en fosforilado)
Las 6 proteinas significativas son: p70S6K, s6, AKT, JNK,
GSK3, y cJun.
p70S6K, s6 y AKT pertenecen a la secuencia concensuada
JNK, GSK3 y cJun no pertenecen a la secuencia concensuada
(diagrama)
Supersión de GSK3 y JNK se deben a supresión de AKT
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resumen de resultados
Las 9 proteinas significativas corresponden a únicamente 6
proteins distintas (diferencia en fosforilado)
Las 6 proteinas significativas son: p70S6K, s6, AKT, JNK,
GSK3, y cJun.
p70S6K, s6 y AKT pertenecen a la secuencia concensuada
JNK, GSK3 y cJun no pertenecen a la secuencia concensuada
(diagrama)
Supersión de GSK3 y JNK se deben a supresión de AKT
Supresión de cJun es un resultado sorprendente
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El ADN normal de un humano tiene 23 pares de cromosomas.
Un par es del sexo y los otros 22 pares son autosomas.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El ADN normal de un humano tiene 23 pares de cromosomas.
Un par es del sexo y los otros 22 pares son autosomas.
El par de cromosomas autosomas son idénticos, por lo que el
número de copias es de 2.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El ADN normal de un humano tiene 23 pares de cromosomas.
Un par es del sexo y los otros 22 pares son autosomas.
El par de cromosomas autosomas son idénticos, por lo que el
número de copias es de 2.
Alteraciones en el número de copias (CNA) es causado por
algunas enfermedades como el cáncer. La enfermedad produce
mutaciones que producen ganancias o pérdidas en segmentos
contiguos de ADN.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El ADN normal de un humano tiene 23 pares de cromosomas.
Un par es del sexo y los otros 22 pares son autosomas.
El par de cromosomas autosomas son idénticos, por lo que el
número de copias es de 2.
Alteraciones en el número de copias (CNA) es causado por
algunas enfermedades como el cáncer. La enfermedad produce
mutaciones que producen ganancias o pérdidas en segmentos
contiguos de ADN.
CGH (Comparative Genomic Hybridization): es una técnica
que combinada con microarreglos producen información en
miles o millones de sondas, al hibridar muestras enfermas con
muestras sanas.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El ADN normal de un humano tiene 23 pares de cromosomas.
Un par es del sexo y los otros 22 pares son autosomas.
El par de cromosomas autosomas son idénticos, por lo que el
número de copias es de 2.
Alteraciones en el número de copias (CNA) es causado por
algunas enfermedades como el cáncer. La enfermedad produce
mutaciones que producen ganancias o pérdidas en segmentos
contiguos de ADN.
CGH (Comparative Genomic Hybridization): es una técnica
que combinada con microarreglos producen información en
miles o millones de sondas, al hibridar muestras enfermas con
muestras sanas.
La información producida es una intensidad del color asociado
a cada muestra (sana y enferma). Se forman cocientes de
estas intensidades y se transforman con logaritmo base 2.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Apl.5
0.0
x
−1.0
−0.5
−0.4 −0.2
x
0.0
0.2
0.5
0.4
Figura. Ejemplo de array-CGH
0
200
400
600
800
1000
0
200
400
600
800
1000
600
800
1000
Index
x
0.0
−0.5
−0.4
x
0.0
0.2
0.5
0.4
Index
0
200
400
600
800
1000
0
200
Index
400
Index
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Contenido
Apl.1
Apl.2
Apl.3
Número de copias en el ADN
El objetivo del análisis de datos aCGH son:
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.4
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El objetivo del análisis de datos aCGH son:
Identificar las regiones contiguas del genoma con igual número
de copias
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El objetivo del análisis de datos aCGH son:
Identificar las regiones contiguas del genoma con igual número
de copias
Determinar el número de copias de cada región
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El objetivo del análisis de datos aCGH son:
Identificar las regiones contiguas del genoma con igual número
de copias
Determinar el número de copias de cada región
Nuestra propuesta considera además los siguientes objetivos:
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El objetivo del análisis de datos aCGH son:
Identificar las regiones contiguas del genoma con igual número
de copias
Determinar el número de copias de cada región
Nuestra propuesta considera además los siguientes objetivos:
Combinar la información proveniente de múltiples muestras
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El objetivo del análisis de datos aCGH son:
Identificar las regiones contiguas del genoma con igual número
de copias
Determinar el número de copias de cada región
Nuestra propuesta considera además los siguientes objetivos:
Combinar la información proveniente de múltiples muestras
Comparar el número de copias en subtipos de la enfermedad
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El objetivo del análisis de datos aCGH son:
Identificar las regiones contiguas del genoma con igual número
de copias
Determinar el número de copias de cada región
Nuestra propuesta considera además los siguientes objetivos:
Combinar la información proveniente de múltiples muestras
Comparar el número de copias en subtipos de la enfermedad
Estudio: Se cuenta con 122 pacientes con cáncer de mama,
con 3 subtipos de enfermedad: ER+ (60 pacientes), PR+ (11
pacientes), y TN (51 pacientes).
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
El objetivo del análisis de datos aCGH son:
Identificar las regiones contiguas del genoma con igual número
de copias
Determinar el número de copias de cada región
Nuestra propuesta considera además los siguientes objetivos:
Combinar la información proveniente de múltiples muestras
Comparar el número de copias en subtipos de la enfermedad
Estudio: Se cuenta con 122 pacientes con cáncer de mama,
con 3 subtipos de enfermedad: ER+ (60 pacientes), PR+ (11
pacientes), y TN (51 pacientes).
Nos concentraremos en comparar los subtipos ER+ y TN
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
Sea Yij el log2 del cociente en la sonda ti de la muestra j.
Yij =
K
X
µk,gj I (i ∈ Ωk ) +
k=1
Luis E. Nieto-Barajas
Lj
X
mlj I (i ∈ ∆lj ) + ij ,
l=1
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
Sea Yij el log2 del cociente en la sonda ti de la muestra j.
Yij =
K
X
µk,gj I (i ∈ Ωk ) +
k=1
Lj
X
mlj I (i ∈ ∆lj ) + ij ,
l=1
µk,gj es la media poblacional, mlj es un efecto aleatorio
especı́fico y ij es el error de medición tal que
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
Sea Yij el log2 del cociente en la sonda ti de la muestra j.
Yij =
K
X
µk,gj I (i ∈ Ωk ) +
k=1
Lj
X
mlj I (i ∈ ∆lj ) + ij ,
l=1
µk,gj es la media poblacional, mlj es un efecto aleatorio
especı́fico y ij es el error de medición tal que
ind
iid
mkj ∼ N(0, τj2 ), con τj2 ∼ Iga(ατ , βτ ).
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
Sea Yij el log2 del cociente en la sonda ti de la muestra j.
Yij =
K
X
µk,gj I (i ∈ Ωk ) +
k=1
Lj
X
mlj I (i ∈ ∆lj ) + ij ,
l=1
µk,gj es la media poblacional, mlj es un efecto aleatorio
especı́fico y ij es el error de medición tal que
ind
iid
mkj ∼ N(0, τj2 ), con τj2 ∼ Iga(ατ , βτ ).
iid
ij ∼ N(0, σ2 )
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
Definimos µk = (µk1 , µk2 ) el vector del número de copias
poblacional para los subtipos 1 y 2.
ind
µk |G ∼ G ,
for k = 1, . . . , K
G = (1 − π)G0 + πG1
ind
Gr |ar ∼ DP(ar , Fr ), r = 0, 1,
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
Definimos µk = (µk1 , µk2 ) el vector del número de copias
poblacional para los subtipos 1 y 2.
ind
µk |G ∼ G ,
for k = 1, . . . , K
G = (1 − π)G0 + πG1
ind
Gr |ar ∼ DP(ar , Fr ), r = 0, 1,
donde ar y Fr son la precisión y la medida de centralidad,
donde
F0 (µk ) = N(µk1 | 0, λ20 )I (µk1 = µk2 )
F1 (µk ) = N2 (µk | 0, Λ1 )
con λ20 > 0 y Λ1 una matriz def. pos.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Número de copias en el ADN
Definimos µk = (µk1 , µk2 ) el vector del número de copias
poblacional para los subtipos 1 y 2.
ind
µk |G ∼ G ,
for k = 1, . . . , K
G = (1 − π)G0 + πG1
ind
Gr |ar ∼ DP(ar , Fr ), r = 0, 1,
donde ar y Fr son la precisión y la medida de centralidad,
donde
F0 (µk ) = N(µk1 | 0, λ20 )I (µk1 = µk2 )
F1 (µk ) = N2 (µk | 0, Λ1 )
con λ20 > 0 y Λ1 una matriz def. pos.
Esta construcción nos permite determinar regiones del
cromosoma en donde hay diferencias en los números de copias
en los dos subtipos.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Apl.5
Figura. Datos simulados
T2
pr
pr
T2
T1
Chromosome 14
T1
Chromosome 11
400
600
800
1000
0
200
400
Probe
Probe
Chromosome 12
Chromosome 15
600
800
1000
600
800
1000
600
800
1000
T2
pr
pr
T2
T1
200
T1
0
400
600
800
1000
0
200
400
Probe
Probe
Chromosome 13
Chromosome 16
T2
pr
pr
T2
T1
200
T1
0
0
200
400
600
800
1000
Probe
Luis E. Nieto-Barajas
0
200
400
Probe
Aplicaciones INMEGEN
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Figura. Cáncer de mama
pr
TN
ER
Chromosome 5
0
500
1000
1500
2000
Probe
pr
TN
ER
Chromosome 15
0
200
400
600
800
1000
1200
Probe
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Figura. Cáncer de mama
pr
TN
ER
Chromosome 9
0
500
1000
1500
Probe
pr
TN
ER
Chromosome 12
0
500
1000
1500
2000
Probe
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Transplante de corazón
Estudio: Los pacientes eran aceptados cuando eran juzgados
candidatos para transplante. Cuando un donador se
presentaba, los médicos seleccionaban el candidato idóneo
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Transplante de corazón
Estudio: Los pacientes eran aceptados cuando eran juzgados
candidatos para transplante. Cuando un donador se
presentaba, los médicos seleccionaban el candidato idóneo
T = Tiempo de supervivencia (dı́as) de un paciente con
problemas cardiacos
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Transplante de corazón
Estudio: Los pacientes eran aceptados cuando eran juzgados
candidatos para transplante. Cuando un donador se
presentaba, los médicos seleccionaban el candidato idóneo
T = Tiempo de supervivencia (dı́as) de un paciente con
problemas cardiacos
Datos: (Cox & Oakes, 1984) n = 249 pacientes aceptados, de
los
 cuales sólo 184 recibieron transplante (74 %)
Tiempo
Indicador
Superviv. Status




espera
transplante
total
final




49
0
49
1

112
0
112
0


50
1
673
1





·
·
·
·


22
1
3716
0
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Transplante de corazón
Existe información de covariables Wi (t) ⇒ mod. regresión
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Transplante de corazón
Existe información de covariables Wi (t) ⇒ mod. regresión
Cada individuo tiene(Ti , Wi ), i.e., fi (t), Fi (t), hi (t) y Si (t)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Transplante de corazón
Existe información de covariables Wi (t) ⇒ mod. regresión
Cada individuo tiene(Ti , Wi ), i.e., fi (t), Fi (t), hi (t) y Si (t)
Modelo de riesgos proporcionales: (Cox, 1972)
0
hi (t) = h0 (t)e Wi (t) θ
θ 0 = (θ1 , . . . , θp ) vector de coeficientes
h0 (t) función de riesgo base (común)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Transplante de corazón
Existe información de covariables Wi (t) ⇒ mod. regresión
Cada individuo tiene(Ti , Wi ), i.e., fi (t), Fi (t), hi (t) y Si (t)
Modelo de riesgos proporcionales: (Cox, 1972)
0
hi (t) = h0 (t)e Wi (t) θ
θ 0 = (θ1 , . . . , θp ) vector de coeficientes
h0 (t) función de riesgo base (común)
Inf. Bayesiana: Definir iniciales sobre θ y h0 (t)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Transplante de corazón
Existe información de covariables Wi (t) ⇒ mod. regresión
Cada individuo tiene(Ti , Wi ), i.e., fi (t), Fi (t), hi (t) y Si (t)
Modelo de riesgos proporcionales: (Cox, 1972)
0
hi (t) = h0 (t)e Wi (t) θ
θ 0 = (θ1 , . . . , θp ) vector de coeficientes
h0 (t) función de riesgo base (común)
Inf. Bayesiana: Definir iniciales sobre θ y h0 (t)
Como h0 (t) es cualquier función de riesgo ⇒ inicial NP
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
Para una v.a. T continua:
f (t) = h(t)S(t), S(t) = e −
Rt
0
h(s)ds
donde h(t) es una función de riesgo:
No negativa
El área bajo su curva es ∞
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
Para una v.a. T continua:
f (t) = h(t)S(t), S(t) = e −
Rt
0
h(s)ds
donde h(t) es una función de riesgo:
No negativa
El área bajo su curva es ∞
⇒ Dist. inicial NP sobre h(t): a través de un proceso estocástico
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
Para una v.a. T continua:
f (t) = h(t)S(t), S(t) = e −
Rt
0
h(s)ds
donde h(t) es una función de riesgo:
No negativa
El área bajo su curva es ∞
⇒ Dist. inicial NP sobre h(t): a través de un proceso estocástico
Inicial: (Nieto-barajas & Walker, 2004). Basada en procesos
de Lévy (mezcla)
Z
h(t) =
k(t, s)dL(s)
IR
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Especificaciones
En particular, la inicial para h0 (t) es de la forma
Z
h0 (t) = k(t, s)dL(s)
dNs (ν) = dν
Rs
0
exp{−νβ(u)}dα(u)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.4
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Especificaciones
En particular, la inicial para h0 (t) es de la forma
Z
h0 (t) = k(t, s)dL(s)
dNs (ν) = dν
k(t, s) =
Rs
0 exp{−νβ(u)}dα(u)
e −a(t−s) I (s ≤ t)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.4
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Especificaciones
En particular, la inicial para h0 (t) es de la forma
Z
h0 (t) = k(t, s)dL(s)
dNs (ν) = dν
Rs
0 exp{−νβ(u)}dα(u)
e −a(t−s) I (s ≤ t)
k(t, s) =
Para el ejemplo: Wi (t) = I (t ≥ wi )
α(·) and β(·) t.q. E{h0 (t)} = 0,02 and Var{h0 (t)} = 20
a ∼ Ga(1/2, 1/2)
θ ∼ N(0, 9)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Especificaciones
En particular, la inicial para h0 (t) es de la forma
Z
h0 (t) = k(t, s)dL(s)
dNs (ν) = dν
Rs
0 exp{−νβ(u)}dα(u)
e −a(t−s) I (s ≤ t)
k(t, s) =
Para el ejemplo: Wi (t) = I (t ≥ wi )
α(·) and β(·) t.q. E{h0 (t)} = 0,02 and Var{h0 (t)} = 20
a ∼ Ga(1/2, 1/2)
θ ∼ N(0, 9)
Resultados: θ̂ = −0,88 ⇒ se reduce el riesgo de morir en casi
60 % si se realiza el transplante de corazón
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.004
0.003
0.002
0.001
0.0
Hazard function
0.005
0.006
Resultados
0
1000
2000
3000
time
Figura :
Luis E. Nieto-Barajas
Funciones de riesgo
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.6
0.4
0.2
0.0
Survival function
0.8
1.0
Resultados
0
1000
2000
3000
time
Figura :
Funciones de supervivencia
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.6
0.4
0.2
0.0
Survival function
0.8
1.0
Resultados
0
1000
2000
Time
Figura :
Estimadores de Breslow (wi = ∞ & wi = 0)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
3000
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.6
0.4
0.2
0.0
Survival function
0.8
1.0
Resultados
0
1000
2000
3000
Time
Figura :
Estimadores de Breslow + estimadores posteriores (wi = ∞ & wi = 0)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Pacientes que se curan
Estudio: Pacientes con leucemia eran sometidos a dos tipos de
tratamiento BMT
Alogénico (infusión de médula de otra persona compatible)
Autogénico (reinfusión de la médula del mismo paciente previa
extracción y limpieza)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Pacientes que se curan
Estudio: Pacientes con leucemia eran sometidos a dos tipos de
tratamiento BMT
Alogénico (infusión de médula de otra persona compatible)
Autogénico (reinfusión de la médula del mismo paciente previa
extracción y limpieza)
T = Tiempo de supervivencia (dı́as) libre de leucemia
Eventos: Inicio=remisión, fin=recaı́da o muerte
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Pacientes que se curan
Estudio: Pacientes con leucemia eran sometidos a dos tipos de
tratamiento BMT
Alogénico (infusión de médula de otra persona compatible)
Autogénico (reinfusión de la médula del mismo paciente previa
extracción y limpieza)
T = Tiempo de supervivencia (dı́as) libre de leucemia
Eventos: Inicio=remisión, fin=recaı́da o muerte
Datos: n = 43 pacientes, 16- T.Alogénico y 27-T.Autogénico
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Pacientes que se curan
Estudio: Pacientes con leucemia eran sometidos a dos tipos de
tratamiento BMT
Alogénico (infusión de médula de otra persona compatible)
Autogénico (reinfusión de la médula del mismo paciente previa
extracción y limpieza)
T = Tiempo de supervivencia (dı́as) libre de leucemia
Eventos: Inicio=remisión, fin=recaı́da o muerte
Datos: n = 43 pacientes, 16- T.Alogénico y 27-T.Autogénico
Objetivo: Evaluar la diferencia en la supervivencia libre de
leucemia de los dos tipos de BMT
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.6
0.4
0.2
0.0
Survival probability
0.8
1.0
Estudio
0
500
1000
1500
2000
Time to death or disease relapse (days)
Figura :
Estimadores K-M de las supervivencias estratificadas por grupo BMT
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
La gráfica muestra que una parte de los pacientes no
presentarán el evento de interés (recaı́da o muerte), por lo que
se pueden considerar curados de la enfermedad
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
La gráfica muestra que una parte de los pacientes no
presentarán el evento de interés (recaı́da o muerte), por lo que
se pueden considerar curados de la enfermedad
⇒ Necesitamos un modelo que permita una tasa de cura
(T = ∞) con probabilidad positiva
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
La gráfica muestra que una parte de los pacientes no
presentarán el evento de interés (recaı́da o muerte), por lo que
se pueden considerar curados de la enfermedad
⇒ Necesitamos un modelo que permita una tasa de cura
(T = ∞) con probabilidad positiva
Modelo 1: (Berkson & Gage, 1952)
Spop (t) = π + (1 − π)S(t),
donde π =prop. de cura, y S(t) =función de superv. propia
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
Modelo 2: (Yakolev & Tsodikov, 1996)
Spop (t) = e −θF (t) ,
donde e −θ =prop. de cura, y F (t) =fn. de dist. propia
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
Modelo 2: (Yakolev & Tsodikov, 1996)
Spop (t) = e −θF (t) ,
donde e −θ =prop. de cura, y F (t) =fn. de dist. propia
Estos modelos consideran la prop. de cura pero no el tiempo
de cura
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
Modelo 2: (Yakolev & Tsodikov, 1996)
Spop (t) = e −θF (t) ,
donde e −θ =prop. de cura, y F (t) =fn. de dist. propia
Estos modelos consideran la prop. de cura pero no el tiempo
de cura
Modelo 3: (Nieto-Barajas & Yin, 2008)
hpop (t) = h(t)I (t ≤ τ ),
h(t) una
R τfunción de riesgo
exp{− 0 h(s)ds}=prop. de cura
τ =tiempo de cura
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
Modelo 3 + covariables:
0
hi (t|xi , zi ) = h(t|zi )e γ xi (t) ,
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo
Modelo 3 + covariables:
0
hi (t|xi , zi ) = h(t|zi )e γ xi (t) ,
Inicial: Modelamos h(t|zi ) que permita determinar una prop.
de cura y un tiempo de cura
h(t|zi ) =
∞
X
λk I (k ≤ zi )I (τk−1 < t ≤ τk ),
k=1
{λk } es un proceso de Markov gamma en tiempo discreto
común a todos los individuous
zi es un ı́ndice de cura para el individuo i t.q.
0
zi ∼ Po+ (e δ yi ),
con δ un vector de coeficientes y yi variables explicativas
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Covariables:
X1 =Tipo de transplante (0-autogénico, 1-alogénico)
X2 =Tumor Hodgkin (0-ausente, 1-presente)
X3 =Coeficiente de Karnofsky (100-muy bien, 0-muerte)
X4 =Tiempo de espera al transplante (en meses)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Covariables:
X1 =Tipo de transplante (0-autogénico, 1-alogénico)
X2 =Tumor Hodgkin (0-ausente, 1-presente)
X3 =Coeficiente de Karnofsky (100-muy bien, 0-muerte)
X4 =Tiempo de espera al transplante (en meses)
Las covariables aparecen en el modelo via dos diferentes
caminos:
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Covariables:
X1 =Tipo de transplante (0-autogénico, 1-alogénico)
X2 =Tumor Hodgkin (0-ausente, 1-presente)
X3 =Coeficiente de Karnofsky (100-muy bien, 0-muerte)
X4 =Tiempo de espera al transplante (en meses)
Las covariables aparecen en el modelo via dos diferentes
caminos:
1
En una forma multiplicativa afectando el riesgo base, y
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Covariables:
X1 =Tipo de transplante (0-autogénico, 1-alogénico)
X2 =Tumor Hodgkin (0-ausente, 1-presente)
X3 =Coeficiente de Karnofsky (100-muy bien, 0-muerte)
X4 =Tiempo de espera al transplante (en meses)
Las covariables aparecen en el modelo via dos diferentes
caminos:
1
2
En una forma multiplicativa afectando el riesgo base, y
En la media inicial de zi afectando el tiempo de cura
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Covariables:
X1 =Tipo de transplante (0-autogénico, 1-alogénico)
X2 =Tumor Hodgkin (0-ausente, 1-presente)
X3 =Coeficiente de Karnofsky (100-muy bien, 0-muerte)
X4 =Tiempo de espera al transplante (en meses)
Las covariables aparecen en el modelo via dos diferentes
caminos:
1
2
En una forma multiplicativa afectando el riesgo base, y
En la media inicial de zi afectando el tiempo de cura
Especificaciones: αk = βk = 2, ck = 50
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Cuadro : Estimaciones del efecto de las covariables en el riesgo base
Covariate
Trans. type
Hodgkin
Karnofsky
Waiting
Mean
−0,03
1.17
−0,07
−0,01
Luis E. Nieto-Barajas
95 % CI
(−0,92, 0,86)
(0.14, 2.15)
(−0,08, −0,05)
(−0,03, 0,008)
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Cuadro : Estimaciones del efecto de las covariables en el riesgo base
Covariate
Trans. type
Hodgkin
Karnofsky
Waiting
Mean
−0,03
1.17
−0,07
−0,01
95 % CI
(−0,92, 0,86)
(0.14, 2.15)
(−0,08, −0,05)
(−0,03, 0,008)
El tener tumor Hodgkin presente es dos veces más riesgoso
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Cuadro : Estimaciones del efecto de las covariables en el riesgo base
Covariate
Trans. type
Hodgkin
Karnofsky
Waiting
Mean
−0,03
1.17
−0,07
−0,01
95 % CI
(−0,92, 0,86)
(0.14, 2.15)
(−0,08, −0,05)
(−0,03, 0,008)
El tener tumor Hodgkin presente es dos veces más riesgoso
Una disminución de 10 unidades del coef. de Karnofsky
aumenta el riesgo en 50 %
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Cuadro : Estimaciones del efecto de las covariables en el tiempo de cura
Covariate
Transplant type
Hodgkin’s disease
Karnofsky score
Waiting time
Post. Mean
0.10
−0,74
0.03
0.004
Luis E. Nieto-Barajas
95 % CI
(−0,73, 0,88)
(−1,70, −0,001)
(0.02, 0.04)
(−0,01, 0,02)
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Cuadro : Estimaciones del efecto de las covariables en el tiempo de cura
Covariate
Transplant type
Hodgkin’s disease
Karnofsky score
Waiting time
Post. Mean
0.10
−0,74
0.03
0.004
95 % CI
(−0,73, 0,88)
(−1,70, −0,001)
(0.02, 0.04)
(−0,01, 0,02)
El tener tumor Hodgkin presente disminuye el tiempo de cura
a la mitad
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Cuadro : Estimaciones del efecto de las covariables en el tiempo de cura
Covariate
Transplant type
Hodgkin’s disease
Karnofsky score
Waiting time
Post. Mean
0.10
−0,74
0.03
0.004
95 % CI
(−0,73, 0,88)
(−1,70, −0,001)
(0.02, 0.04)
(−0,01, 0,02)
El tener tumor Hodgkin presente disminuye el tiempo de cura
a la mitad
Una disminución de 10 unidades del coef. de Karnofsky
disminuye el tiempo de cura en 35 %
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Resultados
Cuadro : Estimaciones del tiempo de cura y de la prop. de cura para
nuevos pacientes con transplante autogénico con y sin enfermedad
Hodgkin
Patient
(x1 , x2 , x3 , x4 )
(0, 0, 90, 36)
(0, 1, 90, 36)
(0, 0, 60, 36)
(0, 1, 60, 36)
τz
95 % quantile
34 months
24 months
15 months
10 months
Luis E. Nieto-Barajas
π
Post. Mean
0.64
0.50
0.27
0.15
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.010
0.0
0.005
Hazard Rate
0.015
0.020
Resultados
0
200
400
600
800
1000
Time
Figura :
Estimaciones de la función de riesgo para pacientes con covariables (0, 0, 90, 36) linea contı́nua,
(0, 1, 90, 36) linea punteada, (0, 0, 60, 36) linea punteada-rayada, y (0, 1, 60, 36) linea rayada
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.6
0.4
0.0
0.2
Survival Function
0.8
1.0
Resultados
0
200
400
600
800
1000
Time
Figura :
Estimaciones de la función de supervivencia para pacientes con covariables (0, 0, 90, 36) linea
contı́nua, (0, 1, 90, 36) linea punteada, (0, 0, 60, 36) linea punteada-rayada, y (0, 1, 60, 36) linea rayada
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Incidencias en cáncer de mama
Estudio: Estimar la incidencia de pacientes con cáncer de
mama clasificados por etapa (1–4) y por tipo de áncer: ER
(+,–), nodal (+,–), HER2-neu (+,–).
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Incidencias en cáncer de mama
Estudio: Estimar la incidencia de pacientes con cáncer de
mama clasificados por etapa (1–4) y por tipo de áncer: ER
(+,–), nodal (+,–), HER2-neu (+,–).
Datos: 4 fuentes de información: MDACC, SEER1, SEER2 y
SEER3
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Incidencias en cáncer de mama
Estudio: Estimar la incidencia de pacientes con cáncer de
mama clasificados por etapa (1–4) y por tipo de áncer: ER
(+,–), nodal (+,–), HER2-neu (+,–).
Datos: 4 fuentes de información: MDACC, SEER1, SEER2 y
SEER3
Problema: Únicamente la fuente MDACC está completa en las
4 × 2 × 2 × 2 categorı́as. Las otras 3 fuentes del SEER están
incompletas (colapsadas en al menos una categorı́a).
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Apl.5
Incidencias en cáncer de mama
Cuadro : M. D. Anderson dataset.
Stage/Status
1
2
3
4
1
2
3
4
5
6
7
8
(0,0,0)
(0,0,1)
(0,1,0)
(0,1,1)
(1,0,0)
(1,0,1)
(1,1,0)
(1,1,1)
74
79
26
8
44
48
14
2
0
50
44
17
1
27
29
13
381
124
17
10
38
30
9
2
2
295
117
46
0
51
23
11
Fuente: Department of Breast Medical Oncology, M. D. Anderson Cancer Center,
1997-2005
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Apl.5
Incidencias en cáncer de mama
Cuadro : M. D. Anderson dataset.
Stage/Status
1
2
3
4
1
2
3
4
5
6
7
8
(0,0,0)
(0,0,1)
(0,1,0)
(0,1,1)
(1,0,0)
(1,0,1)
(1,1,0)
(1,1,1)
74
79
26
8
44
48
14
2
0
50
44
17
1
27
29
13
381
124
17
10
38
30
9
2
2
295
117
46
0
51
23
11
Fuente: Department of Breast Medical Oncology, M. D. Anderson Cancer Center,
1997-2005
N = 1, 632 mujeres post-menopausia
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Incidencias en cáncer de mama
Cuadro : Three SEER datasets. First: ER/Nodal status, second: nodal
status only, third: ER status only.
Stage/Profile
1
2
3
4
(1,2)
(0,0,?)
5114
2355
77
34
SEER 1
(3,4)
(5,6)
(0,1,?)
(1,0,?)
1
25062
3043
6574
966
180
222
99
(7,8)
(1,1,?)
3
11339
2460
556
SEER 2
(1,2,5,6)
(3,4,7,8)
(?,0,?)
(?,1,?)
7029
3
1661
2413
66
567
27
253
SEER 3
(1,2,3,4)
(5,6,7,8)
(0,?,?)
(1,?,?)
535
3461
243
976
344
616
525
1425
Fuente: SEER Stat database: Incidence. November 2005 Submission (1973-2003)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Incidencias en cáncer de mama
Cuadro : Three SEER datasets. First: ER/Nodal status, second: nodal
status only, third: ER status only.
Stage/Profile
1
2
3
4
(1,2)
(0,0,?)
5114
2355
77
34
SEER 1
(3,4)
(5,6)
(0,1,?)
(1,0,?)
1
25062
3043
6574
966
180
222
99
(7,8)
(1,1,?)
3
11339
2460
556
SEER 2
(1,2,5,6)
(3,4,7,8)
(?,0,?)
(?,1,?)
7029
3
1661
2413
66
567
27
253
SEER 3
(1,2,3,4)
(5,6,7,8)
(0,?,?)
(1,?,?)
535
3461
243
976
344
616
525
1425
Fuente: SEER Stat database: Incidence. November 2005 Submission (1973-2003)
SEER1 N1 = 58, 085; SEER2 N2 = 12, 019; SEER3 N3 = 8, 125
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Incidencias en cáncer de mama
Sea Yh,i,j,k la v.a. que denota el número de pacientes en etapa
h, ER status i, Nodal status j y HER2 status k, con
h ∈ {1, 2, 3, 4}, i ∈ {0, 1}, j ∈ {0, 1}, y k ∈ {0, 1}
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Incidencias en cáncer de mama
Sea Yh,i,j,k la v.a. que denota el número de pacientes en etapa
h, ER status i, Nodal status j y HER2 status k, con
h ∈ {1, 2, 3, 4}, i ∈ {0, 1}, j ∈ {0, 1}, y k ∈ {0, 1}
Yh,i,j,k ⇐⇒ Yh,r
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Incidencias en cáncer de mama
Sea Yh,i,j,k la v.a. que denota el número de pacientes en etapa
h, ER status i, Nodal status j y HER2 status k, con
h ∈ {1, 2, 3, 4}, i ∈ {0, 1}, j ∈ {0, 1}, y k ∈ {0, 1}
Yh,i,j,k ⇐⇒ Yh,r
θh,r denota la probabilidad de la celda asociada a la etapa h y
al perfil r
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Incidencias en cáncer de mama
Sea Yh,i,j,k la v.a. que denota el número de pacientes en etapa
h, ER status i, Nodal status j y HER2 status k, con
h ∈ {1, 2, 3, 4}, i ∈ {0, 1}, j ∈ {0, 1}, y k ∈ {0, 1}
Yh,i,j,k ⇐⇒ Yh,r
θh,r denota la probabilidad de la celda asociada a la etapa h y
al perfil r
Si Y = {Yh,r }, N el número total de pacientes y θ = {θh,r }
las probabilidades de celda. Entonces
Y ∼ Mult(N, θ)
tal que
X
X
θh,r = 1 y
Yh,r = N con probabilidad uno (c.p.1).
h,r
h,r
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo multinomial reparametrizado
P
Sea Y? = (Y1? , . . . , YH? ), donde Yh? = R
r =1 Yh,r es el
número de pacientes en etapa h, y P
sea θ ? = (θ1? , . . . , θH? ), donde θh? = R
r =1 θh,r es la
probabilidad marginal de estar en la etapa h, h = 1, . . . , H.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo multinomial reparametrizado
P
Sea Y? = (Y1? , . . . , YH? ), donde Yh? = R
r =1 Yh,r es el
número de pacientes en etapa h, y P
sea θ ? = (θ1? , . . . , θH? ), donde θh? = R
r =1 θh,r es la
probabilidad marginal de estar en la etapa h, h = 1, . . . , H.
Sea Yh = (Yh,1 , . . . , Yh,R ) el vector de diferentes perfiles en la
etapa h.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo multinomial reparametrizado
P
Sea Y? = (Y1? , . . . , YH? ), donde Yh? = R
r =1 Yh,r es el
número de pacientes en etapa h, y P
sea θ ? = (θ1? , . . . , θH? ), donde θh? = R
r =1 θh,r es la
probabilidad marginal de estar en la etapa h, h = 1, . . . , H.
Sea Yh = (Yh,1 , . . . , Yh,R ) el vector de diferentes perfiles en la
etapa h.
La distribución de Y se puede re-escribir como:
f (y|θ) = MultH×R (y|N, θ)
= MultH (y? |N, θ ? )
H
Y
MultR (yh |yh? , η h ), (1)
h=1
θ
donde η h = (ηh,1 , . . . , ηh,R ), y ηh,r = θh,r
es la probabilidad
h?
condicional de tener el prefil r dada la etapa h
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo multinomial reparametrizado
Usando la re-parametrización θ ⇐⇒ (θ ? , η) y viendo la
forma de la verosimilitud (1), podemos hacer inferencia por
separado para θ ? y η.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo multinomial reparametrizado
Usando la re-parametrización θ ⇐⇒ (θ ? , η) y viendo la
forma de la verosimilitud (1), podemos hacer inferencia por
separado para θ ? y η.
Concentrándonos en η. La variable etapa en una variable
ordinal, por lo que podemos considerar una evolución natural
en las probabilidades condicionales ηh,r a lo largo de las
etapas h = 1, . . . , 4.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo Dinámico
Proceso de Markov:
η 1 ∼ Dir(β 1 ),
uh |η h ∼ Mult(ch , η h ),
η h+1 |uh ∼ Dir(β h+1 + uh ),
donde β h = (βh,1 , . . . , βh,R ) tal que βh,r > 0 y ch ≥ 0,
h = 1, . . . , H − 1.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo Dinámico
Proceso de Markov:
η 1 ∼ Dir(β 1 ),
uh |η h ∼ Mult(ch , η h ),
η h+1 |uh ∼ Dir(β h+1 + uh ),
donde β h = (βh,1 , . . . , βh,R ) tal que βh,r > 0 y ch ≥ 0,
h = 1, . . . , H − 1.
Si β h = β ∀h ⇒ {η h } es estacionario con marginales
η h ∼ Dir(β).
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo Dinámico
Proceso de Markov:
η 1 ∼ Dir(β 1 ),
uh |η h ∼ Mult(ch , η h ),
η h+1 |uh ∼ Dir(β h+1 + uh ),
donde β h = (βh,1 , . . . , βh,R ) tal que βh,r > 0 y ch ≥ 0,
h = 1, . . . , H − 1.
Si β h = β ∀h ⇒ {η h } es estacionario con marginales
η h ∼ Dir(β).
En promedio se tiene un modelo lineal a pedazos:
E(η h+1 |η h ) =
Luis E. Nieto-Barajas
β h+1 + ch η h
.
b + ch
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Modelo Dinámico
Proceso de Markov:
η 1 ∼ Dir(β 1 ),
uh |η h ∼ Mult(ch , η h ),
η h+1 |uh ∼ Dir(β h+1 + uh ),
donde β h = (βh,1 , . . . , βh,R ) tal que βh,r > 0 y ch ≥ 0,
h = 1, . . . , H − 1.
Si β h = β ∀h ⇒ {η h } es estacionario con marginales
η h ∼ Dir(β).
En promedio se tiene un modelo lineal a pedazos:
E(η h+1 |η h ) =
β h+1 + ch η h
.
b + ch
Adicionalmente θ ? ∼ Dir(δ)
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Apl.5
Resultados
Profile 2
Profile 3
0.15
0.20
Profile 4
2
3
4
1
2
3
4
0.0
0.05
0.0
0.02
0.0
0.0
1
2
3
4
1
2
3
Stage
Stage
Stage
Stage
Profile 5
Profile 6
Profile 7
Profile 8
4
0.4
1
2
3
Stage
Figura :
4
1
2
3
Stage
4
0.0
0.1
0.0
0.0
0.0
0.02
0.2
0.05
0.2
0.04
0.4
0.10
0.3
0.06
0.6
0.08
0.15
0.5
0.10
1
0.05
0.05
0.04
0.10
0.10
0.06
0.10
0.15
0.08
0.15
0.10
Profile 1
1
2
3
4
1
Stage
2
3
4
Stage
Estimadores posteriores de ηh,r con el modelo dinámico, usando sólo los datos M. D. Anderson.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
Apl.5
Resultados
0.10
0.15
0.10
0.05
0.05
2
3
4
1
2
3
4
0.0
1
2
3
4
1
2
3
Stage
Stage
Stage
Profile 5
Profile 6
Profile 7
Profile 8
0.6
0.15
0.10
0.3
1
2
3
Stage
Figura :
4
1
2
3
Stage
4
0.0
0.1
0.0
0.0
0.0
0.02
0.2
0.05
0.2
0.04
0.4
0.06
0.4
0.6
0.08
0.5
0.10
4
0.20
Stage
0.8
1
0.0
0.0
0.0
0.02
0.02
0.04
0.04
0.06
0.08
0.06
0.10
0.15
Profile 4
0.20
Profile 3
0.08
Profile 2
0.12
Profile 1
1
2
3
4
1
Stage
2
3
4
Stage
Estimadores posteriores de ηh,r con el modelo dinámico, usando las 4 fuentes de información.
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Contenido
Apl.1
Apl.2
Apl.3
Apl.4
0.0
0.1
0.2
0.3
0.4
0.5
0.6
Resultados
1
2
3
4
Stages
Figura :
Estimadores posteriores de θ ? con distribución inicial θ ? ∼ Dir(1, 1, 1, 1).
Luis E. Nieto-Barajas
Aplicaciones INMEGEN
Apl.5
Descargar