Diseños cross-over (alternativos): Aspectos

Anuncio
Diseños cross-over (alternativos):
Aspectos metodológicos y analíticos*
Jaime Arnau Gras y Manuel Viader Junyent
El diseño alternativo o cross-over, conocido también como diseño change-over, es un
esquema de investigación experimental donde cada una de las unidades de observación o sujetos recibe dos o más tratamientos y en el cual el orden de aplicación de dichos tratamientos a los
diversos sujetos viene determinado por la estructura del propio diseño. El diseño alternativo más
simple (y probablemente el más utilizado en la práctica) es conocido por diseño 2 x 2 (2
tratamientos-2 períodos). En esta disposición la mitad de los sujetos recibe el tratamiento A y
posteriormente cambia y recibe el tratamiento B; la otra mitad recibe los tratamientos en orden
inverso. De este modo quedan definidos dos grupos experimentales diferenciados por la
secuencia de aplicación de los tratamientos. Obviamente, el principal propósito de los diseños
alternativos es sustraerde las comparaciones de los tratamientos (y períodos) cualquier componente
que se refiera a las diferencias entre sujetos. Ahora bien, dada la estructura del diseño se derivan
una serie de efectos que constituyen sus más importantes desventajas, sobre todo en los diseños
2 x 2. Estos efectos reciben el nombre genérico de efectos de orden (Louis, Lavori, Bailar y
Polansky, 1986). Un primer efecto de orden es conocido como "carry-over" o efecto residual de
orden k, en el cual los efectos de cierto tratamiento se extienden más allá del período de aplicación
hasta los siguientes k períodos. Un segundo efecto de orden es el asociado al período, obviamente
relacionado con el lugar que ocupa el tratamiento en la secuencia experimental. De acuerdo con
lo expuesto, el esquema de un diseño alternativo quedaría, en el caso más sencillo (2 x 2), del
siguiente modo:
El análisis de los datos generados en este diseño puede plantearse a partir de un modelo que,
a diferencia de los propuestos por otros autores (Anderson y McLean, 1974) incluye, además de
los tres componentes básicos del modelo de diseño de cuadrado latino (efecto de sujetos, efecto
de periodo u orden y efecto de tratamiento), el efecto residual de los tratamientos, referido
específicamente a la diferencia entre tales efectos, es decir, a la presencia o no de transferencia
asimétrica entre tratamientos. Cabe destacar que la estructura de análisis es similar a la de un
diseño split-plot. En efecto, la suma de cuadrados total es dividida en dos grandes componentes:
SC entre-sujetos, que incluye SC carry-over y residual entre-sujetos, y SC intra-sujetos, que se
descompone en SC de tratamientos (ajustada a los periodos), SC de periodos (ajustada a los
tratamientos) y SC residual intra-sujetos (Hills y Armitage, 1979). Se asumiría que los efectos
de sujetos son independientes y distribuídos con media cero y varianza común para los distintos
grupos. De este modo el cuadro-resumen del ANOVA para el diseño alternativo 2 x 2 toma la
siguiente forma:
La estrategia de análisis plantearía como paso preliminar la prueba de la hipótesis de nulidad
en cuanto a la igualdad de los efectos residuales. Dada la importancia de esta hipótesis, suele
aconsejarse (Grizzle, 1965) que se rechace a un nivel del 10%.
En efecto, cuando dicha hipótesis de nulidad puede aceptarse la interpretación de los
resultados es simple, puesto que basta tener en cuenta los posibles efectos de tratamientos y
periodos. El problema se complica considerablemente en presencia de efectos carry-over
significativos, más aún cuando no existe una sola explicación para el rechazo de la hipótesis de
nulidad de tales efectos. Como ocurre en otros diseños, el problema fundamental radica en la
confusión entre algunos de los efectos presentes en el diseño y los consiguientes errores de
interpretación que pueden producirse. En particular, de la estructura del diseño y de los datos
utilizados de forma consiguiente para el cálculo de los distintos efectos se deriva la confusión
entre los efectos de grupo, efectos residuales e interacción Tratamientos x Periodos. Obviamente,
esto no representaría ninguna dificultad si dichos efectos poseyeran una magnitud despreciable
en relación con el efecto principal de los tratamientos experimentales, pero indudablemente esta
es una presuposición fuerte que debería ser contrastada de forma eficaz.
El problema de las posibles diferencias entre los grupos experimentales puede solucionarse
mediante una utilización adecuada de las técnicas de aleatorización en la formación de los grupos.
Sin embargo, se plantean dificultades objetivas en el momento de aplicar estas técnicas en
situaciones aplicadas y, en particular, en la práctica clínica. Si no es posible una aleatorización
completa en la formación de los grupos experimentales, se hace imprescindible la introducción
de un periodo de observación pre-tratamiento a fin de valorar la equivalencia inicial de los grupos,
aunque ciertamente esta solución posee importantes limitaciones, tal y como se ha demostrado
repetidamente en el análisis de diseños cuasi -experimentales.
La i mportancia de la igualdad de los efectos residuales y, por tanto, de la inexistencia de
transferencia asimétrica entre tratamientos, puede demostrarse con cierta facilidad si se atiende
a los efectos fijos que se asumen en el análisis de los datos de este tipo de diseño. Dichos efectos
se expresan en la siguiente tabla 3, (caso 2 x 2):
Solamente en el caso de que los dos efectos residuales sean idénticos puede plantearse una
comparación correcta entre los tratamientos a partir de la promediación de periodos distintos. En
efecto, bajo el supuesto de igualdad de los efectos residuales los valores esperados de las
diferencias entre periodos en cada uno de los grupos serían los siguientes:
Obviamente estos dos valores esperados son idénticos (en valor absoluto) en caso de que sea
cierta la hipótesis nula Ho: 1 = 2, lo cual permite contrastar dicha hipótesis de forma inmediata.
Un razonamiento parecido podría efectuarse en lo que se refiere al contraste de las diferencias
globales entre periodos. En este último caso es también condición indispensable la igualdad de
los efectos residuales entre tratamientos.
La alternativa más simple que puede utilizarse cuando los efectos residuales son desiguales
consistiría en analizar únicamente los datos obtenidos durante el primer periodo de observación
(Grizzle, 1965). De este modo el diseño quedaría reducido a una estructura de grupos al azar. Sin
embargo, es obvio que se produce una gran pérdida de información y se pierden también las
ventajas de la estructura de medidas repetidas, en particular la comparación entre los tratamientos
a partir de datos entre-sujetos. Por otra parte, Willan y Pater (1986) han mostrado que en muchos
casos el posible sesgo introducido por la presencia de efectos residuales desiguales se ve
compensado por la reducción de varianza producida por la utilización de los datos de los diversos
periodos. En cualquier caso, es posible plantear otras líneas de acción, de entre las cuales
destacaremos las siguientes:
Introducción de periodos de observación sin tratamiento
Una solución relativamente eficaz consistiría en introducir una observación sin tratamientos
antes del primer periodo de intervención e intercalar otras observaciones sin tratamiento entre los
distintos periodos de intervención. Una primera ventaja de este planteamiento consistiría en la
posibilidad de evaluar directamente los efectos residuales mediante una comparación entre las
fases de no tratamiento pre y post intervención. Pueden plantearse también contrastes para la
interacción Tratamientos x Periodos tanto si se asume como si no la presencia de efectos
residuales significativos (Jones y Kenward, 1989). En caso de presencia de tales efectos el
contraste del efecto de los tratamientos podría plantearse mediante una comparación entre
observaciones pre-tratamiento y primer periodo de intervención, salvando de este modo el
principio básico de establecer comparaciones intrasujetos, aunque resulta obvia la pérdida de
información producida al no utilizarse los datos del segundo periodo de tratamiento.
Por otra parte, sugerimos la posible utilidad del uso de periodos de "línea base" intercalados
entre los tratamientos y de duración variable, con una observación al final del periodo. Una
elección adecuada de los intervalos podría permitirnos establecer el carácter temporal o
permanente de los efectos residuales y su duración aproximada, lo cual constituye sin duda una
información importante para el planteamiento de futuros estudios. Sin embargo, resulta evidente
que este tipo de planteamiento posee importantes límites en la práctica habitual.
Utilización de diseños de alto orden
En el caso frecuente de que se utilicen dos tratamientos, se considerarán de alto orden aquellos
diseños alternativos que incluyan más de dos grupos experimentales (diferenciados por la
secuencia de introducción de los tratamientos) y/o más de dos periodos de tratamiento. Las
ventajas principales de este tipo de disposición radican en la mayor potencia en la detección de
transferencia asimétrica entre tratamientos (puesto que puede utilizarse para ello información
intra-sujeto) y en la posibilidad de evitar, en algunos casos, la confusión entre efectos residuales
e interacción Tratamientos x Periodos.
El problema que se plantea en el caso de los diseños de alto orden radica en la gran cantidad
posible de alternativas de las cuales se dispone y, consecuentemente, en la necesidad de establecer
un criterio de "optimidad" en la selección del diseño, combinando criterios metodológicos,
estadísticos y pragmáticos. Ciertamente, desde el punto de vista de las posibilidades de análisis
existe un conjunto de diseños que pueden considerarse óptimos. Por ejemplo, en caso de que se
desee mantener únicamente dos periodos de observación es óptima la utilización del denominado
diseño de Balaam, que presentaría la siguiente estructura:
De la estructura del diseño de Balaam se deriva la posibilidad de obtener una estimación del
efecto de los tratamientos a partir de datos intrasujeto aun en el caso de presencia de transferencia
asimétrica. Los estimadores del efecto de los tratamientos en caso de presencia de efectos
residuales desiguales o de ausencia de tal diferencia vienen dados por los siguientes contrastes:
Claramente, la primera de estas estimaciones está corregida respecto a la existencia de efectos
residuales asimétricos. La principallimitación del diseño de Balaam radica en que no permite
estimar de forma independiente el efecto carry-over y la interacción Tratamientos x Periodos.
Para evitar esta confusión es necesario recurrir a diseños de estructura más compleja (por
ejemplo, un diseño de tres periodos con 6 secuencias de tratamiento permite estimar de forma
independiente todos los efectos, aun a costa de aumentar considerablemente la complejidad del
análisis). Debe considerarse también el hecho de que el aumento del número de periodos permite
aumentar considerablemente la precisión del diseño: por ejemplo, la introducción de un periodo
extra en el diseño de Balaam permite reducir la varianza del estimador de los efectos residuales
desde 42/N hasta .5 2/N
(Jones y Kenward, 1989).
Introducción de medidas repetidas intraperiodos
La existencia de diferentes observaciones dentro de cada periodo de tratamiento y,
eventualmente, en los posibles periodos de no tratamiento, introduce algunas posibilidades
suplementarias para el análisis de los datos en diseños alternativos. Particularmente, la elección
de intervalos entre observaciones adecuados permitiría valorar la evolución temporal del efecto
de los diversos tratamientos e, indirectamente, sobre la posible existencia de efectos residuales.
Esta información estaría contenida en la estimación de la interacción Carry-over x Ocasiones. Si
pudiera demostrarse, por ejemplo, que un tratamiento posee un efecto residual decreciente que
incide únicamente sobre las primeras observaciones del siguiente periodo de tratamiento, podría
optarse por utilizar únicamente los últimos registros de cada periodo.
La estructura de los datos en diseños alternativos que incluyen medidas repetidas intraperiodos
es relativamente especial, puesto que tales datos constituyen un conjunto de series de observación
que probablemente poseen estructuras de covarianza distintas dentro de cada periodo. Esto
sugiere la necesidad de plantear alternativas a la utilización del ANOVA clásico, y para ello se
ha sugerido al menos una soluciones relevante. La idea fundamental para esta solución consiste
en reducir las diversas medidas repetidas a un pequeño conjunto de estadísticos que pueden ser
analizados tanto mediante técnicas univariables como desde una perspectiva multivariable. Por
ejemplo, puede intentarse el ajuste de un polinomio de grado bajo a cada una de las funciones
obtenidas dentro de cada periodo. Los parámetros estimados para tal polinomio en cada uno de
los sujetos constituirían los nuevos datos a utilizar como entradas en técnicas estadísticas clásicas.
Otra posibilidades de reducción de los datos originales serían la utilización de medidas de
centralización, cálculo del área bajo cada una de las curvas, niveles máximos y/o mínimos, etc.
En caso de que no sea posible o conveniente la reducción de los datos, es necesario recurrir
a un ANOVA para un diseño split-plot con medidas repetidas para cada tratamiento (Greenhouse
y Geisser, 1959), o bien a técnicas generales como el análisis de ante-dependencia (Kenward,
1987).
Referencias
ANDERSON, V.L. y MCLEAN, R.A. (1974). Design ofexperiments. New York: Marfel Dekker
GREENHOUSE, S.W. y GEISSER, S. (1959). Psychometrika, 24, 95-112
GRIZZLE, J.E. (1965). The two-period change-over design and its use in clinical trials.
Biometrics, 21, 467-480
HILLS, M. y ARMITAGE, P. (1979). The two period cross-over clinical trial. British Joumal of
Clinical Pharmacology, 8, 7-20
JONES, B. y KENWARD, M.G. (1989). Design and analysis of cross-over trials. London:
Chapman and Hall
KENWARD, M.G. (1987). A method for comparing profiles of repeated measurements. Applied
Statistics, 36, 296-308
LOUIS, T.A,LAVORI, P.W.BAILAR, J.C. y POLANSKY, M. (1986). Cross-over and selfcontrolled designs in clinical research. En J.C. Bailar y F. Mosteller (Eds.): Medical uses of
statistics. Waltham (Mass.): NUM Books
WILLAN, A.R. y PATER, J.L. (1986). Carryover and the two period crossover design.
Biometrics, 42, 593-599
Descargar