Análisis de series temporales interrumpidas: un

Anuncio
Análisis de series temporales
interrumpidas: un estudio de
simulación
Guillermo Vallejo, Javier Herrero, Dolores Paz y Marcelino Cuesta*
Durante la última década, donde por cierto es fácil constatar la creciente utilización que se
está haciendo de las técnicas estadísticas en los diseños de series temporales interrumpidas
(Kazdin, 1984; Bush y Marascuilo, 1988; Morley y Adams, 1 989), la solución habitualmente
practicada por los investigadores a la hora de tratar el problema de la autocorrelación, que
habitualmente se produce en los diseños de series temporales interrumpidas, ha consistido en
emplear la técnica de modelamiento ARIMA, originariamente propuesta por Box y Tiao (1965).
Este enfoque se basa en la adaptación e integración dentro de una teoría comprensiva por parte
de Box y Jenkins (1970) del análisis espectral utilizado en las ciencias Físicas con datos de corte
longitudinal de carácter continuo al análisis de datos de corte longitudinal, pero de carácter
discreto (observaciones registradas en intervalos predeterminados de tiempo y, por lo general, en
longitudes igualmente espaciadas). En los trabajos de estos autores, además de presentarse las
aportaciones más novedosas en torno al tratamiento estocástico de las series temporales, se
propone una metodología que permite llegar a modelar adecuadamente la estructura que sigue
l a parte sistemática del componente estocástico de la serie bajo estudio; modelamiento que se
encuadra dentro de una clase paramétrica de procesos estocásticos lineales y discretos formado
por los denominados "autorregresivos, integrados y de medias móviles", procesos que reciben
el nombre genérico de modelos ARIMA. La técnica en cuestión involucra la construcción
empírica de un complejo modelo matemático que posteriormente es reexaminado para comprobar
si el modelo identificado se ajusta bien a los datos desde los cuales fue erigido, de manera que
el componente residual del mismo describa un proceso de ruido blanco. Así pues, el modelo es
utilizado para extraer la dependencia existente entre los componentes del error de las distintas
observaciones, con el propósito de que los procesos inferenciales efectuados mediante los
contrastes tradicionales a la hora de evaluar las características de los cambios entre las distintas
fases de la serie cronológica sean pertinentes. Este enfoque, al margen de contemplar la
dependencia entre los errores de las puntuaciones de una serie temporal, tiene otras dos
i mportantes ventajas, como son la de no requerir de una línea base estable (fase en la cual se toman
observaciones en ausencia de tratamiento o innovación) y la de proporcionar un análisis separado
acerca de las tendencias y/o ciclos y de los cambios de nivel operados.
Con todo, este enfoque al margen de no poder ser llevado a cabo mediante sencillos
procedimientos de cálculo, adolece de algunas limitaciones que condicionan su utilización. La
principal barrera que constriñe el uso de esta técnica tiene que ver con el excesivo número de
observaciones que son requeridas para una adecuada identificación del modelo de dependencia
serial. Si bien el número de puntuaciones necesitadas es difícil de precisar y éstas dependen de
factores tales como: Naturaleza de las puntuaciones o grado de correlación que manifiesten los
datos, tipos de cambios a través de las fases, variabilidad intrafase, u otro tipo de procesos que
caracterizan a una serie dada, son varios los autores (McCleary y Hay, 1980; Glass, Willson y
Gottman, 1975) que han sugerido que son requeridas al menos 50 y preferiblemente 100
observaciones por fase experimental para llevar a cabo la especificación del modelo con ciertas
garantías de éxito. No obstante, los tamaños muestrales superiores a 100 son los que más
predominan en las aplicaciones prácticas descritas por los investigadores. De ahí que sea esta
última cifra la que se haya venido considerando como valor medio habitual en los analisis
univariantes de series temporales.
El problema derivado de la excesiva reducción del número de observaciones ha recibido
durante la última década una considerable atención y debate. Entre las soluciones propuestas,
cabe destacar, por un lado, los que se derivan del uso de procedimientos pseudogeneralizados de
mínimos cuadrados aplicados al modelo básico de la regresión lineal (diferencias generalizadas
o cuasi generalizadas, análisis de tendencias, análisis autorregresivos) y otros procedimientos
estadísticos relativamente simples (razones tipo Von Neumann generalizados); estos métodos,
además de no requerir de alguno de los supuestos de la regresión mínimo cuadrática ordinaria,
son fácilmente aplicables y se han mostrado relativamente eficaces, sobre todo, cuando el
conocimiento de que disponemos en base a teoría e investigaciones previas es amplio. Y, por otro,
los que se basan en eliminar totalmente el ciclo de construcción del modelo la problemática etapa
de la identificación.
De acuerdo con la segunda solución, que dicho sea de paso va a ser en la que se centre nuestro
interés en la presente comunicación, muchos investigadores, entre los que podemos mencionar
a Theil (1971) y Simonton (1977), han considerado que una forma sencilla, pero razonable, a
juzgar por la frecuencia con que han sido encontrados en las Ciencias Sociales, de analizar los
datos se basa en asumir que los residuales de una serie temporal son adecuadamente representados
por estructuras simplificadas tipo ARIMA (1,0,0). Para otros, en cambio, las cosas no son tan
sencillas como parecen, y han propuesto ajustar las series mediante un proceso autorregresivo de
orden superior; en concreto, Velicer y McDonald (1984) han adaptado un modelo ARIMA
(5,0,0).
Con la finalidad de recabar evidencia empírica del comportamiento de los modelos asumidos
de antemano [ARIMA (1,0,0) y ARIMA (5,0,0)] en relación con el modelo correctamente
identificado, Harrop y Velicer (1985) llevaron a cabo una investigación en la cual fueron
utilizadas múltiples series con observaciones simuladas mediante el conocido procedimiento
Monte Carlo para comparar los resultados del análisis de series temporales interumpidas en los
modelos referidos, excepción hecha del enfoque de la Transformación General que fue aproximado
por un ARIMA (3,0,0). Los descubrimientos de estos autores, en base a comparar los tres modelos
en relación con la varianza del error de los residuales, nivel previo a la intervención, y cambio
de nivel posterior a la intervención, parecen sugerir que la problemática fase de identificación
puede ser eliminada del ciclo de construcción del modelo y reemplazada completamente por
cualquiera de los modelos especificados.
Sin embargo, existen una serie de cuestiones que, como mínimo, nos obligan a ser cautelosos
con los resultados obtenidos por Harrop y Velicer. En primer lugar, en la fase de identificación
puede ocurrir, y de hecho ocurre en este caso, que se especifiquen varios modelos alternativos
y que una vez estimados cada uno de ellos satisfaga los criterios examinados. En segundo lugar,
si bien es verdad que en el trabajo de estos autores se incluyen los modelos más frecuentemente
encontrados en las Ciencias Sociales, excepción hecha del ARIMA (1, 1,0), (0,0,2) y del ARIMA
(1,0, l), no podemos decir que ocurra lo mismo con la representación de las regiones del área de
estacionariedad-invertibilidad. Por último, al no estimarse ni los errores estándar de los
parámetros ni las probabilidades de cometer errores Tipo I o errores Tipo II bajo los diferentes
enfoques, las conclusiones de los autores quedan muy debilitadas.
A raíz de lo dicho, resulta obvio, que se necesitan nuevas pruebas con el objeto de poder
determinar si las sugerencias de Harrop y Velicer van más allá de lo meramente tentativo y
podemos aceptar la recomendación de eliminar definitivamente el proceso de identificación del
ciclo de construcción del modelo. Pues, como se habrá observado, los autores argumentan
convincentemente acerca de las ventajas que este hecho reporta; sin embargo, son menos
persuasivos con la evidencia empírica que nos proporcionan. De aquí que la meta fundamental
de la presente investigación se centre principalmente en el estudio de los problemas que
restringen el alcance de los descubrimientos anteriores. En especial los que se refieren a las
cuestiones siguientes:
a) Grado de sesgadez de los parámetros estimados.
b) Eficacia de los estimadores obtenidos bajo los diferentes enfoques.
c) Probabilidad empírica de cometer errores Tipo I.
d) Potenciaade prueba de los test estadísticos para cada uno de los tres procedimientos de
análissis.
Método
En orden a evaluar el objetivo que nos hemos marcado en el apartado anterior hemos diseñado
un experimento de simulación de Monte Carlo en base a tres áreas de interés:Número de puntos
generados, tipo de modelos seleccionados y valor de los parámetros manejados.
Con respecto al primer criterio hemos generado series utilizando los tamaños muestrales 50
(n1 = n2 =25) y 100 (n1=n2=50). Estos valores no se fijaron arbitrariamente sino que se basan
en la recomendación sugerida por la mayoría de los autores consultados de disponer de un mínimo
de 50 puntuaciones, si bien como ha sido mencionado un valor medio más ajustado lo constituyen
l 00. L a manipulación de esta variable nos permite analizar, por un lado, en qué medida el tamaño
de la muestra afecta a la eficacia de los enfoques autorregresivos [AR (l) y [AR (5)] en relación
con el modelo correctamente identificado (MCI).Y, por otro, determinaren qué medida se facilita
l a labor de identificar los MCI cuando el número de observaciones aumenta. Téngase presente
que dado el carácter estocástico de las series, un mismo modelo puede generar series diferentes
para un mismo periodo. Lo cual supone que la serie generada constituye una de las muchas series
que podía haber originado el modelo identificado.
En lo que se refiere al segundo criterio, se han seleccionado los modelos ARIMA (1,0,0),
ARIMA (2,0,0), ARIMA (0,0, l), ARIMA (0,0,2) y ARIMA (0,1,1). Esta selección se debe a que
estos procesos son, en opinión de los diversos autores (Gottman y Glass, 1978; Glass, Wilson y
Gottman, 1975), representativos de series que uno puede encontrarse con más frecuencia en
Psicología y Ciencias Sociales. También se ha seleccionado el modelo ARIMA (1,0,1) para
comprobar la eficacia de los enfoques AR(1) y AR(5) en situaciones complejas. Aunque
ciertamente con este proceso mixto parece que es más difícil toparse, ya que Gottman y Glass
(1978) y Glass y otros (1979) no encontraron ningún proceso de este tipo en el total de las 211
series estudiadas. En suma, creemos que la estructura relativamente sencilla de los modelos
elegidos se acomoda adecuadamente a lo que la experiencia acumulada confirma.
Por lo que respecta al último criterio, los valores de los parámetros 1 y 2 se han elegido de
manera que sean representativos del rango de valores aceptables para satisfacer la condición de
estacionariedad (-1<1<l) y de invertibilidad (-1<l<1). Igualmente, tanto los valores de los
parámetros del proceso ARIMA (1,0,1) como los de los procesos autorregresivos y de media
móvil de segundo orden se seleccionaron de forma que quedasen representadas las seis áreas de
las regiones de estacionariedad e invertibilidad de acuerdo a las delimitaciones gráficas
elaboradas por Stralkoswki, Wu y Devor (1970). En la tabla 1 se esquematiza el valor de los
parametros para cada uno de los modelos.
Discusión
El principal propósito del presente trabajo se ha dirigido a investigar si dentro del ciclo de
construcción del modelo ARIMA puede prescindirse por entero de la engorrosa y problemática
fase de identificación y reemplazarse sin pérdida de eficacia por el asumido proceso AR (1) o por
el enfoque de la Transformación General AR (5); tal y como se desprende de la recomendación,
aunque con carácter tentativo, hechas por Harrop y Velicer al estudiar el grado de sesgadez que
manifiestan los parámetros estimados bajo los enfoques MCI, AR (1) y AR (3).La confirmación
una vez más de este hallazgo, reportaría una serie de ventajas considerables, pues, además de ser
difícilmente justificable utilizar procedimientos complejos cuando los resultados obtenidos con
otros más sencillos son esencialmente los mismos, se incrementa sustancialmente el número
potencial de aplicaciones de la técnica ARIMA en aquellas investigaciones que utilizan el diseño
de series temporales interrumpidas en el ámbito de las Ciencias Sociales, Comportamentales y
de la Salud; al reducirse tanto el grado de sofisticación estadística requerida como el número de
observaciones necesarias.
Los datos de nuestro estudio indican, por un lado, que los tres procedimientos [MCI, AR(1)
y AR(5)] arrojan resultados bastante similares en lo referente a las estimaciones empíricas
concernientes a la probabilidad de cometer errores Tipo 1 y al grado de sesgadez cometido a la
horade estimar el nivel previo a la introducción del tratamiento (L) y el cambio de nivel posterior
a la presentación (1), sobre todo, en lo relativo a esta segunda cuestión, los resultados son
prácticamente idénticos. Y, por otro, el enfoque MCI, además de ser siempre más poderoso que
los otros dos enfoques, nos proporciona estimaciones más eficientes que las obtenidas bajo los
procedimientos AR(1) y AR(5).
En efecto, si comparamos los errores estándar (SE) de los tres procedimientos de estimación
a través de los diferentes modelos ARIMA observamos como en todos los casos los SE asociados
con el enfoque MCI son bastante más pequeños que los SE vinculados con los otros dos enfoques,
sobre todo, sustancialmente más reducidos que los SE ligados al enfoque AR(1).Por tanto, si
conjugamos este hecho con el descubrimiento señalado anteriormente de que las estimaciones de
los efectos del tratamiento eran esencialmente los mismos para los tres enfoques,podemos
concluir que el procedimiento MCI nos proporciona estimadores relativamente más eficaces que
los estimadores obtenidos bajo los procedimientos AR(1) y AR(5).
Por lo que a la potencia de prueba se refiere, los datos encontrados por nosotros ponen de
relieve como cuando el efecto del tratamiento está presente el procedimiento MCl es siempre más
poderoso a la hora de detectar la presencia de dicho efecto que cualesquiera de los otros dos
procedimientos. Esta tendencia se mantiene inalterable a lo largo de los seis modelos ARIMA, si
bien, al igual que ocurre con la eficacia relativa de los estimadores, las discrepancias entre los tres
procedimientos de análisis son menos acentuadas en el modelo ARIMA (1,0, l ).Adicionalmente,
desde nuestros datos se desprende que el enfoque AR(5) se muestra sistemáticamente más eficaz
que el enfoque AR(1). Igualmente, también consideramos notable resaltar,por un lado,cómo un
incremento del tamaño de muestra conlleva indefectiblemente un incremento de la potencia de
prueba estimada empíricamente y, por otro, cómo las diferentes estrategias analíticas se muestran
ligeramente más poderosas a la hora de detectar los efectos del tratamiento en procesos de medias
móviles [ARIMA (0,0,1) Y ARIMA (0,0,2)] que en procesos autorregresivos [ ARIMA (1,0,0)
y ARIMA (2,0,0) ].
En consecuencia, podemos concluir diciendo que la eliminación de la fase de identificación
en aras de algún modelo asumido de antemano va a disminuir nuestra capacidad para detectar
cambios útiles y efectivos cuando en realidad existen; es decir, nos va a llevar a cometer errores
Tipo II con más frecuencia de lo deseado. Con todo, no queremos olvidar que la generalización
de este tipo de estudios está mediatizada por el procedimiento, modelos utilizados, valor de los
parámetros y tamaño de muestra elegidos.
Referencias
BOX, G.E.P. y JENKINS, G.M. (1970). Time Series Analysis: Forescasting and Control. San
Francisco: Holden Day.
BOX, G.E.P. y TIAO, G.C. (1965). A change in level of non-stationary time-series. Biometrika,
52, 181-192.
BUSK, P.L. y MARASCUILO, L.A. (1988). Autocorrelation in single-subject research: A
counter argument to the myth of no autocorrelation. Behavioral Assessment, 10, 229-242.
CHATFIELD, C. (1989). The Analysis of Time Series: An Introduction. (4th edition). London:
Chapman and Hall.
GLASS, G.V.,WILLSON,V.L. y GOTTMAN, J.M. (1975). Design andAnalysis of Time-Series
Experiments. Boulder, Colorado: Colorado Associated University Press.
GOTTMAN, J.M. y GLASS, G.V. (1978). Time-series analysis of interrupted time-series
experiments. En T.R. Krutochwill (Ed.). Single-Subject Research: Strategies forEvaluating
Change, New York: Academic Press.
HARROP, J.W. y VELICER, W.F. (1985). A comparison of alternative approaches to the
analysis of interrupted time-series. Multivariate Behavioral Research, 20, 27-44.
KAZDIN, A.E. (1984). Statistical analysis for single-case experimental designs. En D.Barlow y
H. Hersen (Eds.), Single-case Experimental Designs: Strategies for Studying Behavior
Change (Ed.Rev.) New York: Pergamon Press.
MCCLEARY, R. y HAY, R.A., Jr.(1980). Applied Time Series Analysis for the Social Sciences.
Beverly Hills, CA: SAGE.
MORLEY, S. y ADAMS, M. (1989). Some simple statistical tests for exploring single-case timeseries data. British Journal of Clinical Psychology. 28, 1-18.
SIMONTON, D.K. (1977). Cross-sectional time-series experiments: Some suggested statistical
analysis. Psychological Bulletin, 84, 489-502.
STRALKOWSKI, C.M.; WU, S.M. y DEVOR. R.E. (1970). Charts for the interpretation and
estimation of the second order autorregressive model. Technometrics, 12, 669-685.
STRALKOWSKI, C.M. ; WU, S.M y DEVOR, R.E. (1974). Charts for the interpretation and
estimation of the second order moving average and mixed first order autorregressive-moving
average models. Technometrics. 16, 275-285.
THEIL, H. (1971). Principles of Econometrics. New York; John Wiley.
VELICER, W.F. y MCDONALD, R.P. (1984). Time series analysis without model identification.
Multivariate Behavioral Research, 19, 33-47.
Descargar