Experimentos. (1) Por Andrés Gacitúa S. El experimento es quizás la forma más conocida de la investigación científica. Consiste en un plan de mediciones y manipulaciones de variables que están ordenadas de tal manera que permiten sacar UNA conclusión clara: la manipulación de la variable independiente (o tratamiento) , se demuestra, (o no se demuestra,) eficiente para producir un determinado efecto sobre la variable dependiente. Se trata de estudios de eficacia causal: se quiere ganar conocimientos sobre la eficacia de ciertos presuntos factores causales de un determinado fenómeno. El diseño experimental suele ser bastante seguro, en el sentido de que sus conclusiones son claras y confiables, pero modesto y tedioso, en el sentido de que obliga a largos procesos de descarte de variables presuntamente “eficaces” y que no lo son. Hoy tenemos en el SIDA un ámbito en el que quizás se haya realizado millones de experimentos : ¿ Tiene eficacia causal (de detención, atenuación, eliminación, alivio de dolores, etc.) del proceso de avance del SIDA y sus secuelas, la administración de un cierto compuesto farmacológico “x” ? Aunque existen los “experimentos de campo” y los “experimentos de un solo sujeto”, por lo general, el Experimento se realiza en condiciones de fuerte control sobre las variables, lo cual ocurre en Laboratorios, y utilizando dos grupos de unos cuántos sujetos cada uno. La representación esquemática de un “diseño experimental clásico” (Campbell y Stanley) puede dibujarse así: Grupo Experimental Asignación Aleatoria de Ss Grupo Control Medición Con Antes de Tratamiento Intervención Experimental Medición Sin Antes de Tratamiento Intervención Experimental Medición Después de la Intervención Medición Después de la Intervención Más resumidamente, se ha convenido en expresar este diseño de la siguiente manera: R GE GC 01 02 X 03 04 La “X” es el tratamiento experimental que recibe únicamente el Grupo Experimental, y 01, 02, 03 y 04, son las Observaciones o Mediciones a realizar. La numeración de las Observaciones-Mediciones permite explicar la “lógica” o la “racionalidad” del diseño experimental . La R equivale a “ramdom”, aleatoriedad. Se distribuye a los sujetos aleatoriamente al Grupo Control y al Grupo Experimental; de esa manera, se puede asumir probabilísticamente, que ambos grupos son iguales, o más bien, que no son significativamente diferentes. Tenemos entonces dada la posibilidad de comparar a ambos grupos, sin que ellos puedan diferir sustantivamente uno de otro. La equivalencia de los grupos crece, cuanto más sujetos se incluye en cada grupo. Si tenemos un experimento con tres sujetos en el Grupo Experimental y tres sujetos en el Grupo Control, las garantías de “Aleatoriedad” y de “Equivalencia” de los grupos son mínimas. En cambio con más de 30 sujetos en cada grupo la aleatoriedad tiene la capacidad de asegurar fuertemente la equivalencia de los grupos. La situación de laboratorio permite “controlar variables”. Esto significa, que se tiene una alta certeza respecto de que la única diferencia que ambos grupos VIVEN EN ESE AMBIENTE, es la variable experimental que está siendo aplicada como tratamiento al Grupo Experimental. Por decirlo así, el laboratorio “deja fuera” la posibilidad de que intervengan otras variables. El Laboratorio es, en consecuencia, un ambiente ideal de alto control de variables, lo que lo hace distinto de los ambientes naturales-ecológicossociales en los que normalmente viven los individuos, donde miles de variables pueden estar actuando simultáneamente. (Como reflexión: haga una lista con las variables causales que podrían afectarlo a Usted en un día en que Usted realiza sus actividades habituales). Así, si en un experimento de laboratorio observáramos una diferencia entre los Grupos Experimental y Control, no podríamos atribuir ese resultado diferencial SINO al tratamiento experimental, ya que ambos grupos son equivalentes y vivieron exactamente las mismas situaciones,…salvo por el tratamiento experimental. Veamos ahora la riqueza de apreciaciones que permite el diseño de las Observaciones y Mediciones. En primer lugar, la comparación de 01 vs 02 nos permite asegurarnos de que antes de la aplicación del tratamiento los grupos no son significativamente distintos. Una vez realizado el Tratamiento Experimental, la comparación 03 vs 01 nos permite decir si el Grupo Experimental “ganó” algo con motivo de su tratamiento (“Ganar”, puede ser positivo, como en ganar habilidades, o puede ser negativo como en aumentar las células cancerígenas en la sangre.) Paralelamente podemos comparar (03 vs 01) y (04 vs 02); es decir, nos preguntamos si el Grupo Control “ganó” algo en proporciones comparables a las del grupo experimental. Durante los experimentos, muchas veces actúan variables que no podemos excluir del proceso por más que queramos. Por ejemplo, el cansancio, la sed y el hambre son variables que actúan inevitablemente, cuanto más se alargue la duración del experimento. De similar forma, en experimentos de larga duración, es inevitable que los niños crezcan y aumenten de peso, que los viejos envejezcan y pierdan capacidades funcionales. Estas variables “imposibles de dejar fuera del Laboratorio” son las que en muchos casos producen cambios en el Grupo Control,…. Que aparentemente no ha recibido tratamiento alguno. En el diseño experimental clásico hay tres “resultados posibles” de máxima utilidad : a)ambos grupos se muestran prácticamente iguales en las mediciones previas al tratamiento, y se muestran bastante distintos después del tratamiento; b)el grupo Experimental muestra ganancias importantes después-antes; c) las ganancias después-antes (03-01) del grupo experimental son drásticamente mayores que las del grupo control. Un buen experimento es el diseño óptimo para determinar eventuales eficacias causales de una variable sobre otra en cualquier plano. Ciertamente, el diseño no podría ser bueno para otros propósitos, para los que no está diseñado. Experimentos (2) En las dos páginas previas expusimos las ideas básicas sobre lo que es un experimento y pusimos como ejemplo clave el “diseño experimental clásico” de Campbell. Pero la verdad es que hay una diversidad de diseños experimentales, algunos incluso más “poderosos” que el “experimental clásico”, y también hay otros más “débiles”, que por lo general son llamados pre-experimentales. Mientras sea posible y necesario, por supuesto, se debe usar el diseño más poderoso, el que ofrece mejores garantías. Pero no siempre es posible aplicar ciertos diseños…y en muchas ocasiones, debemos conformarnos con otros diseños que sin ser perfectos, resuelven al menos las principales necesidades que podamos tener. Los distintos diseños pre-experimentales, cuasi-experimentales y experimentales propiamente tales, difieren en su capacidad para controlar las diversas FUENTES DE INVALIDACION que pudieran afectar a los datos por ellos recopilados. Las principales Fuentes de Invalidación son : 1. Historia. Cuando entre las mediciones Pre y las Post (Antes-Después) transcurre un considerable periodo de tiempo (y qué cosa es “considerable” en este sentido, depende de factores que tienen que ver con cada experimento) , puede perfectamente ocurrir que los resultados registrados en las mediciones POST no se deban al tratamiento experimental, sino a OTRAS VARIABLES EXOGENAS AL EXPERIMENTO QUE ACTUARON COMO VARIABLES INTERVINIENTES SOBRE LOS SUJETOS EN DICHO PERIODO. Un ejemplo típico. Un psicólogo clínico está realizando una terapia para alcanzar un buen grado de control de angustia de parte de un paciente suyo. Hizo mediciones de la capacidad de controlar angustia del paciente al inicio del tratamiento, y pretende darlo de alta, cuando obtenga mediciones francamente mejores. El tratamiento se extiende por varios meses, y por desgracia, durante ese tiempo el paciente sufre un “cogoteo”, tiene un accidente en auto y queda cesante. Al volverse a medir, la capacidad de controlar angustia está por los suelos: el paciente muestra bastante más angustia que al iniciar el tratamiento. Factores debidos al transcurso de la “historia” están causando efectos contrarios a los que quiere alcanzar la terapia. Ciertamente, también puede ocurrir todo lo contrario: imagínese un tratamiento contra la depresión en un paciente cesante que ha sido abandonado por su novia…pero un tratamiento muy malo: ese “terapeuta” en realidad no sabe lo que está haciendo. Tras unos meses de terapia, el paciente ha superado absolutamente su depresión. ¿Cómo pudo ocurrir esto?...el paciente volvió con su novia, encontró trabajo, y se sacó el Loto….La historia también puede deparar factores que contribuyan –incluso más que el tratamiento experimental- a obtener los resultados deseados. Por supuesto, no siempre se puede hacer tratamientos tan rápidos que prácticamente no haya transcurso significativo de tiempo entre las mediciones Pre y las Post. El control del factor de invalidación “historia” no se consigue abreviando los tratamientos, sino con el grupo control equivalente. Cuales quiera que sean los fenómenos que tengan lugar como “historia”, se puede suponer que los mismos afectarán por igual a dos grupos que han sido constituidos en términos equivalentes. Si nuestro ejemplo del terapeuta que trata de desarrollar control de angustia en el paciente fuera una investigación experimental, la solución pudiera ser: a) hacer la terapia con 50 sujetos que han sido constituidos como GRUPO EXPERIMENTAL. b) constituir un GRUPO CONTROL EQUIVALENTE con otros sujetos, en todo iguales a los del grupo experimental, pero que por ahora no recibirán el tratamiento. (Al azar se decide quienes van a grupo experimental y quienes a grupo control) C) hacer mediciones pre y post tratamiento para ambos grupos, tal como lo indica el diseño experimental clásico de Campbell. En estas condiciones, cualquier factor externo –la historia- que pueda afectar a los sujetos del grupo experimental, debería afectar también a los sujetos del grupo control. 2) Maduración. La “historia” no sólo es externa al sujeto. También hay un proceso de “maduración” que podemos entender como “historia interna” de la persona. En este caso, cualquier “factor interno” como maduración, crecimiento, cansancio, fatiga, aburrimiento, etc. Cualquier enfermedad fisiológica puede afectar negativamente al impacto deseado de un tratamiento experimental. Un ejemplo: si se llevara a cabo un estudio de la auto-imagen que han logrado desarrollar las alumnas de un Quinto Básico podría registrarse diferencias enormes entre dos grupos de niñas: las que ya han tenido su primera menstruación, y por ende están acomodando su auto-imagen infantil a otra mucho más madura, mientras que las niñas que no han tenido aún su menarquia, se ven sólidamente instaladas en un a auto-imagen que aún tiene muchos rasgos infantiles. Si el estudio hubiera prescindido del factor maduracional “menarquia”, sus datos estarían fuertemente viciados: el efecto final de dos grupos extremos, tiene más que ver con la menarquia que con otros factores incidentes en la autoestima de las niñas. 3) Administración de Tests. El sólo hecho de hacer mediciones, o aplicar una batería de instrumentos a determinados sujetos, puede afectar fuertemente a aquellas variables relacionadas con la batería recibida. Un ejemplo clásico son los “facsímiles” de la PAA y ahora de la PSU. Los alumnos que se entrenan respondiendo docenas y hasta centenares de facsímiles similares a la prueba definitiva, ven mejoradas sus “aptitudes académicas”, por un “tratamiento” que supuestamente, no es tratamiento sino una medición. Algunos esquizofrénicos inteligentes, a fuerza de que les pasen tests de personalidad una y otra vez, “se aprenden las buenas respuestas” y son capaces de “simular normalidad” a pesar de padecer severas esquizofrenias. 4) Regresión : se llama “regresión estadística” a un efecto que consiste en que, cuando se trabaja con grupos que están en los valores extremos de una cierta variable, independientemente del tratamiento que se les aplique, e incluso sin que se les aplique tratamiento alguno, las mediciones POST tienden a ser más moderadas y “centrales” que las que tuvieron al inicio del estudio. Esto ocurre por simple probabilidad. Supongamos que queremos probar la eficacia un tratamiento contra la depresión, pero tenemos el problema de que tememos que el tipo de terapia a aplicar pudiera ocasionar efectos secundarios indeseables. En una decisión poco afortunada, pudiéramos elegir trabajar con dos grupos de sujetos: un grupo integtrado por sujetos INTENSAMENTE DEPRESIVOS y el otro integrado por sujetos que CARECEN DEL MÁS MÍNIMO INDICADOR DE DEPRESIÓN. La idea es que si hay “efectos secundarios” de esta terapia, ellos deben actuar sobre el grupo no-depresivo, tanto como sobre el grupo de los depresivos. Por simple probabilidad, un grupo que ya es severamente depresivo muy difícilmente pueda intensificar aún más sus niveles de depresión, porque ya está en el extremo de la máxima depresión imaginable; lo más probable es que en algunos de sus sujetos, ocurra la “remisión espontánea de síntomas” y en una segunda evaluación, tengan puntajes correspondientes a menores grados de depresión: se mejoraron solos. Por su parte, el grupo de los que no tienen “nada” de depresión, no pueden alejarse más de la depresión, porque ya están en el extremo más distante de dicha condición. En cambio, pudiera ocurrir que a algunos integrantes de este grupo les ocurrieran accidentes, infortunios, etc.,….que los acercaran en parte hacia la depresión: se “enfermaron” solos. 5) Mortalidad y Selectividad. A lo largo de una investigación, y cuanto más larga peor, se corre el riesgo de que los grupos o muestras de sujetos varíen entre las mediciones iniciales y las finales. En el caso extremo, la gente muere. Más suavemente, algunas personas se aburren de participar en experimentos y desertan, otras veces carecen de dinero para asistir diariamente a los tratamientos, y también desertan. Ocurren así ciertas anomalías. A) Si queremos comparar en un mismo grupo las mediciones Pre con las Post, cometemos un cierto error, porque el grupo ya no es el mismo que partió en el estudio. Se ha modificado. B) Las modificaciones que sufre un grupo por causa de “mortandad muestral” de sujetos, casi nunca son aleatorias. Más bien ocurre que son factores muy precisos los que llevan a la deserción de ciertos sujetos. Pueden desertar…los que no tienen dinero para locomoción, así como los que tienen pasajes comprados para irse de vacaciones al extranjero. La mortandad de semejante “muestra” sería muy selectiva: nos estaríamos quedando con grupos que pierden a los sectores de mayores y menores ingresos, para quedarnos en definitiva sólo con una clase “media” que puede pagar su locomoción, que no le alcanza para vacacionar en el extranjero. También puede ocurrir –en términos de selectividad- exactamente lo contrario de la mortalidad, o si se quiere, una especie de “mortalidad positiva”. En las universidades se suele investigar con estudiantes que se prestan voluntariamente para participar en los experimentos. El punto está en que estos “voluntarios” pueden no representar al resto de sus compañeros, y en esa medida, no se puede considerar a los resultados que se obtenga como representativos o generalizables a toda esa población estudiantil. Esto es típico de estudios donde el componente “valórico” y el “desplante” personal pesan muy decisivamente. Imagínese un estudio realizado para detectar y evaluar el comportamiento sexual de los alumnos del primer año de cualquier universidad. Se pide voluntarios; ¿Quiénes cree Usted que se presentarán…? Serán voluntarios para este estudio sólo algunos estudiantes, por ejemplo, los que llevan una vida sexual estable desde hace varios años, y que ya no tienen problema alguno en hablar de eso; en cambio, aquellos alumnos que no tengan experiencia sexual alguna pudieran avergonzarse de esta situación y por ello, no se ofrecerían como voluntarios. Es de suponer que gays y lesbianas tendrían buenas razones para no ofrecerse como voluntarios, etc. El efecto actúa no sólo en el momento en que se ofrecen los voluntarios. Una vez constituidos los grupos, es evidente que habrá personas más pudorosas y recatadas que otras, que apenas se atreverán a describir sus prácticas sexuales; en el otro extremo, quizás tengamos a locuaces Don Juanes y Quintralas, que hablarán hasta por los codos de prácticas que no necesariamente han vivido personalmente. Los grupos estudiados pueden variar a lo largo de una investigación. Pueden “morir” los que no logran costear la movilización, tanto como los que se van de vacaciones, y pueden auto-seleccionarse positivamente para participar en ciertos estudios, otros sujetos cuya motivación para permanecer en los estudios puede obedecer a las más disímiles razones. Mortandad-Selectividad hacen incomparables a las mediciones Pre y Post porque los grupos han cambiado. Si hay diferencias en las mediciones, ellas pueden deberse a los factores de mortandad y selectividad, y no a los del tratamiento experimental. Ahora podemos volver a hablar de la LOGICA que subyace a los experimentos. Todo experimento quiere resultados válidos. Se eligirá los diseños pre- cuasi y experimentales, con el criterio de que nos brinden las mejores garantías de validez. Usted puede revisar en Campbell y Stanley (1973) muchos más factores de invalidación que los aquó mencionados, y puede revisar muchos más diseños que los que aquí hemos descrito. A la luz de lo anterior, comparemos ahora algunos diseños típicos. A) Estudio de Caso con medición post solamente. Se representa: X…..O . Se aplica un tratamiento experimental (X) y se mide el efecto al concluir el tratamiento (O). Es un diseño insolvente, absolutamente ingenuo, que no merece el nombre de investigación seria. Pueden ocurrir dos cosas: a) Lo que se observa tras el tratamiento no fue producido por éste sino por otros factores de “historia”, “maduración”, “regresión” o “mortalidad-selectividad”. b) Lo que se observa al final ( O ), puede representar un estado de cosas PEOR de lo que había antes del tratamiento. Es decir, el diseño no nos permite averiguar si el efecto del tratamiento MEJORA O EMPEORA el fenómeno al que se lo aplica, ni tampoco si lo causó mi tratamiento u otros factores de los que no tengo registro. B) Diseño PRE-Experimental con PRE y POST en un solo grupo. Se representa : O1 X O2 Es muy similar al anterior, pero esta vez existe una medición previa al tratamiento. Ella nos permite comparar las mediciones PRE y POST, lo que a su vez, nos dirá si el efecto es de MEJORA o de EMPEORAMIENTO. Sin embargo, subsiste un severo descontrol de muchas fuentes de invalidación posibles. En particular, no puedo saber si el efecto fue causado por mi tratamiento experimental, o si el mismo es producto de la intervención de otras variables exógenas no controladas. Historia, Maduración, Regresión, Mortandad y Selectividad Muestral, etc., me pueden estar engañando severamente en mi interpretación de los resultados,… si atribuyo éstos a mi tratamiento experimental . C) Diseño Experimental Clásico. Se representa : R R GE GC O1 O3 X O2 O4 Este diseño asigna aleatoriamente (R = ramdom) los sujetos a los grupos; de donde cabe esperar que no difieran significativamente, si la cantidad de sujetos se vuelve importante. (Si sólo tenemos 4 sujetos, decir que los ponemos en los grupos “al azar” es casi un mal chiste; en cambio, con 50 sujetos en cada grupo, el azar realmente tiene la oportunidad de garantizarnos que los grupos no son significativamente distintos.) Constituidos por azar los grupos Experimental y Control, se aplica la medición PRE a ambos grupos ( O1 y O3) , se aplica el Tratamiento Experimental (X) sólo al grupo experimental, y se vuelve a aplicar medición POST a ambos grupos una vez concluido el tratamiento experimental.(O2 y O4). Si comparamos con los diseños previos, ahora tenemos: a) que podemos averiguar si los tratamientos causan efectos de MEJORA O DE EMPEORAMIENTO; B) también podemos saber si los efectos se deben a nuestro tratamiento experimental o a otras variables. Sabemos esto, porque si han actuado OTRAS VARIABLES ellas tendrían que haber afectado por igual al grupo experimental y al control; en cambio, si el efecto se debe al tratamiento experimental, O2 tiene que superar en grado importante a O4. Supongamos que nuestro experimento clásico se propone evaluar la eficacia de una droga contra el SIDA en la atenuación de los síntomas que padecen quienes manifiestan claramente su VIH. Tenemos una escala que mide INTENSIDAD DE LOS SINTOMAS en valores que van desde 01 hasta 100, siendo 100 el extremo de máxima intensidad, y 01 aquel en que la manifestación de los síntomas es prácticamente indetectable a causa de su mínima intensidad posible de registrar. En este contexto, supongamos que las mediciones son: PRE R R Grupo EXPERIMENTAL 80 Grupo CONTROL 78 X POST GANANCIA 40 40 PTS 65 13 PTS Hagamos una lectura en varios puntos: a) La asignación aleatoria de sujetos a los grupos nos ha constituido, efectivamente, dos grupos equivalentes: entre 78 y 80 puntos no hay una diferencia inicial significativa. b) El grupo Experimental muestra una enorme ganancia: la intensidad con que se manifiestan los síntomas VIH ha bajado a la mitad de lo que era antes de la droga experimental. c) El Grupo Control, aunque en bastante menor grado, muestra también una cierta reducción en la intensidad con que se manifiestan sus síntomas; la ganancia, en todo caso, tendría que ser analizada, ya que pudiera no ser estadísticamente significativa. d) La ganancia de 40 puntos por el Grupo Experimental, supera ampliamente a la ganancia del Grupo Control. Es decir, el efecto puede ser atribuido a nuestra droga experimental, EN UNA BUENA MEDIDA. e) La ganancia del Grupo Control, si resulta significativa estadísticamente, nos estaría señalando que en el efecto final participan algunas variables que no fueron consideradas en nuestro diseño experimental clásico. Obviamente, tendríamos que hacer nuevas investigaciones para averiguar cuáles pudieran ser estas variables de efecto favorable. Ningún experimento permite sacar conclusiones definitivas: con resultados como los señalados, estaríamos brincando de alegría y preparándonos para realizar réplicas de este estudio en las más variadas condiciones. Aumentaríamos los sujetos, mejoraríamos las condiciones de muestreo, tomaríamos todas las previsiones para dejar fuera ese efecto de variables exógenas, etc. Sólo después que tuviéramos una docena de repeticiones con resultados similares, nos atreveríamos a decir que tenemos una vacuna que, ….estadísticas de por medio y con alta probabilidad,….. será capaz de atenuar al 50% la intensidad de unos cuántos síntomas (a especificar…) del cuadro del VIH y que, …. en la docena de estudios realizados…. No han aparecido efectos secundarios indeseables…..a pesar de que hemos realizado evaluaciones que hubiesen detectado a una enorme profusión de efectos generalmente asociados al VIH. Adviértase que hablamos en PROBABILIDADES y no en “verdades objetivas”. La droga y su efecto no es una “verdad objetiva”; es una manipulación médica que reduce al 50% la intensidad del 80% (supongamos) de los síntomas conocidos del VIH. Cabe predecir, que lo seguirá haciendo,…mientras los sujetos sean como los de nuestros estudios, las dosis sean producidas y manejadas igual que hicimos nosotros, etc. Ni aún así lograríamos la “verdad segura”; diríamos que el 80% de los enfermos diagnosticados de VIH se beneficia en grado importante con esta vacuna. No sirve para el total de los enfermos,…no reduce a la totalidad de los síntomas,… y está por verse si aparece algún efecto secundario indeseable. Insistimos en que el alumno COMPARE a los anteriores diseños, en términos de su control sobre las fuentes de invalidación, y en términos de lo que habríamos podido concluir si nuestro estudio sobre la droga atenuadora de síntomas VIH, se hubiese llevado a cabo con cada uno de los diseños arriba presentados. Presentaremos a continuación dos diseños más: D) Diseño Experimental de los Cuatro Grupos de Solomon. Se lo representa : R R R R G1 G2 G3 G4 O1 O3 X X O2 O4 O5 O6 Si se observa bien, las primeras dos líneas son exactamente iguales a las del Diseño Experimental Clásico arriba comentado. De manera que este diseño (4 grupos de Solomon) puede ser analizado en términos de qué más que el Experimental Clásico puede ofrecernos… en virtud de sus grupos 3 y 4. Se plantea que los 4 Grupos de Solomon ofrecen dos ventajas sobre el Diseño Experimental Clásico : La primera es que mientras el clásico ofrece dos comparaciones para evaluar el efecto principal, el de Solomon ofrece seis comparaciones. Si el efecto principal se manifiesta en las seis comparaciones posibles, entonces el “hallazgo” de tal efecto queda mucho más sólidamente asegurado que en el Experimental clásico (de aquí se puede deducir las flaquezas…del Experimental clásico….para desmentir cualquier pseudo acusación de “verdad objetiva” mal entendida. ) La segunda ventaja es que el de Solomon permite controlar un efecto de invalidación que el experimental clásico no controla: la Interacción del Tratamiento X con la administración de los instrumentos de medición. Como señalé en algunos ejemplos, (tests de personalidad a los esquizofrénicos) (fascículos de PAA y PSU a quienes van a rendir estas pruebas), la administración de determinados instrumentos de medición puede interactuar con la variable independiente, ya sea acentuándola o inhibiéndola. El esquizofrénico atenúa su problema a partir de su conocimiento de los tests de personalidad, y el alumno que va a la PSU mejora su rendimiento en ésta si se prepara respondiendo muchos facsímiles de la PSU. A veces no se requiere de muchas repeticiones en esto: puede ser suficiente una sola aplicación de un instrumento para que ello incida en la variable medida. Cuando este es el caso, surge la conveniencia de agregar al diseño Experimental clásico los Grupos 3 y 4 del diseño de Solomon. En los 4 de Solomon, al comparar el GR 1 vs Gr 2, podemos tener un fuerte efecto de interacción Tests-Tratamiento invalidando nuestros resultados. Pero al agregar los GR 3 y Gr 4, surgen posibles comparaciones que mejoran la validez de nuestras lecturas y conclusiones. Al comparar O2 vs O5 las diferencias que aparezcan deben ser atribuidas al efecto de administración de Tests. Lo mismo ocurrirá al comparar O4 vs O6 : las posibles diferencias deberán atribuirse a efecto de administración de tests-mediciones. Es decir, LA AUSENCIA DE MEDICIONES PRE-TRATAMIENTO EN LOS GRUPOS 3 Y 4 PERMITE CONTROLAR EL EFECTO DE DICHAS MEDICIONES EN LOS GRUPOS 1 Y 2. Por cierto, tiene sentido multiplicar los grupos y complicar todos los análisis, SOLO ALLI DONDE EXISTAN DUDAS RAZONABLES sobre un posible efecto por administración de tests. El Investigador debe tener buen tino y saber discernir cuándo se justifica entrar en las mayores complejidades y costos de un diseño de 4 Grupos de Solomon, y cuando es absolutamente seguro conformarse con la mayor simplicidad del un diseño Experimental Clásico de solo dos grupos. E) Diseño Cuasi-Experimental de Series Cronológicas Múltiples. Se lo representa : O1 O2 O3 O4 X O5 O6 O7 O8 -----------------------------------------------------------------O1 O2 O3 O4 O5 O6 O7 O8 Se trata de una serie de ocho mediciones-observaciones-registros que se extienden en el tiempo. Entre cada una de las mediciones y la siguiente, puede hacer intervalos iguales, o éstos pueden ser sólo parecidos. Entre las mediciones 4 y 5 aparece la aplicación de un tratamiento. Esa serie de ocho mediciones ha sido aplicada a dos grupos de sujetos que no son equivalentes, es decir, que no han sido asignados a sus dos grupos aleatoriamente (eso es lo que indica la línea de puntos que separa a ambos grupos. La serie de mediciones puede ser mucho mayor ( en el caso del clima, las temperaturas mínimas y máximas se miden todos los días durante años;… si las considerásemos como una serie cronológica de mediciones,…tendríamos miles de mediciones) y puede ser irregular en cuanto a los momentos en que se aplica las mediciones. Idealmente, los Censos son cada diez años, pero en los hechos, no todos nuestros Censos están perfectamente distanciados por diez años, cada uno, del siguiente. Las series temporales son un diseño tan frecuente y útil como los experimentos. Suele usárselas sin el componente experimental del tratamiento intermedio, y con muchas más mediciones. No hay disciplina que no maneje fenómenos que varían día a día, de año en año, y respecto de los cuales hay que tomar decisiones. Estadísticas sanitarias, precio del dólar, ventas al extranjero de productos agrícolas, precio del cobre, casos de virus hanta detectados, accidentes automovilísticos, etc. En este módulo, haremos dos abordajes a las series cronológicas o temporales. Las veremos asociadas a la experimentación, como diseño “cuasi-experimental” (así la representamos arriba), y más adelante, la veremos también como el sólo registro de datos analizables, independientemente de si se quiere manipular variables y ocasionar efectos o si sólo se está siguiendo las fluctuaciones de un fenómeno para estar al tanto de su comportamiento…como puede ser el caso de la actividad sísmica de estas semanas en la undécima región : … no tenemos factores causales que controlar a ese nivel…... Como cuasi-experimento, las series temporales pueden ofrecernos muy diversos resultados. En primer lugar, es posible que el fenómeno ya lleve una cierta tendencia y que la mantenga, independientemente de qué factor causal manipulemos. Puede ocurrir lo contrario, es decir, que la manipulación introducida afecte las tendencias del fenómeno en cualquier sentido. Puede intensificar el fenómeno o atenuarlo. Y lo puede hacer sostenidamente o sólo en el momento de su aplicación. Más aún, el cambio introducido por la manipulación puede tener una duración escasa, tras la cual el fenómeno vuelve a sus tendencias normales, o el impacto puede ser perecedero y mantenerse diríamos que indefinidamente para nuestra percepción. (Véase en Campbell y Stanley , 1973 : pp 78 y siguientes.) El entrenamiento de deportistas, el aprendizaje de los escolares, la rehabilitación de los enfermos, la productividad de una fábrica y muchos otros fenómenos, pueden evaluarse y registrarse como series temporales “de un solo caso”. La idea no es comparar con otros grupos sino evaluar al caso por si mismo, y no desde parámetros externos, sino en referencia a sus propios comportamientos previos y en referencia a lo por ella ambicionado como deseable. ______________________________________________ Donald Campbell & Julian Stanley : (1973) : Diseños Experimentales y Cuasi-experimentales en la investigación social. Editorial Amorrortu, Buenos Aires.