Experimentos. (1) Por Andrés Gacitúa S.

Anuncio
Experimentos. (1) Por Andrés Gacitúa S.
El experimento es quizás la forma más conocida de la investigación científica. Consiste
en un plan de mediciones y manipulaciones de variables que están ordenadas de tal
manera que permiten sacar UNA conclusión clara: la manipulación de la variable
independiente (o tratamiento) , se demuestra, (o no se demuestra,) eficiente para
producir un determinado efecto sobre la variable dependiente. Se trata de estudios de
eficacia causal: se quiere ganar conocimientos sobre la eficacia de ciertos presuntos
factores causales de un determinado fenómeno. El diseño experimental suele ser
bastante seguro, en el sentido de que sus conclusiones son claras y confiables, pero
modesto y tedioso, en el sentido de que obliga a largos procesos de descarte de variables
presuntamente “eficaces” y que no lo son. Hoy tenemos en el SIDA un ámbito en el
que quizás se haya realizado millones de experimentos : ¿ Tiene eficacia causal (de
detención, atenuación, eliminación, alivio de dolores, etc.) del proceso de avance del
SIDA y sus secuelas, la administración de un cierto compuesto farmacológico “x” ?
Aunque existen los “experimentos de campo” y los “experimentos de un solo sujeto”,
por lo general, el Experimento se realiza en condiciones de fuerte control sobre las
variables, lo cual ocurre en Laboratorios, y utilizando dos grupos de unos cuántos
sujetos cada uno.
La representación esquemática de un “diseño experimental clásico” (Campbell y
Stanley) puede dibujarse así:
Grupo
Experimental
Asignación
Aleatoria de Ss
Grupo Control
Medición
Con
Antes
de Tratamiento
Intervención
Experimental
Medición
Sin
Antes
de Tratamiento
Intervención
Experimental
Medición
Después de la
Intervención
Medición
Después de la
Intervención
Más resumidamente, se ha convenido en expresar este diseño de la siguiente manera:
R
GE
GC
01
02
X
03
04
La “X” es el tratamiento experimental que recibe únicamente el Grupo Experimental, y
01, 02, 03 y 04, son las Observaciones o Mediciones a realizar. La numeración de las
Observaciones-Mediciones permite explicar la “lógica” o la “racionalidad” del diseño
experimental .
La R equivale a “ramdom”, aleatoriedad. Se distribuye a los sujetos aleatoriamente al
Grupo Control y al Grupo Experimental; de esa manera, se puede asumir
probabilísticamente, que ambos grupos son iguales, o más bien, que no son
significativamente diferentes. Tenemos entonces dada la posibilidad de comparar a
ambos grupos, sin que ellos puedan diferir sustantivamente uno de otro. La equivalencia
de los grupos crece, cuanto más sujetos se incluye en cada grupo. Si tenemos un
experimento con tres sujetos en el Grupo Experimental y tres sujetos en el Grupo
Control, las garantías de “Aleatoriedad” y de “Equivalencia” de los grupos son
mínimas. En cambio con más de 30 sujetos en cada grupo la aleatoriedad tiene la
capacidad de asegurar fuertemente la equivalencia de los grupos.
La situación de laboratorio permite “controlar variables”. Esto significa, que se tiene
una alta certeza respecto de que la única diferencia que ambos grupos VIVEN EN ESE
AMBIENTE, es la variable experimental que está siendo aplicada como tratamiento al
Grupo Experimental. Por decirlo así, el laboratorio “deja fuera” la posibilidad de que
intervengan otras variables. El Laboratorio es, en consecuencia, un ambiente ideal de
alto control de variables, lo que lo hace distinto de los ambientes naturales-ecológicossociales en los que normalmente viven los individuos, donde miles de variables pueden
estar actuando simultáneamente. (Como reflexión: haga una lista con las variables
causales que podrían afectarlo a Usted en un día en que Usted realiza sus actividades
habituales).
Así, si en un experimento de laboratorio observáramos una diferencia entre los Grupos
Experimental y Control, no podríamos atribuir ese resultado diferencial SINO al
tratamiento experimental, ya que ambos grupos son equivalentes y vivieron
exactamente las mismas situaciones,…salvo por el tratamiento experimental.
Veamos ahora la riqueza de apreciaciones que permite el diseño de las Observaciones y
Mediciones. En primer lugar, la comparación de 01 vs 02 nos permite asegurarnos de
que antes de la aplicación del tratamiento los grupos no son significativamente distintos.
Una vez realizado el Tratamiento Experimental, la comparación 03 vs 01 nos permite
decir si el Grupo Experimental “ganó” algo con motivo de su tratamiento (“Ganar”,
puede ser positivo, como en ganar habilidades, o puede ser negativo como en aumentar
las células cancerígenas en la sangre.) Paralelamente podemos comparar (03 vs 01) y
(04 vs 02); es decir, nos preguntamos si el Grupo Control “ganó” algo en proporciones
comparables a las del grupo experimental. Durante los experimentos, muchas veces
actúan variables que no podemos excluir del proceso por más que queramos. Por
ejemplo, el cansancio, la sed y el hambre son variables que actúan inevitablemente,
cuanto más se alargue la duración del experimento. De similar forma, en experimentos
de larga duración, es inevitable que los niños crezcan y aumenten de peso, que los
viejos envejezcan y pierdan capacidades funcionales. Estas variables “imposibles de
dejar fuera del Laboratorio” son las que en muchos casos producen cambios en el Grupo
Control,…. Que aparentemente no ha recibido tratamiento alguno. En el diseño
experimental clásico hay tres “resultados posibles” de máxima utilidad : a)ambos
grupos se muestran prácticamente iguales en las mediciones previas al tratamiento, y se
muestran bastante distintos después del tratamiento; b)el grupo Experimental muestra
ganancias importantes después-antes; c) las ganancias después-antes (03-01) del grupo
experimental son drásticamente mayores que las del grupo control.
Un buen experimento es el diseño óptimo para determinar eventuales eficacias causales
de una variable sobre otra en cualquier plano. Ciertamente, el diseño no podría ser
bueno para otros propósitos, para los que no está diseñado.
Experimentos (2)
En las dos páginas previas expusimos las ideas básicas sobre lo que es un experimento y
pusimos como ejemplo clave el “diseño experimental clásico” de Campbell. Pero la
verdad es que hay una diversidad de diseños experimentales, algunos incluso más
“poderosos” que el “experimental clásico”, y también hay otros más “débiles”, que por
lo general son llamados pre-experimentales. Mientras sea posible y necesario, por
supuesto, se debe usar el diseño más poderoso, el que ofrece mejores garantías. Pero no
siempre es posible aplicar ciertos diseños…y en muchas ocasiones, debemos
conformarnos con otros diseños que sin ser perfectos, resuelven al menos las principales
necesidades que podamos tener.
Los distintos diseños pre-experimentales, cuasi-experimentales y experimentales
propiamente tales, difieren en su capacidad para controlar las diversas FUENTES DE
INVALIDACION que pudieran afectar a los datos por ellos recopilados.
Las principales Fuentes de Invalidación son :
1. Historia. Cuando entre las mediciones Pre y las Post (Antes-Después) transcurre un
considerable periodo de tiempo (y qué cosa es “considerable” en este sentido, depende
de factores que tienen que ver con cada experimento) , puede perfectamente ocurrir que
los resultados registrados en las mediciones POST no se deban al tratamiento
experimental, sino a OTRAS VARIABLES EXOGENAS AL EXPERIMENTO QUE
ACTUARON COMO VARIABLES INTERVINIENTES SOBRE LOS SUJETOS EN
DICHO PERIODO. Un ejemplo típico. Un psicólogo clínico está realizando una terapia
para alcanzar un buen grado de control de angustia de parte de un paciente suyo. Hizo
mediciones de la capacidad de controlar angustia del paciente al inicio del tratamiento, y
pretende darlo de alta, cuando obtenga mediciones francamente mejores. El tratamiento
se extiende por varios meses, y por desgracia, durante ese tiempo el paciente sufre un
“cogoteo”, tiene un accidente en auto y queda cesante. Al volverse a medir, la
capacidad de controlar angustia está por los suelos: el paciente muestra bastante más
angustia que al iniciar el tratamiento. Factores debidos al transcurso de la “historia”
están causando efectos contrarios a los que quiere alcanzar la terapia. Ciertamente,
también puede ocurrir todo lo contrario: imagínese un tratamiento contra la depresión en
un paciente cesante que ha sido abandonado por su novia…pero un tratamiento muy
malo: ese “terapeuta” en realidad no sabe lo que está haciendo. Tras unos meses de
terapia, el paciente ha superado absolutamente su depresión. ¿Cómo pudo ocurrir
esto?...el paciente volvió con su novia, encontró trabajo, y se sacó el Loto….La historia
también puede deparar factores que contribuyan –incluso más que el tratamiento
experimental- a obtener los resultados deseados.
Por supuesto, no siempre se puede hacer tratamientos tan rápidos que prácticamente no
haya transcurso significativo de tiempo entre las mediciones Pre y las Post. El control
del factor de invalidación “historia” no se consigue abreviando los tratamientos, sino
con el grupo control equivalente. Cuales quiera que sean los fenómenos que tengan
lugar como “historia”, se puede suponer que los mismos afectarán por igual a dos
grupos que han sido constituidos en términos equivalentes. Si nuestro ejemplo del
terapeuta que trata de desarrollar control de angustia en el paciente fuera una
investigación experimental, la solución pudiera ser: a) hacer la terapia con 50 sujetos
que han sido constituidos como GRUPO EXPERIMENTAL. b) constituir un GRUPO
CONTROL EQUIVALENTE con otros sujetos, en todo iguales a los del grupo
experimental, pero que por ahora no recibirán el tratamiento. (Al azar se decide quienes
van a grupo experimental y quienes a grupo control) C) hacer mediciones pre y post
tratamiento para ambos grupos, tal como lo indica el diseño experimental clásico de
Campbell. En estas condiciones, cualquier factor externo –la historia- que pueda afectar
a los sujetos del grupo experimental, debería afectar también a los sujetos del grupo
control.
2) Maduración. La “historia” no sólo es externa al sujeto. También hay un proceso de
“maduración” que podemos entender como “historia interna” de la persona. En este
caso, cualquier “factor interno” como maduración, crecimiento, cansancio, fatiga,
aburrimiento, etc. Cualquier enfermedad fisiológica puede afectar negativamente al
impacto deseado de un tratamiento experimental. Un ejemplo: si se llevara a cabo un
estudio de la auto-imagen que han logrado desarrollar las alumnas de un Quinto Básico
podría registrarse diferencias enormes entre dos grupos de niñas: las que ya han tenido
su primera menstruación, y por ende están acomodando su auto-imagen infantil a otra
mucho más madura, mientras que las niñas que no han tenido aún su menarquia, se ven
sólidamente instaladas en un a auto-imagen que aún tiene muchos rasgos infantiles. Si
el estudio hubiera prescindido del factor maduracional “menarquia”, sus datos estarían
fuertemente viciados: el efecto final de dos grupos extremos, tiene más que ver con la
menarquia que con otros factores incidentes en la autoestima de las niñas.
3) Administración de Tests. El sólo hecho de hacer mediciones, o aplicar una batería
de instrumentos a determinados sujetos, puede afectar fuertemente a aquellas variables
relacionadas con la batería recibida. Un ejemplo clásico son los “facsímiles” de la PAA
y ahora de la PSU. Los alumnos que se entrenan respondiendo docenas y hasta
centenares de facsímiles similares a la prueba definitiva, ven mejoradas sus “aptitudes
académicas”, por un “tratamiento” que supuestamente, no es tratamiento sino una
medición. Algunos esquizofrénicos inteligentes, a fuerza de que les pasen tests de
personalidad una y otra vez, “se aprenden las buenas respuestas” y son capaces de
“simular normalidad” a pesar de padecer severas esquizofrenias.
4) Regresión : se llama “regresión estadística” a un efecto que consiste en que, cuando
se trabaja con grupos que están en los valores extremos de una cierta variable,
independientemente del tratamiento que se les aplique, e incluso sin que se les aplique
tratamiento alguno, las mediciones POST tienden a ser más moderadas y “centrales”
que las que tuvieron al inicio del estudio. Esto ocurre por simple probabilidad.
Supongamos que queremos probar la eficacia un tratamiento contra la depresión, pero
tenemos el problema de que tememos que el tipo de terapia a aplicar pudiera ocasionar
efectos secundarios indeseables. En una decisión poco afortunada, pudiéramos elegir
trabajar con dos grupos de sujetos: un grupo integtrado por sujetos INTENSAMENTE
DEPRESIVOS y el otro integrado por sujetos que CARECEN DEL MÁS MÍNIMO
INDICADOR DE DEPRESIÓN. La idea es que si hay “efectos secundarios” de esta
terapia, ellos deben actuar sobre el grupo no-depresivo, tanto como sobre el grupo de los
depresivos.
Por simple probabilidad, un grupo que ya es severamente depresivo muy difícilmente
pueda intensificar aún más sus niveles de depresión, porque ya está en el extremo de la
máxima depresión imaginable; lo más probable es que en algunos de sus sujetos, ocurra
la “remisión espontánea de síntomas” y en una segunda evaluación, tengan puntajes
correspondientes a menores grados de depresión: se mejoraron solos. Por su parte, el
grupo de los que no tienen “nada” de depresión, no pueden alejarse más de la depresión,
porque ya están en el extremo más distante de dicha condición. En cambio, pudiera
ocurrir que a algunos integrantes de este grupo les ocurrieran accidentes, infortunios,
etc.,….que los acercaran en parte hacia la depresión: se “enfermaron” solos.
5) Mortalidad y Selectividad. A lo largo de una investigación, y cuanto más larga
peor, se corre el riesgo de que los grupos o muestras de sujetos varíen entre las
mediciones iniciales y las finales. En el caso extremo, la gente muere. Más suavemente,
algunas personas se aburren de participar en experimentos y desertan, otras veces
carecen de dinero para asistir diariamente a los tratamientos, y también desertan.
Ocurren así ciertas anomalías. A) Si queremos comparar en un mismo grupo las
mediciones Pre con las Post, cometemos un cierto error, porque el grupo ya no es el
mismo que partió en el estudio. Se ha modificado. B) Las modificaciones que sufre un
grupo por causa de “mortandad muestral” de sujetos, casi nunca son aleatorias. Más
bien ocurre que son factores muy precisos los que llevan a la deserción de ciertos
sujetos. Pueden desertar…los que no tienen dinero para locomoción, así como los que
tienen pasajes comprados para irse de vacaciones al extranjero. La mortandad de
semejante “muestra” sería muy selectiva: nos estaríamos quedando con grupos que
pierden a los sectores de mayores y menores ingresos, para quedarnos en definitiva sólo
con una clase “media” que puede pagar su locomoción, que no le alcanza para
vacacionar en el extranjero.
También puede ocurrir –en términos de selectividad- exactamente lo contrario de la
mortalidad, o si se quiere, una especie de “mortalidad positiva”. En las universidades
se suele investigar con estudiantes que se prestan voluntariamente para participar en los
experimentos. El punto está en que estos “voluntarios” pueden no representar al resto
de sus compañeros, y en esa medida, no se puede considerar a los resultados que se
obtenga como representativos o generalizables a toda esa población estudiantil. Esto es
típico de estudios donde el componente “valórico” y el “desplante” personal pesan muy
decisivamente. Imagínese un estudio realizado para detectar y evaluar el
comportamiento sexual de los alumnos del primer año de cualquier universidad. Se
pide voluntarios; ¿Quiénes cree Usted que se presentarán…? Serán voluntarios para
este estudio sólo algunos estudiantes, por ejemplo, los que llevan una vida sexual
estable desde hace varios años, y que ya no tienen problema alguno en hablar de eso; en
cambio, aquellos alumnos que no tengan experiencia sexual alguna pudieran
avergonzarse de esta situación y por ello, no se ofrecerían como voluntarios. Es de
suponer que gays y lesbianas tendrían buenas razones para no ofrecerse como
voluntarios, etc. El efecto actúa no sólo en el momento en que se ofrecen los
voluntarios. Una vez constituidos los grupos, es evidente que habrá personas más
pudorosas y recatadas que otras, que apenas se atreverán a describir sus prácticas
sexuales; en el otro extremo, quizás tengamos a locuaces Don Juanes y Quintralas, que
hablarán hasta por los codos de prácticas que no necesariamente han vivido
personalmente.
Los grupos estudiados pueden variar a lo largo de una investigación. Pueden “morir” los
que no logran costear la movilización, tanto como los que se van de vacaciones, y
pueden auto-seleccionarse positivamente para participar en ciertos estudios, otros
sujetos cuya motivación para permanecer en los estudios puede obedecer a las más
disímiles razones. Mortandad-Selectividad hacen incomparables a las mediciones Pre y
Post porque los grupos han cambiado. Si hay diferencias en las mediciones, ellas
pueden deberse a los factores de mortandad y selectividad, y no a los del tratamiento
experimental.
Ahora podemos volver a hablar de la LOGICA que subyace a los experimentos. Todo
experimento quiere resultados válidos. Se eligirá los diseños pre- cuasi y
experimentales, con el criterio de que nos brinden las mejores garantías de validez.
Usted puede revisar en Campbell y Stanley (1973) muchos más factores de invalidación
que los aquó mencionados, y puede revisar muchos más diseños que los que aquí hemos
descrito.
A la luz de lo anterior, comparemos ahora algunos diseños típicos.
A) Estudio de Caso con medición post solamente.
Se representa:
X…..O .
Se aplica un tratamiento experimental (X) y se mide el efecto al concluir el tratamiento
(O). Es un diseño insolvente, absolutamente ingenuo, que no merece el nombre de
investigación seria. Pueden ocurrir dos cosas: a) Lo que se observa tras el tratamiento
no fue producido por éste sino por otros factores de “historia”, “maduración”,
“regresión” o “mortalidad-selectividad”. b) Lo que se observa al final ( O ), puede
representar un estado de cosas PEOR de lo que había antes del tratamiento. Es decir, el
diseño no nos permite averiguar si el efecto del tratamiento MEJORA O EMPEORA el
fenómeno al que se lo aplica, ni tampoco si lo causó mi tratamiento u otros factores de
los que no tengo registro.
B) Diseño PRE-Experimental con PRE y POST en un solo grupo.
Se representa :
O1
X
O2
Es muy similar al anterior, pero esta vez existe una medición previa al tratamiento. Ella
nos permite comparar las mediciones PRE y POST, lo que a su vez, nos dirá si el efecto
es de MEJORA o de EMPEORAMIENTO. Sin embargo, subsiste un severo descontrol
de muchas fuentes de invalidación posibles. En particular, no puedo saber si el efecto
fue causado por mi tratamiento experimental, o si el mismo es producto de la
intervención de otras variables exógenas no controladas. Historia, Maduración,
Regresión, Mortandad y Selectividad Muestral, etc., me pueden estar engañando
severamente en mi interpretación de los resultados,… si atribuyo éstos a mi tratamiento
experimental .
C) Diseño Experimental Clásico.
Se representa :
R
R
GE
GC
O1
O3
X
O2
O4
Este diseño asigna aleatoriamente (R = ramdom) los sujetos a los grupos; de donde cabe
esperar que no difieran significativamente, si la cantidad de sujetos se vuelve
importante. (Si sólo tenemos 4 sujetos, decir que los ponemos en los grupos “al azar” es
casi un mal chiste; en cambio, con 50 sujetos en cada grupo, el azar realmente tiene la
oportunidad de garantizarnos que los grupos no son significativamente distintos.)
Constituidos por azar los grupos Experimental y Control, se aplica la medición PRE a
ambos grupos ( O1 y O3) , se aplica el Tratamiento Experimental (X) sólo al grupo
experimental, y se vuelve a aplicar medición POST a ambos grupos una vez concluido
el tratamiento experimental.(O2 y O4).
Si comparamos con los diseños previos, ahora tenemos: a) que podemos averiguar si los
tratamientos causan efectos de MEJORA O DE EMPEORAMIENTO; B) también
podemos saber si los efectos se deben a nuestro tratamiento experimental o a otras
variables. Sabemos esto, porque si han actuado OTRAS VARIABLES ellas tendrían
que haber afectado por igual al grupo experimental y al control; en cambio, si el efecto
se debe al tratamiento experimental, O2 tiene que superar en grado importante a O4.
Supongamos que nuestro experimento clásico se propone evaluar la eficacia de una
droga contra el SIDA en la atenuación de los síntomas que padecen quienes
manifiestan claramente su VIH. Tenemos una escala que mide INTENSIDAD DE LOS
SINTOMAS en valores que van desde 01 hasta 100, siendo 100 el extremo de máxima
intensidad, y 01 aquel en que la manifestación de los síntomas es prácticamente
indetectable a causa de su mínima intensidad posible de registrar. En este contexto,
supongamos que las mediciones son:
PRE
R
R
Grupo
EXPERIMENTAL
80
Grupo
CONTROL
78
X
POST
GANANCIA
40
40 PTS
65
13 PTS
Hagamos una lectura en varios puntos:
a) La asignación aleatoria de sujetos a los grupos nos ha constituido, efectivamente, dos
grupos equivalentes: entre 78 y 80 puntos no hay una diferencia inicial significativa.
b) El grupo Experimental muestra una enorme ganancia: la intensidad con que se
manifiestan los síntomas VIH ha bajado a la mitad de lo que era antes de la droga
experimental.
c) El Grupo Control, aunque en bastante menor grado, muestra también una cierta
reducción en la intensidad con que se manifiestan sus síntomas; la ganancia, en todo
caso, tendría que ser analizada, ya que pudiera no ser estadísticamente significativa.
d) La ganancia de 40 puntos por el Grupo Experimental, supera ampliamente a la
ganancia del Grupo Control. Es decir, el efecto puede ser atribuido a nuestra droga
experimental, EN UNA BUENA MEDIDA.
e) La ganancia del Grupo Control, si resulta significativa estadísticamente, nos estaría
señalando que en el efecto final participan algunas variables que no fueron consideradas
en nuestro diseño experimental clásico. Obviamente, tendríamos que hacer nuevas
investigaciones para averiguar cuáles pudieran ser estas variables de efecto favorable.
Ningún experimento permite sacar conclusiones definitivas: con resultados como los
señalados, estaríamos brincando de alegría y preparándonos para realizar réplicas de
este estudio en las más variadas condiciones. Aumentaríamos los sujetos, mejoraríamos
las condiciones de muestreo, tomaríamos todas las previsiones para dejar fuera ese
efecto de variables exógenas, etc. Sólo después que tuviéramos una docena de
repeticiones con resultados similares, nos atreveríamos a decir que tenemos una vacuna
que, ….estadísticas de por medio y con alta probabilidad,….. será capaz de atenuar al
50% la intensidad de unos cuántos síntomas (a especificar…) del cuadro del VIH y que,
…. en la docena de estudios realizados…. No han aparecido efectos secundarios
indeseables…..a pesar de que hemos realizado evaluaciones que hubiesen detectado a
una enorme profusión de efectos generalmente asociados al VIH. Adviértase que
hablamos en PROBABILIDADES y no en “verdades objetivas”. La droga y su efecto
no es una “verdad objetiva”; es una manipulación médica que reduce al 50% la
intensidad del 80% (supongamos) de los síntomas conocidos del VIH. Cabe predecir,
que lo seguirá haciendo,…mientras los sujetos sean como los de nuestros estudios, las
dosis sean producidas y manejadas igual que hicimos nosotros, etc.
Ni aún así
lograríamos la “verdad segura”; diríamos que el 80% de los enfermos diagnosticados de
VIH se beneficia en grado importante con esta vacuna. No sirve para el total de los
enfermos,…no reduce a la totalidad de los síntomas,… y está por verse si aparece algún
efecto secundario indeseable.
Insistimos en que el alumno COMPARE a los anteriores diseños, en términos de su
control sobre las fuentes de invalidación, y en términos de lo que habríamos podido
concluir si nuestro estudio sobre la droga atenuadora de síntomas VIH, se hubiese
llevado a cabo con cada uno de los diseños arriba presentados.
Presentaremos a continuación dos diseños más:
D) Diseño Experimental de los Cuatro Grupos de Solomon.
Se lo representa :
R
R
R
R
G1
G2
G3
G4
O1
O3
X
X
O2
O4
O5
O6
Si se observa bien, las primeras dos líneas son exactamente iguales a las del Diseño
Experimental Clásico arriba comentado. De manera que este diseño (4 grupos de
Solomon) puede ser analizado en términos de qué más que el Experimental Clásico
puede ofrecernos… en virtud de sus grupos 3 y 4.
Se plantea que los 4 Grupos de Solomon ofrecen dos ventajas sobre el Diseño
Experimental Clásico : La primera es que mientras el clásico ofrece dos comparaciones
para evaluar el efecto principal, el de Solomon ofrece seis comparaciones. Si el efecto
principal se manifiesta en las seis comparaciones posibles, entonces el “hallazgo” de tal
efecto queda mucho más sólidamente asegurado que en el Experimental clásico (de aquí
se puede deducir las flaquezas…del Experimental clásico….para desmentir cualquier
pseudo acusación de “verdad objetiva” mal entendida. ) La segunda ventaja es que el de
Solomon permite controlar un efecto de invalidación que el experimental clásico no
controla: la Interacción del Tratamiento X con la administración de los instrumentos de
medición.
Como señalé en algunos ejemplos, (tests de personalidad a los esquizofrénicos)
(fascículos de PAA y PSU a quienes van a rendir estas pruebas), la administración de
determinados instrumentos de medición puede interactuar con la variable independiente,
ya sea acentuándola o inhibiéndola. El esquizofrénico atenúa su problema a partir de
su conocimiento de los tests de personalidad, y el alumno que va a la PSU mejora su
rendimiento en ésta si se prepara respondiendo muchos facsímiles de la PSU. A veces
no se requiere de muchas repeticiones en esto: puede ser suficiente una sola aplicación
de un instrumento para que ello incida en la variable medida. Cuando este es el caso,
surge la conveniencia de agregar al diseño Experimental clásico los Grupos 3 y 4 del
diseño de Solomon.
En los 4 de Solomon, al comparar el GR 1 vs Gr 2, podemos tener un fuerte efecto de
interacción Tests-Tratamiento invalidando nuestros resultados. Pero al agregar los GR 3
y Gr 4, surgen posibles comparaciones que mejoran la validez de nuestras lecturas y
conclusiones. Al comparar O2 vs O5 las diferencias que aparezcan deben ser atribuidas
al efecto de administración de Tests. Lo mismo ocurrirá al comparar O4 vs O6 : las
posibles diferencias deberán atribuirse a efecto de administración de tests-mediciones.
Es decir, LA AUSENCIA DE MEDICIONES PRE-TRATAMIENTO EN LOS
GRUPOS 3 Y 4 PERMITE CONTROLAR EL EFECTO DE DICHAS MEDICIONES
EN LOS GRUPOS 1 Y 2.
Por cierto, tiene sentido multiplicar los grupos y complicar todos los análisis, SOLO
ALLI DONDE EXISTAN DUDAS RAZONABLES sobre un posible efecto por
administración de tests. El Investigador debe tener buen tino y saber discernir cuándo se
justifica entrar en las mayores complejidades y costos de un diseño de 4 Grupos de
Solomon, y cuando es absolutamente seguro conformarse con la mayor simplicidad del
un diseño Experimental Clásico de solo dos grupos.
E) Diseño Cuasi-Experimental de Series Cronológicas Múltiples.
Se lo representa :
O1 O2 O3 O4 X
O5 O6 O7 O8
-----------------------------------------------------------------O1 O2 O3 O4
O5 O6 O7 O8
Se trata de una serie de ocho mediciones-observaciones-registros que se extienden en el
tiempo. Entre cada una de las mediciones y la siguiente, puede hacer intervalos iguales,
o éstos pueden ser sólo parecidos. Entre las mediciones 4 y 5 aparece la aplicación de
un tratamiento.
Esa serie de ocho mediciones ha sido aplicada a dos grupos de sujetos que no son
equivalentes, es decir, que no han sido asignados a sus dos grupos aleatoriamente (eso
es lo que indica la línea de puntos que separa a ambos grupos.
La serie de mediciones puede ser mucho mayor ( en el caso del clima, las temperaturas
mínimas y máximas se miden todos los días durante años;… si las considerásemos
como una serie cronológica de mediciones,…tendríamos miles de mediciones) y puede
ser irregular en cuanto a los momentos en que se aplica las mediciones. Idealmente, los
Censos son cada diez años, pero en los hechos, no todos nuestros Censos están
perfectamente distanciados por diez años, cada uno, del siguiente.
Las series temporales son un diseño tan frecuente y útil como los experimentos. Suele
usárselas sin el componente experimental del tratamiento intermedio, y con muchas más
mediciones. No hay disciplina que no maneje fenómenos que varían día a día, de año en
año, y respecto de los cuales hay que tomar decisiones. Estadísticas sanitarias, precio
del dólar, ventas al extranjero de productos agrícolas, precio del cobre, casos de virus
hanta detectados, accidentes automovilísticos, etc. En este módulo, haremos dos
abordajes a las series cronológicas o temporales. Las veremos asociadas a la
experimentación, como diseño “cuasi-experimental” (así la representamos arriba), y
más adelante, la veremos también como el sólo registro de datos analizables,
independientemente de si se quiere manipular variables y ocasionar efectos o si sólo se
está siguiendo las fluctuaciones de un fenómeno para estar al tanto de su
comportamiento…como puede ser el caso de la actividad sísmica de estas semanas en la
undécima región : … no tenemos factores causales que controlar a ese nivel…...
Como cuasi-experimento, las series temporales pueden ofrecernos muy diversos
resultados. En primer lugar, es posible que el fenómeno ya lleve una cierta tendencia y
que la mantenga, independientemente de qué factor causal manipulemos. Puede ocurrir
lo contrario, es decir, que la manipulación introducida afecte las tendencias del
fenómeno en cualquier sentido. Puede intensificar el fenómeno o atenuarlo. Y lo puede
hacer sostenidamente o sólo en el momento de su aplicación. Más aún, el cambio
introducido por la manipulación puede tener una duración escasa, tras la cual el
fenómeno vuelve a sus tendencias normales, o el impacto puede ser perecedero y
mantenerse diríamos que indefinidamente para nuestra percepción. (Véase en Campbell
y Stanley , 1973 : pp 78 y siguientes.)
El entrenamiento de deportistas, el aprendizaje de los escolares, la rehabilitación de los
enfermos, la productividad de una fábrica y muchos otros fenómenos, pueden evaluarse
y registrarse como series temporales “de un solo caso”. La idea no es comparar con
otros grupos sino evaluar al caso por si mismo, y no desde parámetros externos, sino en
referencia a sus propios comportamientos previos y en referencia a lo por ella
ambicionado como deseable.
______________________________________________
Donald Campbell & Julian Stanley : (1973) : Diseños Experimentales y Cuasi-experimentales en la investigación
social. Editorial Amorrortu, Buenos Aires.
Descargar