MÓDULO 0614 - METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 1 INDICE UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA Lectura 2 Quera, V. y Behar, J. (1997). La observación. En G. Buela y J. Sierra (dirs.). Manual de Evaluación Psicológica. Madrid: Siglo XXI. (Cáp. 15). LA OBSERVACIÓN.......................................................................2 Definición y características de la metodología observacional ...2 Codificación de la conducta.......................................................3 Elección de las conductas a observar....................................4 Unidades conductuales..........................................................4 Sistemas de categorías..........................................................5 Recogida de datos observacionales..........................................6 Medidas conductuales ...........................................................6 Muestreo observacional y sesiones de observación..............7 Reglas de muestreo intrasesional de sujetos y reglas de registro ...................................................................................9 Obtención de medidas conductuales a partir del registro ....11 Control de la calidad de los datos............................................12 Fiabilidad..............................................................................12 Precisión ..............................................................................14 Validez .................................................................................14 Sesgos del observador y de la observación ........................14 Clases de análisis de datos .....................................................16 Áreas de aplicación de la metodología observacional.............17 UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA LA OBSERVACIÓN Definición y características de la metodología observacional En psicología existen áreas de estudio en las que el comportamiento de los sujetos no puede investigarse mediante ninguna de las estrategias tradicionales, como las metodologías experimental y selectiva o correlacional, sino que únicamente es accesible a través de la observación. Esto es así porque la observación sistemática es una estrategia científica que permite cuantificar la conducta espontánea de los sujetos en el momento en que se produce y en su entorno natural, sin introducir elementos de distorsión (Hutt y Hutt, 1970; Sackett, Ruppenthal y Gluck, 1978). Las características fundamentales de la metodología observacional son (Wright, 1960; Weick, 1968; Anguera, 1981, 1985; McRae, 1995; Bakeman, 1997; Bakeman y Gottman, 1997): 1. Se aplica al estudio del comportamiento espontáneo, por lo que no existe una manipulación de variables con el propósito de averiguar cómo afectan al comportamiento. Por el contrario se registran, de un modo controlado, los valores de las variables, tanto ambientales como conductuales, y a continuación se analizan sus covariaciones. La ausencia de manipulación garantiza que no existe distorsión en el comportamiento registrado. 2. Se emplean observadores adiestrados que registran la conducta en el momento en que se produce, y lo hacen ciñéndose a unos códigos conductuales que han sido definidos de forma objetiva por el investigador, y siguiendo unas reglas de registro y de muestreo determinadas. 3. Los observadores son entrenados periódicamente y se controla la calidad de los datos que obtienen mediante técnicas de análisis de la fiabilidad y la precisión de sus registros. 4. El investigador o investigadores dirigen y planifican el estudio, pero no actúan como observadores. Los observadores son 2 personas adiestradas en ese fin concreto, a las que no se les suministra información acerca de las hipótesis y los objetivos de la investigación, con el propósito de evitar o minimizar sus expectativas, que falsearían, los datos obtenidos. 5. Debe evitarse o reducirse el intrusismo del observador con el fin de que ello no provoque reactividad en el comportamiento de los sujetos observados, y su consecuente falta de espontaneidad. 6. Permite estudiar conductas que no sería ético provocar (por ejemplo, el pánico). 7. Puesto que el interés del investigador consiste en averiguar qué covariaciones existen entre el comportamiento y las variables externas a él, o entre diferentes tipos de comportamiento, es necesario que en los datos se refleje una amplia heterogeneidad de variables conductuales, aspecto que sólo es posible lograr obteniendo muchos datos de cada sujeto, es decir, observándolo durante largo tiempo. Los datos obtenidos al aplicar la metodología observacional pueden analizarse de muy diversas formas, siempre de acuerdo a las hipótesis y los objetivos prefijados; sin embargo, debido a que estos datos tienen la forma de secuencias temporales, un tipo de análisis idóneo es el llamado "análisis secuencial", que permite averiguar cuál es la dinámica temporal del comportamiento. La metodología observacional se aplica muchas veces en investigaciones de corte inductivo, y, por lo tanto, no basadas en teorías. Ello ha alimentado la creencia errónea de que la observación sistemática sólo debe emplearse en ausencia de hipótesis concretas. No obstante, la metodología observacional no es intrínsecamente inductiva, como tampoco la experimentación es intrínsecamente hipotético-deductiva. Sea cual sea la forma de proceder (inductiva o deductiva), el investigador observacional plantea objetivos y establece conjeturas acerca de qué espera encontrar en los datos. Si estas conjeturas se derivan de una teoría por deducción lógica, entonces se denominan, con todo rigor, hipótesis. Si se establecen sin que exista una teoría previa, basándolas, por UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA ejemplo, en resultados de investigaciones anteriores, entonces pueden denominarse también hipótesis, con menos rigor, o simplemente conjeturas, lo cual no comporta que la investigación se deprecie o sea de rango menor. En cualquier caso, cada hipótesis que se plantea en la metodología observacional relaciona, como toda hipótesis, al menos dos variables totalmente operativizadas. En esta disciplina las variables que se utilizan son de tres tipos (Johnston y Pennypacker, 1980): 1. Variables conductuales. Son códigos conductuales que toman dos valores, presencia y ausencia, y que el observador asigna a los segmentos de conducta del sujeto observado (Sackett y cols., 1978). Cada código es un tipo de conducta que el investigador ha definido de modo objetivo de acuerdo con los fines de su investigación. A lo largo de una sesión de observación se espera que cada uno de los códigos presente variabilidad. 2. Variables ambientales. Son propiedades susceptibles de evaluación del entorno natural de los sujetos observados, que el investigador considera que pueden estar relacionadas con su comportamiento (por ejemplo, la presencia o la ausencia del maestro cuando se estudia la conducta de un alumno durante un examen). 3. Variables de sujeto. Son atributos de los sujetos observados que no sufren variabilidad intrasujeto ni pueden ser alterados durante la investigación (por ejemplo, la edad, las variables de personalidad o el sexo). Como mínimo una de las variables entre las cuales se establece relación en las hipótesis debe ser una variable conductuyal. Por ejemplo: 1. «¿Lloran más los bebés de madres primíparas que los de madre; ras?». Una variable conductual, "el bebé llora", y una variable del sujeto "primiparidad". 2. «¿Disminuye la probabilidad de que el bebé llore después de que hable?». Dos variables conductuales, «el bebé llora» y «la madre «¿La disminución de la probabilidad de que el bebé llore después la madre le hable es mayor cuando el 3 padre está ausente que cuando está presente?». Las mismas variables conductuales que en el ejemplo anterior, más una variable ambiental, "presencia del padre". Es necesario que todas las variables estén operativizadas, lo que implica medibles de forma totalmente objetiva. Por lo tanto, es de capital importa las variables o códigos conductuales que se emplean en la investigación estés dos de manera que los observadores no puedan efectuar interpretaciones su o idiosincrásicas de las mismas. Ello requiere una especial atención cuando son de naturaleza molar e inferencial (por ejemplo, códigos como "agrede", etc.). Por tanto, la codificación de la conducta a observar etapa no sólo necesaria sino crucial en cualquier investigación observacional, Io que, junto con los observadores entrenados, constituye el instrumento de medí la metodología observacional (Bebas; 1991). Codificación de la conducta La metodología observacional debe enfrentarse a un material de enorme complejidad, la conducta, que es preciso acotar y cuantificar. Cualquier intento por alcanzar un conocimiento objetivo de la conducta debe pasar, como en toda ciencia, por obtención de unidades definibles y diferenciables. Si, con objeto de obtener datos sobre la conducta, se realizan únicamente observaciones no estructuradas; procediendo simplemente a anotar los eventos que se suceden, y utilizando para ello el lenguaje habitual, es muy difícil captar la estructura de la conducta o establecer relación entre diversos aspectos de la misma. Por esta razón es necesario, para conseguir una información objetiva y cuantificada de la conducta, ajustarse a ciertas normas y, de este modo, la elaboración de un sistema de categorías de conducta es una fase fundamental. En este apartado se trata de cómo transformar el flujo conductual en datos objetivos a partir de los cuales sea posible contrastar las hipótesis o conjeturas. UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA Elección de las conductas a observar La cuestión ¿qué es lo que deseamos conocer, cuál es el problema planteado? lleva a delimitar ciertos aspectos del flujo conductual, a elegir unas partes de un todo; en definitiva, a realizar un muestreo conductual. Una vez concretado el objetivo, un primer paso aconsejable es proceder a una observación no sistemática de la conducta (León y Montero, 1995). En esta etapa el observador no realiza ningún control y se limita a recoger aquello que considera relevante para posibilitar la diferenciación de unos eventos de otros, y estimar cuáles guardan relación con las preguntas plantea-das. Sin esta precisión, y ante la duda de lo que es realmente importante, se recogería un número excesivo de datos que en realidad no guardarían relación con el objeto de la investigación. Esta fase de observación preliminar, cuyos datos no deben incluirse en el análisis final, proporciona material en bruto para plantearse cuestiones y formular hipótesis y asimismo facilita una aproximación a la conducta objeto de estudio que resulta imprescindible para proceder posteriormente a la codificación de la misma (Martin y Bateson, 1986). Los datos obtenidos en esta primera fase presentan las características de un sistema verbal (Fassnacht, 1982), con signos propios del lenguaje y con una relación entre los signos correspondiente a la sintaxis. El uso del lenguaje cotidiano en el registro y la ausencia de cualquier tipo de norma o limitación en cuanto a qué registrar y cómo registrarlo implica: 1. Subjetividad en la elección de las conductas a observar. 2. No comparabilidad de los registros de observadores distintos, ya que pueden estar utilizando expresiones diferentes para describir una misma realidad. 3. Dificultad en la cuantificación. Desde una perspectiva histórica los sistemas verbales fueron los primeros en ser utilizados en la observación, en una época en que la metodología observacional carecía de la entidad actual. En la actualidad, los sistemas verbales son una forma de registro inicial y casi imprescindible en toda investigación 4 observacional, pues facilitan un primer abordaje de las conductas que serán objeto de estudio. Unidades conductuales El material obtenido a partir de la observación no sistemática debe ser estudiado y analizado con objeto de segmentar el flujo conductual y obtener así las unidades conductuales. Esta segmentación no puede ser arbitraria y debe apoyarse en determinados indicios. Existen diversos indicadores de segmentación en función de distintos criterios. Sulzer-Azarof y Reese (1982) proponen analizar las tareas y subdividirlas en diversos componentes o segmentos. Por ejemplo, la tarea "conducir un automóvil" podría subdividirse en los componentes: abrir la puerta, sentarse, cerrar la puerta, abrocharse el cinturón de seguridad, poner la llave de contacto, etc. Rosenblum (1978) sugiere tener en cuenta dos dimensiones: un cambio marcado en la intensidad motriz y un cambio en la orientación del sujeto durante la conducta. En el segundo criterio considera también la existencia de contacto con un objeto, ya sea inanimado o social. El tamaño de las unidades, es decir, su molaridad o molecularidad, viene también dictado en cierta medida por el objetivo de la investigación. Por ejemplo, si se desean estudiar las pautas motrices del recién nacido se impondrán de forma natural unidades moleculares que recojan con el mayor detalle posible los diversos movimientos que los bebés sean capaces de realizar. En cambio, en una investigación sobre habilidades sociales las unidades deberían reflejar conductas de mayor complejidad, que, al incluir diversos segmentos conductuales, implican mayor molaridad. Sin embargo, a pesar de esta determinación inicial, el investigador toma su propia decisión sobre el tamaño de las unidades a utilizar, y, aun respetando la orientación derivada del objetivo de la investigación, marca el grado de molaridad o de molecularidad. De este modo, en sistemas de codificación empleados para captar la interacción en la pa-reja es posible hallar desde sistemas como el MICS-III (Weiss,1985), con unidades de relativa molaridad, hasta otros como el DCS (Julien y cols., 1989), en el que cada unidad abarca UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 20 minutos. Si, por el carácter exploratorio del trabajo, los objetivos no están claramente definidos, es preferible codificar conductas moleculares y, posteriormente y si se considera oportuno, combinarlas para conseguir unidades molares. Por otra parte, en función de su contenido las unidades pueden clasificarse en estructurales (o morfológicas) y funcionales. Las primeras corresponden a localizaciones concretas en el dominio espacio-temporal (Schleidt, 1982). Por ejemplo, "dar patadas": golpe dado con la planta del pie; "acariciar", rozar suavemente alguna parte del cuerpo del otro con la mano. En estas unidades se realiza una descripción por operación. Las unidades funcionales se definen por las consecuencias que producen en el entorno físico o social, es decir, no por los movimientos que componen las acciones sino por los productos de dichas acciones. Se trata de descripciones por con-secuencia; por ejemplo, "coser un vestido", "escribir un libro" o "hacer un programa de radio". Sean de uno u otro tipo, las unidades de conducta deben definirse de forma objetiva y completa. Objetiva, utilizando en la definición características observables de la conducta y evitando en todo momento cualquier tipo de interpretación; y completa, precisando los límites de la unidad, para de este modo facilitar la discriminación entre las diversas unidades. En la definición deben emplearse expresiones claras y sencillas que eviten la ambigüedad. De acuerdo con su duración, las unidades de conducta se consideran eventos cuando son segmentos de duración muy pequeña, o menor que la unidad de tiempo fijada por el investigador, y se consideran estados cuando su duración es mayor que esa unidad. En general, son eventos todos aquellos segmentos que son transitorios (por ejemplo, "levantar las cejas", "salir de casa", "sentarse"), y estados, todos aquellos segmentos que representan una permanencia (por ejemplo, "dormir", "estar sentado", "llorar"). Sistemas de categorías Las unidades de conducta deben articularse en un sistema o conjunto de manera que resulten claras las relaciones 5 conceptuales entre ellas; asimismo, es aconsejable en ocasiones establecer separaciones temporales disyuntivas entre las unidades. Estas relaciones entre unidades de conducta son la mutua exclusividad y la exhaustividad. Un conjunto cíe unidades mutuamente excluyentes entre sí (tanto conceptual como temporalmente) y además exhaustivas (como mínimo conceptualmente) se denomina sistema de categorías de conducta. Un sistema de categorías es un sistema nominal (Passnacht, 1982). Un conjunto de unidades en las que no exista exclusividad mutua entre todas ellas y/o no sean conceptualmente exhaustivas recibe a veces el nombre de sistema de rasgos distintivos. Mientras que un sistema de categorías es cerrado, un sistema de rasgos distintivos puede considerarse abierto o incompleto. Definir sistemas de categorías es de especial utilidad, pues facilita el trabajo observar y registrar en vivo y permite llevar a cabo más cómodamente determinados análisis de los datos. Cuando las unidades de conducta son categorías, registrar una de ellas hace imposible registrar otra simultáneamente. Asimismo, siempre existirá una categoría para registrar los segmentos conductuales relacionados con el objetivo de la investigación, ya que el sistema debe ser conceptualmente exhaustivo. Es también posible, pero no siempre necesaria, la exhaustividad temporal. En cada categoría es posible diferenciar un núcleo conceptual y un nivel de plasticidad o grado de apertura (Anguera, 1991). El núcleo conceptual de una categoría está compuesto por los elementos comunes que existen en los diversos segmentos conductuales que son clasificados en la misma. Este núcleo confiere significado a la categoría y la identifica y diferencia respecto a otras categorías. El nivel de plasticidad o grado de apertura de una categoría es el grado de diversidad de los diferentes segmentos conductuales adscritos a ella. Si tras poner a prueba el sistema de categorías se verifica que éste no cumple los requisitos de exhaustividad conceptual y de mutua exclusividad de las categorías, es posible reelaborar el sistema hasta conseguirlo. De este modo, si se produce coocurrencia entre dos categorías (ausencia de exclusividad) cabe recurrir a dos procedimientos: UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 1. Establecer prioridades. Si dos unidades de conducta tienden a ocurrir simultáneamente, entonces se establece cuál de ellas debe registrarse, en detrimento de la otra; ello supone una pérdida de información. 2. Crear una nueva categoría. Se mantienen ambas categorías en el sistema, y se define una nueva categoría por agrupación de las dos, lo que implica un incremento de la información. 6 Quera, 1995a). Por lo tanto, no siempre puede considerarse indispensable imponer la restricción de mutua exclusividad temporal cuando es claro que el fenómeno conductual que se investiga puede analizarse con mayor profundidad empleando unidades de conducta que se solapan temporalmente. Recogida de datos observacionales Medidas conductuales Si el problema es de falta de exhaustividad, cabe recurrir a: 1. Creación de categorías vacías, que recogerán las ocurrencias de segmentos conductuales que se consideran irrelevantes y que son excluyentes con el resto de las categorías. 2. Creación de categorías "cajón de sastre", que incluirán segmentos heterogéneos que, aun guardando relación con el objetivo de la investigación, ocurren raras veces y son poco importantes para el objetivo de la investigación. Utilizar sistemas de categorías es especialmente aconsejable cuando la observación ha de realizarse en vivo. Sin embargo, el comportamiento no es en sí mismo mutuamente excluyente en un sentido temporal. Por ejemplo, si se observa la interacción entre dos personas, las conductas de una y otra pueden perfectamente solaparse en el tiempo. Si la observación se efectúa con imágenes grabadas en vídeo, cabe la posibilidad, si así lo exigen los objetivos de la investigación, de definir unidades de conducta que coocurran, pues pueden registrarse a partir del vídeo con facilidad. La disponibilidad de sistemas de registro observacional informatizados (por ejemplo, The Observer de Noldus [1992] permite trabajar con unidades de conducta estructuradas en varios sistemas de categorías paralelos en el tiempo, por ejemplo, uno de exprcsion facial, otro de conducta verbal y otro de control postura( de un individuo). Asimismo, las técnicas de análisis de datos observacionales más actuales facilitan el tratamiento de secuencias de conducta en las que existen unidades con solapa-miento temporal (por ejemplo, Bakeman y La finalidad de la recogida de datos en la observación sistemática es la obtención de un registro conductual del que poder extraer medidas de la conducta que tengan variabilidad a lo largo de las sesiones de observación o dentro de una misma sesión de observación. Las medidas conductuales pueden dividirse en primarias y secundarias. Las medidas primarias son la frecuencia y la duración de las categorías (Johnston y Pennypacker, 1980; Barrett, Johnston y Pennypacker, 1986). La frecuencia de una categoría a lo largo de un período de observación es el número de segmentos conductuales a los que se ha asignado dicha categoría, o, en otras palabras, es el número - de veces que ha ocurrido la categoría. Se trata de una medida absoluta que se expresa en una escala de razón absoluta (cero y unidad no transformables). La unidad de medida de la frecuencia es el ciclo o "número de veces", aunque, puesto que el ciclo no es una dimensión física, se considera que la frecuencia es una medida adimensional. Es posible calcular frecuencias tanto de categorías estado como de categorías evento. La duración de ocurrencia es el tiempo ocupado por la ocurrencia de una categoría. Sumando las duraciones de todas las ocurrencias de una categoría a lo largo de un período de observación obtenemos su duración. Ambos tipos de duración son también medidas absolutas, expresadas en una escala de razón (cero absoluto, pero unidad transformable). La unidad de medida más corriente es el segundo (s). Sólo es posible obtener duraciones de categorías estado, pues las ocurrencias de una categoría evento tienen duración nula por definición. Otros tipos de duración son: el intervalo o lapso entre ocurrencias, o el tiempo UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA transcurrido desde que finaliza una ocurrencia de una categoría hasta que se inicia la siguiente ocurrencia de la misma categoría; y la latencia, o tiempo transcurrido desde que ocurre un cierto evento hasta el inicio de la primera ocurrencia de una categoría. El evento en cuestión puede ser la emisión de un estímulo, la ocurrencia de un evento en la conducta de otro individuo, etc. La frecuencia y la duración (en cualquiera de sus formas) no son útiles si no se proporciona información acerca del tiempo total que ha durado el período de observación o si no se relacionan una con otra. Por este motivo existen medidas relativas o secundarias, directamente interpretables, que se derivan de las anteriores. Las más empleadas son la tasa (frecuencia dividida por el tiempo total de observación), la frecuencia relativa (frecuencia dividida por la suma de las frecuencias de todas las categorías), la duración relativa (duración dividida por la suma de las duraciones de todas las categorías) y duración media (duración dividida por frecuencia). Todas las medidas anteriores caracterizan las categorías de una forma estática, es decir, se emplean para "re-sumir" la conducta que se produce durante un cierto período de observación. Sin embargo, para contrastar ciertas hipótesis es necesario caracterizar las categorías de forma dinámica: cuantificar cómo cambia la conducta momento a momento durante el período de observación (Bakeman y Gottman, 1997). El análisis del cambio conductual momento a momento se llama análisis secuencial, y sus características principales se exponen en un apartado posterior de este capítulo. Las medidas dinámicas básicas son la frecuencia de transición y la frecuencia relativa de transición (Castellan, 1979; Van Hooff, 1982). La frecuencia de transición es el número de veces que ocurre una transición entre un par de categorías. Para unas categorías A y B la frecuencia de transición de A a B es el número de veces que después de A ocurre B en la secuencia de datos. La frecuencia relativa de transición entre dos categorías A y B es la proporción de todas las transiciones desde A que terminan en B, o la estimación de la probabilidad de que después de A ocurra B, y se calcula dividiendo la frecuencia de transición entre A y B por el número total de transiciones observadas desde A. 7 Muestreo observacional y sesiones de observación Para contrastar las hipótesis de una investigación, rara vez es posible acceder a toda la población de individuos a la que se desean generalizar los resultados. En la observación sistemática existen diversas poblaciones de interés que es imposible estudiar en su totalidad. Las principales son la población de sujetos y la población de tiempo. Ambas están delimitadas por los objetivos de la investigación. Así, en un estudio acerca de las interacciones entre madre y recién nacido durante el primer mes de vida del niño, la población de sujetos está compuesta por todas las parejas madre-recién nacido, y la población temporal consta de todas las unidades de tiempo comprendidas desde el momento del nacimiento hasta el término del primer mes de vida del bebé. Puesto que ni una ni otra población pueden estudiarse en su totalidad, es necesario seleccionar muestras de ambas que representen adecuadamente las poblaciones respectivas. Las selecciones posibles son las siguientes, de las cuales las tres primeras son necesarias y la cuarta es opcional: a. Muestreo de sujetos. Consiste en seleccionar una muestra representativa de sujetos a partir de la población a la que se quieren generalizar los resultados (Suen y Ary, 1989). En el ejemplo anterior se concretaría en seleccionar un grupo de parejas de madre y recién nacido. Este tipo de muestreo es común a todas las metodologías de investigación. b. Muestreo intrasesional de sujetos (Suen y Ary, 1989). Cuando se observa a más de un sujeto y se juzga imposible que el observador pueda mantener su atención en la conducta de todos a la vez, debe determinarse de antemano qué sujetos del grupo serán observados durante la sesión, y/o en qué orden van a ser observados. c. Muestreo intersesional de tiempo. Consiste en seleccionar los períodos o sesiones durante los cuales los sujetos van a ser observados, lo que implica seleccionar tanto la cantidad de sesiones como los momentos en que éstas se inician y terminan. UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA d. Muestreo intrasesional de tiempo. Si se decide segmentar el flujo conductual en unidades de tiempo, entonces la conducta de los sujetos será registrada de forma discontinua durante la sesión de observación, realizándose un muestreo del tiempo dentro de la misma. La alternativa es observar y registrar de modo continuo dentro de la sesión, sin efectuar ningún tipo de muestreo temporal. La sesión de observación es el período de tiempo durante el cual se observa y se registra siguiendo siempre la misma regla de muestreo intrasesional de sujetos y utilizando la misma técnica de registro. Cada sesión es una muestra del período de estudio o período de tiempo de la vida de los sujetos al cual se quieren generalizar los resultados de la investigación. Como ejemplos de períodos de estudio empleados por los investigadores podemos citar: el posparto, el primer curso de universidad, el año posterior a la jubilación, etc. Cuando el período de estudio es largo (por ejemplo, días, meses, años), es necesario extraer muestras de él porque es imposible permanecer observando a los sujetos durante días enteros, debido tanto a la disponibilidad del observador como a la disponibilidad de los sujetos. La duración de las sesiones dependerá de: 1. El tipo de conducta a observar. La duración de las sesiones tiene que ser suficientemente larga para que en ellas tenga lugar una variabilidad aceptable en el comportamiento observado, es decir, para que ocurra un número grande de transiciones entre ocurrencias de categorías de conducta. Ello depende a su vez del grado de molaridad de las categorías y de sus duraciones medias. La duración total de la sesión ha de ser mucho mayor que las duraciones medias de las categorías conductuales. 2. La fatiga del observador. La atención constante repercute en un aumento de la fatiga y un descenso de la calidad de los datos. Sin embargo, la utilización del vídeo en la observación sistemática permite grabar sesiones de larga duración que después pueden ser observadas durante sesiones de trabajo de menor duración. En la observación en vivo de sujetos 8 humanos en interacción social una duración de sesión indicativa oscila entre 30 y 60 minutos. La cantidad total de sesiones ha de ser suficiente para que el volumen de datos recogidos permita poner a prueba las hipótesis de investigación (Yarrow y Waxler, 1979). Cuantas más categorías de conducta se hayan definido y cuanto menor tasa tengan, más largas habrán de ser las sesiones y/o mayor número de ellas deberá haber para que las medidas de las categorías obtenidas sean aptas para realizar los análisis estadísticos pertinentes. Así por ejemplo, si estamos interesados en averiguar si la categoría "interacción verbal positiva de la madre" (A) activa secuencialmente la categoría "interacción verbal positiva del hijo" (B), necesitaremos observar el número de sesiones suficiente para que, en la pareja o en la totalidad de la muestra, las frecuencias totales de A y de B sean grandes para poder estimar adecuadamente la probabilidad de que a A siga B y compararla con la probabilidad no condicionada de que ocurra B. Las técnicas estadísticas mediante las que se compararán dichas estimaciones de probabilidad exigirán que las frecuencias aludidas alcancen un mínimo, que puede ser 30 aproximadamente. Para que la conducta registrada en una sesión sea representativa de toda la conducta restante que ocurre fuera de la sesión y no es observada, deben programarse adecuadamente los inicios y finalizaciones de las sesiones que van a realizarse con el fin de que no dependan de las preferencias del observador. Ello significa que los inicios han de ser seleccionados de forma que todos los puntos temporales del período de estudio tengan la misma probabilidad de ser inicios de sesiones, siempre que haya transcurrido un tiempo determinado desde el inicio de la sesión anterior. El muestreo intersesional de tiempo suele adoptar una de estas formas (Altmann, 1974): 1. Muestreo aleatorio. Si se seleccionan los inicios de sesión mediante muestreo aleatorio dentro del período de estudio se da por supuesto que tanto los sujetos como el observador estarán disponibles en cualquier momento. Esta situación puede ser realista en casos muy concretos, como por ejemplo, si el período de estudio es de un día, o si es posible UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA obtener una grabación audiovisual permanente de los sujetos, pero en general cabe suponer que observador y observado están disponibles únicamente en ciertos subperíodos de la fase de estudio, es decir, a ciertas horas. En tal caso el muestreo intersesional ha de restringirse a dichos subperíodos y, por lo tanto, puede producirse algún sesgo en la muestra de conducta observada. 2. Selección fija. También pueden iniciarse las sesiones siempre a las mismas horas del día. Ello tiene la ventaja de que es más cómodo para el observador pero sólo permite recoger datos representativos de esas horas. Por lo tanto, la muestra de los flujos conductuales que se obtiene puede estar sesgada. 3. Criterios comportamentales. El observador permanece atento al comporta-miento de los sujetos sin registrarlo, hasta que ocurre por primera vez una determinada categoría conductual de interés, momento en el cual se inicia la sesión. Asimismo, la finalización de la sesión puede determinarse por la presencia o ausencia de otra cierta categoría. La selección por criterios comportamentales posee la desventaja de que la muestra de conducta que se obtiene únicamente es representativa de los períodos iniciados y terminados por las categorías en cuestión y, por lo tanto, puede contener un sesgo importante si lo que se desea es generalizar los resultados al resto del período de estudio. No obstante, si el período de estudio se define en función de la aparición de tales categorías, la selección por criterios comportamentales dará lugar a una muestra de conducta representativa. A modo de ejemplo, si estamos interesados en investigar las secuencias de agresión en una cierta especie animal bastará con que iniciemos las sesiones en el momento en que tiene lugar una cierta categoría que presumimos desencadenará la agresión (por ejemplo, una amenaza) y las terminemos en el momento en que los individuos se alejen unos de otros o inicien otro tipo de actividad (por ejemplo, comer). 9 Reglas de muestreo intrasesional de sujetos y reglas de registro Las reglas de muestreo intrasesional de sujetos especifican qué sujetos han de observarse y cuándo, dentro de la sesión de observación. Si el registro va a realizarse en una díada o en un grupo, si ha de realizarse en vivo (porque no puede grabarse en vídeo para verlo posteriormente), y si el observador no puede prestar atención simultánea a la conducta de todos los sujetos, entonces es preciso aplicar una de las reglas que se especifican a continuación (Altmann, 1974; Martin y Bateson, 1986; Qucra, 1991): 1. Muestreo focal. El observador únicamente mantiene su atención centrada en el comportamiento de un individuo, sea un sujeto en un grupo, una díada en un grupo de díadas, o un subgrupo en un grupo formado por varios subgrupos similares. Si la investigación está orientada a obtener datos de sujetos individuales cuando se encuentran solos, el muestreo de sujetos siempre es focal. Se utiliza la denominación "focal" porque es más corriente observar sujetos que se encuentran en grupos que sujetos solitarios e interesa destacar que, ocurra lo que ocurra en el grupo, el observador centra su atención exclusivamente en uno de los sujetos. 2. Muestreo de barrido o multifocal. El observador focaliza su atención en cada uno de los individuos durante un intervalo de tiempo corto y por turnos, de forma rotatoria. Durante la sesión, el barrido se efectúa un gran número de veces, razón por la cual el intervalo dedicado a cada individuo cuando se le observa es muy pequeño en comparación con la duración de la sesión. Todos los intervalos tienen siempre la misma duración. El orden en que los individuos son observados es siempre el mismo en cada turno, y se establece de antemano. Las reglas de registro especifican qué propiedades de las categorías de conducta han de ser registradas y en qué momentos. En cada sesión de observación se combina una regla de registro y una regla de muestreo intrasesional de sujetos. Las UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA reglas de registro observacional son las siguientes (Martin y Bateson, 1986; Quera, 1991; Bakeman y Gottman, 1997): 1. Registro activado por transiciones (RAT). El observador anota todas las ocurrencias de las categorías del individuo focal o de los individuos que son multifocalizados, en la secuencia en que se producen; además el observador puede anotar en qué momento termina una categoría y se inicia la siguiente. Decimos que el registro está activado por transiciones porque el observador únicamente anota en aquellos momentos en que se produce una transición entre ocurrencias de categorías, efectuando por consiguiente una segmentación conductual del flujo. El RAT permite obtener información completa y precisa acerca de la frecuencia, la duración y la secuencia u orden temporal de las categorías de conducta. 2. Registro activado por unidades de tiempo (RAUT). El observador anota las coocurrencias de las categorías de conducta del individuo focal o de cada uno de los individuos multifocalizados rigiéndose por unidades de tiempo llamadas intervalos. Mientras que en el RAT es la unidad de conducta la que determina la anotación, en el registro activado por unidades de tiempo es la finalización de cada unidad de tiempo o intervalo, indicada por un metrónomo o reloj, lo que activa al observador para que anote. Por lo tanto, se realiza una segmentación temporal y no conductual del flujo. El RAUT recibe a veces el nombre de "muestreo de tiempo" en referencia a que, según la técnica concreta que se emplee (véanse los párrafos siguientes), el observador puede prescindir de mantener la atención sobre los sujetos mientras no haya transcurrido la unidad de tiempo pertinente; se trata pues de un muestreo intrasesional del tiempo. Los tres tipos de RAUT más comunes son (Hansen, 1966; Altmann, 1974; Powell, Martindale y Kulp, 1975; Ary y Suen, 1983; Bakeman y Gottman, 1987; Suen y Ary, 1989): a. Muestreo instantáneo, momentáneo o puntual. La sesión de observación se divide en N intervalos de duración constante (longitud de intervalo) y el observador sólo registra cuál de las categorías está ocurriendo al término del intervalo o punto de 10 muestreo. La distancia entre puntos de muestreo (o longitud de intervalo 7) ha de ser pequeña en comparación con la duración de la sesión (T), por lo que la cantidad de puntos de muestreo o intervalos (N) suele ser un número grande. Para cada una de las categorías el registro que se obtiene es una secuencia de unos y ceros que indican respectivamente la presencia y la ausencia de la categoría en los puntos de muestreo. Al utilizar el muestreo instantáneo se parte del supuesto de que todas las ocurrencias de las categorías de conducta poseen duración y que las transiciones entre ellas son instantáneas. Por lo tanto, el muestreo instantáneo es totalmente inadecuado cuando las categorías son eventos. b. Muestreo de intervalo parcial, de Hansen o "uno-cero ". La sesión se divide también en N intervalos y el observador registra en cada uno de ellos qué categorías han ocurrido, prescindiendo de cuántas veces han ocurrido, cuánto han durado sus ocurrencias, y en qué momentos han tenido lugar dentro del intervalo. Para cada categoría es un registro "todo o nada" o "uno-cero"; es decir, sólo interesa tener constancia de si la categoría se ha dado o no en el intervalo. Se trata de un RAUT no restrictivo porque basta que una categoría ocurra en cualquier instante de un intervalo para que sea registrada en el mismo. El observador no ha de esperar necesariamente hasta que termine el intervalo para anotar; basta que anote cada categoría cuando ocurre por primera vez dentro del intervalo. También en este caso el producto del registro es un conjunto de secuencias binarias, una por categoría. Este muestreo es utilizable tanto si las categorías de conducta son eventos como si son estados. c. Muestreo de intervalo total. La sesión se divide en N intervalos y el observador anota en cada uno de ellos cuál ha sido la categoría que ha ocupado la totalidad del intervalo. Se trata de un RAUT totalmente restrictivo porque no permite registrar categorías que ocurran sólo en una parte del intervalo. Si en un intervalo se produce una transición entre categorías entonces ninguna de ellas es registrada. Sólo los intervalos sin transiciones dan lugar a registro. Esta forma de registro no es adecuada cuando las categorías son eventos. UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA Si tiene lugar una transición durante el intervalo el observador puede sustraer su atención de la conducta de los sujetos, no registrar nada, y esperar a que se inicie el siguiente intervalo para volver a observar. En comparación con el RAT, el RAUT posee las siguientes ventajas: 1. Produce menor fatiga en el observador, lo cual repercute en que tiene menos errores y los datos tienden a ser más fiables (Sackett, 1978; Mehm y Knutson, 1987). 2. Los observadores pueden ser adiestrados más rápidamente (Bakeman y Gottman, 1987). Es más fácil de utilizar que el RAT porque el observador simplemente ha de anotar a intervalos regulares, en lugar de decidir cuándo hay o no transiciones entre categorías. Por lo tanto, en general, utilizar un RAUT repercute en un menor coste para la investigación (Sackett, 1978; Klesges, Woolfrey y Vollmer, 1985). En contrapartida, la desventaja del RAUT es que no produce una representación fidedigna de los cambios que ocurren en los flujos conductuales (Altmann, 1974; Suen y Ary, 1989). Por lo tanto, no proporciona valores exactos de la frecuencia y la duración de las conductas, ni permite obtener información acerca de las secuencias. Sin embargo, si la longitud del intervalo es pequeña en comparación con las duraciones medias de las conductas, el registro obtenido se aproxima al que proporcionaría un RAT. Además, a partir de un RAUT es posible realizar estimaciones de las frecuencias y las duraciones mediante técnicas específicas (Suen y Ary, 1986, 1989; (lucra, 1989, 1990, 1991). 11 Obtención de medidas conductuales a partir del registro En el RAT la información acerca de la frecuencia, duración y secuencia es inmediata a partir del registro. Por ejemplo, supongamos que se definió este sistema de categorías para el intercambio verbal en una pareja: (M+, M-, Mo, H+, H-, Ho), donde M simboliza Mujer, H Hombre, + "intervención positiva", - "intervención negativa" y 0 "intervención neutra". Un RAT efectuado con este sistema podría dar como resultado estos datos en los que el primer elemento de cada par simboliza una categoría de conducta, y el segundo el tiempo en que se inició, correspondiendo el cero al comienzo de la sesión: M+ 0 H+ 12 Ho 15 M+ 17 Ho 24 M-31 H-35 La última unidad de tiempo de la sesión fue la unidad 39 (en total, 40 unidades de tiempo). La secuencia de categorías es, obviamente, M+ H+ Ho M+ 1 Ho M– H-. Las frecuencias (F) y duraciones (D) de las categorías son: F: D: M+ 2 19 Al— 1 4 Mo 0 0 H+ 1 3 H— 1 5 Ho 2 9 En el RAUT la frecuencia y la duración de las conductas pueden estimarse mediante fórmulas a partir de las medidas proporcionadas por este tipo de registro. Las medidas proporcionadas por un RAUT son: UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 1. Frecuencia modificada (0). La frecuencia modificada de una categoría de conducta es la cantidad de unos de su secuencia binaria, es decir, el número de intervalos en los que la categoría ha sido anotada conforme a la regla de registro (Sackett, 1978). 2. Seudofrecuencia (f). La seudofrecuencia de una categoría de conducta es el número de pares 01 de su secuencia binaria, esto es, la cantidad de ráfagas de unos de la misma (Suen y Ary, 1989; Quera, 1991). Si en una misma sesión se aplicasen simultáneamente los tres tipos de RAUT con la misma longitud de intervalo, las frecuencias modificadas obtenidas para cada conducta no coincidirían necesariamente. Lo mismo ocurriría con las seudofrecuencias. Luego, para la interpretación de ambas medidas se necesita conocer qué tipo de RAUT las ha 12 producido y con qué longitud de intervalo. La frecuencia modificada no es en absoluto una estimación ni de la frecuencia ni de la duración de la conducta. Control de la calidad de los datos Como en toda ciencia, en psicología y específicamente en la metodología observacional, una fase fundamental del proceso de investigación es la dedicada al control de calidad de los datos. Carece de sentido y puede dar lugar a conclusiones falsas aplicar sofisticadas técnicas estadísticas si no es posible disponer previamente de una cierta garantía de que los datos procedentes de la observación reflejan la realidad. Para realizar dicho control de calidad se dispone en metodología observacional de procedimientos como la evaluación de la fiabilidad, la precisión y la validez de los datos. Además, puesto que se conocen las fuentes de los sesgos posibles del observador y del observado, es factible intentar evitar que éstos se produzcan. A continuación se realiza una somera aproximación a cada uno de estos conceptos. Para un tratamiento más detallado de la calidad de los datos observacionales, se remite al lector a los textos de Suen (1988) y Bakeman (1997). Fiabilidad Aun en el caso de que los registros observacionales se realicen con la ayuda de vídeo v computadores portátiles, en último término la intervención del observador es in-dispensable para determinar si se ha producido o no una cierta categoría de conducta, por lo que la tarea a desempeñar por el mismo es sumamente importante. Del observador depende en gran medida el grado de calidad de los datos. Es necesario que la observación la realicen como mínimo dos observadores con objeto de comparar sus registros y poseer así un control del grado de subjetividad incorporado al registro por cada uno de ellos y conseguir de este modo datos sin sesgo. Tal como indican Suen y Ary (1989, p. 100), «la evidencia de fiabilidad en los datos de observación conductual es necesaria para demostrar UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA públicamente que los datos reflejan la realidad». En la metodología observacional se define la fiabilidad como el grado de concordancia entre los datos proporcionados por dos o más observadores cuando registran independientemente la misma conducta en la misma ocasión (fiabilidad interobservadores); o bien, como la concordancia entre dos registros de una misma sesión obtenidos por el mismo observador en dos momentos diferentes, gracias a la grabación en vídeo (fiabilidad intraobservador o consistencia del observador) (House y House, 1979). Existe una amplia gama de índices estadísticos empleados como coeficientes de fiabilidad. La elección de cualquiera de ellos debe venir marcada por el objetivo de la investigación y por la escala de medida a la que pertenecen los datos (Hartmann, 1977). Pueden distinguirse tres clases de coeficientes de fiabilidad: • Coeficientes globales o de sesión. Son correlaciones entre medidas globales como la tasa, la duración relativa, etc., de las categorías de conducta, obtenidas por dos observadores diferentes. Esta clase de coeficiente es el que deberá calcularse cuando las hipótesis relacionen variables expresadas en forma de medidas globales (véase el concepto de macroanálisis en el apartado v). • Coeficientes secuenciales. Son correlaciones entre las frecuencias de transición obtenidas por dos observadores diferentes. Estos coeficientes son los que han de calcularse cuando las hipótesis aluden a la existencia de relaciones secuenciales entre categorías (véase el concepto de microanálisis en el apartado v). • Coeficientes punto por punto. Son proporciones de concordancia momento a momento entre los observadores, y deben calcularse cuando las hipótesis aluden a relaciones temporales entre unidades de tiempo ocupadas por las categorías, dentro de la sesión de observación. Estos coeficientes son más estrictos que los de las dos clases anteriores. Para calcularlos es necesario construir una tablao matriz de confusión cuyas filas corresponden a las categorías tal como son registradas por uno de los observadores, y 13 cuyas columnas corresponden a las categorías tal como son registra-das por el otro. En las casillas de la matriz se incluyen segmentos temporales, de modo que cada unidad de tiempo de la sesión se asigna a una casilla de la tabla. En el cuadro 15.2 se muestra una hipotética matriz de confusión. En dicha matriz, de las siete unidades de tiempo que, según el observador 1, han estado ocupadas por la categoría B, dos unidades fueron ocupadas por la categoría A según el observador 2. Cuando la concordancia es perfecta, todas las casillas de la tabla que no pertenecen a su diagonal principal contienen valores nulos. De entre los numerosos coeficientes existentes para la evaluación de la fiabilidad punto por punto, resumidos por Frick y Semmel (1978) o Wallace y Elder (1980), destaca el coeficiente Kappa de Cohen (1960), que es una proporción de concordancia en la que se corrige la concordancia que es posible lograr por azar. Para su cálculo se utilizan la proporción de concordancia total obtenida y la proporción de concordancia aleatoria esperada. Esto lo hace preferible a los diversos tipos de porcentajes de acuerdo ampliamente utilizados en metodología observacional (Hanley, 1987). El coeficiente Kappa se calcula así: k = (Po - P)/(1 - Pe), donde P, es la proporción de concordancia observada y Pe es la proporción de concordancia aleatoria. En el ejemplo del cuadro 15.2, P = (10+4+4)/22 = 0,818, P = (10x13+7x4+5x5)/22' = 0,378, k = (0,818-0,378)/(1-0,378) = 0,707. El grado eje concordancia es mayor cuanto más próximo a la unidad es el valor del coeficiente obtenido. UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA Precisión La precisión se define como el grado de concordancia entre un observador y un criterio establecido o registro estándar (Landis, 1975; Green, 1982). Fiabilidad y precisión están íntimamente relacionadas sin que ninguna de ellas implique la otra. En un registro puede ocurrir que la fiabilidad interobservadores sea alta pero la precisión baja, por haber cometido igual tipo de errores ambos observadores. Por ello se aconseja frecuentemente evaluar la precisión en lugar de la fiabilidad inter o intraobservadores (Foster y Cone, 1980; Johnston y Pennypacker, 1980). Sin embargo, la dificultad de disponer de registros estándar lleva a que se calcule el coeficiente de precisión en pocas ocasiones. Para el cálculo de la precisión pueden utilizarse las mismas técnicas que en la evaluación de la fiabilidad, con la única diferencia de que en lugar de evaluar la concordancia entre dos observadores con igual grado de adiestramiento, se evalúa la concordancia entre un observador considerado falible y un observador estándar. Además, existen coeficientes de precisión punto por punto específicos para la evaluación de la precisión: 1. El coeficiente de sensibilidad, o la proporción de unidades de tiempo en las que verdaderamente ocurre la categoría, que son registradas correctamente por el observador falible; esta proporción es la estimación de la probabilidad de que el observador falible registre la conducta cuando debe hacerlo. 2. El coeficiente de especificidad, o proporción de unidades de tiempo en las que verdaderamente no ocurre la categoría, que no son registradas por el observador falible; esta proporción es la estimación de la probabilidad de que el observador falible no registre la conducta cuando no debe hacerlo. Validez En su acepción más común la validez se refiere a la relación existente entre lo que se evalúa y lo que se desea 14 evaluar (Martin y Bateson, 1986). Por lo tanto, debe establecerse la relación entre una variable, como la medida de una conducta, y otra variable externa, indicativa del objeto de la medida. En la metodología observacional se trata de comprobar la validez del sistema de categorías. Pese a la importancia del concepto, la metodología observacional no ha dedicado al mismo ni análisis teóricos frecuentes, ni su comprobación regular en las investigaciones. Posiblemente, dado que la conducta se observa directamente, sin intermediarios (tests, cuestionarios, autoinformes...), sin manipulación de variables independientes y sin realizar inferencias, no se pone en cuestión la validez de los datos obtenidos. Cuando en las definiciones de las categorías se realizan inferencias, por la utilización de categorías molares, la validez no es tan inmediata y se trata entonces de comprobar si las categorías son buenas definiciones operacionales de los elementos implicados en el problema. La vía óptima es comparar el registro del observador con una medida independiente de la misma variable. Si este procedimiento no es viable por la dificultad de conseguir dicho criterio externo, entonces puede procederse a hallar el grado en que los registros de los observadores son los mismos que si estuvieran determinados por una posición teórica bien formada y documentada (Anguera, 1985). Sesgos del observador y de la observación La existencia del error de medida es un problema común al proceso de recogida de datos en cualquier disciplina científica. Los sesgos del observador son aquellos errores de medida que se deben al observador o al instrumento de observación, registro o medición, y se reflejan en los datos en forma de problemas de fiabilidad y/o precisión. Los sesgos de la observación son aquellos errores que se deben a fallos de diseño o de procedimiento que alteran la situación del registro y por lo tanto la conducta del sujeto observado, y que limitan la generalización de los resultados (Behar y Riba, 1993). Son sesgos del observador: 1. Errores mecánicos de registro, debidos a la complejidad de la tarea a realizar. UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA 2. Errores de interpretación del sistema de categorías, debidos a la deriva del observador, consensuada o no, que consiste en que los observadores desarrollan versiones idiosincrásicas de las definiciones originales de las categorías de conducta (Kazdin, 1977); o debidos a la complejidad del sistema cíe categorías, existiendo una relación inversa entre la complejidad y el grado de precisión (Mash y McElwec, 1974). 3. Errores perceptivos, entre ellos el efecto de halo, que transforma la percepción presente en función de la evaluación antecedente (Muchielli, 1974). 4. Efectos biosociales, como la incidencia de la edad, del sexo y de la etnia del observador en los datos que obtiene (Rosenthal, 1967). 5. Efectos biográficos, psicosociales y situacionales, debidos a que la historia personal del observador, su situación familiar y social, su ideología y sus rasgos psicológicos parecen influir sobre sus registros, al percibir la realidad a través de su prisma personal. 6. Expectancia, o tendencia del observador a obtener datos que se ajustan a las expectativas iniciales fruto de una teoría implícita o explícita. En la metodología observacional existe la posibilidad de controlar los sesgos del observador, siendo los procedimientos más eficaces y relevantes: 1. La diferenciación entre investigador y observador a fin de que este último desconozca el objetivo final de la investigación y se evite así el sesgo de expectancia. 2. La definición de sistemas de categorías no excesivamente molares, no ambiguas, especificadas clara y detalladamente, para evitar la subjetividad del observador en el registro. 3. La elaboración de un manual de instrucciones, que al suministrar pautas específicas sobre el contexto en que debe realizarse el registro y sobre el iniclo y finalización del mismo, proporciona rigor y homogeneidad a la observación. 4. El adiestramiento y entrenamiento del observador; con la finalidad de conseguir y mantener el aprendizaje, por parte 15 del observador, del sistema de categorías y del manual de instrucciones y disponer de este modo de un instrumento que per-mita la objetividad en la medida. Tener en cuenta estos requisitos y evitar o reducir los posibles errores del observador es velar por la fiabilidad de los datos. Por lo que se refiere a los sesgos de la observación, éstos pueden resumirse en la noción de reactividad o cambios que puede sufrir la conducta de un individuo cuando desempeña el papel de sujeto en una investigación psicológica (Behar y Riba, 1993). Se trata de una noción propia y exclusiva de las ciencias del comportamiento. Kazdin (1977), Kcnt y Eoster (1977) y Baum, Forehand y Zegiob (1979) han puesto en evidencia que la conducta de los sujetos observados es cualitativa y cuantitativamente distinta a la que se hubiese producido si el observador no hubiese estado presente, y el sujeto no se hubiese sentido observado (Jacob, Tennenbaum y Krahn, 1987). Según Behar y Riba (1993), la reactividad viene modificada por diversos factores: el ambiente, los sujetos y la conducta. Las configuraciones ambientales complejas, en las que el observador desarrolla su tarea habitualmente, suscitan reactividad cuando se produce algún tipo de cambio en sus elementos. El mismo observador forma parte de estas configuraciones ambientales y en función de sus características personales, de sus rasgos físicos —como talla, peso, edad, sexo, etnia—y psicológicos, afecta de forma distinta al sujeto observado y da lugar a mayor o menor reactividad. No todos los sujetos presentan igual grado de reactividad, debido a sus rasgos de personalidad y a sus experiencias previas. La reactividad comporta resistencias del sujeto observado que lo llevan a inhibirse, sobreactuar o engañar. Asimismo, unas conductas son más sensibles que otras a la reactividad. Las conductas automáticas o involuntarias, las inducidas por mediadores hormonales, los hábitos, etc., presentan una reactividad prácticamente nula. Por el contrario, la conducta voluntaria, especialmente la verbal, con un objetivo preciso, es más sensible a la reactividad. La reactividad puede manifestarse en forma de conductas nuevas, que no formaban parte de las variables dependientes o del sistema de categorías UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA previsto, o bien en la desaparición de conductas previas y esperadas en el contexto de la observación. En todo caso la reactividad no afecta únicamente a las frecuencias y a las tasas de las conductas sino que pueden modificar su latencia y su duración. Es posible minimizar el sesgo de reactividad: a. Haciendo que el observador permanezca oculto, o bien que sepa inspirar confianza al sujeto observado para que éste se comporte de forma sincera y natural. b. Manteniendo al sujeto observado en la ignorancia del objetivo real de la investigación. c. Consiguiendo que el observador pase a ser un observador olvidado, es decir, que el sujeto observado llegue a habituarse a su presencia. La utilización de estos procedimientos no reactivos, especialmente el del observador oculto, está asociada a cuestiones éticas que pueden resumirse en el derecho de cualquier persona a no ser objeto de una observación, al igual que ocurre en cualquier investigación con humanos. Clases de análisis de datos La elección de una técnica concreta de análisis de datos observacionales depende de la clase de hipótesis que se desee verificar y de la escala de medida en la que se hayan expresado las variables. Podemos distinguir dos clases de análisis de datos en este contexto (Quera, 1986, 1993), que son complementarios porque hacen posible descubrir distintos tipos de relaciones o regularidades en los datos: a. Macroanálisis. Las variables conductuales implicadas en las hipótesis están expresadas en forma de frecuencias, duraciones, tasas, etc., es decir, medidas "globales" y "estáticas» en general. El término "global" se refiere al hecho de que dichas medidas son "resúmenes" de sesiones de observación, y para calcular sus valores no es necesario conocer la secuencia de códigos a lo largo de la misma. Como técnicas estadísticas aplicables pueden citarse los contrastes de medias, la 16 correlación, el análisis de covariancia, el análisis de agrupamiento, el análisis factorial, etc. (véase Gottman, 1978), técnicas también utilizadas para analizar datos obtenidos mediante otras metodologías. La hipótesis «¿los niños de 5 años invierten mayor cantidad de tiempo en juego paralelo que los niños de 4 años?» puede ponerse a prueba a través de un macroanálisis; esta hipótesis relaciona una variable de sujeto, la edad, con una variable conductual, el juego paralelo (Bakeman y Gottman, 1997), la cual se expresa en forma de duración, o mejor, la duración relativa o prevalencia. Para contrastar esta hipótesis compararíamos las duraciones relativas de la conducta "juego paralelo", obtenida a lo largo de unas sesiones de observación, en dos grupos de niños, uno de 4 años y otro de 5. La técnica estadística concreta podría ser, por ejemplo, el cálculo de un contraste t de Student entre los valores medios de las duraciones relativas de los dos grupos. Otro ejemplo de macroanálisis es el siguiente. Supóngase que las variables de una investigación sobre la interacción materno-filial son "primiparidad", "prematuridad", "tasa de vocalizaciones de la madre" y "tasa de lloro del bebé". Además, ambas tasas han sido obtenidas para cada pareja madre-hijo en dos puntos temporales, al final de la primera semana y al final de la cuarta semana de vida del bebé. Por tanto, en conjunto existen variables, cuatro de ellas conductuales, acerca de cuyas relaciones binarias, ternarias, etc., es posible formular hipótesis. Puesto que estas variables conductuales se evalúan en forma de tasas, se trata de un macroanálisis. Una de las hipótesis que podrían plantearse es «cuanto mayor es la tasa de vocalización de la madre en la primera semana, menor es la tasa de lloro del bebé en la cuarta». Otra hipótesis es «en las madres no primíparas, cuanto mayor es la tasa de vocalización de la madre en la primera semana, menor es la tasa de lloro del bebé en la cuarta, mientras que en las madres primíparas dichas variables no están relacionadas». Estas hipótesis podrían ponerse a prueba calculando las correlaciones entre las variables conductuales a partir de los datos de una muestra de parejas madre-hijo. En ambos casos, se trataría de un análisis longitudinal, pues se estaría averiguando la UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA relación que existe entre variables evaluadas en puntos temporales diferentes. b. Microanálisis. Las variables conductuales están evaluadas en forma de frecuencias de transición, absolutas o relativas, o de frecuencias de coocurrencia, todas ellas medidas "dinámicas", esto es, que expresan el cambio conductual dentro de la sesión de observación (Kaye, 1982). Las técnicas estadísticas aplicables en este caso se engloban bajo el epígrafe de "análisis secuencial", y se basan en la aplicación de la teoría de los procesos estocásticos y de contrastes para tablas de contingencia bi o multivariadas (estadísticos chi-cuadrado, modelos log-lineales) (Gottman y Roy, 1990). He aquí un ejemplo de microanálisis. Las variables de una investigación acerca de la interacción verbal en parejas son "tipo de pareja" (con dos valores, "problemática" y "no problemática"), "intervención positiva del hombre", "intervención neutra del hombre", "intervención negativa del hombre", "intervención positiva de la mujer", "intervención neutra de la mujer", "intervención negativa de la mujer". Una hipótesis para cuya contrastación es necesario el análisis secuencial es, por ejemplo, «¿las parejas problemáticas tienen más reciprocidad negativa que positiva, al contrario de las no problemáticas, que tienen más reciprocidad positiva que negativa?». La reciprocidad negativa puede definirse como la tendencia de cada miembro de la pareja a intervenir negativamente después de que el otro miembro haya intervenido negativamente, y la reciprocidad positiva, corno la tendencia a intervenir positivamente después de una intervención positiva. Para contrastar dichas hipótesis deberíamos obtener las frecuencias de transición entre los códigos conductuales definidos para el hombre y la mujer, en nuestras parejas problemáticas y no problemáticas a lo largo de un conjunto de sesiones de observación. Estas frecuencias podrían disponerse en una tabla de contingencia de tres dimensiones: A ("tipo de pare-ja") x B ("tipo de conducta antes de la transición") x C ("tipo de conducta después de la transición"), donde cada una de estas dos últimas variables tiene dos valores, "intervención positiva (del hombre o de la mujer)" o "intervención negativa (del hombre o de la mujer)". Por tanto, se trataría de una tabla de contingencia con 17 2 x 2 x 2 = 8 casillas, con la que es posible evaluar el ajuste de un modelo log-lineal acorde con la hipótesis, mediante un contraste chi-cuadrado. El análisis secuencial es pues la técnica adecuada cuando las variables implicadas en la hipótesis son códigos conductuales registrados en secuencia. Se trata de una técnica que ha sido objeto de una atención especial por parte de los investigadores durante los últimos años. El lector interesado tanto en los fundamentos metodológicos y estadísticos del análisis secuencia) corno en el tratamiento informático de los datos secuenciales puede consultar los textos de Van Hooff (1982), Gottman y Roy (1990), Bakeman y Quera (1992, 1995a, 1995b), Quera (1993), Bakeman, Robinson y Quera (1996) y Bakeman y Gottman (1997). Áreas de aplicación de la metodología observacional Las áreas de aplicación de la metodología observacional son tantas como los ámbitos de actuación de la psicología. En tanto que la metodología observacional se ocupa de la conducta espontánea tal como ésta se produce, los únicos límites vienen marcados por el propio repertorio conductual, humano o animal y por la privacidad de determinadas conductas. Existen investigaciones en el marco familiar, como la de Bakeman y Brown (1977) que analiza la interacción madre-hijo, o la de Noack (1992) que estudia las relaciones que se establecen durante la primera adolescencia con los padres y con los iguales; en el marco escolar, sobre el rendimiento académico (HustonStcin, Friedrick-Coffer y Susman, 1977), sobre el desarrollo del lenguaje, la adaptación escolar en niños de preescolar (Zazzo, 1978), la interacción con iguales en la adolescencia durante la hora de recreo (Behar, 1987); en instituciones penitenciarias se ha utilizado para evaluar la evolución individual y grupal en un programa para tratar conductas adictivas (Pleite e Ibern, 1991). Abikoff, Gittelman y Klein (1980) desarrollaron un sistema de codificación para la observación en el aula de la conducta de niños hiperactivos entre 6 y 12 años. Se consideraron hiperactivos aquellos niños a los que el maestro y los padres valoraban como tales y que no presentaban ningún otro UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA MÓDULO 0614- METODOLOGÍA II. EL MÉTODO CIENTÍFICO Y LA EVALUACIÓN PSICOLÓGICA diagnóstico psiquiátrico. En total fueron observados 57 chicos y 4 chicas con estas características, con una media de edad de 8 años, 4 meses y una desviación tipo de 1 año y 4 meses. Asimismo, se observó un número igual de niños no hiperquinéticos del mismo nivel escolar, para proceder a la comparación con los anteriores Se utilizó un sistema de codificación de 11 categorías conductuales y la observación se realizó durante situaciones estructuradas de explicación del profesor y durante períodos de trabajo académico independiente bajo la supervisión del profesor. El niño fue observado al menos en tres sesiones de 16 minutos cada una. Los datos fueron recogidos por cuatro observadores que desconocían el objetivo de la investigación y las características clínicas de los sujetos estudiados. Para evitar la reactividad, los observadores se situaban siempre al final del aula, en ángulo con los sujetos a observar, para disponer de una vista de perfil de los mismos, pero estar fuera de su área de visión. Se obtuvo una mayor frecuencia en los niños hiperactivos que en el grupo control de todas las categorías de observación consideradas, como agresión verbal a los compañeros, agresión verbal al profesor o permanecer fuera de la silla. Para dar respuesta a la pregunta de si los padres proporcionan diferente socialización a niños y niñas, Fagot y Hagan (1991) realizaron una investigación observacional. La muestra estaba formada por 50 niños y 42 niñas de 12 meses, al inicio de la observación, y 42 niños y 40 niñas de 18 meses, también al iniciar la observación. Diez de los niños de 12 meses y doce de los niños de 18 meses vivían sólo con la madre, y el resto pertenecía a familias con padres casados o que vivían juntos, en pro-medio, desde hacía 4 años. Los datos se recogieron en casa de las familias, al volver el niño de la guardería, y cuando todos los miembros de la familia estaban presentes. A éstos se les pedía que no miraran la televisión, que atendieran al teléfono con la mayor brevedad posible, y que actuasen con la máxima normalidad. Para cada niño se realizaron cuatro sesiones de observación de una hora cada una. El sistema de categorías incluía cinco secciones diferenciadas: categorías de contexto o de actividades, categorías interactivas, 18 receptores, reactores y reacciones. El niño era siempre el objetivo de la observación. Se codificaba la actividad del niño y su interacción, y a continuación el receptor de dicha interacción, el sujeto que reaccionaba y el tipo de reacción. Los observadores fueron adiestrados en el sistema de categorías durante un período antes de iniciar la recogida de datos, y para ser considerados fiables debían alcanzar un grado de concordancia del 90% (proporción de concordancia no corregida por el efecto del azar). Debido a la baja frecuencia de algunas de las conductas observadas en los niños se hicieron agrupaciones de las mismas: conductas motrices amplias, juegos típicos de niños y de niñas, comunicación con los adultos y conductas agresivas. Por su parte, las categorías de reacciones se agruparon en respuestas instructivas, respuestas positivas y respuestas negativas. Asimismo, se realizaron agrupaciones empíricas de aquellas conductas que ofrecían diferencias significativas entre niños y niñas. De entre los resultados que se obtuvieron cabe destacar los siguientes. Los padres tenían reacciones diferentes ante niños y niñas, con reacciones más positivas ante los niños cuando éstos desarrollaban conductas agresivas y cuan-do jugaban con juguetes típicamente masculinos. Las madres presentaban reacciones más positivas que los padres hacia los juguetes típicamente femeninos. Asimismo, los niños recibían reacciones más negativas que las niñas cuando intentaban comunicarse; los niños recibían reacciones más positivas al jugar con juguetes típica-mente masculinos, y al realizar conductas agresivas. Las más positivas por intentar comunicarse. A pesar de la diversidad de las aplicaciones reseñadas, se constata que en ellas los datos se obtienen directamente de la realidad, sin utilización de instrumentos intermediarios, y que se siguen las fases propias del método científico. Al mismo tiempo, presentan características propias y diferenciales respecto a otras metodologías, como la elaboración del sistema de categorías, el adiestramiento de los observadores y el control de los sesgos del observador y de la observación. UNIDAD II. FUNDAMENTOS TEÓRICOS Y PRÁCTICOS DE LA OBSERVACIÓN DIRECTA