PSICOMETRÍA TEMA 1: EL PROBLEMA DE LA MEDICIÓN EN PSICOLOGÍA Introducción •

PSICOMETRÍA TEMA 1: EL PROBLEMA DE LA MEDICIÓN EN PSICOLOGÍA • Introducción La Psicometría es la rama de la Psicología que se ocupa de cuestiones relacionadas con la medición de aspectos psicológicos. El psicodiagnóstico y la evaluación psicológica están tomadas de la interacción entre psicometría y el desarrollo de instrumentos de medida. La psicometría trata dos grandes áreas: • Contenido de aplicación, cómo se desarrollan y aplican los test. • Contenido teórico de la teoría de los test (estadística e informática). Los test psicométricos son una medida objetiva y tipificada de una muestra de conducta que han sido cuidadosamente elegidos y que están controlados de antemano. Fundamentalmente nos permiten hacer descripciones, una descripción es mucho más exacta si conlleva o no medición. Nos permiten con posibilidad de errores hacer pronósticos, más exactos que solo cualitativos. Nos sirve para comparar a una persona con otra, a una misma persona en diferentes momentos de su vida; deben existir reglas para medir y comparar (también es un campo de la psicometría). Los test deben saber utilizarse, miden bien si están bien utilizados. Es necesario elegirlos en base a la naturaleza de la cuestión a medir. El valor de un test es relativo (p.e. un microscopio nos puede servir para ver partículas pero no para ver astros), puede servir para una personas pero para otras no, y cuesta determinarlo (riesgo de utilizar inadecuadamente un test por eso hay que saber a quién y para qué se usa). • Métodos de medición Método de prueba. Es un test psicométrico, en el que están controlados todos los ítems, forma de aplicación, corrección y análisis de resultados. Hay una gran estandarización y son bastante artificiales (p.e. MMPI). Método observacional de medición. Se mide la conducta manifiesta de una persona de forma más natural, menos controlada, en la vida cotidiana. Métodos mixtos. Se puede planificar una observación para medir, yo la planifico, algo estratégico, normalizo algunos de los pasos pero la hago en el medio natural. • Escalas de medición Para simplificar las cosas se les puede asignar números a los datos, dependiendo del uso que se les de. Cada una de las escalas de medición conlleva diferente operación matemática, algunos tipos de escalas son: • Rótulos. Es una utilización del número (no es una medida en sí). Por ejemplo, el número uno de la lista, solo nombra−permite identificar personas, objetos, cosas... pero no tiene una implicación matemática. • Categorías. Cuando los números nos permiten agrupar a más de un objeto por algo común o semejante que tengan respecto a un atributo o característica (p.e. 1 chico, 2 chicas; son posibles de manejar matemáticamente). • Ordinales. Permiten ordenar a las personas u objetos en base a una característica−atributo, a la manifestación de ese atributo en esas personas. Tenemos un punto de partida, no sabemos si es cero 1 (p.e. uno es más alto que el otro). • Intervalo. Tenemos información del orden de la diferencia de tamaño de una clasificación y se puede tener otro (p.e. edad). • Razón o proporción. Se usa el punto cero, se hace una comparación (porcentaje, percentiles) En base a las escalas existen diferentes baremos, tipificaciones y manejo de formas de medida. • Normas de medida Criterios. No tienen porque tener una normalización o ser comparados con otros. Permiten una meta a conseguir, la comparación es personal (p.e. reducir el número de cigarros que fuma una persona de 20 a 10). Normas. Normalmente nos permiten saber cómo manejar los números, cómo asignarlos con el propósito de representar una característica. Se asignan números de manera uniforme/estándar, permiten comparar ya que utiliza unas mismas reglas para medir a diferentes personas. Comparación grupal (la normalización es utilizada para comparar unas personas con otras). Los test psicométricos están basados en normas, comparaciones grupales pero no están basadas en normas (p.e. escalas subjetivas basadas en criterios). Las normas de medición no tienen valor moral ni ético solo numérico/estadístico. Las normas de medida las trasladamos a la norma social (p.e. decir que la persona se encuentra por encima o debajo de la media, como resultado de un test, no tiene valor moral). Cuando transformamos el número y le damos una cualidad, hacemos una interpretación del número relativa y con posibilidad de errores. Algunas normas básicas para establecer comparaciones son: • Normas de edad. Punto de referencia que compara, se elige una muestra normativa (muestre que represente a la población en la cual vamos a utilizar esa medida y en base a la cual vamos a extraer las reglas que utilizaremos). Por ejemplo, en un test infantil se escogen niños de diferentes edades, extraemos el promedio de actuación (la media) y de ahí podemos decir que lo normal es que un niño de 6 años es que saqué 7 puntos en ese test, si lo hace estaría en la media pero si saca 5 puntos estaría por debajo, o por encima si saca 8 puntos. Se compara a los niños de 6 años con la media de actuación de esa edad. • Normas de grado. La muestra normativa se elige en base a un nivel escolar (p.e. se extrae en base a los niños de primer grado no según la edad, test escolares). • Normas de porcentaje. No se necesita escoger una muestra normativa externa, se puede utilizar el propio grupo de muestra (p.e. percentiles, campana de Gauss y de ahí las notas). • Normas estándares o de tipificación. No solo se utiliza el grupo de referencia y el punto medio de actuación sino que se compara el grupo con la media y la desviación típica, es más compleja (p.e. t de student, se pueden obtener tipificando las normas de porcentaje) Estas normas se pueden combinar entre sí y en base a estas normas haremos los baremos, transformación de las puntuaciones directas en puntuaciones indirectas (p.e en el WAIS, puntuaciones escalares), y ello da la normalidad o no al grupo. Las escalas normativas son combinación de escalas de medición (uso de los números) y las reglas que seguimos para medir (normas). Existen diferentes tipos (centiles, cociente intelectual): ♦ Escala típicas. ♦ Escalas típicas normalizadas y derivadas de estas puntuaciones típicas normalizadas y transformadas , para que no sean negativas y no se trabaje con decimales (p.e. eneatipos 1 a 9, del 1 al 10). 2 TEMA 2: LOS TEST PSICOMÉTRICOS 2.1 Características Son procesos estandarizados de recogida de información, son voluntarios, no enmascarados (sabemos la finalidad de la prueba) y estandarizados. Se basan en procedimientos estadísticos y el material esta tipificado (que todos lo utilizan de forma uniforme, en la aplicación, corrección e interpretación). Los test psicométricos iniciaron dentro de la teoría de los rasgos, pero actualmente se apoyan en diferentes modelos, tienen en común que poseen una base empírica y todos intentan medir. 2.2 Componentes de los test • Manual técnico de descriptores del test • Descripción del test (¿para qué sirve?, autor, año de publicación, cómo se comercializa). • Desarrollo de las escalas (qué pasos siguió para elaborar los ítems, tareas, qué modificaciones se han dado, criterios seguidos paras las modificaciones) • Proceso de adaptación española del test.. • Justificación estadística (tratamiento de los datos, fiabilidad, validez, estudios comparativos, grupos normativos especiales, estudios transculturales). • Normas de interpretación (parámetros de cómo valorar cada una de las puntuaciones que se han obtenido). • Otros (bibliografía). • Tablas de los normativos (estudios de estandariazación). WAIS: a. Estimación de las capacidades intelectuales de una persona. c. Adaptación de un test en otra lengua a la española (cómo se han superado los sesgos culturales p.e. en los subtest de información) g. Datos estadísticos de las características de la muestra con la que se ha hecho la estadarización (p.e. edad, sexo, nivel educativo) en el WAIS p.e. hay datos de varias edades. • Manual de aplicación y corrección (cómo se administran cada una de las tareas): • Ámbito de aplicación (lugar) • Cualificación del examinador (condiciones psicológica en individuales, si tiene dificultad para comprender o algún problema sensorial). • Procedimiento normalizado (reglas, instrucciones, etc.) • Tiempo de aplicación (para cada subtest, tiempo mínimo esperado en el WAIS hora y media). • Condiciones ambientales. • Tablas y baremos de corrección y ajustes estadísticos (inicialmente aparecen diferenciados para cada subgrupo de edad) • Obtención de puntuaciones típicas, escalares y CI/índices. • Cuadernillo/hoja de respuestas, pueden estar o no. • Materiales de administración para cada test. • Plantilla de corrección: manual o informatizada. 3 2.4 Presentación de un test La forma de presentación de un test difiere según la finalidad de este, existen cuatro tipos: • Forma de presentación de los ítems (preguntas y respuestas). ♦ Verbales. ♦ Gráficos (p.e. visuales, test de Raven, test de dominó). ♦ Manipulativos ♦ Mixtos (WAIS). ♦ Contenido del test. Cómo está estructurado, pueden ser: ⋅ Homogéneo o de tarea única, siempre se realiza la misma tarea (MMPI). ⋅ Ómnibus, tiene diferentes tareas con diferentes puntuaciones pero que llevan a una única puntuación global (p.e. WAIS). ⋅ Batería de test, son múltiples tareas pero con diferentes puntuaciones (p.e. batería de aptitudes diferenciales de Thurstone, se saca un perfil con diferentes puntuaciones, que son independientes entre sí). ⋅ Tipo de respuesta, que se le pide al sujeto: ♦ Respuesta ya elaborada por el autor del test (p.e. exámenes tipo test, se selecciona la R/) ♦ Test de producción de respuesta, el sujeto produce su propia respuesta (p.e. examen de desarrollo). ♦ Según la aplicación del test: ⋅ Colectiva, se pueden aplicar también de forma individual. ⋅ Individual, no se pueden aplicar de forma colectiva. 2.4 Etapas de elaboración de un test ♦ Demarcación de la prueba: ¿Qué queremos hacer? (p.e. un test de calidad de vida del enfermo de cáncer, ya está hecho o no, cómo es, hacer un estudio de mercado). Ubicar el instrumento, definir qué voy a medir, a qué problema va ser dirigido (p.e. calidad de vida, cáncer), qué deseo hacer con el, para qué sirve (p.e. clasificar, intervenir, saber el estado actual de su enfermedad). Buscar a nivel práctico y teórico. ♦ Delimitación conceptual y operativa: a. Fundamentar teóricamente el atributo a medir, buscar bibliografía (qué es calidad de vida). b. Definir el objetivo, finalidad y uso del test (por qué y para qué se construye el instrumento) c. Elegir a qué sujeto se destina el test (para quién se hace el instrumento (personas con cáncer del País Vasco). Con mayor precisión en la definición pensaremos mejor en ellas. 4 d. Establecer cómo se va a aplicar el instrumento, colectivo o individual, procedimiento y presentación. ♦ Cómo se define de forma operativa ese atributo. ♦ Elaboración del protocolo: ♦ Formato del test: gráfico, verbal, manipulativo..., forma de presentación: cuadernillo, hoja de respuesta. ♦ Ítems que va a tener el instrumento (verbales−creencias, gráficos−niños, manipulativos o mixtos). Se elaboran en base a la edad, contexto sociocultural, qué es lo que yo quiero valorar ¿Cuántos ítems hacer?, a la hora de construir el test hacer un 25% más de ítems por los que se puedan desechar. Tiempo disponible para la aplicación y tipo de tarea. Elaboración de ítems, ¿cómo ordenarlos? (p.e. de menor a mayor dificultad). Presentación del test (hoja de instrucciones, ejercicios prácticos como modelo, ficha de identificación o no, etc.). Construcción de los ítems ◊ Ítems de construcción de respuesta libre o producción de respuesta: ♦ Ítems de ensayo. El sujeto debe responder con sus propias palabras, no hay una única respuesta. Es la más completa. El sujeto desarrolla de forma abierta y libre una respuesta ante una pregunta que se plantea, desde una perspectiva personal y su propio lenguaje. Puede ser verbal, manipulativo o gráfico. Ventajas: se recoge la creatividad/originalidad de la respuesta del sujeto, se permiten varias respuestas verdaderas y se puede valorar no solo lo que dice sino también cómo lo expone y lo construye (información adicional). Desventajas: la subjetividad a la hora de construir y, fundamentalmente, a la hora de valorar estos ítems (diferentes evaluadores no llegan al mismo acuerdo, es diferente según el juez, evaluación sesgada, a no ser que evalué un solo juez). Sobre los demás tiene la ventaja de tener la mejor manera de valorar la creatividad y originalidad del sujeto. ♦ Ítems de respuesta restringida. En los que se le pide una respuesta breve, tiene menor libertad pero se puede ampliar el número de ítems (hacer más preguntas). Ventajas: corrección rápida y se llega a un acuerdo entre jueces. Desventajas: perdemos mucho la valoración de la 5 creatividad del sujeto y sigue siendo subjetiva. Son más globalistas. ◊ Ítems de respuesta estructurada o elección de respuesta: Se pierde totalmente la posibilidad de valorar respuestas creativas (p.e. exámenes tipo test), se le dan las respuestas al sujeto y se le pide que elija una alternativa. La muestra es mucho mayor, se hacen más preguntas. Se responde a cada ítem por separado, son independientes entre sí y se suelen puntuar uno a uno. Ventajas: permiten la comparación de grupo por presentar las mismas respuesta a cada sujeto. Más fáciles de cuantificar, mayor precisión, hay una clave de corrección clara y por ende, más acuerdo entre los jueces. Desventaja: menor libertad a la hora de responder, no se valora la originalidad y creatividad. Perdemos cualidades, son muy atomistas (analiza una pequeña parte del comportamiento del sujeto). Existen diferentes tipos: ♦ Ítems de respuesta alterna. Verdadero−falso, sí−no. ♦ Asegurarse de que el ítem se puede clasificar inequívocamente de verdadero o falso. ♦ Utilización de términos que no sean generales o universales, pues son erróneos (nunca, siempre, todas, ninguna...) ♦ Evitar el empleo de términos ambiguos o indefinidos para asignar cantidad (p.e. hace ejercicio frecuentemente?, la interpretación de este puede variar de una persona a otra). Es necesario poner cantidad (3, 4 o más veces por semana). ♦ Procurar no utilizar negaciones (enunciados negativos) y muchísimo menos la doble negación (pues esto afirma). ♦ Limitar los enunciados de verdadero−falso a una sola idea (una idea para cada enunciado) ♦ Que los enunciados tengan aproximadamente la misma extensión (p.e. generalmente, un enunciado verdadero es más extenso que uno falso). Ventajas: se pueden construir muchos, recoger más muestras de conducta, son fáciles de corregir y rápidos. Desventajas: difíciles de construir, pierde la capacidad de creatividad. ♦ Ítems de elección de respuesta múltiple. ♦ Poseen más de dos alternativas, generalmente de 3 a 5. Son más flexibles, representan mejor lo que quieren evaluar, hay más opciones para el sujeto. ♦ Es necesario delimitar bien el enunciado de las alternativas de respuesta. El enunciado debe contener toda la pregunta 6 (saber que estamos preguntando y poner las alternativas pertinentes). El enunciado puede ser amplio pero las alternativas de respuesta deben ser breves. ♦ El enunciado debe ser claro y específico, claramente expuesto (cuál es nuestra pregunta) y que sea positivo, no utilizar la doble negación (pues esta evalúa lo peor de una persona no lo mejor). ♦ Utilizar material novedoso para explorar la creatividad del sujeto. ♦ Asegurarse de que haya solo una respuesta válida o que expresa mejor lo que se pregunta (p.e. en los test de personalidad, la respuesta que manifiesta mejor ese rasgo). Que haya una única respuesta óptima, evidente sobre las demás y asegurarse de que las otras también sean plausibles. ♦ No proporcionar indicadores involuntarios para las respuesta (todas tienen que acercarse a lo que quieren medir). Ventajas: suele ser más objetiva la corrección, existe un mayor acuerdo y se puede corregir mediante el uso del ordenador (p.e. en la selección de personal). Se corrige rápidamente y de forma objetiva se puede comparar y el número de ítems es amplio para tener una muestra representativa de la conducta del sujeto. Recogen mucha información en poco tiempo. Desventajas: para redactarlos bien lleva mucho tiempo (su construcción), no permiten analizar la creatividad del sujeto. A veces es difícil determinar cuando una respuesta óptima es correcta sobre las demás. Su utilización depende del ámbito de trabajo, por ello puede ser mejor o peor en una determinada situación (p.e. para aplicaciones grupales son buenas pero en el ámbito clínico no, serían mejores las de ensayo). ¿Qué peso relativo tiene cada área de evaluación? La característica a evaluar se puede plasmar en diferentes ámbitos, puedo elegir algunos o uno. Si cada ámbito va ser valorado igual habrá un mismo número de ítems para cada área (p.e. la asertividad en la familia, el trabajo, con los amigos), si le damos más relevancia = mayor número de ítems y obtener más muestras de conducta. Temas: Teoría Introd. Test de los Psicometría psicométricos test 20% 40% 40% Conceptos 2 10% Relación Objetivos 30% 4 4 6 12 12 12 24 24 7 Aplicación 60% Total: 100 20 40 40 Está es una tabla de doble entrada, que nos permite darle peso a cada área del test. Para ello no hay una regla fija, es relativo y depende de quien elabora el test. No hay que extrapolar los datos obtenidos en un área a otras (p.e. del laboral al familiar). Toma de decisiones subjetiva. ¿Cómo elegimos los ítems? La elección de los ítems la hace el autor de los test, tomando en cuenta: ♦ Que sean representativos del atributo que quiero medir, ¿cómo se manifiesta ese atributo? observación directa, definir cuál es la manifestación, tomar datos de campo. ♦ Hasta que punto necesito una precisión de los datos, cuanto más estructurado es un ítem más preciso es pero menos creativo. Qué quiero evaluar y qué precisión quiero; me interesan los datos cualitativos o cuantitativos, describir (cualidad, ensayo) o predecir (cantidad, respuesta alternativa). ♦ Las personas, a quien voy a evaluar, considerar edad, nivel sociocultural, académico, contexto, ambiente. Variables del sujeto. ♦ Forma de administración: individual o colectiva. ♦ Tiempo disponible (las pruebas verbales son más rápidas de aplicar y corregir que una manipulativa o gráfica) ♦ Dificultad que le quiero dar a la prueba (p.e. para un niño son más difíciles los ítems verbales que los gráficos). ♦ Destrezas del propio autor del test (p.e. que sepa dibujar). Longitud (cuántos ítems tendrá la prueba): ♦ Ver la característica que quiero evaluar y lo amplia que es (p.e. una característica de personalidad es más amplia que el clima familiar, más concreto), y ver si tengo de esa característica tengo más áreas de evaluación, si es así necesitaré más ítems. Cada uno de los ítems es una muestra de conducta, cuántas más tengamos mejor podremos entender al sujeto pero sin perder el equilibrio (no preguntas en exceso). ♦ Tipo de ítems elegidos (la prueba es más larga o corta según los ítems, las pruebas verbales tienen más ítems, los manipulativos son menos). Demarcar la longitud del test. ♦ Finalidad del instrumento, según ella la longitud puede cambiar. ♦ Forma de aplicación. Los test individuales suelen tener menor número de ítems, en los colectivos se pierden la relación de tú a tú y otra información, hay que tener más 8 preguntas, son más amplios que los individuales (p.e. tiempo de reacción WAIS, dificultad de los ítems y cuánto tiempo necesita para pensar y responder). ♦ Características del sujeto. ♦ Tiempo de aplicación, si tenemos menos tiempo utilizamos test cortos. No hay normas fijas, depende de estos apartados y del autor. ¿Qué nivel de dificultad deben tener los ítems? Tomar en cuenta el tipo de prueba, en las de personalidad tendrá que ser una dificultad media y media−alta, en los test de manipulativos y de inteligencia existirán diferentes niveles. Por ende, hay que valorar lo que mide la prueba y el tipo de sujetos a evaluar (tipo de ítems, presentación, áreas de contenido y características del sujeto marcarán la dificultad). Es importante que el nivel de lectura o lenguaje de los sujetos evaluados no sea un obstáculo para responder a las tareas, debe estar adecuado a su nivel de lenguaje. La única excepción sería si se trata de una prueba en que se evalué el rendimiento en el lenguaje, pero en ellas poco a poco se va aumentado el grado de dificultad para que el sujeto encuentre ítems que pueda resolver. Construcción de las instrucciones del protocolo Instrucciones del protocolo/cuestionario, existen dos niveles de instrucciones: a. Instrucciones para el sujeto que va a realizar el test. Explicar la sujeto cuál es la tarea que va a realizar con un lenguaje claro, precio y sencillo. El protocolo debe proporcionar algún tipo de ejemplo con la tarea ya resuelta, explicarle al sujeto si hay límite de tiempo o no, si existe penalización por las respuestas incorrectas o no (p.e. en test de rendimientos sí). b. Instrucciones para el evaluador (manual del test). − Especificar si el evaluador necesita una preparación previa y de qué tipo. − Circunstancias situacionales: situación ambiental, tiempo que requiere, material a utilizar... − Ficha técnica del test, datos de fiabilidad y validez. − Condiciones y claves de corrección, cómo se utiliza la plantilla si hay. − Condiciones de interpretación del test. 9 − El autor debe decir a que marco teórico pertenece. − Instrucciones de manejo y calidad científica del test. Por último, deben estar las tablas de conversión de datos (baremos) para poder comparar al sujeto con otros, y otras referencias. ♦ Primer estudio empírico Saber si lo que hemos construido es válido o no, se realiza un análisis cuantitativo y cualitativo. Los pasos a seguir son los siguientes: ♦ Identificar y seleccionar una muestra en la cual aplicar el test (debe representar la población a la que va dirigida el test). ♦ Aplicar el test en las mejores condiciones posibles y corregirlo, obtenemos las puntuaciones que nos permitan un primer análisis estadístico descriptivo de los resultados ♦ Análisis de cada uno de los ítems, saber cuáles no son importantes o están mal redactados. Se realiza el análisis en dos niveles: ◊ Cuantitativo. Analizar el contenido (representan lo que miden) y redacción de los ítems (lo buenos que son, si se entienden o no). ◊ Cualitativo. Analizar hasta que punto el ítem discriminan bien, nivel de dificultad que tiene, cómo es de consistente (si siempre mide igual), son homogéneos o heterogéneos, independencia de cada uno de los ítems, hasta que punto responden bien a la finalidad del test, interesa comparar el ítem consigo mismo y el exterior. ♦ Reestructuración de la prueba, modificar los ítems que están mal o quitarlos, dejar los que sirven, cambio en el orden o la presentación. ♦ Segundo estudio empírico Volver a aplicar el test, ampliar la muestra de sujetos, para baremar el test. Su objetivo es garantizar la bondad del instrumento desde el punto de vista psicométrico y científico. La muestra debe ser realmente representativa de la población para que sea punto de comparación para los sujetos futuros. Se deben tomar en cuenta todas las variables (edad, sexo, nivel académico o sociocultural...). No debe ser un muestreo aleatorio sino que se debe hacer una estratificación (p.e. mismo porcentaje de hombres y mujeres, en clase serían más chicas que chicos), se deben utilizar estrategias de muestreo. ♦ Aplicación del test Se analizan los ítems para validar nuevamente el 10 instrumento, confrontar que está bien. ♦ Estudio de la fiabilidad del test Elegir el método más apropiado (estadísticos de correlación), nos dicen hasta que punto esos datos obtenidos nos dan una seguridad porque se mantiene en el tiempo (p.e. una balanza que siempre de el mismo peso para un objeto). Si hay estabilidad en la medida es una medida fiable pero no me asegura que es buena (p.e. si la balanza pesa 2kg. de más), puede conllevar error, por ello se necesita la validez. ♦ Estudio de la validez del test Existen diferentes modos dependiendo de la finalidad que tiene, saber hasta que punto es válido y útil ♦ Capacidad de predicción del test (también estadísticos) ♦ Tipificación Elegir las normas a partir de las cuales hacer la tipificación y luego pasamos las puntuaciones directas a puntuaciones indirectas, lo hacemos a través de un baremo. En base a los datos de la muestra normativa. ♦ Llevarlo a la imprenta, ponerle precio y distribuirlo Definiciones: Análisis de los ítems, ordenar y analizar los datos de la muestra o población. Población estadística, conjunto de elementos que cumplen una serie de características o propiedades en común. Población finita, conocemos el número de sujetos y en la población infinita no lo sabemos. Muestra, es la parte representativa de la población. Estadística, es la ciencia. Estadísticos son operaciones matemáticas que proporcionan descripciones de una muestra. Parámetro, propiedad que le pertenece a la población. Cualidad, atributo. Modalidad, cómo se presenta la característica. Medición, proceso de atribución de números a características 11 o cualidades. Escalas de medición, uso que se les da a los números. Los atributos pueden ser: variables, pueden tomar diferentes números o valores y se puede mostrar en diferentes modalidades (cuantitativa: género, profesión y cualitativa: rasgos de personalidad, altura) y constantes. Valor de la variable, dato cuantitativo de ese momento. Las variables cuantitativas pueden ser: discretas, solo puede tomar un número finito de valores (p.e. número de hijos, ji cuadrada) y continuas, que al menos teóricamente puede tomar infinitos valores en un intervalo (p.e. talla, peso). Estadística descriptiva, describen la muestra a partir de una o más características o variables. Intenta describir y analizar a una muestra en base a características o variables. Estadística inferencial, a partir de una muestra representativa no sesgada, tener un conocimiento de la representatividad de la población. Hacemos inferencias de que eso le pertenece a una población. En la estadística inferencial adquieren mucha importancia las puntuaciones: − Puntuaciones directas o brutas, aquellas que se obtienen a partir de la medida de una característica manifiesta (p.e. el Raven 84, pero no da mucha información psicológica, para saberlo es necesario comparar esa información: la puntuación obtenida por el sujeto menos la media del grupo pero a veces esta medida queda corta). − Puntuaciones indirectas o ponderadas, para que tengan un sentido es necesario transformar las puntuaciones para poder hacer comparaciones. Es importante comparar de la forma más exacta posible, lo más verídica (que me compare con mi grupo de referencia real). Por ejemplo, si se aplica un test de razonamiento abstracto para compararlo con el rendimiento de las notas de matemática, es necesario saber cómo es el grupo, cómo se distribuyen las puntuaciones (representación gráfica: diagrama de barras, histograma: polígono de frecuencias, pictograma, etc.). Es necesario analizar los datos, ordenarlos a través de una tabla de frecuencias o gráfico, donde se resuma la realidad objetiva de los datos. Luego a partir de la representación gráfica se siguen operando los datos. En la estadística descriptiva veremos cómo son los chicos, cómo se comportan como grupo (estadísticos de posición: media−promedio de actuación del grupo, moda−valor que 12 más se repite, mediana−punto que divide a al distribución en dos parte iguales, percentiles−50% a la izquierda y 50% a la derecha. La desviación típica, variable del grupo con respecto a la media (si esta fuera de la desviación típica del grupo, el sujeto seria anormal estadísticamente), nos dice la posición del sujeto, si está cerca o no del grupo, si hay diferencia o no entre los miembros. Nos muestra cuánto se desvía cada sujeto con respecto a la media. La varianza, nos dice si como grupo somos muy homogéneos o heterogéneos, variación total de grupo con respecto a otros grupos. Si la varianza es pequeña el grupo será más homogéneo (parecido) y si es grande, el grupo será más heterogéneo (más diferente). Coeficiente de variación, comparar a un grupo con respecto a otros (CV = (S/X) x 100). Para poder inferir y predecir se necesitan los estadísticos de correlación (expresan la relación entre dos o más conjuntos de puntuaciones o variables). Cuando nos interesa saber la relación entre dos características se utiliza la estadística descriptiva. En la correlación, dos o más variables que covarían juntas, nos basamos en las varianzas del grupo. También existen correlaciones múltiples. Los valores de la correlación directa van de +1 a −1 y los de la correlación inversa de 0 a +1. Son necesarias las medidas de relación en: ♦ Cuando nos interesa saber la relación entre dos características o variables (describir). ♦ Cuando estudiamos la relación entre dos variables para hacer una predicción a partir de los datos de otra. ♦ Determinar hasta que punto un test o instrumento psicológico es útil como instrumento de medición (fiabilidad). ♦ A partir de un instrumento o test pretendemos evaluar las características actuales de la persona para predecir otras que aun no se han dado (p.e. mejores notas, mejor profesional?) Los estadísticos de correlación se utilizan en unas condiciones determinadas, por ejemplo, para variables continuas, lineales se utiliza la r de Pearson pero si las variables son nominales se utiliza la ji cuadrada (nombran) y para variables ordinales la r de Spearman (cuando se han ordenado). A veces hay variables continuas que las hacemos discretas, variables dicotómicas (p.e. género), las que tienen dos categorías (altura, variable continua), la podemos dicotomizar artificialmente (pequeños, altos), ji cuadrada. 13 La mayor parte de la población está en un límite determinado, media + 3 desviaciones típicas, se hallan el 99.8% de los sujetos. El 95.4% en + 2 s y el 68.2% + 1 s. Por ejemplo, aquí con una desviación típica (s) = 0.5, las notas estaría entre 4.5 y 7.5, un 9 seria anormal estadísticamente Preguntas: ♦ ¿Cuál es la tendencia de esas puntuaciones?, ¿cómo se representan gráficamente el conjunto de puntuaciones para saber cómo se comporta el grupo? Para saber la tendencia de las puntuaciones podemos analizar en base a los estadísticos de posición (media, mediana, moda), en este caso utilizamos la moda porque es la que más se repite y se representa gráficamente un histograma (polígono de frecuencias). ♦ A través de qué estadístico podemos saber el promedio de actuación del grupo. La media ♦ ¿Cómo podemos saber como de bueno es el grupo respecto a otro grupo del colegio? Diferencia de medias, si es significativa (el grupo con mayor diferencia tendrá una mejor actuación). ♦ ¿Cuál es el nivel típico de ejecución de grupo? Moda (porque nos da el que más se repite). ♦ Los chicos con muy iguales o no entre sí, ¿cómo es de amplia su variación? Estadísticos de dispersión, porque nos dan la posición del individuo con respecto a su grupo (desviación típica), nos dice cómo de homogéneo es el grupo. La varianza nos daría la dispersión total del grupo y para saber cómo de amplia es esa dispersión (amplitud o recorrido de una distribución), le restamos al dato máximo el dato mínimo. ♦ ¿Cuál es la dispersión de todo el grupo? La dispersión grupal nos la da la varianza (mientras que la desviación típica nos dice cuánto se desvía el sujeto respecto al grupo, los percentiles solo nos dan una posición aproximada del sujeto−posición relativa). Cuanto más te alejas de la media hay mayor dispersión, más cerca de la 14 media las puntuaciones entre sujetos están más cercanas, entre más lejos de la media más lejanas las puntuaciones entre los sujetos). ♦ ¿Cuál es el lugar concreto de un sujeto con respecto a ese grupo? Puntuación típica (z), nos da la posición exacta del sujeto (al tipificar las puntuaciones puedo comparar puntuaciones de diferentes variables). ♦ Relación entre la capacidad de abstracción y el rendimiento en matemática, cuál es la relación, se dan juntas estas dos variables. Si covarian juntos (la covarianza nos da la correlación). Análisis de los ítems Se puede hacer de forma cualitativa o cuantitativa. El análisis cuantitativo se puede realizar con una tabla de doble entrada, en la parte superior se coloca cada ítem con sus alternativas de respuesta y en las columnas se pone la actuación de cada alumno, que respuesta a dado. La siguiente tabla es un ejemplo de matriz de datos: 1 Sujeto a b 2 c a b 3 c a b 15

PSICOMETRÍA TEMA 1: EL PROBLEMA DE LA MEDICIÓN EN PSICOLOGÍA Introducción •

Productos

Apoyo

PSICOMETRÍA TEMA 1: EL PROBLEMA DE LA MEDICIÓN EN PSICOLOGÍA Introducción •

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib