PSICOMETRÍA TEMA 1: EL PROBLEMA DE LA MEDICIÓN EN PSICOLOGÍA Introducción •

Anuncio
PSICOMETRÍA
TEMA 1: EL PROBLEMA DE LA MEDICIÓN EN PSICOLOGÍA
• Introducción
La Psicometría es la rama de la Psicología que se ocupa de cuestiones relacionadas con la medición de
aspectos psicológicos. El psicodiagnóstico y la evaluación psicológica están tomadas de la interacción entre
psicometría y el desarrollo de instrumentos de medida.
La psicometría trata dos grandes áreas:
• Contenido de aplicación, cómo se desarrollan y aplican los test.
• Contenido teórico de la teoría de los test (estadística e informática).
Los test psicométricos son una medida objetiva y tipificada de una muestra de conducta que han sido
cuidadosamente elegidos y que están controlados de antemano. Fundamentalmente nos permiten hacer
descripciones, una descripción es mucho más exacta si conlleva o no medición. Nos permiten con posibilidad
de errores hacer pronósticos, más exactos que solo cualitativos. Nos sirve para comparar a una persona con
otra, a una misma persona en diferentes momentos de su vida; deben existir reglas para medir y comparar
(también es un campo de la psicometría). Los test deben saber utilizarse, miden bien si están bien utilizados.
Es necesario elegirlos en base a la naturaleza de la cuestión a medir. El valor de un test es relativo (p.e. un
microscopio nos puede servir para ver partículas pero no para ver astros), puede servir para una personas pero
para otras no, y cuesta determinarlo (riesgo de utilizar inadecuadamente un test por eso hay que saber a quién
y para qué se usa).
• Métodos de medición
Método de prueba. Es un test psicométrico, en el que están controlados todos los ítems, forma de aplicación,
corrección y análisis de resultados. Hay una gran estandarización y son bastante artificiales (p.e. MMPI).
Método observacional de medición. Se mide la conducta manifiesta de una persona de forma más natural,
menos controlada, en la vida cotidiana.
Métodos mixtos. Se puede planificar una observación para medir, yo la planifico, algo estratégico, normalizo
algunos de los pasos pero la hago en el medio natural.
• Escalas de medición
Para simplificar las cosas se les puede asignar números a los datos, dependiendo del uso que se les de. Cada
una de las escalas de medición conlleva diferente operación matemática, algunos tipos de escalas son:
• Rótulos. Es una utilización del número (no es una medida en sí). Por ejemplo, el número uno de la
lista, solo nombra−permite identificar personas, objetos, cosas... pero no tiene una implicación
matemática.
• Categorías. Cuando los números nos permiten agrupar a más de un objeto por algo común o
semejante que tengan respecto a un atributo o característica (p.e. 1 chico, 2 chicas; son posibles de
manejar matemáticamente).
• Ordinales. Permiten ordenar a las personas u objetos en base a una característica−atributo, a la
manifestación de ese atributo en esas personas. Tenemos un punto de partida, no sabemos si es cero
1
(p.e. uno es más alto que el otro).
• Intervalo. Tenemos información del orden de la diferencia de tamaño de una clasificación y se puede
tener otro (p.e. edad).
• Razón o proporción. Se usa el punto cero, se hace una comparación (porcentaje, percentiles)
En base a las escalas existen diferentes baremos, tipificaciones y manejo de formas de medida.
• Normas de medida
Criterios. No tienen porque tener una normalización o ser comparados con otros. Permiten una meta a
conseguir, la comparación es personal (p.e. reducir el número de cigarros que fuma una persona de 20 a 10).
Normas. Normalmente nos permiten saber cómo manejar los números, cómo asignarlos con el propósito de
representar una característica. Se asignan números de manera uniforme/estándar, permiten comparar ya que
utiliza unas mismas reglas para medir a diferentes personas. Comparación grupal (la normalización es
utilizada para comparar unas personas con otras).
Los test psicométricos están basados en normas, comparaciones grupales pero no están basadas en normas
(p.e. escalas subjetivas basadas en criterios). Las normas de medición no tienen valor moral ni ético solo
numérico/estadístico.
Las normas de medida las trasladamos a la norma social (p.e. decir que la persona se encuentra por encima o
debajo de la media, como resultado de un test, no tiene valor moral). Cuando transformamos el número y le
damos una cualidad, hacemos una interpretación del número relativa y con posibilidad de errores.
Algunas normas básicas para establecer comparaciones son:
• Normas de edad. Punto de referencia que compara, se elige una muestra normativa (muestre que
represente a la población en la cual vamos a utilizar esa medida y en base a la cual vamos a extraer las
reglas que utilizaremos). Por ejemplo, en un test infantil se escogen niños de diferentes edades, extraemos
el promedio de actuación (la media) y de ahí podemos decir que lo normal es que un niño de 6 años es que
saqué 7 puntos en ese test, si lo hace estaría en la media pero si saca 5 puntos estaría por debajo, o por
encima si saca 8 puntos. Se compara a los niños de 6 años con la media de actuación de esa edad.
• Normas de grado. La muestra normativa se elige en base a un nivel escolar (p.e. se extrae en base a los
niños de primer grado no según la edad, test escolares).
• Normas de porcentaje. No se necesita escoger una muestra normativa externa, se puede utilizar el propio
grupo de muestra (p.e. percentiles, campana de Gauss y de ahí las notas).
• Normas estándares o de tipificación. No solo se utiliza el grupo de referencia y el punto medio de
actuación sino que se compara el grupo con la media y la desviación típica, es más compleja (p.e. t de
student, se pueden obtener tipificando las normas de porcentaje)
Estas normas se pueden combinar entre sí y en base a estas normas haremos los baremos, transformación de
las puntuaciones directas en puntuaciones indirectas (p.e en el WAIS, puntuaciones escalares), y ello da la
normalidad o no al grupo. Las escalas normativas son combinación de escalas de medición (uso de los
números) y las reglas que seguimos para medir (normas). Existen diferentes tipos (centiles, cociente
intelectual):
♦ Escala típicas.
♦ Escalas típicas normalizadas y derivadas de estas puntuaciones típicas normalizadas y
transformadas , para que no sean negativas y no se trabaje con decimales (p.e. eneatipos 1 a 9,
del 1 al 10).
2
TEMA 2: LOS TEST PSICOMÉTRICOS
2.1 Características
Son procesos estandarizados de recogida de información, son voluntarios, no enmascarados (sabemos la
finalidad de la prueba) y estandarizados. Se basan en procedimientos estadísticos y el material esta tipificado
(que todos lo utilizan de forma uniforme, en la aplicación, corrección e interpretación).
Los test psicométricos iniciaron dentro de la teoría de los rasgos, pero actualmente se apoyan en diferentes
modelos, tienen en común que poseen una base empírica y todos intentan medir.
2.2 Componentes de los test
• Manual técnico de descriptores del test
• Descripción del test (¿para qué sirve?, autor, año de publicación, cómo se comercializa).
• Desarrollo de las escalas (qué pasos siguió para elaborar los ítems, tareas, qué modificaciones se han
dado, criterios seguidos paras las modificaciones)
• Proceso de adaptación española del test..
• Justificación estadística (tratamiento de los datos, fiabilidad, validez, estudios comparativos, grupos
normativos especiales, estudios transculturales).
• Normas de interpretación (parámetros de cómo valorar cada una de las puntuaciones que se han
obtenido).
• Otros (bibliografía).
• Tablas de los normativos (estudios de estandariazación).
WAIS:
a. Estimación de las capacidades intelectuales de una persona.
c. Adaptación de un test en otra lengua a la española (cómo se han superado los sesgos culturales p.e. en los
subtest de información)
g. Datos estadísticos de las características de la muestra con la que se ha hecho la estadarización (p.e. edad,
sexo, nivel educativo) en el WAIS p.e. hay datos de varias edades.
• Manual de aplicación y corrección (cómo se administran cada una de las tareas):
• Ámbito de aplicación (lugar)
• Cualificación del examinador (condiciones psicológica en individuales, si tiene dificultad para
comprender o algún problema sensorial).
• Procedimiento normalizado (reglas, instrucciones, etc.)
• Tiempo de aplicación (para cada subtest, tiempo mínimo esperado en el WAIS hora y media).
• Condiciones ambientales.
• Tablas y baremos de corrección y ajustes estadísticos (inicialmente aparecen diferenciados para cada
subgrupo de edad)
• Obtención de puntuaciones típicas, escalares y CI/índices.
• Cuadernillo/hoja de respuestas, pueden estar o no.
• Materiales de administración para cada test.
• Plantilla de corrección: manual o informatizada.
3
2.4 Presentación de un test
La forma de presentación de un test difiere según la finalidad de este, existen cuatro tipos:
• Forma de presentación de los ítems (preguntas y respuestas).
♦ Verbales.
♦ Gráficos (p.e. visuales, test de Raven, test de dominó).
♦ Manipulativos
♦ Mixtos (WAIS).
♦ Contenido del test. Cómo está estructurado, pueden ser:
⋅ Homogéneo o de tarea única, siempre se realiza la misma tarea (MMPI).
⋅ Ómnibus, tiene diferentes tareas con diferentes puntuaciones pero que llevan
a una única puntuación global (p.e. WAIS).
⋅ Batería de test, son múltiples tareas pero con diferentes puntuaciones (p.e.
batería de aptitudes diferenciales de Thurstone, se saca un perfil con
diferentes puntuaciones, que son independientes entre sí).
⋅ Tipo de respuesta, que se le pide al sujeto:
♦ Respuesta ya elaborada por el autor del test (p.e. exámenes
tipo test, se selecciona la R/)
♦ Test de producción de respuesta, el sujeto produce su propia
respuesta (p.e. examen de desarrollo).
♦ Según la aplicación del test:
⋅ Colectiva, se pueden aplicar también de
forma individual.
⋅ Individual, no se pueden aplicar de forma
colectiva.
2.4 Etapas de elaboración de un test
♦ Demarcación de la prueba:
¿Qué queremos hacer? (p.e. un test de calidad de vida del
enfermo de cáncer, ya está hecho o no, cómo es, hacer un
estudio de mercado).
Ubicar el instrumento, definir qué voy a medir, a qué
problema va ser dirigido (p.e. calidad de vida, cáncer), qué
deseo hacer con el, para qué sirve (p.e. clasificar, intervenir,
saber el estado actual de su enfermedad). Buscar a nivel
práctico y teórico.
♦ Delimitación conceptual y operativa:
a. Fundamentar teóricamente el atributo a medir, buscar
bibliografía (qué es calidad de vida).
b. Definir el objetivo, finalidad y uso del test (por qué y para
qué se construye el instrumento)
c. Elegir a qué sujeto se destina el test (para quién se hace el
instrumento (personas con cáncer del País Vasco). Con
mayor precisión en la definición pensaremos mejor en ellas.
4
d. Establecer cómo se va a aplicar el instrumento, colectivo o
individual, procedimiento y presentación.
♦ Cómo se define de forma operativa ese atributo.
♦ Elaboración del protocolo:
♦ Formato del test: gráfico, verbal, manipulativo..., forma de
presentación: cuadernillo, hoja de respuesta.
♦ Ítems que va a tener el instrumento (verbales−creencias,
gráficos−niños, manipulativos o mixtos). Se elaboran en base
a la edad, contexto sociocultural, qué es lo que yo quiero
valorar ¿Cuántos ítems hacer?, a la hora de construir el test
hacer un 25% más de ítems por los que se puedan desechar.
Tiempo disponible para la aplicación y tipo de tarea.
Elaboración de ítems, ¿cómo ordenarlos? (p.e. de menor a
mayor dificultad). Presentación del test (hoja de
instrucciones, ejercicios prácticos como modelo, ficha de
identificación o no, etc.).
Construcción de los ítems
◊ Ítems de construcción de respuesta libre o
producción de respuesta:
♦ Ítems de ensayo. El sujeto debe responder con sus propias
palabras, no hay una única respuesta. Es la más completa. El
sujeto desarrolla de forma abierta y libre una respuesta ante
una pregunta que se plantea, desde una perspectiva personal
y su propio lenguaje. Puede ser verbal, manipulativo o
gráfico.
Ventajas: se recoge la creatividad/originalidad de la
respuesta del sujeto, se permiten varias respuestas verdaderas
y se puede valorar no solo lo que dice sino también cómo lo
expone y lo construye (información adicional).
Desventajas: la subjetividad a la hora de construir y,
fundamentalmente, a la hora de valorar estos ítems
(diferentes evaluadores no llegan al mismo acuerdo, es
diferente según el juez, evaluación sesgada, a no ser que
evalué un solo juez).
Sobre los demás tiene la ventaja de tener la mejor manera de
valorar la creatividad y originalidad del sujeto.
♦ Ítems de respuesta restringida. En los que se le pide una
respuesta breve, tiene menor libertad pero se puede ampliar
el número de ítems (hacer más preguntas).
Ventajas: corrección rápida y se llega a un acuerdo entre
jueces.
Desventajas: perdemos mucho la valoración de la
5
creatividad del sujeto y sigue siendo subjetiva.
Son más globalistas.
◊ Ítems de respuesta estructurada o elección de
respuesta:
Se pierde totalmente la posibilidad de valorar respuestas
creativas (p.e. exámenes tipo test), se le dan las respuestas al
sujeto y se le pide que elija una alternativa. La muestra es
mucho mayor, se hacen más preguntas. Se responde a cada
ítem por separado, son independientes entre sí y se suelen
puntuar uno a uno.
Ventajas: permiten la comparación de grupo por presentar
las mismas respuesta a cada sujeto. Más fáciles de
cuantificar, mayor precisión, hay una clave de corrección
clara y por ende, más acuerdo entre los jueces.
Desventaja: menor libertad a la hora de responder, no se
valora la originalidad y creatividad. Perdemos cualidades,
son muy atomistas (analiza una pequeña parte del
comportamiento del sujeto). Existen diferentes tipos:
♦ Ítems de respuesta alterna. Verdadero−falso, sí−no.
♦ Asegurarse de que el ítem se puede clasificar
inequívocamente de verdadero o falso.
♦ Utilización de términos que no sean generales o universales,
pues son erróneos (nunca, siempre, todas, ninguna...)
♦ Evitar el empleo de términos ambiguos o indefinidos para
asignar cantidad (p.e. hace ejercicio frecuentemente?, la
interpretación de este puede variar de una persona a otra). Es
necesario poner cantidad (3, 4 o más veces por semana).
♦ Procurar no utilizar negaciones (enunciados negativos) y
muchísimo menos la doble negación (pues esto afirma).
♦ Limitar los enunciados de verdadero−falso a una sola idea
(una idea para cada enunciado)
♦ Que los enunciados tengan aproximadamente la misma
extensión (p.e. generalmente, un enunciado verdadero es más
extenso que uno falso).
Ventajas: se pueden construir muchos, recoger más
muestras de conducta, son fáciles de corregir y rápidos.
Desventajas: difíciles de construir, pierde la capacidad de
creatividad.
♦ Ítems de elección de respuesta múltiple.
♦ Poseen más de dos alternativas, generalmente de 3 a 5. Son
más flexibles, representan mejor lo que quieren evaluar, hay
más opciones para el sujeto.
♦ Es necesario delimitar bien el enunciado de las alternativas
de respuesta. El enunciado debe contener toda la pregunta
6
(saber que estamos preguntando y poner las alternativas
pertinentes). El enunciado puede ser amplio pero las
alternativas de respuesta deben ser breves.
♦ El enunciado debe ser claro y específico, claramente
expuesto (cuál es nuestra pregunta) y que sea positivo, no
utilizar la doble negación (pues esta evalúa lo peor de una
persona no lo mejor).
♦ Utilizar material novedoso para explorar la creatividad del
sujeto.
♦ Asegurarse de que haya solo una respuesta válida o que
expresa mejor lo que se pregunta (p.e. en los test de
personalidad, la respuesta que manifiesta mejor ese rasgo).
Que haya una única respuesta óptima, evidente sobre las
demás y asegurarse de que las otras también sean plausibles.
♦ No proporcionar indicadores involuntarios para las respuesta
(todas tienen que acercarse a lo que quieren medir).
Ventajas: suele ser más objetiva la corrección, existe un
mayor acuerdo y se puede corregir mediante el uso del
ordenador (p.e. en la selección de personal). Se corrige
rápidamente y de forma objetiva se puede comparar y el
número de ítems es amplio para tener una muestra
representativa de la conducta del sujeto. Recogen mucha
información en poco tiempo.
Desventajas: para redactarlos bien lleva mucho tiempo (su
construcción), no permiten analizar la creatividad del sujeto.
A veces es difícil determinar cuando una respuesta óptima es
correcta sobre las demás. Su utilización depende del ámbito
de trabajo, por ello puede ser mejor o peor en una
determinada situación (p.e. para aplicaciones grupales son
buenas pero en el ámbito clínico no, serían mejores las de
ensayo).
¿Qué peso relativo tiene cada área de evaluación?
La característica a evaluar se puede plasmar en diferentes
ámbitos, puedo elegir algunos o uno. Si cada ámbito va ser
valorado igual habrá un mismo número de ítems para cada
área (p.e. la asertividad en la familia, el trabajo, con los
amigos), si le damos más relevancia = mayor número de
ítems y obtener más muestras de conducta.
Temas:
Teoría
Introd.
Test
de los
Psicometría psicométricos
test
20%
40%
40%
Conceptos
2
10%
Relación
Objetivos
30%
4
4
6
12
12
12
24
24
7
Aplicación
60%
Total: 100 20
40
40
Está es una tabla de doble entrada, que nos permite darle
peso a cada área del test. Para ello no hay una regla fija, es
relativo y depende de quien elabora el test. No hay que
extrapolar los datos obtenidos en un área a otras (p.e. del
laboral al familiar). Toma de decisiones subjetiva.
¿Cómo elegimos los ítems?
La elección de los ítems la hace el autor de los test, tomando
en cuenta:
♦ Que sean representativos del atributo que quiero medir,
¿cómo se manifiesta ese atributo? observación directa,
definir cuál es la manifestación, tomar datos de campo.
♦ Hasta que punto necesito una precisión de los datos, cuanto
más estructurado es un ítem más preciso es pero menos
creativo. Qué quiero evaluar y qué precisión quiero; me
interesan los datos cualitativos o cuantitativos, describir
(cualidad, ensayo) o predecir (cantidad, respuesta
alternativa).
♦ Las personas, a quien voy a evaluar, considerar edad, nivel
sociocultural, académico, contexto, ambiente. Variables del
sujeto.
♦ Forma de administración: individual o colectiva.
♦ Tiempo disponible (las pruebas verbales son más rápidas de
aplicar y corregir que una manipulativa o gráfica)
♦ Dificultad que le quiero dar a la prueba (p.e. para un niño son
más difíciles los ítems verbales que los gráficos).
♦ Destrezas del propio autor del test (p.e. que sepa dibujar).
Longitud (cuántos ítems tendrá la prueba):
♦ Ver la característica que quiero evaluar y lo amplia que es
(p.e. una característica de personalidad es más amplia que el
clima familiar, más concreto), y ver si tengo de esa
característica tengo más áreas de evaluación, si es así
necesitaré más ítems. Cada uno de los ítems es una muestra
de conducta, cuántas más tengamos mejor podremos
entender al sujeto pero sin perder el equilibrio (no preguntas
en exceso).
♦ Tipo de ítems elegidos (la prueba es más larga o corta según
los ítems, las pruebas verbales tienen más ítems, los
manipulativos son menos). Demarcar la longitud del test.
♦ Finalidad del instrumento, según ella la longitud puede
cambiar.
♦ Forma de aplicación. Los test individuales suelen tener
menor número de ítems, en los colectivos se pierden la
relación de tú a tú y otra información, hay que tener más
8
preguntas, son más amplios que los individuales (p.e. tiempo
de reacción WAIS, dificultad de los ítems y cuánto tiempo
necesita para pensar y responder).
♦ Características del sujeto.
♦ Tiempo de aplicación, si tenemos menos tiempo utilizamos
test cortos. No hay normas fijas, depende de estos apartados
y del autor.
¿Qué nivel de dificultad deben tener los ítems?
Tomar en cuenta el tipo de prueba, en las de personalidad
tendrá que ser una dificultad media y media−alta, en los test
de manipulativos y de inteligencia existirán diferentes
niveles. Por ende, hay que valorar lo que mide la prueba y el
tipo de sujetos a evaluar (tipo de ítems, presentación, áreas
de contenido y características del sujeto marcarán la
dificultad). Es importante que el nivel de lectura o lenguaje
de los sujetos evaluados no sea un obstáculo para responder a
las tareas, debe estar adecuado a su nivel de lenguaje. La
única excepción sería si se trata de una prueba en que se
evalué el rendimiento en el lenguaje, pero en ellas poco a
poco se va aumentado el grado de dificultad para que el
sujeto encuentre ítems que pueda resolver.
Construcción de las instrucciones del protocolo
Instrucciones del protocolo/cuestionario, existen dos niveles
de instrucciones:
a. Instrucciones para el sujeto que va a realizar el test.
Explicar la sujeto cuál es la tarea que va a realizar con un
lenguaje claro, precio y sencillo. El protocolo debe
proporcionar algún tipo de ejemplo con la tarea ya resuelta,
explicarle al sujeto si hay límite de tiempo o no, si existe
penalización por las respuestas incorrectas o no (p.e. en test
de rendimientos sí).
b. Instrucciones para el evaluador (manual del test).
− Especificar si el evaluador necesita una preparación previa
y de qué tipo.
− Circunstancias situacionales: situación ambiental, tiempo
que requiere, material a utilizar...
− Ficha técnica del test, datos de fiabilidad y validez.
− Condiciones y claves de corrección, cómo se utiliza la
plantilla si hay.
− Condiciones de interpretación del test.
9
− El autor debe decir a que marco teórico pertenece.
− Instrucciones de manejo y calidad científica del test.
Por último, deben estar las tablas de conversión de datos
(baremos) para poder comparar al sujeto con otros, y otras
referencias.
♦ Primer estudio empírico
Saber si lo que hemos construido es válido o no, se realiza un
análisis cuantitativo y cualitativo. Los pasos a seguir son los
siguientes:
♦ Identificar y seleccionar una muestra en la cual aplicar el test
(debe representar la población a la que va dirigida el test).
♦ Aplicar el test en las mejores condiciones posibles y
corregirlo, obtenemos las puntuaciones que nos permitan un
primer análisis estadístico descriptivo de los resultados
♦ Análisis de cada uno de los ítems, saber cuáles no son
importantes o están mal redactados. Se realiza el análisis en
dos niveles:
◊ Cuantitativo. Analizar el contenido (representan lo
que miden) y redacción de los ítems (lo buenos que
son, si se entienden o no).
◊ Cualitativo. Analizar hasta que punto el ítem
discriminan bien, nivel de dificultad que tiene, cómo
es de consistente (si siempre mide igual), son
homogéneos o heterogéneos, independencia de cada
uno de los ítems, hasta que punto responden bien a la
finalidad del test, interesa comparar el ítem consigo
mismo y el exterior.
♦ Reestructuración de la prueba, modificar los ítems que están
mal o quitarlos, dejar los que sirven, cambio en el orden o la
presentación.
♦ Segundo estudio empírico
Volver a aplicar el test, ampliar la muestra de sujetos, para
baremar el test. Su objetivo es garantizar la bondad del
instrumento desde el punto de vista psicométrico y científico.
La muestra debe ser realmente representativa de la población
para que sea punto de comparación para los sujetos futuros.
Se deben tomar en cuenta todas las variables (edad, sexo,
nivel académico o sociocultural...). No debe ser un muestreo
aleatorio sino que se debe hacer una estratificación (p.e.
mismo porcentaje de hombres y mujeres, en clase serían más
chicas que chicos), se deben utilizar estrategias de muestreo.
♦ Aplicación del test
Se analizan los ítems para validar nuevamente el
10
instrumento, confrontar que está bien.
♦ Estudio de la fiabilidad del test
Elegir el método más apropiado (estadísticos de correlación),
nos dicen hasta que punto esos datos obtenidos nos dan una
seguridad porque se mantiene en el tiempo (p.e. una balanza
que siempre de el mismo peso para un objeto). Si hay
estabilidad en la medida es una medida fiable pero no me
asegura que es buena (p.e. si la balanza pesa 2kg. de más),
puede conllevar error, por ello se necesita la validez.
♦ Estudio de la validez del test
Existen diferentes modos dependiendo de la finalidad que
tiene, saber hasta que punto es válido y útil
♦ Capacidad de predicción del test (también estadísticos)
♦ Tipificación
Elegir las normas a partir de las cuales hacer la tipificación y
luego pasamos las puntuaciones directas a puntuaciones
indirectas, lo hacemos a través de un baremo. En base a los
datos de la muestra normativa.
♦ Llevarlo a la imprenta, ponerle precio y distribuirlo
Definiciones:
Análisis de los ítems, ordenar y analizar los datos de la
muestra o población.
Población estadística, conjunto de elementos que cumplen
una serie de características o propiedades en común.
Población finita, conocemos el número de sujetos y en la
población infinita no lo sabemos.
Muestra, es la parte representativa de la población.
Estadística, es la ciencia.
Estadísticos son operaciones matemáticas que proporcionan
descripciones de una muestra.
Parámetro, propiedad que le pertenece a la población.
Cualidad, atributo.
Modalidad, cómo se presenta la característica.
Medición, proceso de atribución de números a características
11
o cualidades.
Escalas de medición, uso que se les da a los números.
Los atributos pueden ser: variables, pueden tomar
diferentes números o valores y se puede mostrar en
diferentes modalidades (cuantitativa: género, profesión y
cualitativa: rasgos de personalidad, altura) y constantes.
Valor de la variable, dato cuantitativo de ese momento.
Las variables cuantitativas pueden ser: discretas, solo
puede tomar un número finito de valores (p.e. número de
hijos, ji cuadrada) y continuas, que al menos teóricamente
puede tomar infinitos valores en un intervalo (p.e. talla,
peso).
Estadística descriptiva, describen la muestra a partir de una
o más características o variables. Intenta describir y analizar
a una muestra en base a características o variables.
Estadística inferencial, a partir de una muestra
representativa no sesgada, tener un conocimiento de la
representatividad de la población. Hacemos inferencias de
que eso le pertenece a una población. En la estadística
inferencial adquieren mucha importancia las puntuaciones:
− Puntuaciones directas o brutas, aquellas que se obtienen
a partir de la medida de una característica manifiesta (p.e. el
Raven 84, pero no da mucha información psicológica, para
saberlo es necesario comparar esa información: la puntuación
obtenida por el sujeto menos la media del grupo pero a veces
esta medida queda corta).
− Puntuaciones indirectas o ponderadas, para que tengan
un sentido es necesario transformar las puntuaciones para
poder hacer comparaciones. Es importante comparar de la
forma más exacta posible, lo más verídica (que me compare
con mi grupo de referencia real). Por ejemplo, si se aplica un
test de razonamiento abstracto para compararlo con el
rendimiento de las notas de matemática, es necesario saber
cómo es el grupo, cómo se distribuyen las puntuaciones
(representación gráfica: diagrama de barras, histograma:
polígono de frecuencias, pictograma, etc.).
Es necesario analizar los datos, ordenarlos a través de una
tabla de frecuencias o gráfico, donde se resuma la realidad
objetiva de los datos. Luego a partir de la representación
gráfica se siguen operando los datos. En la estadística
descriptiva veremos cómo son los chicos, cómo se
comportan como grupo (estadísticos de posición:
media−promedio de actuación del grupo, moda−valor que
12
más se repite, mediana−punto que divide a al distribución en
dos parte iguales, percentiles−50% a la izquierda y 50% a la
derecha.
La desviación típica, variable del grupo con respecto a la
media (si esta fuera de la desviación típica del grupo, el
sujeto seria anormal estadísticamente), nos dice la posición
del sujeto, si está cerca o no del grupo, si hay diferencia o no
entre los miembros. Nos muestra cuánto se desvía cada
sujeto con respecto a la media.
La varianza, nos dice si como grupo somos muy
homogéneos o heterogéneos, variación total de grupo con
respecto a otros grupos. Si la varianza es pequeña el grupo
será más homogéneo (parecido) y si es grande, el grupo será
más heterogéneo (más diferente).
Coeficiente de variación, comparar a un grupo con respecto
a otros (CV = (S/X) x 100). Para poder inferir y predecir se
necesitan los estadísticos de correlación (expresan la relación
entre dos o más conjuntos de puntuaciones o variables).
Cuando nos interesa saber la relación entre dos
características se utiliza la estadística descriptiva.
En la correlación, dos o más variables que covarían juntas,
nos basamos en las varianzas del grupo. También existen
correlaciones múltiples. Los valores de la correlación directa
van de +1 a −1 y los de la correlación inversa de 0 a +1. Son
necesarias las medidas de relación en:
♦ Cuando nos interesa saber la relación entre dos
características o variables (describir).
♦ Cuando estudiamos la relación entre dos variables para hacer
una predicción a partir de los datos de otra.
♦ Determinar hasta que punto un test o instrumento psicológico
es útil como instrumento de medición (fiabilidad).
♦ A partir de un instrumento o test pretendemos evaluar las
características actuales de la persona para predecir otras que
aun no se han dado (p.e. mejores notas, mejor profesional?)
Los estadísticos de correlación se utilizan en unas
condiciones determinadas, por ejemplo, para variables
continuas, lineales se utiliza la r de Pearson pero si las
variables son nominales se utiliza la ji cuadrada (nombran) y
para variables ordinales la r de Spearman (cuando se han
ordenado).
A veces hay variables continuas que las hacemos discretas,
variables dicotómicas (p.e. género), las que tienen dos
categorías (altura, variable continua), la podemos
dicotomizar artificialmente (pequeños, altos), ji cuadrada.
13
La mayor parte de la población está en un límite
determinado, media + 3 desviaciones típicas, se hallan el
99.8% de los sujetos. El 95.4% en + 2 s y el 68.2% + 1 s.
Por ejemplo, aquí con una desviación típica (s) = 0.5, las
notas estaría entre 4.5 y 7.5, un 9 seria anormal
estadísticamente
Preguntas:
♦ ¿Cuál es la tendencia de esas puntuaciones?, ¿cómo se
representan gráficamente el conjunto de puntuaciones para
saber cómo se comporta el grupo?
Para saber la tendencia de las puntuaciones podemos analizar
en base a los estadísticos de posición (media, mediana,
moda), en este caso utilizamos la moda porque es la que más
se repite y se representa gráficamente un histograma
(polígono de frecuencias).
♦ A través de qué estadístico podemos saber el promedio de
actuación del grupo.
La media
♦ ¿Cómo podemos saber como de bueno es el grupo respecto a
otro grupo del colegio?
Diferencia de medias, si es significativa (el grupo con mayor
diferencia tendrá una mejor actuación).
♦ ¿Cuál es el nivel típico de ejecución de grupo?
Moda (porque nos da el que más se repite).
♦ Los chicos con muy iguales o no entre sí, ¿cómo es de
amplia su variación?
Estadísticos de dispersión, porque nos dan la posición del
individuo con respecto a su grupo (desviación típica), nos
dice cómo de homogéneo es el grupo. La varianza nos daría
la dispersión total del grupo y para saber cómo de amplia es
esa dispersión (amplitud o recorrido de una distribución), le
restamos al dato máximo el dato mínimo.
♦ ¿Cuál es la dispersión de todo el grupo?
La dispersión grupal nos la da la varianza (mientras que la
desviación típica nos dice cuánto se desvía el sujeto respecto
al grupo, los percentiles solo nos dan una posición
aproximada del sujeto−posición relativa). Cuanto más te
alejas de la media hay mayor dispersión, más cerca de la
14
media las puntuaciones entre sujetos están más cercanas,
entre más lejos de la media más lejanas las puntuaciones
entre los sujetos).
♦ ¿Cuál es el lugar concreto de un sujeto con respecto a ese
grupo?
Puntuación típica (z), nos da la posición exacta del sujeto (al
tipificar las puntuaciones puedo comparar puntuaciones de
diferentes variables).
♦ Relación entre la capacidad de abstracción y el rendimiento
en matemática, cuál es la relación, se dan juntas estas dos
variables.
Si covarian juntos (la covarianza nos da la correlación).
Análisis de los ítems
Se puede hacer de forma cualitativa o cuantitativa. El análisis
cuantitativo se puede realizar con una tabla de doble entrada,
en la parte superior se coloca cada ítem con sus alternativas
de respuesta y en las columnas se pone la actuación de cada
alumno, que respuesta a dado. La siguiente tabla es un
ejemplo de matriz de datos:
1
Sujeto
a
b
2
c
a
b
3
c
a
b
15
Descargar