Overviewing a statistics “Cookbook”

Anuncio
Actividad nº 69
La metodología de investigación
cuantitativa aplicada
a la docencia universitaria
Dr. Albert Sesé
Universitat de les Illes Balears
ALGUNAS CONSIDERACIONES INICIALES
• La implantación del Espacio Europeo de
Educación Superior (EEES) conlleva la
implementación de sistemas de calidad.
• La filosofía de la calidad aplicada a la docencia universitaria implica
no sólo ajustar nuestra guía docente desde el punto de vista de la
carga de trabajo y la temporalidad de las actividades, sino también
implica probar empíricamente que nuestras propuestas
didácticas son eficientes (principio de mejora continua).
• Sólo a partir de la obtención de evidencia empírica podemos
evaluar la eficiencia de nuestra acción docente.
OBJETIVO
Conocer qué métodos son efectivos, para
mantenerlos, y cuáles no, para no repetirlos
¿Suponemos la eficiencia de lo que hacemos?
¿Suponemos que ante unos malos resultados son
los alumnos quienes fallan?
¿Supone el nuevo sistema Bolonia que los malos
resultados son siempre causa del profesorado?
¿Suponemos que los buenos resultados se deben a
la calidad de nuestra docencia?
¿Seguimos suponiendo?
¿Valor?
SS
“Se le supone”
EL SESGO ATRIBUCIONAL
La hipótesis de la envidia
como deporte nacional
rn
a
Ex
t
er
na
Los demás
In
te
Ex
t
Fracaso
er
na
In
te
Éxito
rn
a
Yo
EL PRINCIPIO DE MEJORA CONTINUA
Ventajas
• Búsqueda de estrategias eficientes
• Mejor ajuste de cargas de trabajo y actividades formativas
• Obligación de reciclaje académico y didáctico
• Mejor grado de satisfacción e implicación
Inconvenientes
• Utilizar la asignatura como “banco de pruebas” no es sencillo
• Implica un mayor nivel de trabajo
• Requiere un mínimo de formación en investigación educativa
• Puede degenerar de forma que sea más importante el método
que el propio resultado
ESTRATEGIA DE ACCIÓN
DISEÑO
EVALUACIÓN
IMPLANTACIÓN
MEDICIÓN
LA MATEMATIZACIÓN DE LA REALIDAD
La perspectiva cuantitativa
A se considera causa de B siempre que:
1. A preceda a B
2. Haya covariación
entre A y B
→
3. Se controle el efecto
de variables extrañas
EL MÉTODO DE INVESTIGACIÓN
Generalización
de relaciones
Marco teórico
Teoría
Análisis
de datos
Proposiciones
Observaciones
Hipótesis
Diseño empírico
Plan
de
investigación
CARACTERÍSTICAS DEL MÉTODO
Generalizabilidad
Escepticismo
Empirismo
Parsimonia
Replicabilidad
Accidentalidad
(Serendipity)
LAS HIPÓTESIS
Fuentes de generación de hipótesis
•
•
•
•
•
•
¿Por qué ocurre un fenómeno? Curiosidad científica
Derivación de teorías
Lagunas de conocimiento en algún área
Replicación de resultados obtenidos en investigaciones previas
La propia experiencia
Las necesidades que surgen a lo largo de la investigación
Criterios
de
Formulación
(Arnau, 1995)
•
•
•
•
•
•
Formulación clara y operativa
Adecuación al problema y poder explicativo
Comprobables o falsables (contrastabilidad)
Establecer relaciones entre variables
Seguir el principio de parsimonia
Coherencia con el resto de hechos ya
contrastados
LAS VARIABLES
Los conceptos que expresan o representan características o
propiedades de la realidad fenoménica reciben el nombre de
Variables.
Se trata de dimensiones a las que se asignan valores
numéricos de acuerdo a unos supuestos o criterios.
Nominales
Cualitativas
Ordinales
Tipos de variables
Discretas
Cuantitativas
Continuas
LA VALIDEZ EN LA INVESTIGACIÓN
VALIDEZ
INTERNA
Grado con el que un experimento demuestra de
forma inequívoca lo que pretende demostrar.
VALIDEZ
EXTERNA
Grado en el que una investigación puede generalizar
una relación causa-efecto a y entre sujetos,
contextos, ocasiones y medidas diferentes
VALIDEZ DE
CONSTRUCTO
Grado en el que los constructos teóricos utilizados
han sido adecuadamente operacionalizados (validez
de contenido, de criterio, y factorial)
VALIDEZ
Se refiere al grado de corrección con el que se
DE CONCLUSIÓN
infieren las hipótesis a nivel estadístico.
ESTADÍSTICA
VALIDEZ
ECOLÓGICA
Grado de semblanza entre la situación experimental
y la situación real en la cual se produce
habitualmente el fenómeno de estudio
TIPOS DE DISEÑOS DE INVESTIGACIÓN
Tipo de diseño
Características
Finalidad
Experimental
• Manipulación de las variables
independientes
• Aleatorización de los sujetos
• Máximo control interno
• Verificación del impacto de
variables manipuladas sobre
variables dependientes
Cuasiexperimental
• Extensión del experimental
• Ausencia de aleatorización
• Disminución de control
• Probar los efectos de
intervenciones sociales en
situaciones con poca
posibilidad de control
• Ausencia de manipulación y
en ocasiones de aleatorización
• Poca existencia de control
• Descripción de muestras,
relación entre variables,
predicción, estudio del
cambio
• Registro “en directo” de la
conducta de los individuos,
categorización y clasificación,
para conseguir una
descripción en condiciones
naturales (sin control).
• Estudiar individuos en
condiciones naturales,
procesos de cambio.
Selectiva
(encuestas,
comparativa,
correlacional)
Observacional
UN CONTINUO ENTRE
LOS MÉTODOS DE INVESTIGACIÓN
Metodología
selectiva
Metodología
observacional
Metodología
experimental
Máxima
intervención del
investigador.
Alto nivel de
control interno
Grado máximo
de naturalidad
Control inexistente
o escaso
Validez
ecológica
Validez
interna
DISEÑOS EXPERIMENTALES
DISEÑOS EXPERIMENTALES
El método experimental representa una forma de adquisición del
conocimiento a través de una modalidad del método científico
que tiene como objetivo:
Establecer relaciones causales entre variables a
partir de la manipulación de la posible causa y bajo
condiciones de control, que permiten eliminar o
neutralizar la influencia de variables extrañas.
Elementos fundamentales
• Situación en la que, al menos, se manipula 1 variable.
• Proceso aleatorio de selección de la muestra, asignación
aleatoria de unidades (sujetos) a los diferentes niveles o
categorías de la variable o variables manipuladas, bajo
condiciones de control
• Los tres ejes básicos de la metodología experimental son: La
aleatorización, el control y la manipulación de la variable
independiente (VI)
DISEÑOS BÁSICOS
EN METODOLOGIA EXPERIMENTAL
b1
a1
a2
a1
a2
...
b2
b3
a1
ak
a2
Diseño ENTRE
unifactorial
de dos grupos
Diseño ENTRE
unifactorial
multigrupo
Diseño ENTRE
Factorial (2 x 3)
b1
a1
a1
a2
S1
S2
S3
S4
S5
Diseño INTRA
simple
...
ak
b1
S1
S2
S3
S4
S5
Diseño INTRA
Factorial (2 x 2)
a2
b2
b1
b2
S1
S2
a1 S3
S4
S5
S6
S7
a2 S8
S9
S10
Diseño MIXTO
(A entre 2 x B intra 3)
b2
b3
DISEÑOS CUASI-EXPERIMENTALES
DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (I)
La metodología cuasi-experimental afronta situaciones donde
no es posible o no es ético aplicar la metodología
experimental, o donde los estrictos requisitos del método
experimental no se satisfacen, como por ejemplo, el contexto
educativo.
Secuencia de Registro
Diseño
pretest-postest
GRUPOS
Único
ASIGNACIÓN
NE
PRETEST
O1
TRATAMIENTO
X
POSTEST
O2
NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida
Ejemplo. Pasamos una prueba de nivel en un grupo de nuestra
asignatura. Posteriormente aplicamos una intervención y
seguidamente volvemos a evaluar con una prueba de nivel. La
diferencia pretest-postest ofrece evidencia empírica del efecto de
la intervención.
DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (II)
Secuencia de Registro
Diseño
Solo postest
GRUPOS
ASIGNACIÓN
Experimental (GE)
Control (GC)
NA
NA
PRETEST
TRATAMIENTO
X
-
POSTEST
O2
O2
NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida
Ejemplo. Queremos probar qué efecto genera una determinada
estrategia didáctica. Disponemos de un grupo en el que
aplicaremos la estrategia, frente a otro en el que no. No hay
mediciones a priori del rendimiento académico, pero sí a
posteriori. Se evalúa la diferencia entre las medidas postest de los
dos grupos.
DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (III)
Secuencia de Registro
Grupo control no
equivalente
GRUPOS
ASIGNACIÓN
Experimental (GE)
Control (GC)
NA
NA
PRETEST
TRATAMIENTO
O1
O1
X
-
POSTEST
O2
O2
NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida
Ejemplo. Queremos probar qué efecto genera una determinada
estrategia didáctica. Disponemos de un grupo en el que
aplicaremos la estrategia, frente a otro en el que no.
Establecemos mediciones a priori del rendimiento académico, y
también a posteriori. Se evalúa la diferencia entre las medidas
pretest y postest en ambos grupos.
DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (IV)
Secuencia de Registro
Diseño con
doble pretest
GRUPOS
ASIGN.
Experimental (GE)
Control
(GC)
NA
NA
PRET 1
O1
O1
PRET 2
O2
O2
TRATAM.
X
-
POSTEST
O3
O3
NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida
Ejemplo. Probamos la efectividad de una actividad formativa en
un grupo. Se establecen dos medidas pretest, se implementa la
actividad en el grupo experimental, y luego se obtiene una
medida postest en ambos grupos. Las dos medidas pretest se
suelen establecer para analizar la estabilidad de la medida previa.
DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (V)
Secuencia de Registro
Diseño
de cohortes
COHORTES
ASIGNACIÓN
Primera (GC)
Segunda (GE)
NA
NA
PRETEST
O1
TRATAMIENTO
X
POSTEST
O2
NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida
Ejemplo. Utilizamos dos grupos de una misma asignatura
pertenecientes a cursos académicos diferentes. Medimos el nivel
previo al tratamiento en la primera cohorte, pero la intervención
se hace en la segunda, así como la medida postest. Se evalúa la
diferencia pretest-postest suponiendo que aunque se trate de
cohortes diferentes, no se observarán cambios en su composición
pretratamiento.
DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (VI)
Secuencia de Registro
Discontinuidad
de la regresión
GRUPOS
ASIGNACIÓN
Experimental (GE)
Control (GC)
NAC
NAC
PRETEST
TRATAMIENTO
O1
O1
POSTEST
X
-
O2
O2
NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida
Ejemplo. Utilizamos un grupo de una asignatura, al cual pasamos una
prueba pretest de nivel. En función de un punto de corte determinado,
establecemos dos subgrupos de nivel alto y bajo. Aplicamos la actividad
formativa a evaluar sobre uno de los dos grupos, por ejemplo, el de nivel
alto, y medimos a posteriori. Si no hay efecto, los dos grupos mantendrán
su nivel inicial. Si hay efecto, el grupo tratado discontinuará la regresión.
GE
GE
POSTEST
Efecto no
significativo
GC
PRETEST
POSTEST
GC
Efecto
significativo
PRETEST
DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (VII)
Secuencia de Registro
Series temporales
interrumpidas simples
Series temporales
interrumpidas con
grupo control no
equivalente
GRUPOS
ASIGNACIÓN
Único
NA-NAC
PRETEST
TRATAMIENTO
O1 O2 O3
X
POSTEST
O4 O5 O6
Secuencia de Registro
GRUPOS
ASIGNACIÓN
Exper. (GE)
Control (GC)
NA-NAC
NA-NAC
PRETEST
O1 O2 O3
O1 O2 O3
TRATAMIENTO
X
-
POSTEST
O4 O5 O6
O4 O5 O6
NE= No existe A= Aleatoria NA= No aleatoria ni conocida NAC= No aleatoria pero conocida
Ejemplo. En una asignatura se detecta un problema en el tiempo de
dedicación al estudio. Se decide probar la eficacia de un método
motivacional. Se establecen una serie de mediciones de la cantidad de
tiempo empleada (O1-O2-O3) para después introducir la intervención en
uno de los dos grupos. Se sigue recogiendo el tiempo de estudio a
posteriori y se estudia su evolución (O4-O5-O6), e incluso si hay
fluctuación en el tiempo.
DISEÑOS BÁSICOS CUASI-EXPERIMENTALES (VII)
Diseño de series temporales interrumpidas con grupo control no equivalente
METODOLOGÍA SELECTIVA
DISEÑOS DE METODOLOGÍA SELECTIVA (I)
• Pretenden describir una población en un momento determinado.
• La recogida de datos se hace de una sola vez y durante un periodo
corto, con el objetivo de captar ciertos fenómenos presentes en el
momento de realizar la encuesta.
Diseños
transversales
• Adecuados especialmente para estudiar fenómenos estables en el
tiempo.
• Si interesa estudiar la asociación entre variables: diseño correlacional.
• Si interesa predecir una variable de respuesta a partir de otras
variables (predictoras), hablamos de estudios predictivos. Las posibles
predicciones se han de plantear a priori, y sobre ellas construir la
encuesta.
• Se pretende observar el cambio en una población, y para ello se
toman diferentes medidas a lo largo de un periodo de tiempo.
Diseños
longitudinales
• Incorporan la dimensión temporal, y se toman medidas con un mismo
instrumento de las mismas personas, o sobre sujetos comparables.
• Requieren tamaños de muestra más pequeños que los transversales.
DISEÑOS DE METODOLOGÍA SELECTIVA (II)
• Repetición de una serie de encuestas transversales en distintos
momentos temporales para investigar el cambio en el nivel o
distribución de una variable o en las relaciones entre algunas variables.
• Las encuestas se realizan con muestras diferentes de la misma
población.
Diseños
longitudinales
con grupos de
sujetos distintos
• Se siguen los cambios de una variable en una misma población,
muestreando de nuevo en cada medida.
• Para poder realizar comparaciones entre estos estudios sucesivos, es
necesario controlar al máximo todas las posibles variables extrañas, y
también la composición de la muestra.
• Se puede evaluar cambio en la población, a nivel general, no cambio
intraindividual.
DISEÑOS DE METODOLOGÍA SELECTIVA (III)
Diseños de
panel
• Implican la recogida de medidas sucesivas de los mismos sujetos a
lo largo de un periodo de tiempo (medidas repetidas).
• Permite el estudio del cambio en los sujetos y en la población;
permite estudiar el cambio intraindividual.
• Describe el cambio evolutivo, además de intentar explicar el cambio
estableciendo relaciones entre variables.
• Supone la selección inicial de una muestra y la observación de sus
elementos en más de una ocasión.
• Una de las desventajas del modelo es la alta mortalidad estadística
que presenta.
Diseños de
cohortes
• Estudia los procesos de cambio en toda su amplitud, contemplando
los efectos de la edad, del periodo (momento de medida u
observación), y de la cohorte.
• Analiza el cambio de la cohorte a lo largo del tiempo y también en
relación a otras cohortes.
• Puede estudiar transversalmente las diferencias cada año entre las
cohortes, las diferencias en la evolución de cada cohorte, así como
los efectos de la edad y la cohorte, y el periodo de medida.
• Los inconvenientes del diseño son fundamentalmente los costos
elevados y una gran mortalidad estadística.
METODOLOGÍA OBSERVACIONAL
DISEÑOS DE METODOLOGÍA OBSERVACIONAL (I)
Según el grado de estructuración de la observación
Observación
natural
La observación se realiza en contexto natural y el observador es
un espectador que no interviene en la situación.
Observación
estructurada
Existe cierto grado de intervención del observador. Tiene el
compromiso de mantener el contexto natural, pero introduciendo
cierta estructuración de la situación.
Experimento
de campo
Grado de estructuración mayor de la situación en contexto
natural. Subyace una teoría tentativa explicativa de los datos a
observar. Se requieren al menos dos situaciones de observación
diferentes para probar la teoría.
DISEÑOS DE METODOLOGÍA OBSERVACIONAL (II)
Según el grado de intervención del observador
No participante
o externa
El observador permanece distanciado del objeto de estudio. No
existe interacción entre él y los sujetos que observa. La
objetividad del observador es su principal ventaja.
El observador forma parte de los acontecimientos que observa.
Permite una mejor comprensión del comportamiento estudiado.
Presenta una mayor accesibilidad a los sujetos.
Observación
Participante
Autoobservación
• O. como participante: Se conoce su papel de investigador pero
no toma parte.
• Participante/observador: Toma parte activa en los hechos, y su
estatus es conocido por todos.
• Participación completa: Participa de los hechos, pero su rol no
es conocido por los otros sujetos.
Es la observación de un sujeto sobre sí mismo. Supone el más
alto grado de participación: uno mismo es objeto y sujeto. Es
imprescindible para el acceso a conductas privadas, encubiertas
o poco accesibles.
DISEÑOS DE CASO ÚNICO (N=1)
DISEÑOS DE CASO ÚNICO (N=1)
• Intenta averiguar en qué medida la conducta de un sujeto, correctamente
operativizada y registrada, presenta algún tipo de cambio como consecuencia de
una intervención o tratamiento.
• N=1. Sólo utilizan como unidad de análisis un único sujeto.
• El interés se centra en el individuo más que en el efecto del tratamiento en sentido
estricto.
• Tratan de probar causalidad entre la VI y la VD. (manipulación de la VI y control de
factores extraños).
¿Cuándo utilizar un diseño N=1?
• En entornos clínicos resulta muy difícil conseguir grupos de sujetos con el
mismo problema.
• El sujeto es su propio control. En el entorno clínico es muy difícil usar grupos
control (problemas éticos).
• La persona es un cliente que demanda una intervención concreta e inmediata,
y efectiva en ella misma, independientemente del grado de efectividad
estadística.
• El diseño N=1 normalmente se utiliza cuando la investigación se orienta al
tratamiento de procesos básicos, o con clara base biológica.
¿Podemos proponer ejemplos
aplicables de diseños de
investigación en función de las
distintas actividades formativas que
introducimos en nuestra docencia?
EL ANÁLISIS DE LOS DATOS
Algunos modelos estadísticos básicos
EL PROCESO DE ANÁLISIS DE DATOS
FASES
ANTECEDENTES
FASES DEL PROCESO
DE ANÁLISIS DE DATOS
FASES
FINALES
Fundamentación
teórica
Introducción
de datos
Interpretación de
análisis
Diseño de
investigación
Elaboración y selección
de instrumentos
Obtención de
medidas
Depuración
de datos
Transformación
de datos
Análisis
exploratorios
Análisis
de contraste
Selección de
resultados
Conclusiones y
discusión
LA DESCRIPCIÓN UNIVARIANTE DE LAS VARIABLES:
ANÁLISIS EXPLORATORIO DE DATOS
Principios básicos del EDA (Exploratory Data Analysis)
• Da más importancia a las medidas de localización, variabilidad, forma y posición
que tienen la propiedad de resistencia, razón por la cual son indicadores
adecuados para una gran variedad de distribuciones.
• Utiliza diversos resúmenes estadísticos
en lugar de trabajar únicamente con
uno o dos. Así, mientras que la
estadística descriptiva clásica se basa
fundamentalmente
en
la
media
aritmética y la variancia, el EDA utiliza
un gran número de índices.
• Utiliza resúmenes visuales, dando
mucha más relevancia a la información
recogida de forma gráfica.
ANÁLISIS EXPLORATORIO DE DATOS. Un ejemplo.
Tras la celebración de un examen parcial de la asignatura de
“Psicología General” se han obtenido las calificaciones numéricas
(escala de 0 a 10) que aparecen a continuación.
Llevar a cabo la descripción univariante completa de la variable
mediante
análisis
exploratorio
de
datos
(Menú
“Analizar”→“Estadísticos descriptivos” → “Explorar” del
programa SPSS)
5
6,5
5
5
0
4
8
7,5
7
6
3
1
6
6
5
7
6,5
7
6,5
5,75
0
6,6
7
7,5
6
5,5
6
0
9
4
La cuestión de la inferencia estadística
Población
Parámetro
Toda característica de la
población bajo estudio.
Conjunto formado por todos los
elementos sobre los cuales
queremos obtener información.
π
p
m
μ
s
p±e m±e s±e
Estimación puntual
de un sólo valor como el
estimador del parámetro.
Muestra
Subconjunto de los
elementos que
forman la población.
σ
Estimación por intervalo
al que pertenece el parámetro
con alta probabilidad.
Estadístico
Función de las observaciones x1, x2, … , xn que se
pueden obtener en una muestra.
Estimador
Regla que establece el cálculo de una estimación
basada en observaciones muestrales.
Muestra aleatoria simple
n observaciones x1, x2,…,xn
independientes, extraída con
reemplazamiento o sin él, pero
de una población grande.
ESTADÍSTICA
Establece inferencias con respecto a la población a
partir de la información contenida en una muestra.
UN EJEMPLO DE ANÁLISIS ESTADÍSTICO BÁSICO
La guía docente de una asignatura perteneciente a un título oficial
de grado de la UIB incluye una serie de itinerarios evaluativos que
han permitido obtener un conjunto de variables relacionadas con el
proceso de enseñanza-aprendizaje y el rendimiento y que se
detallan a continuación:
• Sexo (“sexo”) → Variable dicotómica nominal (Hombre-Mujer)
• Calificación 1er parcial (“rendim1”) → Variable cuantitativa (0-10)
• Calificación 2º parcial (“rendim2”) → Variable cuantitativa (0-10)
• Método de examen (“método”) → Variable categórica nominal (1-2-3)
• Horas de estudio (“horasestudio”) → Variable cuantitativa (0-40)
• Motivación (“motivación”) → Variable cuantitativa (0-100)
• Ansiedad ante los exámenes (“ansiedad”) → Var. cuantitativa (0-40)
LA COMPARACIÓN DE DOS MEDIAS
(Grupos independientes)
Vía paramétrica
Teniendo en cuenta la variable “sexo”, podemos plantear hacer una
comparación de medias entre el grupo de hombres y de mujeres
con relación a la variable “rendimiento 1”.
Llevar a cabo la estimación de una prueba t para grupos
independientes teniendo en cuenta las variables consideradas.
(Menú “Analizar”→ “Comparar medias” → “Prueba T para
muestras independientes” del programa SPSS).
Se requiere la distribución normal de la variable de contraste en
ambos grupos, así como homogeneidad de varianzas.
LA COMPARACIÓN DE DOS MEDIAS
(Grupos dependientes)
Vía paramétrica
Dado que se han realizado dos exámenes parciales, nos puede
interesar saber si se han producido diferencias estadísticamente
significativas entre las calificaciones de ambas pruebas. Para ello
hay que aplicar una prueba T para muestras dependientes, ya que
en este caso, comparamos el mismo grupo de sujetos en dos
momentos temporales diferentes.
(Menú “Analizar”→ “Comparar medias” → “Prueba T para
muestras relacionadas” del programa SPSS).
Al tratarse de un grupo único medido en dos ocasiones, cada sujeto
hace de control de sí mismo, y no es necesaria la condición de
homogeneidad de varianzas, aunque sí la normalidad.
LA COMPARACIÓN DE DOS MEDIAS
(Grupos independientes)
Vía no paramétrica
Ante el incumplimiento de los supuestos para la comparación de
medias correspondiente a la variable “rendim2” respecto al sexo, se
debe aplicar una prueba no paramétrica de comparación de medias
para grupos independientes.
Una de las pruebas no paramétricas para este tipo de análisis es la
U de Mann-Whitney
(Menú “Analizar”→ “Pruebas no paramétricas” → “2 muestras
independientes” del programa SPSS).
LA COMPARACIÓN DE DOS MEDIAS
(Grupos dependientes)
Vía no paramétrica
Ante el incumplimiento del supuesto de normalidad en el caso de la
comparación de las medias de las calificaciones obtenidas por el
mismo grupo de sujetos en los dos exámenes parciales, se debe
aplicar una prueba no paramétrica de comparación de medias para
grupos relacionados.
Una de las pruebas no paramétricas para este tipo de análisis es la
de Wilcoxon.
(Menú “Analizar”→ “Pruebas no paramétricas” → “2 muestras
relacionadas” del programa SPSS).
EL ANÁLISIS DE LA VARIANZA
Vía paramétrica
Cuando se trata de comparar más de dos medias simultáneamente,
el modelo estadístico a aplicar es el análisis de la varianza
(ANOVA). Para ejemplificar este análisis tomaremos la variable
“método de examen”, que presenta tres modalidades: preguntas
cortas, de desarrollo, o de alternativas, respecto a las calificaciones
obtenidas en el segundo parcial (“rendim2”).
(Menú “Analizar”→ “Comparar medias” → “ANOVA de un
factor” del programa SPSS).
Se necesita el cumplimiento de la homoscedasticidad de las
varianzas de los grupos y de la normalidad de la variable de
contraste.
EL ANÁLISIS DE LA VARIANZA
Via no paramétrica
Si se produce un incumplimiento de los supuestos sobre la
comparación de las media de las calificaciones en el segundo
parcial respecto del tipo de preguntas del examen, se debe recurrir
al análisis de la varianza no paramétrico.
La prueba no paramétrica más utilizada en este caso es la H de
Kruskal-Wallis.
(Menú “Analizar”→ “Pruebas no paramétricas” → “k muestras
independientes” del programa SPSS).
LA CORRELACIÓN LINEAL
El estadístico de asociación lineal más conocido es el coeficiente
de correlación lineal de Pearson (rxy). Es un valor estandarizado
que oscila entre -1 y +1, indicando el 0 la situación de
independencia (“esfera”) entre dos variables x e y.
Rxy es simétrico y no establece una dirección en la asociación (no
así en la regresión lineal). La prueba de significación determina si
el valor en la muestra es o no distinto de 0 en la población.
Teniendo en cuenta la matriz de datos, podemos
calcular la correlación existente entre las
calificaciones de los dos parciales (Menú
“Analizar”→ “Correlaciones” → “Bivariadas” del
programa SPSS).
LA REGRESIÓN LINEAL SIMPLE
En la regresión lineal simple se pretende evaluar la capacidad
explicativa de una variable X sobre una variable de respuesta Y. El
método de mínimos cuadrados ordinarios permite obtener una recta
de regresión del tipo Y = b0 + b1 X
Llevar a cabo un análisis de
regresión
lineal
simple
tomando como variable
explicativa la motivación y
como variable de respuesta
las calificaciones del primer
parcial.
(Menú “Analizar”→ “Regresión” → “Lineal” del
programa SPSS).
LA REGRESIÓN ¿LINEAL? SIMPLE
La regresión lineal ajusta una ecuación sobre el patrón de
asociación lineal entre dos variables, pero no es capaz de captar
asociaciones no lineales. Por ello es fundamental utilizar un
diagrama de dispersión de forma previa al cómputo de una ecuación
de regresión lineal. Las variables a relacionar son la ansiedad ante
los exámenes y rendim2 (Menú “Gráficos”→ “Cuadros de
diálogo antiguos” → “Dispersión/Puntos” del programa SPSS).
Dado el carácter no lineal de la relación, obtener una estimación de
relación lineal y cuadrática entre ambas variables.
(Menú “Analizar”→ “Regresión” → “Estimación
curvilínea” del programa SPSS).
La cuestión de la significación estadística:
El caso de la regresión lineal simple (I)
Una investigación ha tratado de estudiar la correlación existente entre el nivel de
actividad política y el rendimiento académico. Para ello extraen una muestra aleatoria
simple de 10 estudiantes de primer curso de grado, a los cuales se mide con un
cuestionario el nivel de actividad política, y se recoge el promedio de las calificaciones
obtenidas durante el curso académico.
El valor obtenido para la
correlación
es
de
0.052
(r2=0.003), con una probabilidad
p=0.887, es decir, no se puede
rechazar la hipótesis nula que
expresa que el valor de la
correlación en la población es
igual a 0.
Por tanto, la actividad
política y el rendimiento
académico aparecen
como independientes.
La cuestión de la significación estadística:
El caso de la regresión lineal simple (II)
Supongamos que el investigador del ejemplo anterior consiguió extraer una muestra de
3000 estudiantes de primer curso de grado, a los cuales midió con un cuestionario el
nivel de actividad política, y recogió el promedio de las calificaciones obtenidas durante
el curso académico.
Al establecer de nuevo la
estimación del modelo de
regresión lineal simple, el valor
obtenido para la correlación es
de 0.052 (r2=0.003), con una
probabilidad p=0.004, es decir,
podemos rechazar la hipótesis
nula, y por tanto, el valor de la
correlación en la población es
distinta de 0.
Por tanto, la actividad
política y el rendimiento
mantienen una relación
positiva significativa.
La significación estadística:
Condición necesaria pero no suficiente
Una correlación significativa de magnitud positiva igual a 0.052, con un
nivel de significación p=0.004, por lo tanto estadísticamente
significativa, ¿qué significa realmente?, ¿qué implicaciones tiene?
Significa que, a pesar de haber alcanzado la significación estadística, la
influencia porcentual que ejerce el nivel de actividad política del
alumnado sobre las diferencias obtenidas en el rendimiento académico
es solamente del 0.3% (r2=0.003).
En resumen, cualquier prueba estadística puede alcanzar la
significación estadística al aumentar el tamaño de la muestra, pero
resulta necesario establecer un análisis sobre el TAMAÑO DEL
EFECTO.
El tamaño del efecto permite al investigador establecer un
juicio acerca de la significación sustantiva de los
resultados obtenidos; no así la significación estadística.
LA REGRESIÓN LINEAL MÚLTIPLE
La regresión lineal múltiple permite estimar el efecto combinado de
un conjunto de variables predictoras (X) sobre una variable de
respuesta (Y).
Vamos a utilizar el formato de la regresión lineal múltiple para
intentar predecir la variable rendim1, a partir de las variables sexo,
horas de estudio y motivación.
(Menú “Analizar”→ “Regresión”
→ “Estimación curvilínea” del
programa SPSS).
SIN PRETENSIÓN DE EXHAUSTIVIDAD
Y A MODO DE CONCLUSIÓN
Es complicado conocer la totalidad de modelos y submodelos
estadísticos que existen, pero es fundamental aplicar aquella
técnica que mejor se adapte a la estructura de los datos y al
diseño de investigación que manejemos.
Lo importante es mantener conciencia acerca del principio de
calidad que debe regir nuestra docencia, y que implica la
evaluación empírica de la eficacia de nuestras actividades
formativas.
Siempre debe primar la idea de que cualquier pequeña prueba
empírica nos ayudará a arrojar luz sobre los resultados.
“When description opens the way to measurement,
calculation replaces discussion”
Stevens, S.S. (1951)
Activitat nº 69
La metodología de investigación
cuantitativa aplicada
a la docencia universitaria
[email protected]
Dr. Albert Sesé
Universitat de les Illes Balears
Descargar