manual-para-el-uso-de

Anuncio
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
MANUAL PARA EL USO DE SPSS
INTRODUCCIÓN
El propósito de este manual, es ilustrar con un ejemplo cómo generar tablas de frecuencia, tablas de contingencia,
cálculos de medias, así como la generación de los estadísticos de prueba que permitan validar estos resultados.
EJEMPLO
Se aplicó un cuestionario a jóvenes con el objetivo de caracterizar sus hábitos de lectura. Las preguntas del
cuestionario (acá se ilustran algunas) abordaban las siguientes preguntas:
1- ¿Qué es lo que más te gusta leer?
2- ¿Te gusta leer obras literarias?
3- ¿Qué tipo de obras literarias te gusta leer?
4- Califica en una escala del 1 al 5 la importancia que tiene cada uno de los siguientes factores a la hora de
comprar un libro: a) precio del libro, b) habilidades del autor para narrar la historia, c) habilidades del autor
para describir personajes, d) que la obra me permita aprender nuevo vocabulario, e) que la complejidad de
la obra me represente un desafío, f) que la síntesis en la contraportada me motive a comprar un libro.
5- ¿Por qué no lees obras literarias?
6- Datos generales (edad, sexo, ocupación)
Para analizar las respuestas de los encuestados, haremos las pruebas de hipótesis.
ANTEDECENTES
Se trabajará con la base de datos de hábitos de lectura. El editor de datos de SPSS tiene dos vistas:
La vista de variables: donde se registra cada pregunta, con sus respectivas preguntas, categorías, valores
perdidos. La base de datos de los hábitos de lectura tiene la siguiente apariencia:
1
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
2
La vista de datos contiene las respuestas para cada variable
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
TABLA DE CONTINGENCIA
Nos interesa conocer si los hábitos de lectura difieren en los hombres de las mujeres. Para eso se van a contrastar
dos preguntas: ¿Qué es lo que más te gusta leer?, y Sexo, esto con la finalidad si el sexo y los hábitos de lectura
tienen alguna relación.
Paso 1. Plantear hipótesis
H0: No hay relación entre el sexo y los hábitos de lectura
H1: Si hay relación entre el sexo y los hábitos de lectura
Paso 2. Estadístico de prueba
Chi Cuadrada, para medir la relación entre las dos variables
V de Cramer para medir la fuerza de asociación entre las dos variables
Paso 3. Regla de decisión
En este caso es preciso calcular el valor crítico, que representa el límite entre la región de aceptación y la región
de rechazo. Se trabajará con la probabilidad asociada al estadístico de prueba.
Bajo la región de aceptación están las probabilidades mayores al nivel de significancia = 0.05
Bajo la región de rechazo están las probabilidades menores o iguales al nivel de significancia = 0.05
Paso 4. Calcular Chi y V de Cramer
Clic en analizar
3
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
Clic en estadísticos descriptivos
Clic en tablas de contingencia
4
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
Le aparecerá un cuadro de diálogo.
En el cuadro de diálogo. En la izquierda tenemos tres casillas. En la casilla fila traslade la variable sexo y en la casilla
columna la variable ¿Qué te gusta leer más?
5
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
6
En el mismo cuadro de diálogo, seleccione mostrar gráficos de barras agrupadas y suprimir tablas.
Clic en estadísticos, clic en Chi Cuadrada y PHI Y V DE CRAMER,
Clic en continuar, y clic en aceptar.
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
7
En el archivo resultado aparecerán los siguientes cuadros.
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Razón de v erosimilitudes
Asociación lineal por
lineal
N de casos v álidos
Valor
7.164a
9.250
.076
7
7
Sig. asintótica
(bilateral)
.412
.235
1
.783
gl
43
a. 14 casillas (87. 5%) tienen una f recuencia esperada inf erior a
5. La f recuencia mínima esperada es .26.
Paso 5. Tomar la decisión. En este caso, puede observarse que el estadístico asociado a CHI CUADRADA da
0.412, es decir, mayor a 0.05, es decir, que se acepta la hipótesis nula que dice que no hay relación entre el sexo
y lo que más le gusta leer. El resultado es evidente en la tabla de frecuencias.
Paso 6. Tomar la decisión en términos del problema de investigación de mercados
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
En este caso, el sexo no es un factor determinante en las preferencias de compra.
8
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
PRUEBAS PARAMÉTRICAS
PRUEBA T PARA MUESTRAS INDEPENDIENTES
La prueba t para muestras independientes se hace para comparar medias de dos muestras diferentes. Podemos
preguntar si el gasto promedio de los hombres difiere del gasto promedio de las mujeres. En el caso de la encuesta
sobre hábitos de lectura, podemos hacer las siguientes comparaciones:


Comparar la calificación promedio que los hombres dan al precio para tomar sus decisiones de compra
con la que le dan las mujeres
Comparar la calificación promedio que le dan los hombres al resumen en la contraportada del libro para
sentirse motivados a comprarlo de la calificación promedio que le dan las mujeres.
Estas comparaciones pueden hacerse solamente entre dos muestras, es decir, solamente para comparar dos
medias.
Paso 1. Plantear hipótesis
H0: la calificación promedio que los hombres le dan al factor de resumen en la contra portada, no difiere de la
calificación que le dan los hombres.
H1: la calificación promedio que los hombres le dan al factor de resumen en la contra portada, difiere de la
calificación que le dan los hombres.
H0: 1=2
H1: 12
Paso 2. Elegir el estadístico de prueba
Se trabajará con el valor de t en vista que no se conoce la desviación estándar de la población.
Paso 3. Regla de decisión
Se trabajará con la probabilidad asociada al estadístico t. Un valor de significancia alfa de 0.05. Una prueba de dos
colas.
9
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
Paso 4. Calcular t y la probabilidad asociada a t
1- Clic en analizar
2- Clic en comparar media
3- Clic en prueba t para muestras independientes, tal y como aparece encerrado en el círculo.
10
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
11
Como puede observarse, aparece un cuadro de diálogo. En el centro aparece la casilla contrastar
variables, en la cual se introduce la variable que queremos comparar, en este caso, las únicas variables
que podemos comparar son las de categorías de escala, ilustradas por una regla amarilla a la izquierda de
la variable que inician con la palabra califica. Traslade la variable de escala que quiera contrastar a la
casilla contrastar variables.
En este caso hemos
elegido la variable
sombreada, una vez
seleccionada
se
despliega la descripción
de toda la variable.
Bien ahora está todo
listo para que haga el
paso 4:
4- Traslade
la
variable seleccionada
a la casilla contrastar
variables.
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
5- Traslade
la
varible sexo en la
casilla variable de
agrupación. La variable
de agrupació es las que
nos permitira agrupar la
media de los hombres y
la media de las mujeres.
NOTE QUE LA CASILLA
DEFINIR GRUPOS ESTÁ
HABILITADA AHORA.
6- CLIC
CASILLA
GRUPOS.
EN LA
DEFINIR
12
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
NOTE QUE AHORA LE
APARECE OTRO CUA
DRO DE DIALOGO.
Digite en grupo 1, el
numero 1 y en grupo 2
el número 2, clic en
continuar.
13
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
14
Estadísticos de grupo
Calif ica en una escala del
1 al 5 la importancia que
tiene para ti cada uno de
los siguientes f actores a
la hora de comprar un
libro [que la síntesis de la
contraportada me motiv e
a comprar el libro]
sexo
M
N
Media
Desv iación
típ.
Error típ. de
la media
24
4.5833
.58359
.11913
7
3.7143
1.38013
.52164
H
Puede verse que para las mujeres, el resumen en la contra portada es más importante que para las hombres.
Sin embargo, hay que analizar que comparar la probabiidad asociada al estadístico t con el valor de alfa=0.05
Tenemos lo siguiente, para probar si las medias difieren o no, necesitamos saber si usamos la t asumiendo
varianzas iguales, o asumiendo que las varianzas no son iguales.



Note que en la primera fila, el valor de sig., la probabilidad asociada al estadístico f, es menor que 0.05.
Entonces quiere decir que cae en la zona de rechazo, se rechaza la hipótesis nula que las varianzas son
iguales.
Nos trasladamos a la fila 2, donde se asume que las varianzas no son iguales, y trabajamos con el valor
de t en la cuarta columna.
En la sexta columna, el valor de la probabilidad asociada a t es mayor que alfa, lo que quiere decir que se
acepta la hipótesis nula:
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
Paso 5. Toma la decisión: no hay relación entre el sexo y el uso del resumen en la contraportada como factor de
decisión de compra.
Paso 6. Tomar la decisión en términos del problema de investigación de mercados: el sexo no es
determinante para el factor de decisión de compra: resumen en la contraportada.
PRUEBA T PARA MUESTRAS RELACIONADAS
Se desea conocer si difiere la calificación promedio dada por los encuestados hacia el atributo: que la complejidad
de la obra represente un desafío de la calificación dada a que la lectura sea ligera, esto con el objetivo de conocer
cuál es el atributo más importante como factor de decisión de compra.
La prueba t para muestra relacionada se hace para comparar medias para dos categorías diferentes
EJEMPLO
PASO 1. PLANTEAR HIPÓTESIS
Hipótesis nula: La calificación promedio de importancia dada por los encuestados al atributo: que la complejidad de
la obra representa un desafío no difiere de la calificación dada al atributo que la lectura sea ligera.
Hipótesis alternativa: La calificación promedio de importancia dada por los encuestados al atributo: que la
complejidad de la obra representa un desafío no difiere de la calificación dada al atributo que la lectura sea ligera.
PASO 2. ESTADÍSTICO DE PRUEBA
Se trabajará con la prueba t.
PASO 3. REGLA DE DECISIÓN
Se trabajará con las probabilidades bajo la curva de distribución t. La región de rechazo representa las
probabilidades menores o iguales al nivel de significancia = 0.05
La región de aceptación representa las probabilidades mayores a 0.05.
PASO 4. CALCULAR LOS ESTADÍSTICOS USANDO EL EDITOR DE DATOS SPSS
15
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
Primer paso. Abra la base de datos
Segundo paso. Ubíquese en la vista de datos
Tercer paso. Clic en analizar
Cuarto paso. Clic en comparar medias, y luego en prueba t para muestras relacionadas
Quinto paso. Aparece el siguiente cuadro de diálogo.
16
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
17
La casilla seleccionada en un círculo, es donde se trasladan las variables que se van a relacionar.
Sexto paso. Seleccione al mismo tiempo las dos variables que quiera relacionar
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
18
SEPTIMO PASO. CUANDO LAS DOS VARIABLES ESTÉN SOMBREADAS, ENTONCES TRASLADE LAS
VARIABLES A LA CASILLA VARIABLES RELACIONADAS.
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
19
OCTAVO PASO. CLIC EN ACEPTAR.
RESULTADOS
Estadísticos de muestras relacionadas
Media
Par 1
Calif ica en una escala
del 1 al 5 la importancia
que tiene para ti cada
uno de los siguient es
f act ores a la hora de
comprar un libro [ que la
complejidad de la obra
represente un desaf ío]
Calif ica en una escala
del 1 al 5 la importancia
que tiene para ti cada
uno de los siguient es
f act ores a la hora de
comprar un libro [ que la
lectura sea ligera]
Desv iación
típ.
N
Error típ. de
la media
3.3548
31
1.14159
.20504
3.1290
31
1.11779
.20076
ANÁLISIS DEL RESULTADO: EN EL PRIMER GRÁFICO, LA IMPORTANCIA QUE LA OBRA REPRESENTE
UN DESAFÍO TIENE UN NIVEL DE 3.3548 Y LA IMPORTANCIA DE QUE LA LECTURA SEA LIGERA FUE
3.1290. HAY UNA DIFERENCIA DE 3.3548 – 3.1290 = 0.2258, UNA DIFERENCIA MÍNIMA.
¿DIFIEREN AMBOS PROMEDIOS?
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
20
ESTE FRAGMENTO DEL RESULTADO REFLEJA LA DIFERENCIA ENTRE LAS MEDIAS RELACIONADAS DE
0.22581.
PASO 5. TOMAR LA DECISIÓN: EL VALOR DE SIG ES 0.428, MAYOR A 0.05, CAE EN LA REGIÓN DE
ACEPTACIÓN, PUEDE COMPROBARSE ENTONCES LA HIPÓTESIS NULA, QUE NO HAY DIFERENCIAS
ENTRE AMBOS PROMEDIOS.
PASO 6. TOMAR LA DECISIÓN EN TÉRMINOS DEL PROBLEMA DE INVESTIGACIÓN DE MERCADOS.
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
PRUEBA DE VARIANZA (ANOVA DE UN FACTOR)



la comparación de medias, usando la prueba t para muestras independientes y relacionadas, tienen una
limitante, permiten comprar solamente dos medias. El promedio de calificaciones de los hombres con el
promedio de calificaciones de las mujeres. El promedio de calificaciones para un atributo del promedio de
calificaciones para otro atributo.
Pero, ¿Qué pasa si queremos comparar el promedio de calificaciones dada por los estudiantes, con el de
los profesionales y los desempleados? ¿Los clientes moderados, los frecuentes y los esporádicos?
El análisis de varianza o prueba ANOVA permite hacer estas comparaciones.
EJEMPLO
Se desea saber si difieren los encuestados con edades entre 16 – 20, 21 – 25, 26- 30 y mayores de 30 en la
importancia que le dan a que la obra generen un desafío. Puede ser que la edad sea un determinante a la hora de
elegir este atributo como criterio de decisión de compra. O puede ser que no. por eso es preciso genera la
información con el editor de datos SPSS.
PASO 1. HIPOTESIS
Hipótesis nula: 1=2=3=4
Hipótesis nula: 1234
PASO 2. Estadístico de prueba
Se trabaja con el estadístico F, nivel de significancia: 0.05
PASO 3. REGLA DE DECISIÓN
Si la probabilidad asociada al estadístico F es mayor que 0.05, el valor F cae en la zona de aceptación, y se acepta
la hipótesis nula.
Si la probabilidad asociada al estadístico F es menor o igual a 0.05. cae en la zona de rechazo, se rechaza la
hipótesis nula.
21
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
PASO 4. CALCULAR EL ESTADÍSTICO
Primer paso. Clic en analizar
Paso 2. Clic en comparar medias y clic en ANOVA DE UN FACTOR
PASO 3. EN EL CUADRO DE DIÁLOGO QUE APARECE, SELECCIONE LA VARIABLE EDAD Y TRASLADELA A
LA CASILLA FACTOR
22
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
23
PASO 4. SELECCIONE LA VARIABLE QUE LA COMPLEJIDAD DE LA OBRA REPRESENTE UN DESAFÍO A LA
CASILLA DEPENDIENTE.
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
PASO 5. CLIC EN OPCIONES Y LUEGO CLIC EN DESCRIPTIVOS
24
PASO 6. CLIC EN CONTINUAR Y CLIC EN ACEPTAR
RESULTADO
Descriptivos
Calif ica en una escala del 1 al 5 la import ancia que t iene para ti cada uno de los siguientes f actores a la hora de comprar un
libro [que la complejidad de la obra represente un desaf ío]
N
16 - 20
21 - 25
26 - 30
MAYOR DE 30
Total
22
7
1
1
31
Media
3.3182
3.5714
1.0000
5.0000
3.3548
Desv iación
típica
1.08612
.97590
.
.
1.14159
Error típico
.23156
.36886
.
.
.20504
Interv alo de conf ianza para
la media al 95%
Límite
Límite inf erior
superior
2.8366
3.7997
2.6689
4.4740
.
.
.
.
2.9361
3.7736
Mínimo
1.00
2.00
1.00
5.00
1.00
Máximo
5.00
5.00
1.00
5.00
5.00
Para los encuestados entre las edades de 16 y 20, la complejidad del libro como desafío tiene una
importancia promedio de 3.3182, para los encuestados entre 21 y 25, tiene una calificación promedio de
3.57, para los encuestados de 26 a 30, 1 y para los mayores de 30 de 5, Y el promedio general es de 3.3548,
es decir un bajo nivel de imortancia. ¿difieren estos promedios?
Pruebas de Hipótesis usando SPSS
Elaborado por Octavio Alvarado Cervantes
25
ANOVA
Calif ica en una escala del 1 al 5 la import ancia que t iene para ti cada uno de los
siguientes f actores a la hora de comprar un libro [que la complejidad de la obra
represente un desaf ío]
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
8.610
30.487
39.097
gl
3
27
30
Media
cuadrática
2.870
1.129
F
2.542
Sig.
.077
Paso 5. Tomar la decisión: el valor de sig., es probabilidad asociada a F es 0.077, mayor a 0.05, lo que quiere
decir que las medias no difieren. Se acepta entonces la hipótesis nula, porque cae F en la zona de aceptación.
Paso 6. Toma la decisión en los términos del problema de investigación de mercados: entre los hábitos de
lectura, puede decirse que para los jóvenes, sin importar la edad, no es tan importante que el libro sea complejo o
no a la hora de tomar su decisión de compra.
Descargar