Módulo IV Sistema Básico de IBM SPSS Statistics Lic. Héctor Basilio Marcelo CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 1 PRESENTACIÓN IBM® SPSS® Statistics es un sistema global para el análisis de datos. SPSS Statistics puede adquirir datos de casi cualquier tipo de archivo y utilizarlos para generar informes tabulares, gráficos y diagramas de distribuciones y tendencias, estadísticos descriptivos y análisis estadísticos complejos. Este manual, Manual del usuario del sistema básico de IBM SPSS Statistics, proporciona la documentación sobre la interfaz gráfica de usuario de SPSS Statistics. Los ejemplos que utilizan los procedimientos estadísticos que se encuentran en las opciones complementarias se suministran en el sistema de ayuda que se instala con el software. Asimismo, además de los menús y los cuadros de diálogos, SPSS Statistics utiliza un lenguaje de comandos. Algunas de las funciones avanzadas del sistema sólo son accesibles a través de la sintaxis de comandos. (Dichas funciones no están disponibles en la versión para estudiantes.) La información de referencia detallada sobre la sintaxis de comandos está disponible en dos formatos: integrada en el sistema de ayuda global y como un documento independiente en formato PDF en la referencia de sintaxis de comandos (Command Syntax Reference), también disponible en el menú Ayuda CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 2 INTRODUCCIÓN DIRECTA DE DATOS BASE DE DATOS Tanto los cuestionarios y/o formatos de recolección de información constituyen una forma estructurada sistemática y organizada para registrar los datos. Construir un formato de recolección de información o cuestionario obligará al investigador a pensar en términos de sus requerimientos de información, al planeamiento del trabajo de campo o al diseño de su experimento, según sea el caso, y las técnicas estadísticas para el análisis de los resultados INSTRUMENTO SOBRE COMPETENCIAS INVESTIGATIVAS CUESTIONARIO DE COMPETENCIAS INVESTIGATIVAS APELLIDOS Y NOMBRES:___________________________________________________________________ EDAD (en años):_______________________________ SEXO: _____________________________________ INSTRUCCIONES: Estimado estudiante; se está desarrollando la investigación titulada: Competencias Investigativas y la tesis en estudiantes de Ciencias Matemáticas e Informática de la UNCP Por tal motivo, el presente cuestionario tiene por objeto recoger información sobre las competencias investigativas, adquiridas y las que se llevan a cabo en la actualidad. Marca con un aspa (X) en la columna según sea el caso: no hay respuestas correctas e incorrectas, no deje ningún ítem sin contestar. Tus respuestas son anónimas; gracias por su colaboración. ÍNDICES: SIEMPRE CASI SIEMPRE ALGUNAS VECES CASI NUNCA NUNCA N° I. 01 02 03 04 05 06 07 08 09 5 4 3 2 1 ÍTEMS NUN CA CASI NUN CA ALG UNA S VEC ES CASI SIEM PRE SIEM PRE 1 2 3 4 5 CONOCIMIENTOS DEL PROCESO DE INVESTIGACIÓN CIENTÍFICA Puedo identificar el problema de investigación. Identifico criterios para seleccionar, priorizar y formular un problema susceptible de investigar en mi carrera profesional. Puedo determinar y delimitar problemas de la realidad de mi carrera profesional que no pueden ser resueltos con el conocimiento científico existente. Puedo definir ciencia y método científico. Identifico las etapas del proceso de investigación científica. Puedo definir correctamente: conocimiento, sujeto, objeto de investigación. Identifico y defino términos básicos que se relacionan con la variable de estudio. Puedo identificar trabajos de investigaciones nacionales, relacionados con mi tema de investigación. Comprendo y determino los objetivos de la investigación. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 3 10 11 12 13 14 15 16 17 18 19 20 21 II. 22 23 24 25 26 27 28 Reconozco la importancia de mi investigación. Reconozco porqué es pertinente mi proyecto de investigación. Puedo hacer autocrítica y definir mi posición con respecto a la hipótesis general y específicas. Conozco y defino los tipos de variables en la investigación científica. Identifico las variables intervinientes en mi investigación. Puedo definir el método de investigación que utilizo. Conozco los niveles de investigación: exploratorias, descriptivas, experimentales. Identifico los elementos del diseño metodológico en base al tipo de estudio. Identifico y caracterizo la población objeto de estudio. Identifico la muestra objeto de estudio. Puedo definir y diferenciar técnicas e instrumentos de medición. Conozco qué tratamiento estadístico se realiza a los datos recogidos en la investigación. HABILIDADES INVESTIGATIVAS Busco tesis en las bibliotecas. Selecciono material bibliográfico en internet. Elaboro fichas de trabajo y fichas documentales. Recojo información pertinente para mi investigación. Planteo y formulo de manera lógica y coherente el problema. Diseño y redacto los objetivos de la investigación. Elaboro el marco teórico que integra los resultados de la búsqueda bibliográfica y hago comparación entre autores, posturas y planteamientos. 29 Selecciono las investigaciones nacionales e internacionales realizadas, como antecedentes para mi investigación. 30 Elaboro la matriz de consistencia y de operacionalización de variables. 31 Selecciono técnicas e instrumentos de medición para mi investigación. 32 Domino el Word, Excel, SPSS, Minitab u otros. 33 Aplico pruebas estadísticas para comprobar la validez de los instrumentos de medición. 34 Aplico pruebas estadísticas para comprobar la confiabilidad de los instrumentos de medición. 35 Codifico y tabulo los datos de mi investigación. 36 Analizo e interpreto los resultados de acuerdo a las tablas y figuras. 37 Identifico las pruebas de hipótesis de manera adecuada de acuerdo al diseño de investigación. 38 Compruebo los resultados obtenidos con otras investigaciones y teorías. 39 Analizo y sistematizo los resultados de la investigación. 40 Tengo habilidad para comunicación escrita en español. Ortografía y sintaxis. 41 Hago un reporte de investigación en inglés. 42 Redacto la bibliografía de acuerdo a las normas de redacción científica (Vancouver, APA, ISO, etc.) 43 Elaboro el informe de mi investigación. 44 Puedo explicar la lógica de proceso vivido en el proceso de investigación, los factores que han intervenido y cómo se han relacionado entre sí y reconozco lo realizado con una interpretación crítica. 45 Tengo habilidad para comunicación oral en español. Comprensión de lectura e interpretación de códigos y gráficos óptimos. 46 Puedo leer y expresarme verbalmente en inglés. 47 Expongo mi trabajo de investigación tratando de que se genere una discusión en la sustentación. III. ACTITUDES Y VALORES EN INVESTIGACIÓN 48 Tengo plena confianza en mí mismo para culminar mi trabajo de investigación. 49 Tengo curiosidad e interés para realizar un trabajo de investigación. 50 Me gusta investigar temas originales, soy creativo y trato de orientar mi trabajo hacia el logro de metas planteadas al inicio de la investigación. 51 Soy tolerante y procuro controlar mis emociones cuando observan mi trabajo. 52 Soy persistente, constante y me gusta culminar el trabajo iniciado. 53 Soy responsable en el desarrollo de las actividades establecidas en mi trabajo de investigación. 54 Tengo iniciativa ante situaciones complejas y puedo coordinar. 55 Puedo analizar críticamente las investigaciones publicadas en mi carrera profesional. 56 Comparto intereses mutuos, puedo escuchar y revisar el progreso de los demás y puedo hacer una retroalimentación. 57 Tengo facilidad para sacar utilidad de las oportunidades y provecho de los datos estadísticos generados. 58 Soy independiente, autorealizado puedo hacer mi autoevaluación sin problema. 59 Aplico los principios éticos de integridad científica. 60 Conozco los principios éticos de protección a los sujetos que participan en la investigación. IV. MOTIVACIÓN HACIA LA INVESTIGACIÓN 61 Tengo interés en la comprensión del conocimiento científico. 62 Estoy convencido o convencida de que la investigación científica es el camino hacia el desarrollo personal y profesional. 63 Lo más importante fue para mí conseguir buenas calificaciones en la asignatura de formación científica como indicador de haber aprendido los conocimientos básicos. 64 Cuando tengo oportunidad de leer prefiero la investigación científica. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 4 65 66 67 68 69 70 71 Obtener el calificativo alto en el proyecto de investigación, no fue tan importante para mí, como el de haber culminado satisfactoriamente. Elaborar el proyecto de investigación despertó en mí el interés por la investigación. Al culminar mi formación profesional lo más importante será el continuar con la ejecución y terminar mi trabajo de investigación. Prefiero presentar un trabajo de investigación para poder obtener mi título profesional, en lugar de presentarme al examen de suficiencia u otra modalidad. Creo que con la formación científica podré iniciarme como investigador (a) ya que ello me permitirá ser reconocido por mis compañeros y jefes. Confío que puedo desempeñarme bien como integrante de equipos multidisciplinarios de investigación, porque el producto de nuestro trabajo será útil para la sociedad. Considero que con los conocimientos adquiridos en la asignatura del área de investigación he complementado en forma satisfactoria mi formación profesional. La base de datos se inserta teniendo en cuenta la etiqueta y la etiqueta de valores, Item por item del modo siguiente Vista de datos CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 5 Practica Realizar la base de datos del instrumento adjunto en los anexos. Matriz de datos La matriz que presenta el Editor de datos contiene todas las observaciones de las variables que necesitamos para poder realizar el análisis estadístico. Cada columna representa una variable única y cada fila un caso individual de cada variable. Para introducir datos basta con pinchar sobre una casilla y teclear el dato. Si donde tecleamos el dato la variable no está definida, SPSS asigna automáticamente un nombre de variable a la columna y la define con sus parámetros por defecto. Para no tener este problema es bueno primero definir variables Definición de variables Si pulsamos en la pestaña Vista de Variables accederemos a una matriz similar a la de datos, pero en este caso contiene las variables definidas del modo siguiente: cada fila represente una variable y cada columna parámetro o especificación de esta variable. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 6 Nombre: Debemos introducir el nombre de la variable, de 8 caracteres como máximo, que pueden ser letras, números o el símbolo de subrayado (..). El primer carácter únicamente puede ser una letra, y no se hacen distinciones entre mayúsculas y minúsculas. Como por ejemplo en la fila “1” tomamos la variable edad entonces en el parámetro nombre escribimos Edad. Tipo: Si nos ubicamos en el parámetro Tipo, A través del botón se accede a un panel donde podemos seleccionar el tipo de variable a utilizar que puede ser: numérica, coma, fecha, moneda, cadena, etc. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 7 Anchura El parámetro Anchura. Especifica el número de caracteres o dígitos de la variable. El botón que aparece al lado izquierdo permite aumentar o disminuir el número de dígitos o caracteres. Decimales El parámetro decimales, indica el número de decimales, si la variable es de tipo contable el botón que aparce al aldo izquierdo permite aumentar o disminuir el número de decimales Etiqueta Dada la imposibilidad de dar un nombre de variable mayor de 8 caracteres, se usan etiquetas para describir la variable de una forma más clara. Aunque internamente se trabaje con los nombres de las variables, en la presentación de las variables se pueden utilizar las etiquetas. Valores El parámetro valores permite asignar etiquetas a determinados valores de las variables. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 8 Perdidos El parámetro Perdidos permite definir los valores que se trataran como perdidos. Hemos de distinguir entre los valores declarados por el sistema (ausencia de dato) y los valores declarados como perdidos por nosotros mismos. Columnas: El parámetro Columnas indica la anchura de la columna en la vista de datos. El botón aparece al lado izquierdo permite aumentar o disminuir la anchura. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA que 9 Alineación El parámetro alineación indica la posición del dato en la casilla de Vista de datos que puede ser alineación izquierda, centro y derecha. Medida Este parámetro permite especificar el nivel de medida que puede ser. Escala: Puede ser de una escala de intervalo o de razón Ordinal: Representa categoría ordenadas Nominal: Representa categoría sin orden alguno CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 10 MANIPULACION DE CASOS Y VARIABLES Ver información de datos (Display Data Info..) El primer paso en la manipulación de datos con SPSS es obtener información relativa al archvio *Sav, ingrese al menú archivo: File > Diplay data Info.. > External File. De esta forma, se mostrará una ventana donde se tendrá que especificar el archivo CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 11 Luego presione Abrir. Toda la información se mostrara en la ventana de resultados (número de observaciones, nombres de variables, etiquetas, formato y rango de valores Información de archivo Origen C:\Users\Sony\Desktop\OFIMATICA 2017EDUCACION\MODULO IV SPSS\BASE DE DATOS COMPETENCIAS INVESTIGATIVAS.sav Tipo Archivo de datos de SPSS Statistics Fecha de creación 24-FEB-2017 17:31:20 Etiqueta Ninguna Codificación de caracteres UTF-8 Contenido de archivo Tipo de datos Caso N de líneas de documentos Ninguna Conjuntos de variables Ninguna Predicción de información de fecha Definiciones de respuesta múltiple Información de Data Entry para Windows Información de datos Ninguna Ninguna Ninguna Información de TextSmart Ninguna Información de modelador Ninguna N de casos 20 N de elementos de variable 73 definidos N de variables especificadas 73 Variable de ponderación Ninguna Comprimido Sí Variables Esta opción accesible desde el icono mostrados ubicado en el menú de herramientas estándar, permite obtener información de las variables del archivo (file) de trabajo activo, luego pulsando en el icono (botón) mostrado, resulta el siguiente cuadro CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 12 Pulsar variables Este cuadro de diálogo permite observar información de todas las variables que intervienen en el archivo del instrumento competencias investigativas como la variable edad; si se quiere información de las otras variables simplemente haga clic en la variable requerida y se mostrará la información similar a la variable edad. Buscar datos Para buscar e valor especifico de una variable, ubíquese en una celda cualquiera de la columna respectiva. Hay tres formas de alcanzar su objetivo presionando el ícono Buscar datos, mediante el atajo Alt + F5 o a través del menú principal Edi > Find CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 13 La ventana buscar datos en … le pedirá el valor a buscar, y si la búsqueda se hace hacia adelante o hacia atrás esta comenzará a partir de la celda seleccionada. Es posible ignorar las minúsculas o mayúsculas presionando sobre el control select respectivo. Se puede notar además, que la opción restringir búsqueda a cosos filtrados esta desactivada debido a que no se ha hecho una selección previa de casos. Ir a caso Esta opción es accesible desde el icono mostrado ubicado en el menú de herramientas estándar, o a través del menú principal Data > Go to Case.. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 14 Permite desplazarse al caso especificado por el número de fila de la tabla Spss. Luego de ingresar el caso especificado, se pulsa el botón Aceptar (Ok) y se obtiene el resultado buscado. Insertar variable: Se puede insertar una variable a través del menú principal Data > Insert Variable …. O presionado el icono mostrado en la barra de herramientas SPSS insertará una variable (en blanco) en la posición en que se encuentre el cursos, desplazando todas las columna hacia la derecha y nombrando dicha variable por defecto. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 15 En el ejemplo se puede observar que la variable insertada es VAR00003 Insertar caso De manera análoga, dicha tarea se puede realizar a través del menú principal Data > In Case sert caso presionando el ícono mostrado en la barra de herramientas. SPSS insertará un caso (en blanco) en la posición en que se encuentre el cursos, desplazando todas la filas hacia abajo. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 16 En el ejemplo, se puede observar que el caso insertado es 16. Ordenar Casos (Data > Sort Cases) Spss puede ordenar los casos de acuerdo a una o mas variables, para ello, se ofrece una interfaz cómoda y fácil de realizar. El gráfico muestra la ventana Sort Cases… donde se incluye una lista de variables, a partir de la cual se puede hacer la selección. Cuando el foco azul ilumina una variable, se presionará luego el botón de desplazamiento para ubicar dicha variable en la caja Sort by… CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 17 El orden en que aparezcan las variables en la caja Sort by.. Determinará la jerarquía entre estas. Así, una variable será ordenando ascendente o descendentemente dentro de un valor determinado de la variable precedente. Dividir Archivos (Data > Split File..) Se puede dividir archivos presionando el icono mostrado en la barra de herramientas, o a través del menú principal Data > Split File… La segmentación de archivos es útil para realizar análisis de datos o gráficos con cruce de variables. El procedimiento es sencillo, solo se tiene que especificar la(s) variable(s) de segmentación seleccionándola(s) una por una desde la lista de variables y presionando el botón de desplazamiento para ubicarla en la caja Groups Based CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 18 Calcular Variable:(Compute Variable…) A través del menú principal Transfom > Compute… se puede calcular la variable de un archivo Es posible crear una nueva variable que sea el producto de una transformación en la misma variable, o de otras variables existentes. Como muestra el grafico, la ventana Compute Variable… está compuesta por una línea de edición para especificar el nombre de la variable objetivo, operadores (aritméticos, algebraicos, relacionales y lógicos) funciones estadísticas y matemáticas, así como la opción condicional SI, que permitirá restringir la trasformación de variables a un subconjunto de datos que cumplen una condición. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 19 INFORMES, ESTADÍSTICAS DESCRIPTIVAS, TABLAS Informe (Reports) Informe (Reports) permite presentar con calidad los resultados con calidad los resultados obtenidos. Los cuadros estadísticos son un componente importante de los reportes de investigación; en consecuencia merecen una atención especial. El presente sub menú centra su atención en la presentación de información estadística mediante cuadro. Para ingresar a informes debe seguir las siguientes instrucciones (Ver gráfico) Cubos OLAP Crea una tabla con varias capas que contienen totales, medias y otros estadísticos univariados para variables de resumen continuas, según una o mas variables categóricas de agrupación. En la tabla, se creara una nueva capa para cada categoría de cada variable de agrupación. Resúmenes de casos Calcula estadísticos de subgrupo para las variables dentro de las categorías de una o más variables de agrupación. Se cruzan todos los niveles de las variables de agrupación Permite elegir el orden en el que se mostraran los estadísticos. También se muestran estadísticos de resumen para cada variable a través de todas las categorías. Los valores de los datos en cada categoría pueden mostrase en una lista o suprimirse. Con grandes conjuntos de datos se pueden listar los primeros n caos. Informe de estadísticos en filas CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 20 Genera informes en los que se presentan distintos estadísticos de resumen en filas. También se encuentran disponibles listados de los casos, con o sin estadísticos de resumen. Informe de estadísticos en columnas Genera informes en los que diversos estadísticos de resumen aparecen en columnas distintas. Las opciones son similares a las del procedimiento anterior. Estadísticos Descriptivos Es la herramienta estadística mas utilizada en diferentes niveles básicos de estudio. Frecuencias Presenta estadísticas y representaciones gráficas útiles para describir o inspeccionar muchos tipos de variables. Los variables pueden organizarse en orden ascendente o descendente, y se pueden ordenar las categorías por sus frecuencias. Descriptivos Proporciona estadísticas de resumen para varias variables en una única tabla, y se calcula valores tipificados (puntuaciones Z). las variables se pueden ordenar por el tamaño de sus medias (en orden) ascendente o descendente, alfabéticamente o por el orden en el que se seleccione (por defecto) se pueden guardas las puntuaciones Z añadiéndose al Editor de datos para su posterior uso. Explorar CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 21 Genera estadísticas de resumen y representaciones gráficas, bien para todos los casos o bien de forma separada para grupos de casos. Este procedimiento se puede usar para inspeccionar los datos identificar valores atípicos o extremos, descubrir discontinuidades, obtener descripciones, comprobar supuesto y caracterizar diferencias de sub poblaciones (grupos de casos). Tablas de contingencia (Cruzadas) Crea tablas de clasificación doble y múltiple, y además proporciona una serie de pruebas y medidas de asociación para las tablas de doble clasificación. La estructura de la tabla y el hecho de que las categorías estén ordenadas o no, determinan las pruebas o medidas que se utilizan. Razón Permite calcular ratios estadístico como los coeficientes de dispersión, coeficientes de variación y otros, permitiendo facilitar enormemente a los usuarios la interpretación de indicadores estadísticos que pueden servir para una toma de decisiones rápida y oportuna. Gráficos P-P Crea un gráfico de las proporciones acumuladas de una variable respecto a las de una distribución cualquiera de prueba, es decir, por cada variable especificada proporciona dos gráficos; en el primero se representan los valores de la función de distribución acumulada esperada, bajo el supuesto de normalidad (Por defecto) frente a los observados. En el segundo, se representan los residuos. Los gráficos de probabilidad suelen emplearse para determinar si la distribución de una variable coincide con una distribución dada. Gráficos Q-Q Crea un gráfico con los cuantiles de distribución de una variable, respecto a los cuantiles de una distribución cualquiera de prueba, es decir, por cada variable especificada proporciona dos gráficos en el primero, se representan los valores de los cuantiles esperados, bajo el supuesto de distribución normal (por defecto) de medida cero y varianza uno frente a los observados. Ejercicio Práctico Suponga que se mide la altura de los niños de una clase y se obtiene los siguientes resultados (cm) Alumno Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5 Alumno 6 Alumno 7 Alumno 8 Alumno 9 Alumno 10 Estatura 1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29 Alumno Alumno 11 Alumno 12 Alumno 13 Alumno 14 Alumno 15 Alumno 16 Alumno 17 Alumno 18 Alumno 19 Alumno 20 Estatura 1,23 1,26 1,30 1,21 1,28 1,30 1,22 1,25 1,20 1,28 Alumno Alumno 21 Alumno 22 Alumno 23 Alumno 24 Alumno 25 Alumno 26 Alumno 27 Alumno 28 Alumno 29 Alumno 30 Estatura 1,21 1,29 1,26 1,22 1,28 1,27 1,26 1,23 1,22 1,21 Presentar la información en una tabla de frecuencias. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 22 Calcular Ma, Me y Mo Calcular el Primer Cuartil, Segundo Cuartil y Tercer Cuartil Calcular el rango, varianza, desviación típica Calcular el índice de asimetría y de Curtosis Tablas personalizadas Genera tablas cruzadas y de subgrupo de cada variable. COMPARAR MEDIAS, MODELO LINEAL GENERAL Y CORRELACIÓN Comparar medias (prueba de hipótesis) Comprar medias de Spss es un procedimiento estadístico que permite realizar distintos tipos de contrates sobre una dos y hasta “n” medias Prueba T para muestras relacionadas Compra las medias de dos variables de un solo grupo, calcula las diferencias entre los valores de las dos variables de cada caso y contrasta si la media difiere de cero, además, compara estadísticas de muestras relacionadas; correlación entre pares, diferencia entre medias, probabilidad bilateral para prueba de no diferencia y para prueba de correlación cero entre pares. Ejercicio práctico CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 23 Se ha realizado un estudio para investigar el efecto del ejercicio físico en el nivel de colesterol en plasma, en el que participaron 11 sujetos. Antes del ejercicio, se tomaron muestras de sangre para determinar el nivel del colesterol de cada participante. Después, los individuos fueron sometidos a un programa de ejercicios que se centraba en carreras y marchas diarias. Al final del periodo de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma de los sujetos. Se quiere estimar la diferencia entre el nivel medio de colesterol antes y después del ejercicio. Se recogieron los siguientes datos Nivel previo mg/dl Nivel posterior mg/dl 182 198 232 210 191 194 200 220 148 138 249 220 276 219 213 161 241 210 480 313 262 226 Decidir si existen diferencias significativas entre estos niveles antes y después del ejercicio físico. SOLUCION: X: “nivel de colesterol antes del ejercicio físico” → N(µ1, σ1) Y: “nivel de colesterol después del ejercicio físico” → N(µ2, σ2) El problema se plantea H0: µ1= µ2 No existe diferencia significativa de medias entre el antes y después H1: µ1≠ µ2 Existe diferencia significativa de medias entre el antes y después CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 24 Se utiliza t para muestra relacionadas El resultado se muestra a continuación Prueba de muestras emparejadas Diferencias emparejadas Media Par 1 antes despues 33,18182 Desviación Media de error estándar estándar 51,06627 15,39706 95% de intervalo de Sig. confianza de la diferencia (bilate Inferior -1,12497 Superior 67,48860 t 2,155 CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA gl ral) 10 ,057 25 A la vista de estos resultados, como el p-valor asociado es mayor que el nivel de significación especificado (0.057 > 0.05), se puede admitir que la diferencia de medias es 0, es decir, admitimos que las dos medias son iguales con un nivel de confianza del 95% Prueba T para muestras independientes Comprar las medias de dos grupos de casos. Los sujetos deben asignase aleatoriamente a dos grupos, de forma que cualquier diferencia en la respuesta sea debida al tratamiento (o falta de tratamiento) y no a otros factores. Ejercicio práctico En dos grupos no aleatorios se experimentó sobre la influencia de cierto programa al grupo uno se le administro el programa y al grupo dos no se tomó un test de inteligencia para ver la influencia. Los resultados fueron los siguientes. Pos-tes Grupo 2 CONTROL 442 434 433 524 471 488 426 491 548 552 425 442 381 459 434 559 510 442 415 544 Pos-test Grupo 1 EXPERIMENTAL 464 529 489 392 497 491 472 425 551 574 501 442 480 437 426 472 375 499 470 571 Plantear la hipótesis y comprobar SOLUCIÓN: CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 26 Después de haber identificado las variables de agrupación se procede del siguiente modo: Se define grupos: CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 27 El problema se plantea H0: µ1= µ2 H1: µ1≠ µ2 A la vista de estos resultados, como el p-valor asociado es mayor que el nivel de significación especificado (0.685 > 0.05), se puede admitir que la diferencia de medias es 0, es decir, admitimos que las dos medias son iguales con un nivel de confianza del 95% Ejercicio práctico 3 A fin de determinar si existe diferencias estadísticamente significativas entre los puntajes de autorresponsabilidad de los grupos de postulantes a una universidad X; unos se prepararon en centros pre universitarios y otros se auto prepararon, se seleccionó una muestra aleatoria de 14 postulantes que se prepararon en centros pre universitarios y 12 que se preparan por su cuenta y se les aplicó un test de responsabilidad, los resultados fueron los siguientes. Postulantes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Centro pre 20 21 20 18 22 20 19 21 19 18 20 21 17 23 Su casa 20 22 21 22 23 22 21 23 20 19 23 23 Hipótesis: CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 28 Ho : No existe diferencias estadísticamente significativas entre los puntajes promedios de autorresponsabilidad de los postulantes. H0: µ1= µ2 H1 : Si existe diferencias estadísticamente significativas entre los puntajes promedios de autorresponsabilidad de los postulantes. H1: µ1≠ µ2 Comprobar la hipótesis Ejemplo 2: Una propaganda de un refresco dietético asegura que si se toma a diario y por un mes se obtendrá una pérdida de peso; la defensoría del consumidor sospecha que ésta propaganda es falsa, por lo que realiza un estudio con 12 personas dispuestas voluntariamente a llevar a cabo dicha investigación conteniéndose los siguientes resultados. Sujetos 1 2 3 4 5 6 7 8 9 10 11 12 Antes de la Después de propaganda propaganda 126 120 194 180 135 140 179 180 205 186 139 142 142 146 172 161 159 160 194 200 164 156 139 126 la Hipótesis: Ho: No existe pérdida de peso de las personas, después de tomar el refresco dietético durante el periodo de un mes. H1: Existe pérdida de peso de las personas, después de tomar el refresco dietético durante el periodo de un mes Comprobar la hipótesis CORRELACIÓN El procedimiento correlaciones permite calcular la matriz de correlaciones de un conjunto de variables. Correlación permite obtener los índices de asociación lineal con variables cuantitativas; asimismo, permite evaluar la existencia de relaciones lineales entre variables CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 29 Correlación Bivariada El procedimiento Bivariadas calcula el coeficiente de correlación de Pearson, la rho de Spearman y la tau-b de Kendall con sus niveles de significación. Las correlaciones miden como están relacionados las variables o los órdenes de los rangos. Antes de calcular un coeficiente de correlación, se deben inspeccionar los datos para detectar valores atípicos (que pueden producir resultados equívocos). Clases de correlaciones: a) Correlación simple (cuando se realiza entre dos variables) b) Correlación múltiple (cuando se realiza tres o mas variables) c) Correlación lineal (Cuando el diagrama de dispersión tiende a formar una línea recta) d) Correlación no lineal (cuando el diagrama de dispersión tiende a formar una curva Diagramas de dispersión: gráfica que describe la relación entre las dos variables de interés Las variables X e Y se grafican en un plano cartesiano se puede obtener los siguientes gráficos. Propiedades de “r” o el coeficiente de correlación CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 30 -1 ≤ r ≤ + 1 De donde se deduce que: Si r > 0 , entonces existe correlación directa positiva. Si r < 0 , existe correlación inversa negativa. Si r = 1 ,Correlación perfecta positiva Si r = -1 , Existe una correlación perfecta negativa Si r = 0 , las variables son incorrelacionadas. (Correlación nula) “r” de Pearson Es el coeficiente ideado por Kalz Pearson, estadístico inglés, y es el índice de correlación mas usado. Fórmula para r r N XY-( X)( Y) [N X 2 ( X)2 ][N Y 2 ( Y)2 ] EJERCICIO PRÁCTICO 1 Alumno Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5 Alumno 6 Alumno 7 Alumno 8 Alumno 9 Alumno 10 Talla 1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29 Peso 32 33 34 30 32 35 34 32 32 35 Alumno Alumno 11 Alumno 12 Alumno 13 Alumno 14 Alumno 15 Alumno 16 Alumno 17 Alumno 18 Alumno 19 Alumno 20 Talla 1,23 1,26 1,30 1,21 1,28 1,30 1,22 1,25 1,20 1,28 Peso 33 35 34 30 33 34 35 32 33 33 Alumno Alumno 21 Alumno 22 Alumno 23 Alumno 24 Alumno 25 Alumno 26 Alumno 27 Alumno 28 Alumno 29 Alumno 30 Talla 1,21 1,29 1,26 1,22 1,28 1,27 1,26 1,23 1,22 1,21 Peso 33 34 34 31 32 34 34 31 35 34 Calcular el coeficiente de correlación bivariada de Pearson. SOLUCIÓN CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 31 En el menú analizar se procede con el análisis de correlación bivariada. Se traslada las variables requeridas y por defecto se selecciona Pearson. Correlaciones talla talla Correlación de Pearson Peso 1 Sig. (bilateral) N Peso ,434* ,017 30 30 Correlación de Pearson ,434* 1 Sig. (bilateral) ,017 N 30 30 CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 32 *. La correlación es significativa en el nivel 0,05 (2 colas). La correlación de talla respecto a peso es 0,434(43,4%) Diagrama de dispersión En el menú gráficos se puede realizar un gráfico de dispersión o nube de puntos del ejemplo. Luego se ubica en los ejes respectivos Se presiona aceptar y el grafico se genera al instante. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 33 EJERCICIO PRÁCTICO 2 Hallar el coeficiente de correlación r de pearson y la gráfica de dispersión de las puntuaciones originales de 14 estudiantes que obtuvieron en dos pruebas X de estadística y Y de matemática, según la siguiente tabla. X 18 18 17 17 16 16 15 15 14 14 13 13 12 12 Y 28 30 30 26 28 24 22 20 26 22 24 18 20 18 EJERCICIO PRÁCTICO 3 Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la longitud en cm. de una cierta variedad de planta al cabo de un año de vida para predecir la longitud de esa variedad de planta en edad adulta: Longitud en cm. el primer año (x) 15,3 14,8 12,6 18,4 17,9 15,6 18,4 14,1 20,2 21,7 20,4 16,5 15,9 17,9 16,7 Longitud en cm. en edad adulta (y) 30,7 32,5 26,3 35,9 34,3 28,5 37,4 29,7 38,8 40,4 40,9 33,3 30,1 35,7 31,4 Se pide: CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 34 a) Representar el diagrama de dispersión b) Calcular el coeficiente de correlación r de pearson Análisis de regresión Lineal Simple La Lineal recta: La curva de aproximación más sencilla, es la línea recta, cuya ecuación es: Y = a + bX Donde a y b son constantes y pueden ser determinadas y b es pendiente Dados dos puntos cualesquiera (x1,y1) y (x2,y2) de la recta, la ecuación puede expresarse también. Y – y1 = (y2 – y1)/(x2 – x1) (X – x1) ó Y – y1 = b(X – x1) LA ECUACIÓN LINEAL Dos características importantes de una ecuación lineal son: La pendiente de la recta La localización de la recta en algún punto. Una ecuación lineal tiene la forma Y = a + bX, en la que a y b son valores que se determinan a partir de los datos de la muestra. La variable Y es la que se habrá de predecir, y X es la variable predictora. Y Y = a + bX X Ejemplo: 1 2 3 4 5 6 7 8 9 10 N X Y XY X2 Y2 20 30 30 40 50 60 60 60 70 80 500 50 73 69 87 108 128 135 132 148 170 1100 1000 2190 2070 3480 5400 7680 8100 7920 10360 13600 61800 400 900 900 1600 2500 3600 3600 3600 4900 6400 28400 2500 5329 4761 7569 11664 16384 18225 17424 21904 28900 134660 CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 35 b N XY-( X)( Y) N X 2 ( X)2 __ b= 2 __ a YbX a = 10 Por lo tanto la recta de predicción de la variable X con respecto a Y es: Y = 10 + 2X Con el Spss podemos calcular de manera inmediata Se utiliza el modelo lineal por defecto. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 36 Coeficientesa Coeficientes Coeficientes no estandarizados Modelo 1 B (Constante) x Error estándar 10,000 2,503 2,000 ,047 estandarizados Beta t ,998 Sig. 3,995 ,004 42,583 ,000 a. Variable dependiente: y Constante a = 10 Pendiente b = 2 Realiza el análisis de regresión de los ejercicios prácticos 2 y 3 PRUEBA DE NORMALIDAD PASO 1 Para una muestra mayor o igual que 50 se utiliza el Kolmogrov y para muestras menores que 50 se utiliza el Shapiro PASO 2: CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 37 GRAFICOS Como la muestra es menor que 50 utilizaremos el Shapiro-Wilk CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 38 Pruebas de normalidad Kolmogorov-Smirnova ESTUDIANTES NOTAS Estadístico gl Shapiro-Wilk Sig. Estadístico gl Sig. G. Estudio ,214 28 ,002 ,895 28 ,009 G. Control ,115 31 ,200* ,957 31 ,248 *. Esto es un límite inferior de la significación verdadera. a. Corrección de significación de Lilliefors PLANTEA LAS HIPÓTESIS Ho: La variable de las calificaciones en la población tiene distribución Normal. p > 0,05 H1: La variable de las calificaciones en la población tiene distinta a la distribución Normal. p < 0,05 En la tabla se puede observar tanto en el grupo de estudio como en el grupo experimental son uno mayor y otro menor que 0,05 por lo tanto se rechaza la H0 y se acepta la H1. PRUEBA DE HOMOGENIDAD Anova de un factor CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 39 Prueba de homogeneidad de varianzas NOTAS Estadístico de Levene 8,040 df1 df2 1 Sig. 57 ,006 PLANTEA LA HIPOTESIS Ho: No existen diferencias significativas en entre las varianzas de las calificaciones de los dos grupos. H1: Existen diferencias significativas entre las varianzas de las calificaciones de los grupos En la tabla se puede observar que la sig. es menor que 0,05 por lo tanto se rechaza la H0 y se acepta la H1. CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 40 CONFIABILIZACIÓN Se utiliza para ver si un instrumento es confiable o no: Se traslada solo los items del instrumento Alfa de crombach Estadísticas de fiabilidad Alfa de Cronbach basada en Alfa de elementos Cronbach estandarizados N de elementos 1,000 1,000 71 CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 41 VALIDEZ ITEM POR ITEM Para validar los ítem se procede de la misma manera La tabla se muestra de la siguiente manera: CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 42 Estadísticas de total de elemento Media de escala si Varianza de escala Correlación total Alfa de Cronbach si el el elemento se ha si el elemento se de elementos elemento se ha suprimido ha suprimido corregida suprimido 1.El medio que uso para conestarme a internet es 75,42 40,490 -,058 ,427 2. Tengo una cuenta en la red social Facebook 75,84 40,567 -,101 ,417 3. Durante el dia estoy conectado al Facebook 74,81 37,285 ,135 ,398 4. Utilizo el Facebook para 73,06 38,231 -,013 ,446 5. Mayomente uso el Facebook en 75,83 40,283 ,073 ,413 6. La razón que me motiva a tener una cuenta en 72,03 31,860 ,067 ,464 Facebook es 7. Acepto cualquier tipo de amistad que me envien 74,91 40,532 -,043 ,417 en el Facebook 8. El número de vesces que entro al Facebook al día 74,38 38,411 ,018 ,429 es 9. Comento continuamente las publicaciones de mia 75,01 40,461 -,029 ,418 amigos en el Facebook 10. Mis padres o tutores saben que uso el Facebook 75,84 40,538 -,059 ,417 11. Para mi es necesario estar conectado(a) al 75,09 39,801 ,089 ,409 Facebook 12. De alguna manera el Facebook me ayuda a 75,17 37,848 ,415 ,378 olvidar mis problemas 13. Mis horas de sueño se han visto alteradas 75,08 39,585 ,132 ,406 debido al uso del Facebook 14. He sido víctima de Bullying mediante el 74,90 40,007 ,158 ,409 Facebook 15. El Facebook ha mejorado mis relaciones 75,55 39,449 ,137 ,405 interpersonales de manera positiva 16. Paso más horas en el Facebook que con mis 74,96 39,798 ,146 ,407 amigos 17. Tengo un(a) enamorado(a) en el Facebook 74,94 39,831 ,153 ,407 18. Soy más amigable en el Facebook qye haciendo 74,91 38,956 ,006 ,428 amigos en persona 19. Me muestro tal y como soy en el Facebook 75,72 40,567 -,052 ,419 20. He creado cuentas falsas en el Facebook 74,97 40,816 -,114 ,423 21. el Facebook para mi es 74,87 40,983 -,163 ,425 22. En mi casa quienes usan el Facebook son 73,34 38,434 ,115 ,403 23. Me he distanciado de mis familiares debido al 74,93 39,995 ,076 ,411 uso del Facebook 24. Mis padres me han llamado la atención porque he descuidado mis tareas domésticas por el uso del 75,23 38,615 ,265 ,392 Facebook 25. Mis padres me controlan de alguna manera el 73,70 33,395 ,362 ,336 uso del Facebook 26. En casa me han dicho alguna vez que sufro de 73,84 32,915 ,335 ,338 alguna adicción al Facebook 27. Tengo frecuentes problemas con mis padres por 72,59 36,365 ,392 ,361 usar el Facebook 28. Mis padres me han castigado debido al uso 73,78 34,849 ,235 ,370 constante del Facebook 29. He bajado mis calificaciones por el uso del 75,05 39,163 ,226 ,399 Facebook 30. Me comunico con mis profesores por el 75,25 39,389 ,134 ,404 Facebook 31. El Facebook me ayuda para 74,16 37,860 ,220 ,388 32. Uso el facebook en mis horas de clase 73,20 40,682 -,075 ,426 33. He usado en Facebook para plagiar en mis 72,91 40,434 -,010 ,416 exámenes 34. He tenido problemas con las autoridades en mi 74,89 40,396 ,012 ,415 colegio por el uso del Facebook CERTIFICACIÓN UNIVERSITARIA EN OFIMÁTICA 43