Guía docente de la asignatura: Manejo y Análisis de Datos con STATA DATOS DESCRIPTIVOS DE LA ASIGNATURA Curso académico: 2015-2016 (1er y 3er trimestre) Nombre de la asignatura: Manejo y Análisis de Datos con STATA Tipo de asignatura: Obligatoria Número de créditos: 3 ETC Horas dedicación: 22 horas Trimestre: 1er trimestre (4 horas) y 3er trimestre (18 horas) Idioma: Castellano/Inglés Coordinación: Mònica Guxens, Xavier Basagaña Profesorado: Mònica Guxens PROFESOR Mònica Guxens es Licenciada en Medicina (2002) por la Universidad Autónoma de Barcelona (UAB), Especialista en Medicina Preventiva y Salud Pública (2007) y Doctora en Salud Pública e Investigación Biomédica (2008) por la Universidad Autónoma de Barcelona (UAB). Actualmente es investigadora (Assistant Research Professor) del Centre de Recerca en Epidemiologia Ambiental (CREAL) de Barcelona y del Departamento de Psiquiatría/Psicología del Niño y del Adolescente del Estasmus University Medical Center-Sophia Children’s Hospital de Rotterdam, Holanda. Sus líneas de investigación incluyen los efectos de la exposición de diversos contaminantes durante el embarazo como la contaminación atmosférica, los contaminantes químicos persistentes y no persistente en la salud y el crecimiento del niño, particularmente el desarrollo del cerebro. Su actividad docente se centra en el máster de Salud Pública de la Universidad Pompeu Fabra (UFP) y Universidad Autónoma de Barcelona (UAB). Email: [email protected] PRESENTACIÓN Una parte fundamental en la investigación epidemiológica es el manejo y análisis estadístico de los datos para su posterior presentación, interpretación y discusión de resultados. Este curso está pensado como una introducción al paquete estadístico STATA, comúnmente utilizado para el manejo y análisis de este tipo de datos. OBJETIVOS DOCENTES Y COMPETENCIAS A ALCANZAR El objetivo general del curso es ser capaz de utilizar, de manera independiente, el paquete estadístico STATA para realizar el manejo y análisis de base de datos de estudios epidemiológicos, utilizando una serie de comandos específicos apropiados para los diferentes análisis estadísticos. Los objetivos específicos son: 1. Familiarizarse con el entorno del paquete estadístico STATA para manipular y gestionar las bases de datos. 2. Identificar los diferentes comandos específicos del paquete estadístico STATA que permiten realizar los correspondientes análisis estadísticos. 3. Obtener y manipular los resultados, tablas, y gráficas con el paquete estadístico STATA para su posterior interpretación, presentación y discusión de los resultados obtenidos en los análisis estadísticos realizados. 1 METODOLOGÍA Y EVALUACIÓN Plan de trabajo Se realizarán actividades en el aula y fuera del aula. En el aula se impartirán clases teóricas y se realizarán ejercicios prácticos. Fuera del aula se realizarán trabajos individuales. Criterios generales de evaluación de la asignatura Se realizará una evaluación continuada del alumno basa en los siguientes criterios: - Participación activa en las sesiones teóricas y prácticas - Evolución de su aprendizaje - Capacidad de comprensión y resolución de los problemas - Redacción e interpretación de los entregables propuestos - Examen Porcentaje en la evaluación de los entregables y del examen 15% - Entregable 1 (1er trimestre, ejercicios 1 y 2) 15% - Entregable 2 (3er trimestre) 15% - Entregable 3 (3er trimestre) 15% - Entregable 4 (3er trimestre) 40% - Examen (3er trimestre) Para superar la asignatura es necesario obtener una nota superior a 4,9 en el examen y una nota media superior a 4,9 en la parte de ejercicios entregables. Sólo podrán realizar recuperación los estudiantes, que habiendo participado en la evaluación continuada y habiéndose presentado al examen final de la asignatura, hayan obtenido la calificación final de suspenso. Los estudiantes recuperarán aquellas partes que hayan obtenido una calificación inferior a 5. FUENTES DE INFORMACIÓN Y RECURSOS DIDÁCTICOS Michael Hills, Bianca L. De Stavola. A Short introduction to Stata for biostatistics: updated to Stata 12 Lawrence C. Hamilton. Statistics with Stata: updated for Version 12 UCLA – Statistical Consulting Group (http://www.ats.ucla.edu/stat/stata/) Alan C. Acock. A gentle introduction to Stata Sophia Rabe-Hesketh, Brian S. Everitt. A Handbook of statistical analyses using Stata Juul, Svend. An introduction to stata for health researchers FAQ in the Stata website (http://www.stata.com/support/faqs) PROGRAMACIÓN A lo largo del curso los alumnos realizarán ellos mismos un análisis estadístico completo, desde la adquisición y preparación de las bases de datos hasta los análisis estadísticos y la preparación de las tablas y figuras para la publicación científica. Se realizará un ejercicio práctico en cada sesión, correspondiente a cada una de las partes del manejo y análisis de datos, que tendrá continuidad a lo largo de todo el curso. Lesson 1. Introduction to STATA and data management I (1st trimester) What is a dataset? Statistical software Overview Stata Help facilities A first look at the data: use, browse, edit, describe, count, codebook, summarize, tabulate, tab1, list General STATA instructions: renvars, more, go, break button, if & | == != < > <= >= Data management: order, drop, keep, sort, gsort, label var, label define, label values, label list, label book, label drop, rename, data types and display formats (describe, format) 2 Lesson 2. Data management II Do file, log file, organization of the folders, working directory Saving files: save, saveold, replace Install commands and new packages Generating new variables: generate, replace, recode, egen, xtile Graph commands: graph pie, catplot, histogram, graph export, graph save, graph combine Lesson 3. Review – Data management I & II (3er trimester) Organization of the folders, open a dataset, save a dataset, do file, working directory Example master thesis (application of commands learnt in lesson 1 & 2) Lesson 4. Data management III Data management: duplicates, round, ceil, append, merge, reshape, string variables (destring, encode, string, tostring, decode, substr), working with dates (mdy, format, year, month, year) Data input and output: import, insheet, export, outfile, outsheet Lesson 5. Data analysis I: Descriptive univariate analysis Tables commands: summ, tab, tab1, tabstat, table, centile, bysort Graph commands: graph pie, pie chart, graph bar, boxplot, catplot, graph exposrt, graph save, graph combine Missing values commands: mxpatterns, mdescr, codebook, misstable sum Lesson 6. Data analysis II: Bivariate analysis Table commands: tab2, oneway, anova, nptrend, kwallis, correlate, spearman, gram Graph commands: twoway scatter plot (matrix), gamplot Lesson 7. Data analysis III: Assumptions regression models Linear regression commands: poredict twoway, gam, rvfplot, estat imtest, estat hottest, vif, Collin, kdensity, qnorm, pnorm, iqr, swilk Logistic regression commands: linktest, lfit, fitstat lsense, lstat, lroc, listcoef, predict, ldfbeta, graph, scatlog, boxtid Exposure and outcome transformation commands: qladder, gladder, fracpoly, fracplot Lesson 8. Data analysis IV: Regression models Regression models commands: regress, logit Change reference category, change unit variable Post-estimation commands: estimates, lrtest, e(), testparm, lincom, parmest, if e(sample). Graph for estimates and 95% confidence intervals Lesson 9. Data analysis V: eddect modification and sensitivity analysis Interaction, stratification Graph commands Lesson 10. Data analysis VI : meta-analysis Meta-analysis commands: parmest, metan, metafunnel, metabias, metatrim, metainf, metap, galbr, metareg Lesson 11. Programming in STATA Loop commands: levelsof, foreach, forval Tables: esttad, eststo, estout, estadd, estpost Export tables automatically 3