FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA RED NACIONAL UNIVERSITARIA Facultad de Ciencias de la Salud Carrera de Fisioterapia y Kinesiología SEGUNDO SEMESTRE SYLLABUS DE LA ASIGNATURA ESTADISTICA Y BIOMETRIA Elaborado por: Lic. Fernando Orellana Montenegro Gestión Académica I/2014 U N I V E R S I D A D 1 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA UDABOL UNIVERSIDAD DE AQUINO BOLIVIA Acreditada como PLENA mediante R. M. 288/01 VISION DE LA UNIVERSIDAD Ser la Universidad líder en calidad educativa. MISION DE LA UNIVERSIDAD Desarrollar la Educación Superior Universitaria con calidad y Competitividad al servicio de la sociedad. Estimado(a) estudiante: El Syllabus que ponemos en tus manos es el fruto del trabajo intelectual de tus docentes, quienes han puesto sus mejores empeños en la planificación de los procesos de enseñanza para brindarte una educación de la más alta calidad. Este documento te servirá de guía para que organices mejor tus procesos de aprendizaje y los hagas mucho más productivos. Esperamos que sepas apreciarlo y cuidarlo. Aprobado por: Fecha: Marzo del 2013 SELLO Y FIRMA JEFATURA DE CARRERA U N I V E R S I D A D D 2 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA SYLLABUS Asignatura: Código: Requisito: Carga Horaria: Horas Teóricas: Horas Prácticas: Créditos: ESTADISTICA Y BIOMETRIA FYK – 236 Ninguno 80 hrs. 40 40 8 I. OBJETIVOS GENERALES DE LA ASIGNATURA. Proporcionar al alumno conocimientos básicos de la estadística descriptiva y demográfica Establecer los criterios y normas mínimas que deben verificarse para construir y presentar adecuadamente los gráficos en el ámbito de la estadística descriptiva Que el alumno conozca como debe emplearse la información y cómo organizar, tabular las medidas obtenidas mediante la construcción de tablas de frecuencia Que el alumno conozca los métodos para elaborar imágenes que sea capaz de mostrar gráficamente unos resultados Lograr que los estudiantes de Fisioterapia capte, aprenda y utilice las bases y normas del método estadístico desde la recolección de la información hasta el análisis de datos mediante clases teóricas y prácticas en aula y terreno. II. PROGRAMA ANALITICO DE LA ASIGNATURA. UNIDAD I: TEMA 1. EL MÉTODO ESTADÍSTICO 1.1. La Estadística y la Bioestadística 1.2. Historia 1.3 Escuelas 1.4 Definiciones 1.5. El método estadístico 1.6. Objetivo e importancia de la Estadística y la Bioestadística 1.7. Estadística descriptiva y Estadística Inferencial TEMA 2. PROCESO ESTADISTICO PARA LA INVESTIGACION 2.1 El proceso estadístico 2.2 El universo y la muestra 2.3 Organización de los datos 2.4 Variables estadísticas 2.5 Registro y recolección de datos 2.6 Sistemas de recolección de datos 2.7 Fuentes de información 2.8 Elaboración de la información 2.9 Presentación de datos (cuadros y gráficos) TEMA 5.POBLACIÓN Y MUESTRA U N I V E R S I D A D 3 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA 5.1 5.2 5.3 5.4 5.5 Universo, Población y Muestra. Definiciones y Conceptos Razones para muestrear Método de muestreo 5.4.1 Muestreo Aleatorio Simple 5.4.2 Muestreo Estratificado 5.4.3 Muestreo Sistemático 5.4.4 Muestreo Por Conglomerado Parámetros de población y estadísticas de las muestras TEMA 3. EXPLORACIÓN Y PRESENTACIÓN DE DATOS 3.1. Utiliza escalas de medición 3.2. Elabora tablas y cuadros de datos para su presentación y posterior interpretación. 3.3. Interpretación de datos presentados en tablas y cuadros estadísticos. TEMA 4. CLASES DE ESCALAS Y GRÁFICOS POR TIPO DE ESCALA 4.1. 4.2. 4.3. 4.4. 4.5. Escalas nominales Escalas ordinales Escalas cuantitativas Cuadros y gráficas para datos nominales y ordinales Representaciones Gráficas 4.5.1. Gráficos para variables cualitativas 4.5.2. Gráficos para variables cuantitativas 4.6. Histogramas, Circular, Líneas, Barras, Pictogramas, Mapas. TEMA 5. MEDIDAS DE TENDENCIA CENTRAL 5.1 Introducción 5.2 Promedio 5.2.1. Aritmético 5.2.2. Geométrico 5.3 La media 5.4 La mediana 5.5 La moda 5.6 Relación entre media, mediana y moda TEMA 6. MEDIDAS DE DISPERSION 6.1 Introducción 6.2 Medidas de variabilidad o dispersión 6.2.1. Rango 6.2.2. Cuartiles 6.2.3. Deciles 6.2.4. Percentiles 6.2.5. Desviación media, Dm 6.2.6. Varianza y Desviación típica 6.2.7. Coeficiente de variación U N I V E R S I D A D D 4 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA UNIDAD II TEMA 7. INDICADORES DE SALUD 7.1 Introducción 7.2 Indicador, razones, proporciones, porcentaje, tasa, indices 7.3 Criterios para la selección de indicadores 7.3.1. Validez 7.3.2. Comparabilidad 7.3.3. Simplicidad 7.3.4. Utilidad 7.4 Indicadores de acceso 7.5 Indicadores de seguimiento 7.6 Indicadores de cobertura 7.7 Indicadores de calidad 7.8 Indicadores de eficiencia 7.9 Interpretación de los indicadores TEMA 9. ESTADISTICAS DE HECHOS VITALES 9.1 Los hechos vitales 9.2 Nacimientos 9.2.1. Medición tasas utilizadas 9.3 Mortalidad 9.3.1. Mortalidad general 9.3.2. Mortalidad Fetal 9.3.3. Mortalidad materna TEMA 9. MONITOREO DE INDICADORES 9.1. Definición 9.2. Evaluación, Monitoreo y Supervisión 9.3. SNIS (Sistema de Información en Salud) 9.3.1. Instrumentos del SNIS 9.3.2. Flujo de información 9.6. C.A.I. (Comité de Análisis de Información) 9.7. ASIS (Análisis de Situación de Salud) TEMA 10. ESTADISTICAS DE POBLACION 10.1 Introducción 10.2 El censo de población 10.3 Empadronamiento 10.4 Métodos para calcular poblaciones 10.4.1. Método de crecimiento natural 10.4.2. Método de crecimiento aritmético 10.4.3. Método de crecimiento geométrico 10.4.4. Método de tasas UNIDAD III TEMA 11. MANEJO DEL EPI-INFO 11.1 Introducción 11.2 Creación de Vistas 11.3 Introducción de datos 11.4 Copia de seguridad 11.5 Análisis de datos 11.6 Mapeo U N I V E R S I D A D 5 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA 11.7 mapeo personalizado TEMA 12. MANEJO DEL SPSS 12.1 Introducción 12.2 Creación de Vistas 12.3 Introducción de datos 12.4 Copia de seguridad 12.5 Análisis de datos 12.6 Mapeo 12.7 mapeo personalizado III. ACTIVIDADES A REALIZAR DIRECTAMENTE EN LA COMUNIDAD. i. Tipo de asignatura para el trabajo social. Asignatura de Apoyo. ii. Resumen de los resultados del diagnóstico realizado para la detección de los problemas a resolver en la comunidad En nuestra ciudad existen varios centros de salud en los que existen personas internadas, a las que se les puede visitar y con las que se pueden realizar actividades de esparcimiento. iii. Nombre del proyecto al que tributa la asignatura Visitas de esparcimiento a centros de internación de niños y adultos iv. Contribución de la asignatura al proyecto Los estudiantes realizaran actividades de esparcimiento y compartirán con los internos de estos centros v. Actividades a realizar durante el semestre para la implementación del proyecto. Trabajo a realizar por los estudiantes Organización del proyecto Localidad, aula o laboratorio Visita a los centros de internación Centros de internación Incidencia social Fecha Primera semana de clases Aula Actividades de esparcimiento y confraternización Del 20 de agosto al 10 de noviembre IV. EVALUACIÓN DE LA ASIGNATURA PROCESUAL O FORMATIVA A lo largo del semestre se realizarán exposiciones, repasos cortos y otras actividades de aula; además de los trabajos de brigadas realizados en las áreas rurales, independientemente de la cantidad, cada una se tomará como evaluación procesual calificándola entre 0 y 50 puntos. DE RESULTADOS DE LOS PROCESOS DE APRENDIZAJE O SUMATIVA (examen parcial o final) U N I V E R S I D A D D 6 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Se realizarán dos evaluaciones parciales con contenido tétrico y práctico. El examen final consistirá en un examen escrito y en la presentación y socialización de los documentos resultantes del trabajo de las brigadas y temas de investigación realizadas. Cada una de estas se calificará con el 50% de la nota del examen final. V. BIBLIOGRAFIA BIBLIOGRAFIA BÁSICA WALTER L. MATINEZ VACA, Estadística Descriptiva con Énfasis en Salud Publica, La Hoguera, Bolivia. 2003 J.L. CARRASCO DE LA PEÑA, El Método Estadístico en la Investigación Médica. Karpus, Madrid, 2.002. MARTÍN ANDRÉS, J.D. LUNA DEL CASTILLO, Bioestadística para las Ciencias de la salud. Norma, Granada, 1999. BIBLIOGRAFÁ COMPLEMENTARIA S.L. WEINBERG, K.P. GOLDBERG, Estadística Básica para las Ciencias Sociales. Nueva Editorial Interamericana, Mexico, 1992. MINISTERIO DE SALUD Y PREVISIÓN SOCIAL, Guía para la Interpretación de Indicadores en Salud, UNICEF, Laz Paz Bolivia, 2.003 VI. PLAN CALENDARIO U N I V E R S I D A D 7 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA SEMANA ACTIVIDADES ACADÉMICAS OBSERVACIONES Examen diagnóstico Trabajo en aula 1ra. Avance de Materia Tema I 2da. Avance de Materia Presentación y Evaluación del GIPs Nº I Avance de Materia Presentación y Evaluación del GIPs Nº 2 Primera Evaluación Parcial Presentación y Evaluación del GIPs Nº 3 Primera Evaluación Parcial Presentación y Evaluación del GIPs Nº 3 Avance de Materia Presentación y Evaluación del: GIPs Nº 4 Avance de Materia Presentación y Evaluación del GIPs Nº 5 Segunda Evaluación Parcial Avance de Materia Segunda Evaluación Parcial Presentación y Evaluación del: GIPs Nº 6 Avance de Materia Presentación y Evaluación del: GIPs Nº 7 Avance de Materia Actividades B. Tema VIII Examen Práctico Avance de Materia Elaboración y revisión del informe final de la materia para su presentación. Tema VIII Examen Teórica 3ra. 4ta. 5ta. 6ta. 7ma. 8va. 9na. 10ma. 11ra. 12da. 13ra. 14ta. 15ta. 16ta. 17ma. 18va. Examen Práctico Tema III Examen Teórico Tema IV Presentación de Notas Tema IV Tema V Tema V Trabajo en aula Tema VI Examen Práctico Tema VI Examen Teórica Tema VII Presentación de Notas Tema VII Segunda incursión Tema VIII Todos Evaluación final 20va. 2da. instancia 21va. Informe Final y Cierre de Gestión I V E R S I D A D D 8 1ra incursión Tema III 19va. U N Examen Corto Tema II Actividades B. E A Q U Examen escrito y Defensa Presentación de Notas Presentación de Notas e Informe Final I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA PROGRAMA DE BIOESTADISTICA WORK PAPER # 1 UNIDAD O TEMA: BIOESTADISTICA TITULO: GENERALIDADES FECHA DE ENTREGA: BIOESTADISTICA Introducción Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, maderas y paredes de cuevas para contar el número de personas, animales y ciertas cosas. Hacia el año 3000 a.C., los babilonios usaban pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides. Los libros bíblicos Los Números y Las Crónicas incluyen, en algunas partes, trabajos de estadística: aquel contiene dos censos de la población de Israel, y el otro describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 a.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el 594 a.C. para cobrar impuestos. El Imperio Romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Durante la Edad Media sólo se realizaron algunos censos exhaustivos en Europa. Los reyes caloringios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un censo; la información obtenida con el mismo, llevado a cabo en 1086, se recogió en el Domesday Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales. Empero, la Estadística como ciencia germina en épocas más recientes, a partir del siglo XVII, cuando surgieron de forma simultánea tres escuelas: La administrativa, alemana, que considera problemas de información al Estado, cuyos principales exponentes fueron Vito de Seckendorff (1626-1689), Hermann Coring (16001689) y Godofredo de Achenwall († 1772). La probabilística, de origen italiano pero devenida francesa sustancialmente, con figuras como Blaise Pascal (1623-1662), Pierre de Fermat (1601-1655), Pierre Simon, marqués de U N I V E R S I D A D 9 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Laplace (1749-1827), Simeón Denis Poisson (1781-1840), los Bernoulli (Jean, Jacques y Daniel), y el alemán Carl Friedrich Gauss (1777-1855). Considera problemas relacionados con el azar. La demográfica, inglesa, que considera problemas actuariales, encabezada por Petty, Halley, King, Davenant y Graunt. Posteriormente, continuó desarrollándose la escuela probabilística, gracias a los trabajos de rusos como Tchebichev, Tchuprov, Markov, Kolmogorov, y franceses como Borel, Levy y Fréchet. No obstante, es en los albores del siglo XIX cuando una segunda escuela inglesa, preocupada por problemas de agricultura y biometría, sienta los cimientos de la ciencia actualmente llamada Estadística, guiada por grandes de la talla de Sir Francis Galton (1822-1911), Carl Pearson (18571936), Sir Ronald Fisher (1890-1962), y Gosset (Student). Merecen mención los integrantes de la escuela escandinava Gram, Thiele, Cramer; de la norteamericana Hotelling, Wilks, Wald, Neyman, Hoel Mood; y el indio Mahalanobis, entre muchos otros. En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información. Estadísticas y Estadística Un primer aspecto que te debe quedar claro es la diferencia entre los términos estadísticas y Estadística. No está muy claro el origen etimológico de la palabra estadística, pues algunos la derivan del griego statera (balanza), otros del latín status (posición, estado, situación), mientras hay quienes afirman que proviene del alemán staat (estado, situación). Cualquiera que fuese su fuente, el hecho es que el primer término se utiliza, en este ámbito, para referirse a datos numéricos, en tanto que el segundo se refiere a: La Estadística es la ciencia encargada de recolectar, organizar, presentar, analizar e interpretar datos numéricos. Específicamente, la estadística trata de teoremas, herramientas, métodos y técnicas que se pueden usar en: Recolección, selección y clasificación de datos. Interpretación y análisis de datos. Deducción y evolución de conclusiones y de su confiabilidad, basada en datos muéstrales. Los métodos de la estadística fueron desarrollados para el análisis de datos muestreados, así como para propósitos de inferencia sobre la población de la que se selecciono la muestra. La estadística como ciencia, cubre un extenso campo donde poder aplicarla. Se agrupa en 2 grandes áreas: estadística descriptiva y estadística inferencial, que desempeñan funciones distintivas, pero complementarias en el análisis. Es importante que todo profesional que utilice la estadística como herramienta auxiliar de trabajo, posea un mínimo de conocimientos y habilidades prácticas en aquellas técnicas que le facilitarán el buen desarrollo de esta actividad. Estadística descriptiva La estadística descriptiva comprende las técnicas que se emplean para resumir y describir datos numéricos. U N I V E R S I D A D D 10 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Son sencillas desde el punto de vista matemático y su análisis se limita a los datos coleccionados sin inferir en un grupo mayor. El estudio de los datos se realiza con representaciones gráficas, tablas, medidas de posición y dispersión. Estadística inferencial El problema crucial de la estadística inferencial es llegar a proposiciones acerca de la población a partir de la observación efectuada en muestras bajo condiciones de incertidumbre. Ésta comprende las técnicas que aplicadas en una muestra sometida a observación, permiten la toman de decisiones sobre una población o proceso estadístico. En otras palabras, es el proceso de hacer predicciones acerca de un todo basado en la información de una muestra. La inferencia se preocupa de la precisión de los estadígrafos descriptivos ya que estos se vinculan inductivamente con el valor poblacional. CUESTIONARIO De los siguientes enunciados ¿cuál probablemente usa cuál, la estadística inferencial? la estadística descriptiva y a) Un médico general estudia la relación entre el consumo de cigarrillo y las enfermedades del corazón. b) Un economista registra el crecimiento de la población en un área determinada. c) Se desea establecer el promedio de bateo de un equipo determinado. d) Un profesor de expresión oral emplea diferentes métodos con cada uno de sus 2 cursos. Al final del curso compara las calificaciones con el fin de establecer cual método es más efectivo. Conteste V ó F a) La estadística descriptiva es el estudio de una muestra que permite hacer proyecciones o estimaciones acerca de la población de la cual procede. F V b) Un parámetro es una medida calculada de alguna característica de una población. F V c) Abrir una caja de manzanas y contar los que están en mal estado es un ejemplo de dato numérico continuo. F V Completa las siguientes frases. a) La estadística que analiza los datos y los describe es ______________ b) Por medio de una investigación se recolectan los _________________ c) Por razones de costo y del tiempo que se gastaría en encuestar a todos los elementos de una ____________, se recurre al ________________ d) Para obtener una ______________ aleatoria de la población, cada elemento debe tener _____________ oportunidad de ser ____________ U N I V E R S I D A D 11 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA PROGRAMA DE BIOESTADISTICA GUIA DE INVESTIGACION PRACTICA – GIP´s # 1 UNIDAD O TEMA: I TITULO: VARIABLES FECHA DE ENTREGA: VARIABLES Variable. Se llama variable a una característica que se observa en una población o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Una variable se puede clasificar de la siguiente manera. Continua Cuantitativa Discreta Variable Nominal Cualitativa Ordinal Variable cuantitativa: es aquella que toma valores numéricos. Dentro de ella, se subdividen en: Continua: son valores reales. Pueden tomar cualquier valor dentro de un intervalo. Ej. Peso, estatura, sueldos. Discreta: toma valores enteros. Ej. N° de hijos de una familia, n° de alumnos de un curso. Variable cualitativa: es aquella que describe cualidades. No son numéricas y se subdividen en: Nominal: son cualidades sin orden. Ej. Estado civil, preferencia por una marca, sexo, lugar de residencia. Ordinal: son cualidades que representan un orden y jerarquía. Ej. Nivel educacional, días de la semana, calidad de la atención, nivel socioeconómico. II.- PRÁCTICA Objetivos Determinar e identificar los tipos de variables Elaborara ejemplos de los distintos tipos de variables Material 1.- Guía de Investigación Práctica Métodos y procedimientos 1. Explicación y orientación inicial por el profesor 2. Revisión del estudiante de los conceptos 3. Taller de creatividad (elaboración de ejemplos por tipos de variables) Conclusiones U N I V E R S I D A D D 12 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA La identificación de los distintos tipos de variables son de vital importancia para el desarrollo de una exitosa investigación. Evaluación 1. ………………………………………………………………………………… 2. ………………………………………………………………………………… 3. ………………………………………………………………………………… 4. ………………………………………………………………………………… 5. ………………………………………………………………………………… 6. ………………………………………………………………………………… 7. ………………………………………………………………………………… 8. ………………………………………………………………………………… ………………………………….. ………………………………….. Firma y sello del catedrático Firma del estudiante Bibliografía WALTER L. MATINEZ VACA, Estadística Descriptiva con Énfasis en Salud Publica, La Hoguera, Bolivia. 2003 J.L. CARRASCO DE LA PEÑA, El Método Estadístico en la Investigación Médica. Karpus, Madrid, 1992. MARTÍN ANDRÉS, J.D. LUNA DEL CASTILLO, Bioestadística para las Ciencias de la salud. Norma, Granada, 1999. S.L. WEINBERG, K.P. GOLDBERG, Estadística Básica para las Ciencias Sociales. Nueva Editorial Interamericana, Mexico, 2.002. U N I V E R S I D A D 13 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA PROGRAMA DE BIOESTADISTICA WORK PAPER # 2 UNIDAD O TEMA: BIOESTADISTICA TITULO: TABLAS DE FRECUENCIA FECHA DE ENTREGA: TABLAS DE FRECUENCIA. Cuando los datos estadísticos de que se dispone son numerosos, es difícil realizar cálculos sobre ellos. Por esta razón se organizan en tablas de manera de facilitar el trabajo. Una tabla de frecuencia es la ordenación de la información obtenida de una muestra, en el estudio de una sola variable. Cuando se dispone de un gran número de datos, es útil distribuirlos en categorías dentro de una tabla para facilitar el análisis. Se explicara con un ejemplo: Veamos el caso de una variable discreta, pero antes se mencionaran las siguientes notaciones: Ejemplo: en una encuesta de presupuesto familiar, se ha obtenido la siguiente información respecto al n° de hijos en 2 familias. Variable x = n° de hijos Los datos son los siguientes: 3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3 x1 x2 x21 Vemos que la variable x toma valores entre 0 y 4, es decir, existen en este grupo 5 categorías o clases. Contamos el número de familias en cada categoría y formamos la tabla. Categorí as Xi Frec. Absoluta fi Frec. Absoluta Acum. Fi Frec. Relativa hi 0 1 2 3 4 f1 = 2 f2 = 4 f3 = 7 f4 = 6 f5 = 2 f1 = 2 f1 + f2 = 6 f1 + f2 + f3 = 13 f1 +.......+ f4 = 19 f1 +.......+ f5 = 21 f1/n = 0.095 f2/n = 0.190 f3/n = 0.333 f4/n = 0.285 f5/n = 0,095 Total n = 21 U N I V E R S Frec. Rel. Acum. Hi h1 = 0.095 h1 + h2 = 0.286 h1 + h2 + h3 = 0.619 h1 +......+ h4 = 0.904 h1 +......+ h5 = 1,000 1.000 I D A D D 14 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA n = tamaño de la muestra Xi = valor de la variable en el individuo i fi = frecuencia absoluta: nº de veces que se repite la variable en la categoría i Fi = frecuencia absoluta acumulada. Indica el nº de individuos hasta la categoría i hi = frecuencia relativa. Porcentaje de la categoría respecto del total, se obtiene dividiendo la frecuencia de la clase por el tamaño de la muestra. Hi = frecuencia relativa acumulada. Porcentaje acumulado Observamos algunos detalles importantes: n es la suma de la columna fi, es decir, siempre debe dar como resultado el tamaño de la muestra. En la columna de frecuencia absoluta acumulada se va sumando los valores de la columna fi, por lo tanto el último valor debe ser igual a n. La columna frecuencia relativa (hi) representa en % de familias en cada categoría. Por ejemplo, en las categorías con 3 hijos a un 28.5% de familias. Esta columna debe sumar 1. La Hi acumula los valores de la frecuencia relativa, por lo tanto el último valor debe ser 1. Ejemplo H4: el 90.4% de las familias encuestadas tienen a los más 3 hijos. En el caso de analizar una variable continua, la tabla de frecuencia cambia sólo en el comienzo. También sé vera en un ejemplo: Salarios semanales de 40 personas en miles de pesos. 90 108 80 95 62 86 100 85 102 110 79 91 85 68 93 83 92 118 93 67 106 99 104 119 110 98 77 108 95 74 106 115 105 91 98 74 112 80 73 88 Efectuemos previamente los siguientes pasos. Se busca el valor mínimo y el valor máximo Xmín = 62 Se calcula el rango: 119 – 62 = 57. Xmáx = 119 Rango: en todo conjunto de valores estadísticos hay valores extremos: el menor de todos y el mayor de todos; la diferencia entre estos valores extremos se llama rango. La cantidad de intervalos no debe ser menor de 5 ni mayor de 18. Por lo general tiene el mismo ancho. Una forma de calcular el nº de intervalos para generar la tabla de frecuencias es mediante la siguiente formula: k = 1 + 3.322 x log (40) = 6.322 usamos k≈6 Se calcula la amplitud de cada intervalo c = rango / k = 57 / 6 = 9.5 ≈ 10 Se construye la tabla: U N I V E R S I D A D 15 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Intervalos Yi-1 – Yi+1 Marca de clase Y1 Frec. Absoluta fi [60 – 69) [70 – 79) [80 – 89) [90 – 99) [100 – 109) [110 – 119) Total 65 75 85 95 105 115 3 5 7 11 8 6 40 Fi hi Hi 3 8 15 26 34 40 0,075 0,125 0,175 0,275 0,20 0,15 0,075 0,20 0,375 0.62 0,85 1,00 1,00 El resto de las columnas se forman de la misma manera que la tabla 1. n = tamaño de la muestra Xi = valor de la variable en el individuo i fi = frecuencia absoluta: nº de veces que se repite la variable en la categoría i Fi = frecuencia absoluta acumulada. Indica el nº de individuos hasta la categoría i hi = frecuencia relativa. Porcentaje de la categoría respecto del total, se obtiene dividiendo la frecuencia de la clase por el tamaño de la muestra. Hi = frecuencia relativa acumulada. Porcentaje acumulado Yi = marca de clase: su valor es igual a la mitad de la suma de los limites inferior y superior del intervalo de clase. En todos los análisis estadísticos se supone que el valor de la marca de una clase es el valor que corresponde asignar a cada uno de los elementos ubicados en ese intervalo. C = amplitud del intervalo: la diferencia entre los limites reales de un intervalo. Yi-1 = limite inferior del intervalo Yi+1 = limite superior del intervalo CUESTIONARIO 1.- En una cierta ella viven y se ha siguientes: 0 1 3 2 ciudad se ha tomado una muestra representativa del total de familias que en anotado el número de hijos de cada una. Los valores de esta variable son los 0 1 4 3 2 4 2 2 1 2 2 3 3 2 2 1 a) Diga que tipo de datos son estos. b) Construya una tabla de frecuencias correspondiente a este ejercicio. 2.- Se visitaron 25 empresas citrícolas de una cierta zona y en cada una se anotó la cantidad de plantas atacadas por un cierto hongo, de lo cuál resultaron los siguientes datos: 15 20 25 15 18 16 17 18 20 18 18 18 19 16 17 19 16 17 17 17 19 18 19 18 15 U N I V E R S I D A D D 16 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA a) Diga que tipo de datos son estos. b) Construya una tabla de frecuencias correspondiente a este ejercicio. 3.- Determine para el ejercicio 1 la frecuencia relativa de familias con 2 hijos o menos y la frecuencia relativa de familias que tienen más de 2 hijos y no más de 4. 4.- Determine para el ejercicio 2 la frecuencia relativa de empresas citrícolas que tienen 18 o menos plantas atacadas por el hongo. Calcule también la frecuencia relativa de empresas citrícolas que tienen no menos de 18 plantas atacadas por el hongo. 5.- El gerente de personal de una compañía registró el número de días que sus 50 empleados habían tomado como licencia por enfermedad. 10 5 12 0 2 35 11 12 4 9 12 17 3 7 8 8 8 10 11 29 44 4 9 3 6 6 7 3 18 4 15 25 5 2 7 20 9 16 10 10 5 2 31 6 0 7 10 9 22 1 a) Identificar la variable y su clasificación. b) Construir una tabla de frecuencia apropiada a estos datos. U N I V E R S I D A D 17 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA PROGRAMA DE BIOESTADISTICA WORK PAPER # 3 UNIDAD O TEMA: I BIOESTADISTICA TITULO: ELABORACION DE GRAFICOS FECHA DE ENTREGA: ELABORACION DE GRAFICOS La entrega de información utilizando gráficos y dibujos es un método funcional que no solo sirve para presentar datos sino también para expresar ideas que se desean destacar. Características generales Generalmente se inscriben en los ejes de coordenadas cartesianas o ejes rectangulares, los cuales: Deben poseer la misma longitud, aceptándose como máximo que el eje X exceda hasta1.5 veces al eje Y. Esto evita la introducción de falacias. Deben estar rotulados. Por el eje X se presenta(n) la(s) variable(s) con su escala de clasificación; en el eje Y, la distribución de frecuencias o medida de resumen utilizada. De ser posible, el origen de los ejes debe ser en el punto (0,0). Deben utilizarse números redondos. Debe evitarse el exceso de divisiones de los ejes. En la actualidad, con el advenimiento de las nuevas tecnologías informáticas, han proliferado los softwares que permiten la construcción de gráficos estadísticos. Al utilizarlos, debes tomar la precaución de analizar cuidadosamente el tipo de información que quieres representar, pues la mayoría de ellos ofrece varias posibilidades de representación, quedando a tu juicio escoger la más apropiada. Los gráficos son las representaciones visuales fundamentalmente 3 características: Forma Acumulación o tendencia Dispersión o variabilidad de los datos en donde se evidencian Los gráficos no deben considerarse como sustitutos de un análisis estadístico, sino más bien como una ayuda visual del comportamiento de los datos. Partes del gráfico Todo gráfico estadístico está constituido por varios elementos, los cuales te mencionamos a continuación. Presentación (Identificación y Título) U N I V E R S I D A D D 18 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Gráfico propiamente dicho Fuente Notas explicativas Leyenda Identificación: consiste en numerar los gráficos consecutivamente, por ejemplo: Gráfico 1, Gráfico 2, etc. Título: el de la tabla que lo originó. Gráfico propiamente dicho: verás los distintos tipos de gráficos en el epígrafe siguiente. Fuente: la tabla que lo originó. Notas explicativas: su uso es similar a lo descrito en las tablas. Leyenda: su fin es identificar los elementos del gráfico (barras, sectores, etc.) con su correspondiente origen. Existen diferentes tipos de gráficos: Barras histogramas y polígonos histogramas y ojivas circulares barras subliminales pictogramas Barras Se construye sobre el sistema de ejes cartesianos. Es un procedimiento gráfico para representar los datos nominales u ordinales. Para cada categoría se traza una barra vertical en que la altura es la frecuencia absoluta de la categoría. El ancho de la barra es arbitrario. También se utiliza si la variable en estudio es numérica discreta. Histogramas y polígonos de frecuencia: Se construyen sobre el sistema de coordenadas cartesianas. Se utiliza cuando la variable en estudio es continua o esta agrupada en una tabla de frecuencia con intervalos en cada categoría. En el eje X se identifica la variable en estudio y en el eje Y sé gráfica la frecuencia absoluta o la frecuencia relativa. Consiste en una serie de rectángulos en donde su altura depende del valor de cada frecuencia. Cada categoría de la variable se representa por una barra. El ancho de cada barra depende de la amplitud del intervalo. El polígono se gráfica uniendo la punta superior de cada barra por segmento de recta. Para que el polígono quede cerrado se considera un punto en la recta horizontal, antes y después de las anotadas. El polígono se dibuja midiendo los puntos medios de cada barra, que corresponde a la marca de clase. Histogramas y ojivas: También se gráfica la columna de frecuencia absoluta acumulada. El gráfico siempre será en forma ascendente. La ojiva se dibuja midiendo segmentos de recta en la parte superior de cada barra, y no se cierra. U N I V E R S I D A D 19 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Gráfico circular: Esta es otra forma de representar los datos, en especial cuando se trata de cualidades. En un gráfico dibujado dentro de un círculo. Es necesario en primer lugar calcular el porcentaje de cada categoría respecto del total y luego repartir proporcionalmente estos porcentajes en los 360° del círculo. Barras subliminales: Es un gráfico de barras muy apropiado para comprobar subdivisiones en la variable. Por ejemplo: % de estudiantes en diferentes carreras, separadas por sexo. Cada barra es un 100%. Pictogramas: Un pictograma es la representación de datos estadísticos por medio de símbolos que por su forma sugieren la naturaleza del dato. Por ejemplo: producción de bicicletas (en miles.) CUESTIONARIO 1. En una industria el informe de contabilidad muestra que la producción fue de $62.600.000 y los gastos así: de administración $11.160.000, de materiales y energéticos $15.650.000, salarios y prestaciones $18.780.000. Elabore con los datos un diagrama circular. 2. Utilizando un diagrama lineal represente la deuda externa de América Latina cuyos valores en millones de US$ son: 1973 1974 1975 1976 1977 55.4 68.5 82.9 98.3 119.1 1978 1979 1980 1981 1982 141.6 169.2 207.1 279.1 312.0 3. Las siguientes medidas corresponden a las alturas de 50 niños. 1,56 1,61 1,53 1,59 1,55 1,47 1,50 1,68 1,65 1,58 a) b) c) d) e) f) 1,59 1,59 1,49 1,58 1,59 1,57 1,62 1,52 1,53 1,52 1,63 1,51 1,57 1,57 1,53 1,60 1,59 1,62 1,59 1,63 1,62 1,62 1,54 1,47 1,56 1,54 1,62 1,59 1,56 1,56 1,65 1,62 1,53 1,64 1,53 1,56 1,54 1,49 1,54 1,62 Construir una distribución de frecuencias absolutas y relativas. Obtener las correspondientes distribuciones de frecuencias acumuladas. Representar las distribuciones anteriores mediante histogramas. Dibujar los correspondientes polígonos de frecuencias. Hallar a partir del polígono de frecuencias acumuladas la proporción de observaciones entre 1,59 y 1,62 ambas inclusive. ¿Qué conclusiones puede extraerse?. U N I V E R S I D A D D 20 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA PROGRAMA DE BIOESTADISTICA GUIA DE INVESTIGACION PRACTICA – GIP´s # 2 UNIDAD O TEMA: I TITULO: PARTES DEL CUADRO ESTADISTICO FECHA DE ENTREGA: PARTES DEL CUADRO ESTADÍSTICO Varias son los elementos que integran una tabla estadística. Seguidamente te presentamos cada uno de ellos: Partes del Cuadro Presentación (Identificación y Título) Cuerpo de la tabla Fuente Notas explicativas 1. Identificación. Consiste en otorgar un orden consecutivo a las tablas, comenzando por el número uno, v.g. Tabla8 1, Tabla 2, etc. 2. Título. Debe ser completo y conciso. Para ser completo, el título debe responder a las preguntas qué, cómo, dónde y cuándo. Reconozcamos en un ejemplo cada una de estas preguntas: Tabla 1. Distribución de fallecidos según grupos de edad y sexo. Santa Cruz, 2006. Un análisis del título anterior permite conocer que: Distribución de fallecidos es de qué trata la tabla. Los grupos de edad y sexo son el cómo se midió, es decir, a través de cuales variables. La Habana es dónde se realizó el estudio. 1999 es cuándo se realizó el estudio. Observa que las variables se presentan alternativamente puedes usar el término “por”. después del vocablo “según”, aunque También es conveniente decirte que, en ocasiones, no es necesario dar respuestas a estas cuatro interrogantes en un título, en cuyo caso sólo deberás responder al qué y al cómo. Ello ocurre cuando estás representando información obtenida en una investigación y, en el informe final o el artículo, ya has consignado en algún apartado anterior al de Resultados, dónde y cuándo se realizó el estudio. El otro elemento, la concisión, consiste en escribir justamente lo necesario. Elimina las preposiciones y artículos que no ayuden a la comprensión del título de tu cuadro. No obstante, no sacrifiques el mensaje redactando un título “telegráfico”, no seas lacónico, pues dificultarías la comprensión de lo que quieres decir. U N I V E R S I D A D 21 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA 3. Cuerpo de la Tabla. Es el cuadro en sí mismo, formado por espacios llamados celdas, las cuales se vertebran en filas y columnas, por ejemplo: Columna matriz xx xx xx Total Fila de encabezamiento xx xx xx xx Total xx xx xx xx La columna matriz se utiliza para consignar la variable con su escala de clasificación. En caso de que el cuadro represente más de una variable, por la columna matriz representarás la que tenga más clases o categorías o la que constituye la causa, en estudios de causalidad. En la fila de encabezamiento se presentan las distribuciones de frecuencias, las medidas de resúmenes o la otra variable. La fila y columna últimas se dedican a los totales. Las tablas estadísticas suelen clasificarse según el número de variables que representan en: Unidimensionales: una variable. Bidimensionales: dos variables. Multidimensionales: tres o más variables Deben ser auto explicativas, o sea, que se expliquen por sí mismas, por lo que debes evitar presentar demasiada información en ellas en aras de ganar claridad. En general, como forma de presentación se utilizan cuadros uni y bidimensionales, reservándose el uso de los multidimensionales para fines de trabajo. 4. Fuente. Se refiere al documento9 de donde se extrajo la información presentada. Por lo general, las fuentes de información se clasifican en: Primaria: aquella de la que el investigador obtiene directamente la información utilizando diversas técnicas y métodos, v.g. la encuesta. Secundaria: aquella que existe independientemente del estudio y el investigador sólo la utiliza, v.g. el Registro de Nacimientos, las historias clínicas. Resulta válido y oportuno aclarar que en la tabla sólo consignarás Fuentes Secundarias. Recuerda que una fuente es un documento. Frecuentemente esto se olvida, y se consignan erróneamente como fuentes algunos locales, departamentos, entre otros, como la Oficina Nacional de Estadísticas, el Archivo del policlínico, etc. 5. Notas explicativas o aclaratorias. Se utilizan cuando se desea aclarar algo, por lo general del título o del cuerpo de la tabla. ERRORES MÁS FRECUENTES No son pocos los errores que se cometen, voluntaria o involuntariamente, en la confección de los cuadros estadísticos. A continuación te presentamos una lista de los más comunes, que podrás revisar si no deseas incurrir en los mismos. 1. Errores en la presentación. Cuadros sin identificación. Título o encabezamiento incorrecto o inadecuado: U N I V E R S I D A D D 22 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Telegráfico: título demasiado pequeño, carente de claridad. Ampuloso: título demasiado extenso, que incluye vocablos que no aportan nada a la claridad del texto. 2. Errores del cuerpo. Errores de cálculo. Disposición incorrecta de los datos. Mostrar solamente medidas relativas (frecuentemente porcentajes) u otras medidas de resumen. Cuadros sobrecargados. 3. Errores en la fuente. No citar la fuente cuando es secundaria. Citar la fuente cuando es primaria. Consignar como fuente aquello que no es un documento (oficinas, departamentos, centros, etc.) ¿CÓMO LEER UN CUADRO ESTADÍSTICO? Realmente parece algo tan trivial, que muchas personas lo pasan por alto muchas veces, lo que puede conllevar a interpretaciones erróneas de la tabla —o en el peor de los casos, a no entenderla—. Para que te evites el fiasco, echa una ojeada al orden propuesto: 1. Lee cuidadosamente el título, así sabrás de qué trata el cuadro exactamente. 2. Lee las notas explicativas. Obviamente, las mismas mejoran considerablemente la comprensión de la tabla. 3. Infórmate de las unidades de medida utilizadas. 4. Fíjate en el promedio total o porcentaje general del grupo. 5. Relaciona el promedio total con el porcentaje de cada una de las variables estudiadas. 6. Relaciona los promedios o porcentajes de las variables estudiadas. II.- PRÁCTICA Objetivos Construir en forma correcta los cuadros estadísticos Elaborara ejemplos de cuadros estadísticos Material 1.- Guía de Investigación Práctica Métodos y procedimientos 4. Explicación y orientación inicial por el profesor 5. Revisión del estudiante de los conceptos 6. Taller de creatividad (elaboración de ejemplos de cuadros estadísticos) Conclusiones La identificación y construcción de cuadros estadísticos son de vital importancia para el desarrollo de una exitosa investigación. Evaluación 1. ………………………………………………………………………………… U N I V E R S I D A D 23 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA 2. 3. 4. 5. 6. 7. 8. ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………….. ………………………………….. Firma y sello del catedrático Firma del estudiante Bibliografía WALTER L. MATINEZ VACA, Estadística Descriptiva con Énfasis en Salud Publica, La Hoguera, Bolivia. 2003 J.L. CARRASCO DE LA PEÑA, El Método Estadístico en la Investigación Médica. Karpus, Madrid, 1992. MARTÍN ANDRÉS, J.D. LUNA DEL CASTILLO, Bioestadística para las Ciencias de la salud. Norma, Granada, 1999. S.L. WEINBERG, K.P. GOLDBERG, Estadística Básica para las Ciencias Sociales. Nueva Editorial Interamericana, Mexico, 2.002. U N I V E R S I D A D D 24 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA PROGRAMA DE BIOESTADISTICA WORK PAPER # 4 UNIDAD O TEMA: I BIOESTADISTICA TITULO: MEDIDAS DE TENDENCIA CENTRAL FECHA DE ENTREGA: MEDIDAS DE TENDENCIA CENTRAL Seguramente, lo primero que está preguntándote es: «¿Por qué de tendencia central?». Bueno, estriba en que ellas están constituidas por un número al que se acercan o “tienden” la mayoría de las observaciones. Con otras palabras, alrededor de él se agrupan las observaciones de la serie de datos, puesto que es en sí el centro de la serie, aunque ello no significa que este número tiene que estar representado en la serie (de hecho, muchas veces no ocurre así). Veamos en detalle cada una de estas medidas. La media aritmética Puedes encontrar la medida que te vamos a presentar con diversos nombres, entre ellos los más utilizados son promedio, promedio aritmético e incluso simplemente media. Al respecto debemos aclararte que existen otras medias que no son aritméticas, pero cuando decimos media a secas, nos referimos a la aritmética. La media aritmética es una cifra que obtienes al sumar todos los valores observados y dividirlos por el número de valores. ¿No te resulta familiar? Claro, estás muy acostumbrado al cálculo del entre estos dos símbolos se hará importante en cursos sucesivos, cuando abordemos temas de Estadística Inferencial. Por lo pronto, utilizaremos el último de ellos. La media conserva las unidades de medida de la variable en su estado original, o sea, que la media de un grupo de edades en años se expresará asimismo en años. El cálculo de la media dependerá de cómo aparezcan los datos, de tal suerte que, para datos simples14, la fórmula es: Veamos un ejemplo. Supón que deseas conocer la estatura media de cinco adolescentes de tu consultorio. Estas son las observaciones (datos) de la medición de cada uno de ellos (en cm): 170.0 150.0 130.0 160.0 140.0 Este resultado indica que, en promedio, los adolescentes miden 150 centímetros. Sencillamente, no hemos hecho otra cosa que decir: «más o menos, los muchachos miden 150 centímetros». U N I V E R S I D A D 25 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Si los datos aparecen en una distribución de frecuencias, entonces calcula la media de la siguiente forma: donde: fi Xi n: son las frecuencias absolutas; son las categorías de la variable; total de observaciones. Por ejemplo, estos son los pesos (en kilogramos) de 10 individuos representados por sus frecuencias absolutas: Con este resultado puedes decir que los 10 sujetos pesan 61.8 kilogramos (o mejor, 62) como promedio. Ahora bien, puede que los datos estén agrupados en una escala de intervalos, entonces el cálculo se realiza como verás. A continuación te mostramos los resultados de la frecuencia cardíaca (FC), en latidos cardíacos por minuto, de 100 pacientes ingresados en el Servicio de Medicina Interna de cierto hospital: La media aritmética de una serie de datos agrupados está dada por: donde: MCi son las marcas de clase de los intervalos, U N I V E R S I D A D D 26 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA fi n: son las frecuencias absolutas de los intervalos. total de observaciones. Procedamos, a calcularla: Ante todo, necesitarás conocer las marcas de clase (MCi) de cada intervalo, para lo cual suma el límite inferior (LI) al superior (LS) del intervalo en cuestión, y luego divídelo por dos. Luego, multiplicarás la marca de clase por la frecuencia absoluta (fi) del intervalo. Sumas todos los números resultantes del paso anterior y, finalmente, divides la suma por el total de observaciones (n). Los cálculos pertinentes por intervalos son: Por último, tenemos por lo que puedes decir que, en promedio, los 100 pacientes estudiados tenían una frecuencia cardiaca de 76 latidos por minuto. Hay ocasiones en que los datos numéricos se hacen difíciles de manejar, bien porque sean muchos, o porque constan de varios dígitos. En esta situación, te aconsejamos agruparlos primero y luego calcular la media. Por otra parte, es bueno que recuerdes que el mayor monto de la información estadística aparece agrupada, por lo que te verás obligado a utilizar la fórmula estudiada. Cometeríamos un grave error si no habláramos de las propiedades de la media. Ciertamente, entre las más notables tenemos que: Es fácilmente entendible por la mayoría de las personas (o, al menos, es fácil de explicar su significado); Siempre existe, y puede calcularse para cualquier dato numérico; Es única, o sea, un grupo de datos sólo tiene una media; Toma en cuenta a todos los valores de la serie de forma individual, esto es, recorre la serie completa. Esta última resulta ser sumamente importante, pues la media calculada representa a todos los valores de la serie, siendo precisamente lo que se quería lograr. Ahora bien, no siempre esto resulta beneficioso, como verás en este ejemplo: imagínate que se deseaba saber la edad promedio de las personas reunidas en un salón de cierto Círculo Infantil, para lo cual se escogió al azar uno de los que poseía dicho centro. En el momento de la medición, se encontraban presentes en el salón escogido siete bebés y la educadora que los cuidaba, siendo sus edades las siguientes (m: meses, a: años): 18m 10m U N 12m 16m I V E R S 20m I D A D 27 12m D E 14m 34a A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Edad media: 510 meses/8 = 63.75 meses = 5.3 años ¿Viste eso? Ahora tenemos que, en promedio, las personas allí reunidas tenían 64 meses de edad (¡Bueno, 5 años es algo más fácil de entender!) ¿Crees que sea cierto ese dato? Claro que no, está bastante lejos de la realidad, mas no está mal hecho el cálculo. Matemáticamente es impecable, pero la lógica dice que algo falló. El motivo por el que apareció un resultado tan dispar es la presencia de un dato discordante en el conjunto: la edad de la educadora. Cuando en una serie de datos encuentras algún dato que se aparta de los demás de forma llamativa, entonces puedes nombrarlo dato(s) aberrante(s). Si calculásemos la media con las edades de los pequeños solamente, entonces hubiese sido de 15 meses. En resumen, si los datos son relativamente homogéneos, la media aritmética es una buena medida de resumen; pero si existen valores muy alejados de la mayoría (datos aberrantes), entonces se distorsiona mucho y deja de reflejar la realidad existente. La mediana Aquí tienes otra de las medidas de tendencia central. Al igual que la media, puedes utilizarla para describir el “centro” de un grupo de datos. No tiene un símbolo específico que la denote; nosotros usaremos med o mediana en lo adelante. La mediana es la observación que divide a una serie ordenada de datos en dos partes iguales, o sea, es la observación que ocupa la posición central de una serie ordenada. De lo antedicho se deduce que lo primero que tienes que hacer para calcular la mediana es ordenar la serie, ya sea en orden creciente o decreciente. Luego, buscarás cuál de los valores es la mediana, lo cual dependerá del número total de observaciones o datos que tengas. De tener los datos simples, si tienes un número n impar de observaciones, la del centro es la medida buscada, como lo es 32 en esta serie: 41, 40, 36, 32, 26, 21, 20. Fíjate que a ambos lados de la mediana hay la misma cantidad de números. En este caso, por simple observación llegaste al resultado, pero puedes valerte de calcular para saber la posición de la mediana, comenzando a contar por cualquiera de los dos extremos de la serie. En el ejemplo anterior el resultado es (7+1)/2 = 4, y el cuarto puesto lo ocupa el 32, no importa por cuál extremo comienzas a contar. La contrapartida ocurre cuando el total de datos es un número par; entonces la mediana es la media aritmética de los valores del centro de la serie, como sucede en el ejemplo: 20, 24, 33, 39, 45, 51, 75, 80. Los valores del centro son 39 y 45, su media es 42, y es este el valor de la mediana de esa serie. No debe causarte extrañeza tal proceder, pues si aplicásemos la fórmula de la posición, entonces la mediana ocuparía el lugar (8+1)/2 = 4.5, esto es, la mitad entre los números 4 y 5 de la serie. Siendo el 39 y el 45 los lugares 4º y 5º respectivamente, entonces 42 es el centro entre ellos. ¿De acuerdo? Se te puede presentar la situación de que tengas una serie con varios valores iguales, como 50, 54, 56, 56, 56, 56, 60, 62. Aquí la mediana es 56, claro está. Recuerda que ella es el valor central del grupo, y sería un atentado abierto a la lógica cuestionarse cuál de los 56s es la mediana. U N I V E R S I D A D D 28 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA También puedes calcular la mediana para datos agrupados. Supón que tienes las edades de 100 individuos de 20 a 54 años de tu área de salud: Nota: la primera columna cumple funciones didácticas solamente, y la última contiene datos de trabajo. Para el cálculo de la mediana en series agrupadas, se utiliza la siguiente expresión: donde: LRI es el límite real inferior del intervalo que contiene a la mediana. n es el total de observaciones de la serie de datos. FAA es la frecuencia absoluta acumulada del IC que antecede al que contiene a la mediana. f es la frecuencia absoluta del IC que contiene a la mediana. c es la amplitud del IC que contiene a la mediana. Así las cosas, ya puedes decir que la mediana de la serie en cuestión es de 34 años de edad, o que la edad mediana de la serie es 34 años. Esta medida de resumen posee las propiedades siguientes: 1. 2. 3. 4. Su cálculo es sencillo; Siempre existe, y puedes calcularla a cualquier conjunto de datos numéricos; Es única; Se puede calcular en series con límites abiertos, excepto cuando la propia mediana caiga en un límite abierto, pero esto es sumamente improbable; y 5. No se afecta fácilmente por valores extremos. La cuarta y quinta propiedades hacen que se prefiera esta medida sobre la media en situaciones en que la escala sea abierta o que existan valores aberrantes. Ahora bien, en la mayoría de los casos —lógicamente, salvo los citados— se prefiere conocer la media como medida de tendencia central. Para ilustrar lo planteado en la quinta propiedad, volvamos al ejemplo de las edades de los niños del Círculo Infantil y su educadora. Si calculamos la mediana de esos datos, ésta sería: Datos ordenados: 10, 12, 12, 14, 16, 18, 20, 34 Mediana: (14 + 16) / 2 = 15 meses, resultado que sí refleja con certeza el centro de los datos. Quizá una desventaja imputable a la determinación de la U N I V E R S I D A D 29 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA mediana radica en el ordenamiento previo de las observaciones, faena que pudiese devenir tediosa y hasta impracticable de ser un número considerable de datos, pero recuerda las potencialidades que te brindan los softwares existentes en el mercado actual, que facilitan enormemente el trabajo15 al calcular la mayoría de estos indicadores. La moda Ahora conocerás una medida realmente sencilla, tanto de determinar como de interpretar. Es muy intuitiva, y consiste en el valor, clase o categoría que aparece con más frecuencia en una serie de datos; o sea, es el que más se repite. Por ejemplo, si de seis pacientes, tres tienen 20 años, y los otros tienen 18, 21, y 25 respectivamente, entonces dirías que 20 años es la moda, o edad modal. La mayor ventaja de la moda radica en que no requiere cálculo alguno, para beneplácito de algunos que no cuentan a las Matemáticas entre su círculo de amistades. Sin embargo, puede que no exista, e incluso puede no ser única. Por ejemplo, la serie 2, 5, 6, 6, 6, 7, 8, 8, 8, es una serie bimodal, pues cuenta con el seis y el ocho como modas. CUESTIONARIO 1. Las cifras siguientes corresponden a la estatura (en centímetros) de los estudiantes de un aula de cierta escuela. La Dra. Fonseca, a cargo de dicho centro, desea resumir esta información con miras a redactar un informe, en el cual deben aparecer consignadas las interpretaciones correspondientes a los resultados de la media aritmética, la mediana y la moda ¿Podrías ayudar a la atribulada doctora en su empeño? 135 151 131 137 134 136 136 148 153 152 219 132 132 137 137 137 134 148 129 137 146 146 147 147 146 123 117 125 124 122 138 138 138 138 138 140 138 143 141 139 145 144 146 146 145 128 126 128 128 127 2. En una investigación sobre la incidencia de la hipertensión arterial en jóvenes de 20-24 años de un municipio de la provincia Ciego de Ávila, se estudiaron 350 jóvenes, de ellos 200 eran varones. A continuación te presentamos un cuadro con la información obtenida. Tabla 1. Distribución de jóvenes según tensión arterial diastólica (TAD). Municipio Ciego de Ávila,1998. a) Determina la media aritmética, la mediana, la desviación media y la desviación estándar. b) Interpreta los resultados obtenidos. 3. Del mismo estudio, se obtuvo la siguiente información por sexos: Tabla 2. Jóvenes según tensión arterial diastólica (TAD) y sexo. Municipio Ciego de Ávila, 1998. U N I V E R S I D A D D 30 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA a) Determina e interpreta la media aritmética, la mediana y moda para cada grupo. b) ¿Qué puedes decir acerca de la variabilidad de cada grupo? c) ¿Para qué valor se encuentra el 70% de los varones por encima de él? d) ¿Para qué valor el 25% de las hembras está por debajo de él? 4. Un grupo de investigadores obtuvo información sobre la glicemia en ancianos de una comunidad, y desean calcular algunas medidas que les permitan resumir la información. A continuación te presentamos lo que obtuvieron: Tabla 1. Ancianos según edad y glicemia. Comunidad X, 1999. a) Calcula e interpreta las medidas de tendencia central que puedan ser aplicadas. PROGRAMA DE BIOESTADISTICA U N I V E R S I D A D 31 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA WORK PAPER # 5 UNIDAD O TEMA: BIOESTADISTICA TITULO: MEDIDAS DE POSICION FECHA DE ENTREGA: MEDIDAS DE POSICION Como recordarás, las medidas estudiadas con anterioridad se nombran de tendencia central por representar el centro del conjunto de observaciones. Verás ahora un grupo de medidas que establecen una posición en una serie ordenada de datos, son una referencia a partir de la cual podrás decir: por encima de este valor están las ¾ partes de las observaciones, o algo por el estilo. De estas medidas, llamadas cuantiles por algunos, veremos a los cuartiles, deciles y percentiles. Los cuartiles Los cuartiles, representados por la letra Q, son valores que dividen una serie ordenada de datos en cuatro partes iguales (cuartos), de tal suerte que por debajo del primer cuartil (Q1) se encuentra ¼ parte (el 25%) de los datos, y por ende, el 75% (las ¾ partes) está por encima de ese cuartil. La mitad de las observaciones cae por debajo del segundo cuartil —y, lógicamente, la otra mitad está por encima de él—; y las ¾ partes de los datos están por debajo del tercer cuartil, como muestra la figura. Figura 2. Los cuartiles Indudablemente, uno de estos nuevos amigos tiene un aire familiar con cierta conocida. ¿Ya te diste cuenta? Claro, es Q2, quien coincide con la mediana. Para hallar los cuartiles de una serie, seguiremos un procedimiento similar al utilizado para conseguir la mediana. Para una serie de datos simples, el cuartil en cuestión Qi será el valor que ocupe la posición siendo qi el cuartil deseado y n el total de observaciones. Si los datos están agrupados, entonces el cuartil será el resultado de calcular: donde: qi LRI: n: FAA: f: c: es el cuartil deseado (i = 1, 2, 3); límite real inferior del intervalo que contiene al cuartil; total de observaciones; frecuencia acumulada absoluta de la clase que antecede a la del cuartil; frecuencia absoluta de la clase que contiene al cuartil; amplitud del IC que contiene al cuartil. U N I V E R S I D A D D 32 E A Q U I N O B O L I V I A , FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Para calcular el primer cuartil, volvamos a auxiliarnos del ejemplo de las frecuencias cardiacas en ciertos pacientes ingresados. 1. Busca en cual clase está el cuarti ; con este valor y siguiendo el procedimiento que seguramente recuerdas de la mediana, rápidamente sabrás que el cuartil está en el tercer intervalo (porque su frecuencia acumulada absoluta es la primera en sobrepasar 25). 2. Los LR de ese IC son: LRI = (60 + 61) / 2 = 60.5; LRS = (80 + 81) / 2 = 80.5. Luego: c = 80.5 – 60.5 = 20. 3. FAA = 18, f = 38. 4. Determina el cuartil: Bien, ya tienes el valor del cuartil, solo tienes que interpretarlo adecuadamente, lo cual lograrás si leíste el comienzo del acápite. La cuarta parte de los pacientes, o el 25% de ellos, tiene 64 o menos latidos cardiacos por minuto; o puedes decir que el 75% (¾ partes de los pacientes) tiene más de 64 latidos cardiacos por minuto. Los deciles Veamos ahora los deciles. Muy parecidos a sus parientes los cuartiles, ellos son nueve (D1, D2,…, D9) que dividen a una serie ordenada de datos en diez partes iguales (décimos). Por ejemplo, por encima de D6 hay cuatro décimos, quedando seis décimos debajo de él, y así por el estilo. Curiosamente, el quinto decil coincide con el segundo cuartil, y, por consiguiente, con la mediana. La posición del decil está dada por la expresión en una serie de datos simples, siendo n el total de observaciones, y di el decil deseado (i = 1, 2, 3, 4, 5, 6, 7, 8, 9). Para datos agrupados, usemos nuevamente el ejemplo de la frecuencia cardiaca. Los pasos para calcular el decil son en esencia iguales que si fueses a calcular el cuartil, haciendo los cambios siguientes: donde: di es el decil deseado (i = 1, 2,…, 9); U N I V E R S I D A D 33 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA LRI: n: FAA: f: c: límite real inferior de la clase o intervalo que contiene al decil; total de observaciones; frecuencia acumulada absoluta de la clase que antecede a la del decil; frecuencia absoluta de la clase que contiene al decil; amplitud del IC que contiene al decil. Los percentiles Los percentiles son observaciones que dividen a una serie ordenada de datos en cien partes iguales, motivo por el que hay 99 de ellos. Sí, ya sabemos que el término te resultó conocido apenas lo viste. Casi de la familia. Pues sí, se trata de los mismos percentiles que utilizas, por ejemplo, para conocer la evaluación nutricional de uno de tus bebitos. Bueno, ahora verás cómo se construye un percentil, procedimiento que conoces en parte porque es muy análogo al utilizado para determinar las medidas de posición estudiadas. Para una serie de datos simples, la posición del percentil estará dada por observaciones, y pi el percentil deseado (i = 1, 2,…, 99). total de Para datos agrupados, el percentil deseado será el resultado de computar: donde: pi LRI: n: FAA: f: c: es el percentil deseado (i = 1, 2,…, 99); límite real inferior de la clase o intervalo que contiene al percentil; total de observaciones; frecuencia acumulada absoluta de la clase que antecede a la del percentil; frecuencia absoluta de la clase que contiene al percentil; amplitud del IC que contiene al percentil. La desviación media Al hablar de dispersión, lo hacemos la mayoría de las veces tomando en cuenta a la media aritmética del conjunto de observaciones. Así, cuando decimos que la dispersión de una serie es pequeña, es porque los datos están agrupados en la cercanía de su media, siendo grande si los datos están alejados de ella. Esto sienta las bases para utilizar como referencia a las distancias para referirnos a la dispersión, o sea, que sería procedente definirla en función de las distancias que existen entre los números y su media. Ahora bien, estas distancias pueden ser vistas como la desviación entre los elementos en cuestión; con otras palabras, si hay mucha distancia, decimos que se desvió mucho el número de la media, y así por el estilo. Si promediásemos las desviaciones entre cada número y la media, o sea, sumarlas y dividirlas por la cantidad de números de la serie, obtendríamos una medida de la variación promedio del conjunto de datos dada por: Por desgracia, realizar este cálculo te sería tan provechoso como no hacer ninguno, pues el resultado final siempre es cero16, debido a razones matemáticas establecidas. Por ejemplo, considera la siguiente serie: 2, 3, 4, 5, 6. Su media es 4, y si calculásemos lo planteado: U N I V E R S I D A D D 34 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA La solución a este inconveniente es hallar la diferencia modular de las desviaciones, de esa manera sólo tomarás en cuenta la magnitud de dichas desviaciones, esto es, hallar el módulo de las diferencias. De esta forma, estarás calculando la desviación media (DM) o desviación promedio, cuya fórmula para datos simples es: donde: Xi X: n: son las observaciones de la serie (i = 1,…, n); media aritmética de la serie; total de observaciones. La desviación media es una medida que se utiliza poco en la práctica, sobre todo si son muchos datos o si éstos tienen muchos lugares decimales, pero principalmente debido a razones de índole matemática que no abordaremos en este curso. De todas formas, optamos por dártela a conocer con el fin de que lograras entender cabalmente las medidas que verás a continuación. La varianza y la desviación estándar Como recuerdas, para calcular la desviación media te viste obligado a utilizar las diferencias modulares para obtener un resultado válido, pues de lo contrario no hubieses obtenido nada. Pues bien, existe otra medida que se vale de elevar al cuadrado las desviaciones de los datos con respecto a su media. Dicha medida recibe el nombre de varianza o variancia. Se denota por los símbolos S2 se hará importante en temas de Estadística Inferencial. De momento, usaremos el primero. Su cálculo (para datos simples) se verifica según la fórmula: donde: Xi X: n: son las observaciones de la serie (i = 1,…, n); media aritmética de la serie; total de observaciones. Esta medida logra describir adecuadamente la dispersión del conjunto de datos, pero tiene un inconveniente: su resultado se expresa en unidades cuadradas, algo harto engorroso y difícil de entender en la mayoría de las situaciones prácticas, y por demás disonante en relación con la medida de tendencia central utilizada. Sería algo así como años cuadrados, o pesos cuadrados (¿?). A fin de eliminar este aparente escollo, puedes hallar la raíz cuadrada positiva del número obtenido, con lo que tendrás de vuelta a las unidades originales, obteniendo así una medida denominada desviación típica o estándar17, y es la medida de variación más ampliamente utilizada en el mundo de las estadísticas. Su símbolo es S (por ser la raíz cuadrada de la varianza), aunque se utiliza también DS (desviación standard) o SD (standard deviation). Tiene, además, la ventaja de que hasta las calculadoras de bolsillo —las científicas, claro está— la calculan, y casi la totalidad de los paquetes estadísticos existentes en el mercado del software. U N I V E R S I D A D 35 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA El coeficiente de variación Ante casos como el descrito con anterioridad, es imprescindible contar con una medida de variabilidad relativa, como el coeficiente de variación (CV), que expresa a la desviación típica como porcentaje de la media, y su cálculo se realiza mediante: Observa que, por tener la desviación estándar y la media las mismas unidades de medida, quedan canceladas dichas unidades, de ahí que el coeficiente de variación no tenga unidades propias19, lo que facilita la comparación. En el ejemplo siguiente, si comparas las desviaciones estándares de los dos grupos, pudieras creer que ambos tienen igual dispersión: Grupo 1: media = 60 cm; SD = 4 cm Grupo 2: media = 170 cm; SD = 4 cm Sin embargo, si calculas la medida recién conocida, entonces: CV1 = 6.6, CV2 = 2.3. Al contrastarlos, ves algo bien diferente, pues en realidad el grupo 1 tiene casi tres veces más dispersión que el grupo 2. CUESTIONARIO 1. Supongamos que un grupo de profesionales en un país A tienen un salario promedio de US$26.888 y varianza US$14.400. En un país B otro grupo de profesionales con iguales características reciben un salario promedio de US$8.570 con desviación estándar de US$80. ¿Cuál grupo de salarios presenta una menor variabilidad?. 2. En un inventario realizado en la bodega de un almacén se encontraron 200 artículos que fueron importados a diferentes precios (en dólares) Xi fi 20,5 20 32,0 30 48,6 50 50,0 60 60,4 40 200 a) Calcular la desviación estándar. b) Calcular le desviación media. c) Calcular coeficiente de variación. 3. En el primer semestre de este año 30 empresas tuvieron en promedio $374 millones en gastos con una varianza de $80 millones. Por un error cada una de las empresas no contabilizó $7 millones en los gastos. Corregir el promedio y la varianza. U N I V E R S I D A D D 36 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA 4. 80 empleados de una compañía tiene un salario promedio de $125.000 y una varianza $12.000. Si reciben un reajuste del 20%. Calcular el nuevo promedio y varianza. 5. Se administra un antibiótico al ganado para combatir cierta enfermedad, el peso (en gramos) del antibiótico depende del peso del animal, el cual debe ser medido con mucha precisión, puesto que una sobredosis puede ser perjudicial para el animal. A continuación se muestra la distribución de frecuencia del peso de las dosis. Peso (gramos) fi 15 – 20 7 20 – 25 25 25 – 30 31 30 – 35 20 35 – 40 11 a) Calcular los estadígrafos de posición y dispersión que le parezcan adecuados (no todos), explique su decisión. b) Investigadores afirman que una dosis con peso mayor o igual a 30 gr. sería peligroso. Según la información de que dispone, ¿qué porcentaje de la dosis se clasifica como peligrosa?. c) Construya histograma y polígono de frecuencias asociado a los datos. 6. Use sus conocimientos para completar las siguientes frases. a) Si calculo la media de los valores absolutos de las desviaciones de las observaciones respecto a la media de ellas, obtenga el valor de _________ . b) Si calculo la media del cuadrado de las desviaciones de las observaciones respecto a la media aritmética de ellas, obtengo el valor de _______________ . c) Si debo comparar el grado de variabilidad de dos series de observaciones, debo utilizar dispersiones ____________________ que se obtienen dividiendo la __________________ por la ___________________ d) Si mido la estatura y el peso de una serie de alumnos, para determinar cual de las dos series de valores tiene mayor grado de variaciones debo utilizar medidas de ________________________ e) Una variable normalizada o _______________________ o simplemente calificación ____________________ indicada a cuantas unidades de desviación estándar esta una puntuación 7. Un postulante presento examen de admisión a dos universidades; en la universidad A obtuvo 325 puntos y en ella la calificación media fue de 305 puntos con desviación estándar de 26. En la universidad B obtuvo 210 puntos y en ella la calificación media fue de 195 puntos con desviación estándar de 18. Halle en que examen fue mejor el resultado. 8. En una prueba deportiva la media para varones es 140 puntos con una desviación estándar 24; para mujeres la media es 162 con una desviación 22. Ana y su hermano Juan participaron en el evento; Juan obtuvo 151 puntos y Ana 171. Hallar: a) Quien tuvo el mejor resultado. b) El rango percentil de Juan y el rango de Ana. U N I V E R S I D A D 37 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA PROGRAMA DE BIOESTADISTICA WORK PAPER # 6 U N I V E R S I D A D D 38 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA UNIDAD O TEMA: BIOESTADISTICA TITULO: INDICADORES FECHA DE ENTREGA: INDICADORES Es la expresión cualitativa o cuantitativa que permite detectar o medir total o parcialmente un comportamiento. Se define también como el instrumento diseñado para valorar el grado de cumplimiento de las actividades y objetivos propuestos. Es la relación entre dos variables, que ayuda a medir directa o indirectamente las modificaciones obtenidas en la situación de Salud y evaluar en que medida se están alcanzando los objetivos y metas de un programa determinado. “Los indicadores de Salud son instrumentos que nos permiten determinar cambios o modificaciones de una condición de Salud, influenciados por factores o actividades concretas.” “Los indicadores de Salud tienen la particularidad de medir y evaluar la eficacia de las acciones de Salud y sus efectos en la población beneficiada”. IMPORTANCIA DE LOS INDICADORES Permiten determinar el impacto de las políticas y Programas. Sirven de apoyo en la elaboración, formulación, implementación y seguimiento de planes y Proyectos. Seguimiento de compromisos nacionales e internacionales. Permiten determinar el impacto de las políticas y Programas. Permiten ver la realidad concreta y la historia. Permiten observar y medir diferencias (comparar). Permiten evaluar el desempeño del Sistema de Salud. Permiten realizar análisis de situación de salud. EVALUACION Es un conjunto de acciones o actividades organizadas y sistemáticas, que se realizan para reconocer los avances y logros de un programa o proyecto, a la vez que refuerzan y dan continuidad a las acciones emprendidas. LA EVALUACION PERMITE: CONOCER: Cuanto hemos avanzado y cuanto nos falta para lograr los objetivos, independientemente de los medios que se utilizaron para esos logros. IDENTIFICAR: Cuales son las limitaciones y obstáculos que impidieron avanzar en el logro de los objetivos de una determinada actividad programada. DECIDIR: Que modificaciones y cambios se necesitan para optimizar los resultados positivos. USO DE INDICADORES POR NIVELES DE APLICACION La construcción de los indicadores prioritarios debe adecuarse a los niveles de su aplicación : Local ( Establecimientos de Salud y comunidad ). U N I V E R S I D A D 39 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Municipal ( DILOS ) Departamental ( SEDES ). Nacional. AMBITO LOCAL: La construcción y uso de los indicadores en el ámbito local estará definida en el marco del plan operativo anual y las metas propuestas (indicadores de accesibilidad, cobertura, satisfacción de los usuarios y participación comunitaria). AMBITO MUNICIPAL: Los indicadores a utilizar deben regirse al cumplimiento de: Los planes operativos y las metas propuestas. La accesibilidad y cobertura de la oferta de Salud. La calidad de los servicios y la inversión en salud. La participación comunitaria y satisfacción de los usuarios. El comportamiento de los daños y de los riesgos que dan una visión clara de la situación de salud del municipio. El impacto de las acciones de salud en la población El Análisis de Situación de Salud. AMBITO DEPARTAMENTAL ( SEDES ): En este nivel se utilizan indicadores para el seguimiento de La Política Nacional de Salud, los planes y programas Los compromisos de gestión y la coordinación intersectorial. El cumplimiento de las inversiones programadas. Los resultados de las acciones en salud. El comportamiento de los daños y riesgos. La situación de salud departamental. AMBITO NACIONAL: En este nivel se utilizan indicadores para el seguimiento de : La Política Nacional de Salud, los planes, proyectos y programas. El impacto de las acciones de salud COMPONENTES DE UN INDICADOR: Los indicadores pueden ser cualitativos y cuantitativos. Los indicadores cuantitativos incluyen las Tasas, Razones, y Proporciones, cada una de ellas con particularidades como incidencia, prevalencia, tasa de ataque, promedio, cobertura, etc. Un indicador consta de 2 variables multiplicadas por una constante K. ( numerador ) --------------------( denominador ) X K (Amplificador) ATRIBUTOS DE UN BUEN INDICADOR Accesibilidad : Se refiere a la recolección de información fácil y al menor costo. Confiabilidad: U N I V E R S I D A D D 40 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Las mediciones realizadas una y otra vez por distintos observadores, deben ser similares . Validez: El indicador debe medir la realidad exacta de lo que realmente se quiere medir. Especificidad: El indicador debe reflejar sólo cambios ocurridos en una determinada situación y no hechos adicionales. Se debe evitar mediciones sujetas a influencias externas al objeto o fenómeno que se observa. Sensibilidad: El indicador debe medir los cambios que realmente estén sucediendo de los hechos que se estudian . Relevancia y utilidad: Los indicadores no sólo tienen que ser relevantes a nivel científico, sino también a nivel político, ya que deben ser útiles en la toma de decisiones. Comparabilidad: La información que aporten los indicadores debe permitir la comparación a distintas escalas territoriales y temporales. TIPOS DE INDICADORES EN SALUD Los indicadores pueden ser de. Resultado aquellos indicadores que muestran la producción del sector que sirve para lograr los indicadores de impacto, ej: cobertura de parto institucional. Proceso, que muestran los productos intermedios, ej: guías o protocolos de atención distribuídos. Impacto, son indicadores macro que sintetizan políticas nacionales del sector, ej: disminución de tasas de mortalidad materno-infantil Tambien pueden ser de: De acceso de los servicios de salud. De seguimiento de programas. De cobertura de los servicios de salud. De calidad de la Atención. Encuestas de satisfacción de los clientes. CUESTIONARIO 1.- Que es un indicador ? 2-. Cual es la importancia de un indicador? 3.- La evaluación no permite? 4.- Cual es el uso de los indicadores en el nivel Municipal? 5.- Cual es el uso de los indicadores en el nivel Departamental? 6.- Cuales son los atributos de un indicador? 7.- Como se clasifican los indicadores? 8.- De ejemplos de indicadores de Accesibilidad y Calidad 9.- De ejemplos de indicadores de Seguimiento y cobertura U N I V E R S I D A D 41 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA PROGRAMA DE BIOESTADISTICA WORK PAPER # 8 UNIDAD O TEMA: BIOESTADISTICA U N I V E R S I D A D D 42 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA TITULO: INDICADORES II FECHA DE ENTREGA: INDICADORES Introducción En la investigación científica en la Atención Primaria de Salud, con frecuencia se utilizan variables cualitativas, bien por su naturaleza, o por la escala empleada. Por supuesto, una vez que la información se recogió, es necesario calcular alguna medida de resumen cuyo resultado es un indicador que deberá analizarse en un momento posterior. En este tema te presentamos las medidas de resumen para variables cualitativas que se utilizan con mayor frecuencia en los estudios que realizas en el nivel primario de atención de salud. Razón e Índice. Definición. Cálculo e interpretación Una razón es la relación por cociente que se establece entre las unidades de análisis que pertenecen a un grupo o categoría (a) y las unidades de análisis que pertenecen a otra categoría (b) de la misma variable. Su expresión. general es: Ejemplo: Supongamos que de los 400 recién nacidos (RN) de un municipio en cierto período, 300 presentaron los ojos oscuros (OO), en tanto que sólo 100 los tenían claros (OC). Aplicando la expresión general, la razón OO/OC es: Nota: Utilizamos la letra R por razones didácticas, realmente la razón no tiene símbolo propio. La razón ojos oscuros/ojos claros es de 3; o lo que es lo mismo, 3:1. Pero, ¿qué significa este resultado? Expresa que hay tres recién nacidos con ojos oscuros por cada recién nacido de ojos claros en ese municipio y en ese período. Fíjate que el numerador y el denominador son disjuntos, es decir, no se interceptan, no están contenidos uno en el otro. Ello te ayudará a establecer las diferencias con las medidas de resumen que estudiarás a continuación. Si multiplicas el resultado obtenido por 100, entonces el nuevo número se denomina índice, de tal suerte que en el ejemplo anterior el índice sería 300. En otras palabras, en el municipio de referencia, en el período estudiado, por cada 100 bebés de ojos claros hay 300 de ojos oscuros. Proporción y Porcentaje. Definición. Cálculo e interpretación Una proporción es la relación por cociente que se establece entre las unidades de análisis que pertenecen a un grupo o categoría (a) de una variable y el total de las unidades de análisis estudiadas (a + b). Su expresión general es : Si se multiplica su resultado por 100, se obtendrá el porcentaje. U N I V E R S I D A D 43 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Seguiremos utilizando el ejemplo del epígrafe anterior. ¿Lo recuerdas? Por supuesto que sí. Pues bien, determinemos la proporción de niños con ojos oscuros (300) en la población de recién nacidos (400): Alternativamente, puedes calcular el porcentaje: Nota: Usamos la P con fines ilustrativos, pues la proporción carece de simbología. Los resultados anteriores significan que tres de cada cuatro recién nacidos tienen los ojos oscuros; o que el 75 por ciento de los recién nacidos tiene los ojos oscuros (y, obviamente, el 25% los tiene claros). ¿No te resultan familiares estas nuevas medidas, o sea, la proporción y el porcentaje? Ya debes estarte preguntando la diferencia que existe entre éstas y la distribución de frecuencias relativas que ya estudiaste. Nada más claro: no es que sean parecidas, son exactamente las mismas, pero restringidas a variables cualitativas. Observa que el porcentaje te permite analizar el aporte, el peso específico o la importancia relativa de cada categoría respecto al total. Otro elemento que debes conocer es el siguiente: si la variable es dicotómica, puedes utilizar tanto razones como proporciones; pero si es politómica, entonces calcula sólo proporciones10. Tasas Siempre que necesites medir el riesgo de que acontezca cierto fenómeno en una población determinada, dispones de un indicador valioso y único: las tasas. Una tasa es una relación por cociente que expresa el riesgo de que ocurra cierto evento en una población y período determinados. Está compuesta por tres elementos, a saber: Veamos cuáles son esos elementos: El numerador contiene al número de veces que ocurrió determinado fenómeno en un área geográfica y en un período determinados. El denominador indica el número de habitantes de la población en la cual puede ocurrir el fenómeno. k es un múltiplo de 10 cuyo uso está justificado por el hecho de que habitualmente el resultado del cociente es un número fraccionario, y al multiplicarlo por una potencia de 10 se facilita enormemente la lectura y comprensión del indicador. Esta es una medida que expresa el riesgo de ocurrencia del evento estudiado en el numerador en la población involucrada, en el tiempo y lugar establecidos. U N I V E R S I D A D D 44 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Las tasas que más importancia revisten para nuestro desempeño en el campo de la Salud Pública son las siguientes: Tasas de importancia Relevante en Salud Pública Tasas relacionadas con la natalidad Tasas relacionadas con la mortalidad Tasas relacionadas con la morbilidad Una particularidad realmente útil de las tasas es que puedes calcularlas tanto para la totalidad de la población, como para parte de ella (por ejemplo, para el grupo de edad de cinco a nueve años, para los estudiantes, para los residentes del área rural, y así por el estilo); por otra parte, puedes calcular las tasas para todas las causas, o solamente para una de ellas (o un grupo de ellas). De este modo, tendrás calculadas tasas brutas, crudas, generales o globales si se tratara de tasas que involucren a toda la población o al total de causas; al tiempo que habrás calculado tasas específicas si incluían a una parte de la población o a una causa o grupo de ellas. Así las cosas, estarás en plena facultad de hallar tasas brutas de mortalidad, de natalidad, o bien específicas por edad, por sexo, por edad y sexo a la vez, entre muchas otras. Teniendo a tu disposición los datos adecuados, podrás hallar una tasa tan específica como desees. Existe en punto cardinal en el manejo de las tasas: la población expuesta al riesgo en cuestión. Como ya sabes, este es el denominador de la ecuación, y de su correcta determinación depende la fidelidad del cálculo. Nunca serán suficientes las medidas que tomes para asegurarte que estás empleando el dato acertado. No creas que es muy difícil saber que estás errado o en lo cierto, el problema radica en que muchas veces se pasa por alto este “detalle” de forma involuntaria. Probablemente te habrás preguntado: «Bueno, ¿y qué tanto problema con el denominador?» ¡Ah! Es que ahí radica el quid de la cosa. Recuerda que calculas una tasa para medir el riesgo de ocurrencia de un evento o fenómeno en una población, pero no en cualquier población, sino en la población expuesta a ese riesgo. Esto quiere decir que sólo podrás calcular la tasa de mortalidad por cáncer de útero en las mujeres de cierta ciudad, puesto que sería imposible calcularla en los hombres; del mismo modo que no puedes calcular la tasa de morbilidad por cáncer de pulmón de los habitantes de Pueblo Mocho en 1999, utilizando para ello a los habitantes que tenía el pueblo en 1979, o a los habitantes de Palma Mocha en 1999. ¿Satisfecha tu inquietud? También haz de saber que las poblaciones están sometidas a constantes cambios en lo que a su número atañe, determinados por los nacimientos y defunciones y por los movimientos migratorios (emigración e inmigración), que provocan que no sea la misma a lo largo de todo el año. De ahí que, por convenio, se tome la población existente a mediados del período11 o población media para el cálculo de las tasas. Por otra parte, debes tener especial cuidado al calcular tasas para poblaciones pequeñas, como la que usualmente manejan los Consultorios, pues suelen volverse inestables, ya que cualquier evento “mueve“ mucho la tasa, y a veces no guarda relación el resultado obtenido con la magnitud del evento acontecido. Bueno, ya estamos en condiciones de particularizar en las tasas más relevantes en la práctica diaria. CUESTIONARIO U N I V E R S I D A D 45 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA De los siguientes indicadores, di su nombre y qué datos necesitarías para calcularlos. 1. Riesgo de morir por enfermedades del corazón en Santa Cruz 2. Riesgo de morir por cualquier causa en Bolivia 3. Contribución del grupo de 60 años y más a la mortalidad general en Cuba 4. Riesgo de morir en la primera semana de vida extrauterina. 5. Riesgo de morir de los enfermos de tuberculosis. 6. Completa e interpreta los datos siguientes: Nota: todas las tasas están calculadas utilizando k = 1 000. PROGRAMA DE BIOESTADISTICA GUIA DE INVESTIGACION PRACTICA – GIP´s # 3 UNIDAD O TEMA: U N I V E R S I D A D D 46 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA TITULO: MONITOREO FECHA DE ENTREGA: CONCEPTO DE MONITOREO Se entiende como Monitoreo el seguimiento de la ejecución de las actividades y el cumplimiento paulatino de los objetivos programados. Está orientado a observar periódicamente la marcha de las acciones y a detectar situaciones críticas para su análisis y corrección, todo esto en un proceso retroalimentado y participativo en la de toma de decisiones. Se diferencia de una evaluación, por que ésta última certifica el grado de cumplimiento de los objetivos y su pertinencia en forma episódica y generalmente se la hace a final de periodo. Objetivo del Sistema de Monitoreo.El objetivo del monitoreo es medir continuamente el logro paulatino del cumplimiento del grado y número de actividades programadas, mismos que en el momento de la planificación fueron expresados en metas y tomar acciones correctivas en forma oportuna Utilidades De un Sistema de Monitoreo 1. Detecta de situaciones Críticas. ( Ruta Crítica) 2. Verifica el grado de cumplimiento de las decisiones. (Realimentación) 3. Comprueba los avances y logros. (Verifica) 4. Identifica las tendencias y resultados (Pronostica). 5. Identifica el grado de satisfacción de los clientes. 6. Desarrolla investigaciones operativas. 7. Realiza Vigilancia y Control epidemiológicos. Al realizar las acciones de salud, urgen las preguntas: ¿Dónde estamos?, ¿Hacia dónde vamos?, ¿ Que es lo que queremos?, Son preguntas que corresponden al proceso de planificación, en el que se toman decisiones dando respuesta a estas preguntas tratando de reducir la brecha existente entre los que se quiere y lo que desea. El monitoreo describe "la ruta crítica", es decir el momento en el cual la curva de tendencia no se proyecta en la meta, lo que amerita la toma de decisiones, ya sea a través de una reprogramación de las actividades y/o corrección de situaciones relacionadas con los recursos, a esto es lo que se denomina realimentación. Por lo indicado el Sistema de Monitoreo de actividades se constituye en un instrumento más importantes en el proceso de ejecución de Planes, Programas y Proyectos y de esto dependerá el logro de los objetivos esperados. El Sistema de Monitoreo, pone también en evidencia la producción y el rendimiento de los recursos, (en especial el recurso humano), el uso y la utilización de los servicios de salud, la calidad de la atención, la cobertura, la satisfacción de los clientes, el comportamiento de eventos epidemiológicos (Brotes, Epidemias, Endémicas y Pandemias) y en general el estado de la situación de salud. Características de un Sistema de Monitoreo De su diseño Para el diseño de instrumentos del monitoreo debemos considerar: 1. Quién necesita hacer monitoreo. 2. Que tipo de información se necesita monitorear. 3. Para que es necesario hacer monitoreo. 4. Conque frecuencia se hará el monitoreo. 5. Que instrumentos se requieren para implementar el monitoreo. U N I V E R S I D A D 47 D E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA De su manejo Un Sistema de monitoreo debe contar con las siguientes características para su manejo: 1. Descentralizado. 2. Por objetivos. 3. Participativo. 4. Organizado por niveles de complejidad. Información Necesaria Para realizar el seguimiento de las actividades, es necesario contar con una serie de instrumentos como fuente de datos como: 1. Registros y sucesos demográficos. 2. Datos de los censos. 3. Registros ordinarios de los servicios de salud. 4. Datos de vigilancia Epidemiológica. 5. Encuestas por muestreo (ENDSA y otras). 6. Registro de otros subsectores. 7. Informes del uso de técnicas participativas. 8. Contrato de gestión municipal en salud El Sistema de Monitoreo por Niveles de Complejidad En la comunidad 1. Con participación de la comunidad, es más participativo 2. Mayor sencillez en su presentación, es más problematizador 3. Se analizan indicadores de la comunidad, es más operativo 4. Se analizan problemas comunitarios particulares, es más reflexivo y motivador En la Red Municipal de salud 1. Con participación de los dirigentes, es mas representativo 2. Con participación de las autoridades locales y otros sectores, es también problematizador, es más táctico, e incluye el hospital de apoyo. 3. Se analizan indicadores de un grupo de comunidades, es más generalizador. 4. Se analizan problemas comunes de las comunidades relacionadas a los programas de salud, es reflexivo en el nivel de dirigencia. En el DILOS 1. Con participación de los dirigentes de organizaciones y las autoridades del municipio y SEDES, es normativo y representativo. 2. Se analizan indicadores del grado de desarrollo técnico y administrativo de una Red Municipal de Salud, es transectorial y de coordinación. 3. Se analizan problemas relacionados al Sistema Local de Salud y las políticas locales, es más estratégico. 4. Se monitorizan objetivos del plan estratégico, es más técnico y de carácter operacional. En el Nivel Departamental 1. Con participación de autoridades regionales y municipales es eminentemente normativo y de elaboración de las directrices políticas del departamento. 2. Se analizan problemas relacionados al Sistema Local de Salud y las políticas locales, es eminentemente estratégico. 3. Se analizan el grado de cumplimiento de los objetivos del Plan Estratégico, es eminentemente evaluativo. El Sistema de Monitoreo debe contar en su organización con: Manuales de normas y procedimientos, guías para uso de formularios, diagramas de flujo y reglamentos en función de su optima aplicación. U N I V E R S I D A D D 48 E A Q U I N O B O L I V I A FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE FISIOTERAPIA Y KINESIOLOGIA Es necesario contar con un plan de capacitación, estableciendo un diseño curricular que oriente el proceso de capacitación permanente del Sistema de Monitoreo y los Sistemas relacionados. II.- PRÁCTICA Objetivos Conocer la importancia y el manejo del monitoreo Elaborara ejemplos de cuadros de monitoreo Material 1.- Guía de Investigación Práctica Métodos y procedimientos 1. Explicación y orientación inicial por el profesor 2. Revisión del estudiante de los conceptos 3. Taller de creatividad (elaboración de ejemplos de cuadros de monitoreo) Conclusiones La construcción de cuadros de monitoreo son de vital importancia para el seguimiento de indicadores de salud, se detecta de situaciones críticas, verifica el grado de cumplimiento de las decisiones, comprueba los avances y logros, identifica las tendencias y resultados, identifica el grado de satisfacción de los clientes, desarrolla investigaciones operativas, realiza Vigilancia y Control epidemiológicos Evaluación 1. ………………………………………………………………………………… 2. ………………………………………………………………………………… 3. ………………………………………………………………………………… 4. ………………………………………………………………………………… 5. ………………………………………………………………………………… 6. ………………………………………………………………………………… 7. ………………………………………………………………………………… 8. ………………………………………………………………………………… ………………………………….. ………………………………….. Firma y sello del catedrático Firma del estudiante Bibliografía MINISTERIO DE SALUD Y PREVISIÓN SOCIAL, Guía para la Interpretación de Indicadores en Salud, UNICEF, Laz Paz Bolivia, 2.003 ARMIJO SUBIETA FREDDY, Indicadores de Salud documento Metodológico, La Paz Bolivia, 2.002 MINISTERIO DE SALUD Y PREVISIÓN SOCIAL, Guía Metodológica para el Funcionamiento de los Comités de Análisis de la Información, Laz Paz Bolivia, 2.002 U N I V E R S I D A D 49 D E A Q U I N O B O L I V I A