UNIVERSIDAD DE PANAMÁ FACULTAD DE MEDICINA ESCUELA DE SALUD PÚBLICA. CARRERA DE NUTRICIÓN DEPARTAMENTO DE MEDICINA PREVENTIVA Y SOCIAL PROGRAMA DEL CURSO METODOLOGÍA DE LA INVESTIGACIÓN CURSO SOBRE METODOLOGÍA DE LA INVESTIGACIÓN MÓDULO 3: BASES METODOLÓGICAS OBJETIVO PARTICULAR: Establecer los elementos metodológicos básicos para el estudio Por: Manuel Escala Luzcando, MD, MSP, EDS Panamá Marzo 2007 ÍNDICE DE TEMAS 87 TEMA No 12. EL DISEÑO DE LA INVESTIGACIÓN TEMA No 13. DEFINICIÓN OPERACIONAL DE LAS VARIABLES TEMA No 14 UNIDADES DE ANÁLISIS Y SUS CRITERIOS DE INCLUSIÓN Y EXCLUSIÓN TEMA No 15 EL UNIVERSO Y LA MUESTRA 88 TEMA No 12 EL DISEÑO DE LA INVESTIGACIÓN OBJETIVO GENERAL: Analizar las características de los tipos de investigación OBJETIVOS OPERACIONALES 1. Diferenciar los tipos de estudios clínico epidemiológicos 2. Reconocer los estudios descriptivos 3. Distinguir las características de los estudios analíticos INFORMACIÓN 4. Precisar los requisitos de los estudios experimentales 5. Prever los sesgos 6. Elaborar el diseño del estudio del Proyecto CONTENIDO 1. 2. 3. 4. 5. Tipos de estudios Estudios Descriptivos Estudios Analíticos Estudios Experimentales Los Sesgos. Precisión y Validez TIPOS DE ESTUDIOS CLÍNICO EPIDEMIOLÓGICOS Pita Fernández S. Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A Coruña. Pita Fernández, S. Epidemiología. Conceptos básicos. En: Tratado de Epidemiología Clínica. Madrid; DuPont Pharma, S.A.; Unidad de epidemiología Clínica, Departamento de Medicina y Psiquiatría. Universidad de Alicante: 1995. p. 25-47. (Actualizado 28/02/2001) Los estudios epidemiológicos clásicamente se dividen en Experimentales y No experimentales. En los estudios experimentales se produce una manipulación de una exposición determinada en un grupo de individuos que se compara con otro grupo en el que no se intervino, o al que se expone a otra intervención. Cuando el experimento no es posible se diseñan estudios no experimentales que simulan de alguna forma el experimento que no se ha podido realizar (1-5). En la Tabla 1 se resumen los diferentes tipos de estudios. Si ha existido manipulación pero no aleatorización se habla de estudios Cuasi-experimentales. Existen diferentes clasificaciones de los diferentes estudios y así también algunos autores describen los estudios como se señalan en la Tabla 2. (6) Tabla 1. Tipos de Estudios Epidemiológicos I Experimentales No Experimentales Ensayo clínico Estudios ecológicos Ensayo de campo Estudios de prevalencia Ensayo comunitario de intervención Estudios de casos y controles Estudios de cohortes o de seguimiento Tabla 2. Tipos de Estudios Epidemiológicos II DESCRIPTIVOS En Poblaciones Estudios ecológicos En Individuos A propósito de un caso Series de casos Transversales / Prevalencia 89 ANALÍTICOS Observacionales Estudios de casos y controles Estudios de cohortes (retrospectivos y prospectivos) Intervención Ensayo clínico Ensayo de campo Ensayo comunitario Dado el objetivo introductorio de este apartado presentamos muy brevemente las características fundamentales de los diferentes tipos de estudios. ESTUDIOS DESCRIPTIVOS. Estos estudios describen la frecuencia y las características más importantes de un problema de salud. Los datos proporcionados por estos estudios son esenciales para los administradores sanitarios así como para los epidemiólogos y los clínicos. Los primeros podrán identificar los grupos de población más vulnerables y distribuir los recursos según dichas necesidades y para los segundos son el primer paso en la investigación de los determinantes de la enfermedad y la identificación de los factores de riesgo (5,6). Los principales tipos de estudios descriptivos son: los estudios ecológicos, los estudios de series de casos y los transversales o de prevalencia. Estudios ecológicos: Estos estudios no utilizan la información del individuo de una forma aislada sino que utilizan datos agregados de toda la población. Describen la enfermedad en la población con relación a variables de interés como puede ser la edad, la utilización de servicios, el consumo de alimentos, de bebidas alcohólicas, de tabaco, la renta per cápita… Un ejemplo de este estudio sería correlacionar la mortalidad por enfermedad coronaria con el consumo per cápita de cigarrillos. Estos estudios son el primer paso en muchas ocasiones en la investigación de una posible relación entre una enfermedad y una exposición determinada. Su gran ventaja reside en que se realizan muy rápidamente, prácticamente sin coste y con información que suele estar disponible. Así por ejemplo los datos demográficos y el consumo de diferentes productos se pueden correlacionar con la utilización de servicios sanitarios, con registros de mortalidad y registros de cáncer. La principal limitación de estos estudios es que no pueden determinar si existe una asociación entre una exposición y una enfermedad a nivel individual. La falacia ecológica consiste precisamente en obtener conclusiones inadecuadas a nivel individual, basados en datos poblacionales. Otra gran limitación de los estudios ecológicos es la incapacidad para controlar por variables potencialmente confusoras. La asociación o correlación que encontremos entre dos variables puede ser debida a una tercera variable que a su vez esté asociada con la enfermedad y la exposición objeto de estudio. 90 Series de casos: Estos estudios describen la experiencia de un paciente o un grupo de pacientes con un diagnóstico similar. En estos estudios frecuentemente se describe una característica de una enfermedad o de un paciente, que sirven para generar nuevas hipótesis. Muchas veces documentan la presencia de nuevas enfermedades o efectos adversos y en este sentido sirven para mantener una vigilancia epidemiológica. Estos estudios aunque son muy útiles para formular hipótesis, no sirven para evaluar o testar la presencia de una asociación estadística. La presencia de una asociación puede ser un hecho fortuito. La gran limitación de este tipo de estudios es en definitiva la ausencia de un grupo control. Estudios transversales: Este tipo de estudios denominados también de prevalencia, estudian simultáneamente la exposición y la enfermedad en una población bien definida en un momento determinado. Esta medición simultánea no permite conocer la secuencia temporal de los acontecimientos y no es por tanto posible determinar si la exposición precedió a la enfermedad o viceversa. La realización de este tipo de estudios requiere definir claramente: La población de referencia sobre la que se desea extrapolar los resultados. La población susceptible de ser incluida en nuestra muestra delimitando claramente los que pueden ser incluidos en dicho estudio. La selección y definición de variables por las que se va a caracterizar el proceso. Las escalas de medida a utilizar. La definición de "caso" Los estudios transversales se utilizan fundamentalmente para conocer la prevalencia de una enfermedad o de un factor de riesgo. Esta información es de gran utilidad para valorar el estado de salud de una comunidad y determinar sus necesidades. Así mismo sirven como todos los estudios descriptivos para formular hipótesis etiológicas. ESTUDIOS ANALÍTICOS. Estudio de casos y controles: Este tipo de estudio identifica a personas con una enfermedad (u otra variable de interés) que estudiemos y los compara con un grupo control apropiado que no tenga la enfermedad. La relación entre uno o varios factores relacionados con la enfermedad se examina comparando la frecuencia de exposición a éste u otros factores entre los casos y los controles (5,6) . A este tipo de estudio que es de los más utilizados en la investigación se le podría describir como un procedimiento epidemiológico analítico, no experimental con un sentido retrospectivo, ya que partiendo del efecto, se estudian sus antecedentes, en el que se seleccionan dos grupos de sujetos llamados casos y controles según tengan o no la enfermedad. En los estudios de casos y controles (Tabla 4) tenemos casos expuestos (a), casos no expuestos (c), controles expuestos (b) y controles no expuestos (d). En este estudio la frecuencia de exposición a la causa entre los casos (a/c) se compara con la frecuencia de exposición en una muestra que represente a los individuos en los que el efecto no se ha producido y entre los que la frecuencia de exposición es (b/d). 91 TABLA 4. Tabla de 2 x 2 en los estudios de Casos y Controles Casos Controles Expuestos a b No expuestos c d Odds ratio (razón de predominio, oportunidad relativa) Si la frecuencia de exposición a la causa es mayor en el grupo de casos de la enfermedad que en los controles, podemos decir que hay una asociación entre la causa y el efecto. La medida de asociación que permite cuantificar esta asociación se llama "odds ratio" (razón de productos cruzados, razón de disparidad, razón de predominio, proporción de desigualdades, razón de oposiciones, oposición de probabilidades contrarias, cociente de probabilidades relativas, oportunidad relativa) y su cálculo se estima: Los grandes temas que se deben abordar al realizar un estudio de casos y controles son después de la definición de caso, la selección de los controles y las fuentes de información sobre la exposición y la enfermedad. No es el objetivo de este apartado realizar una revisión exhaustiva del diseño de este tipo de estudios por lo que resumiremos diciendo que la selección de los casos debe: a. Establecer de forma clara y explícita la definición de la enfermedad y los criterios de inclusión. b. Los casos deben ser incidentes ya que los casos prevalentes: Cambian sus hábitos en relación con la exposición. Los casos prevalentes pueden ser los sobrevivientes de casos incidentes y la supervivencia puede estar relacionada con la exposición. La selección del grupo control debe tener en cuenta: a. La función del grupo control es estimar la proporción de exposición esperada en un grupo que no tiene la enfermedad. b. Los controles deben ser representativos de la población de donde provienen los casos. Los casos y los controles no deben entenderse como dos grupos representativos de dos poblaciones distintas, sino como dos grupos que proceden de una misma población. Los controles deben ser comparables a los casos en el sentido de haber tenido la misma probabilidad de haber estado expuestos. Estudio de cohortes (o de seguimiento): En este tipo de estudio los individuos son identificados en función de la presencia o ausencia de exposición a un determinado factor. En este momento todos están libres de la enfermedad de interés y son seguidos durante un período de tiempo para observar la frecuencia de aparición del fenómeno que nos interesa. Si al finalizar el período de observación la incidencia de la enfermedad es mayor en el grupo de expuestos, podremos concluir que existe una asociación estadística entre la exposición a la variable y la incidencia de la enfermedad. La cuantificación de esta asociación la podemos calcular construyendo una razón entre la incidencia del fenómeno en los expuestos a la variable (le) y la incidencia del fenómeno en los no expuestos (lo). Esta razón entre incidencias se conoce como riesgo relativo y su cálculo se estima como (Tabla 5): 92 Tabla 5. Tabla de 2 x 2 en los estudios de Cohortes Enfermos Sanos Expuestos a b No expuestos c d Total a+c b+d Total a+b c+d a+b+c+d En este tipo de estudio como quiera que los participantes están libres de la enfermedad al inicio del seguimiento, la secuencia temporal entre exposición y enfermedad se puede establecer más claramente. A su vez este tipo de estudio permite el examen de múltiples efectos ante una exposición determinada. Las ventajas y limitaciones de este tipo de estudio y de los diferentes tipos de estudios se resumen en la Tabla 6 (6). Los estudios de cohortes pueden ser prospectivos y retrospectivos dependiendo de la relación temporal entre el inicio del estudio y la presencia de la enfermedad. En los retrospectivos tanto la exposición como la enfermedad ya han sucedido cuando el estudio se inició. En los prospectivos la exposición pudo haber ocurrido o no, pero desde luego lo que aún no ha sucedido es la presencia de la enfermedad. Por tanto se requiere un período de seguimiento en el futuro para determinar la frecuencia de la misma. Tabla 6. Ventajas y limitaciones de los Ensayos Clínicos Ventajas Mayor control en el diseño. Menos posibilidad de sesgos debido a la selección aleatoria de los grupos. Repetibles y comparables con otras experiencias. Estudios de Cohortes Ventajas Estiman incidencia. Mejor posibilidad de sesgos en la medición de la exposición. Estudios de Casos y Controles Ventajas Relativamente menos costosos que los estudios de seguimiento. Corta duración. Aplicaciones para el estudio de enfermedades raras. Permite el análisis de varios factores de riesgo para una determinada enfermedad. diferentes estudios epidemiológicos Limitaciones Coste elevado. Limitaciones de tipo ético y responsabilidad en la manipulación de la exposición. Dificultades en la generalización debido a la selección y o a la propia rigidez de la intervención. Limitaciones Coste elevado. Dificultad en la ejecución. No son útiles en enfermedades raras. Requieren generalmente un tamaño muestral elevado. El paso del tiempo puede introducir cambios en los métodos y criterios diagnósticos. Posibilidad de pérdida en el seguimiento. Limitaciones No estiman directamente la incidencia. Facilidad de introducir sesgos de selección y/o información. La secuencia temporal entre exposición y enfermedad no siempre es fácil de establecer. 93 Estudios Transversales Ventajas Fáciles de ejecutar. Relativamente poco costosos. Se pueden estudiar varias enfermedades y/o factores de riesgo a la vez. Caracterizan la distribución de la enfermedad respecto a diferentes variables. Precisan poco tiempo para su ejecución. Útiles en la planificación y Administración Sanitaria (Identifican el nivel de salud, los grupos vulnerables y la prevalencia). Limitaciones Por sí mismos no sirven para la investigación causal. No son útiles en enfermedades raras ni de corta duración. Posibilidad de sesgos de información y selección. Este tipo de estudios son de la suficiente complejidad para requerir, no sólo un equipo multidisciplinario que los aborde sino una cantidad de recursos suficientes para mantenerlos a lo largo del tiempo. ESTUDIOS EXPERIMENTALES. En los estudios experimentales el investigador manipula las condiciones de la investigación. Este tipo de estudios se utilizan para evaluar la eficacia de diferentes terapias, de actividades preventivas o para la evaluación de actividades de planificación y programación sanitarias. Como en los estudios de seguimiento los individuos son identificados en base a su exposición, pero a diferencia de estos, en los estudios experimentales es el investigador el que decide la exposición. El gran control que se tiene sobre el diseño facilita la interpretación de las asociaciones como causales . Para el médico clínico es de gran interés poder realizar inferencias causales en medio de la incertidumbre que rodea la practica clínica ya sea en actividades de prevención, de diagnóstico o terapéuticas (7,8). Los estudios experimentales pueden ser considerados: 1. Terapéuticos (o prevención secundaria) se realizan con pacientes con una enfermedad determinada y determinan la capacidad de un agente o un procedimiento para disminuir síntomas, para prevenir la recurrencia o para reducir el riesgo de muerte por dicha enfermedad. 2. Los preventivos (o prevención primaria) evalúan si una agente o procedimiento reduce el riesgo de desarrollar una enfermedad. Por ello los estudios experimentales preventivos se realizan entre individuos sanos que están a riesgo de desarrollar una enfermedad. Esta intervención puede ser sobre una base individual o comunitaria a toda una población determinada. Ensayo clínico: Es el estudio experimental más frecuente. Los sujetos son pacientes y evalúa uno o más tratamientos para una enfermedad o proceso. La validez de este estudio radica fundamentalmente en que el proceso aleatorio haga los grupos comparables en las variables más relevantes en relación al problema a estudiar. El diseño del estudio debe contemplar básicamente: a. La ética y justificación del ensayo. b. La población susceptible de ser estudiada. 94 c. La selección de los pacientes con su consentimiento a participar. d. El proceso de aleatorización. e. La descripción minuciosa de la intervención. f. El seguimiento exhaustivo que contemple las pérdidas y los no cumplidores. g. La medición de la variable final. h. La comparación de los resultados en los grupos de intervención y control. Ensayos de campo: Tratan con sujetos que aún no han adquirido la enfermedad o con aquéllos que estén en riesgo de adquirirla y estudian factores preventivos de enfermedades como pueden ser la administración de vacunas o el seguimiento de dietas. Ensayos comunitarios: Incluyen intervenciones sobre bases comunitarias amplias. Este tipo de diseños suelen ser cuasiexperimentales (existe manipulación pero no aleatorización), en los que una o varias comunidades recibirán la intervención, mientras que otras servirán como control. Los estudios experimentales si tienen un diseño cuidadoso con un tamaño muestral suficiente, un proceso de aleatorización adecuado, una intervención y un seguimiento perfectamente controlados pueden proporcionar evidencias muy fuertes que nos permitan emitir juicios sobre la existencia de relaciones causales entre variables. SESGOS. LA PRECISIÓN Y VALIDEZ DE UN ESTUDIO. Independientemente del tema y los objetivos de un estudio, que pueden ser de mayor o menor interés para el lector o para la comunidad científica, lo que siempre se debe perseguir es que el estudio sea preciso y válido. Todo estudio debe ser entendido como un ejercicio de medida en cada uno de los apartados de planificación, ejecución e interpretación. Es por tanto necesario formular unos objetivos de forma clara y cuantitativa para dejar muy bien sentado desde el principio que es lo que se quiere medir. Si este primer paso es deficiente o poco claro la calidad de un estudio se tambalea. (9-11) La meta fundamental que todo estudio epidemiológico debe perseguir es la agudeza en la medición. Por ello, que todo lo que amenace esta correcta medición debe ser identificado y corregido. Los elementos que amenazan estas mediciones son: El Error Aleatorio y el Error Sistemático. La carencia de error aleatorio se conoce como precisión y se corresponde con la reducción del error debido al azar. Para reducir este error el elemento más importante del que disponemos es incrementar el tamaño de la muestra y con ello aumentamos la precisión. Los intervalos de confianza y el error estándar se reducen al aumentar el tamaño muestral. Es por tanto necesario desde un principio preocuparse por el tamaño muestral del estudio que vamos a realizar definiendo la precisión y la seguridad del mismo. La precisión también se puede mejorar modificando el diseño del estudio para aumentar la eficiencia de la información que obtengo de los sujetos del estudio. La carencia del error sistemático se conoce como validez. Esta validez tiene dos componentes: La validez interna, que es la validez de las inferencias a los sujetos reales del 95 estudio y la validez externa o generalización en tanto se aplica a individuos que están fuera de la población del estudio. La validez interna es por tanto un prerrequisito para que pueda darse la extrema. La validez interna que es la que implica validez de inferencia para los propios sujetos de estudio. Se ve amenazada por varios tipos de sesgos. Entendemos por sesgos los errores sistemáticos en un estudio epidemiológico que producen una estimación incorrecta de asociación entre la exposición y la enfermedad. En definitiva producen una estimación equivocada del efecto. Cuando realizamos un estudio o interpretamos los resultados del mismo nos podemos preguntar: ¿Podrían los resultados deberse a algo que los autores no han tenido en consideración?, como por ejemplo: a. Los grupos del estudio no son comparables debido a como fueron seleccionados los pacientes (sesgos en la selección). b. Los grupos de pacientes del estudio no son comparables debido a como se obtuvieron los datos (sesgos en la información). c. Los autores no han recogido información (o la han obtenido pero no la han utilizado) sobre un factor que se relaciona a la vez con la exposición y con el efecto estudiados (factor de confusión). Los principales sesgos que comentaremos son los sesgos de selección, observación e información. SESGO DE SELECCIÓN Este sesgo hace referencia a cualquier error que se deriva del proceso de identificación de la población a estudiar. La distorsión resulta de la forma en que los sujetos han sido seleccionados. Estos sesgos se pueden cometer: Al seleccionar el grupo control. Al seleccionar el espacio muestral donde se realizará el estudio. Por pérdidas en el seguimiento. Por la presencia de una supervivencia selectiva. Los sesgos de selección pueden presentarse también en los estudios de casos y controles, cuando el procedimiento utilizado para identificar el status de enfermedad (sesgo diagnóstico) varía o se modifica con el status exposición. Este sesgo se llama "sesgo de detección". Los sesgos de selección son un problema fundamental en los estudios de casos y controles y en los estudios de cohortes retrospectivos donde la exposición y el resultado final ya han ocurrido en el momento que los individuos son seleccionados para el estudio. Los sesgos de selección son poco probables en los estudios de cohortes prospectivos porque la exposición se determina antes de la presencia de enfermedad de interés. En todos los casos, cuando el sesgo de selección ocurre, el resultado produce una relación entre exposición y enfermedad que es diferente entre los individuos que entraron en el estudio que entre los que pudiendo haber sido elegidos para participar, no fueron elegidos. 96 La evitación de los sesgos de selección depende en gran medida de que el investigador conozca las fuentes de sesgo potenciales. En los estudios de casos y controles para evitar sesgos de selección, se recomienda al menos teóricamente, ya que desde el punto de vista práctico es muy costoso, utilizar dos grupos control. Uno de ellos una muestra poblacional, lo que posibilita el detectar el posible sesgo de selección al hacer estimaciones del efecto por separado. Si obtenemos la misma estimación del efecto en los controles poblacionales que con los otros controles podremos asumir que no hay sesgos en la selección de los mismos. A pesar de todo siempre existe la posibilidad remota de que las dos estimaciones tuviesen el mismo grado de sesgo. Otra recomendación es utilizar muchas patologías como grupo control en lugar de pocas patologías y comprobar que las frecuencias de exposición son similares entre los diferentes grupos diagnosticados en los controles. En los estudios de seguimiento se debe asegurar un seguimiento completo en ambos grupos. SESGO DE INFORMACIÓN U OBSERVACIÓN. Este sesgo incluye cualquier error sistemático en la medida de información sobre la exposición a estudiar o los resultados. Los sesgos de observación o información se derivan de las diferencias sistemáticas en las que los datos sobre exposición o resultado final, se obtienen de los diferentes grupos. El rehusar o no responder en un estudio puede introducir sesgos si la tasa de respuesta está relacionada con el status de exposición. El sesgo de información es por tanto una distorsión en la estimación del efecto por errores de medición en la exposición o enfermedad o en la clasificación errónea de los sujetos. Las fuentes de sesgo de información más frecuentes son: a. Instrumento de medida no adecuado. b. Criterios diagnósticos incorrectos. c. Omisiones. d. Imprecisiones en la información. e. Errores en la clasificación. f. Errores introducidos por los cuestionarios o las encuestadoras. Los errores de clasificación son una consecuencia directa del sesgo de información. Esta clasificación puede ser "diferencial" si el error de clasificación es independiente para ambos grupos o "no diferencial" si el error de clasificación es igual para ambos grupos de estudio, produciéndose una dilución del efecto con una subestimación del mismo. Los encuestadores pueden introducir errores de clasificación "diferencial" si conocen las hipótesis del estudio y la condición del entrevistado. Este tipo de problema se puede controlar por medio de: a. Desconocimiento del entrevistado. b. Desconocimiento de las hipótesis de estudio. c. Utilización de cuestionarios estructurados. d. Tiempos de ejecución de la entrevista definitiva. e. Utilización de pocos entrevistadores. 97 La prevención y control de sesgos potenciales debe prevenirse durante el diseño del estudio ya que en el análisis no va a ser posible solucionar los sesgos de selección e información. Por el contrario los factores de confusión sí pueden ser controlados en el análisis. Dichos factores de confusión van a producir una distorsión en la estimación del efecto, en el sentido de que el efecto observado en a población en estudio es una mezcla de los efectos debidos a una tercera (o más) variables. Los sesgos, el azar y la presencia de variables confusoras deben finalmente siempre, tenerse en cuenta, como explicación posible de cualquier asociación estadística ya sea esta positiva, negativa o no existente; Y es que como señalaba M. Susser en sus reflexiones sobre causalidad "cuando hay minas por todas partes no debe uno aventurarse sin un detector de minas" (12). Bibliografía 1- MacMahon B., Trichopoulos D. Epidemiology: Principles and Methods. 2nd ed. Boston: Lippincott Williams & Wilkins; 1996. [editor] 2- Jenicek M., Cleroux R. Epidemiología: la lógica de la medicina moderna. Barcelona: Masson; 1996. 3- Armijo R.R. Epidemiología básica en Atención primaria de salud. Madrid: Díaz de Santos; 1993. 4- Rothman K.J. Epidemiología Moderna. Madrid: Ediciones Días de Santos; 1987. 5- Kelsey JL., Thompson WD., Evans AS. Methods in Observational Epidemiology. New York: Oxford University Press; 1986. [Amazon] 6- Hennekens CH., Buring JE. Epidemiology in Medicine Boston: Litte, Brown and Company; 1987. 7- Sackett DL., Haynes RB., Guyatt GH., Tugwell P. Epidemiología clínica. Ciencia básica para la medicina clínica. 2ª ed. Madrid: Editorial Médica Panamericana; 1994. 8- Fletcher RH., Fletcher SW., Wagner EH. Epidemiología clínica. 2ª ed. Barcelona: Masson-Williams & Wilkins; 1998. 9- Kleinbaum DG., Kupper LL., Morggenstern H. Epidemiologic Research. Principles and Quantitative Methods. Belmont, California: John Wiley & Sons; 1982. 10- Miettinem OS. Theoretical Epidemiology. New York: Jhon Wiley & Sons; 1985. 11- Rothman KJ. (ed). Causal Inference. Chesnut Hill: Epidemiology Resources Inc; 1988. 12- Susser M. Conceptos y estrategias en epidemiología. El pensamiento causal en ciencias de la salud. México: Biblioteca de la Salud; 1991. 98 CURSO DE METODOLOGÍA DE LA INVESTIGACIÓN PRACTICA No 12 SELECCIÓN DEL TIPO Y DISEÑO DE LA INVESTIGACIÓN I. OBJETIVOS: 1. Identificar los tipos de estudio, 2. Establecer el diseño correspondiente a la prueba de hipótesis, 3. Seleccionar el tipo de estudio y el diseño para la investigación propuesta. II. DOCUMENTOS DE REFERENCIA: 1. Pita Fernández, S. Epidemiología. Conceptos básicos. En: Tratado de Epidemiología Clínica. Madrid; DuPont Pharma, S.A.; Unidad de epidemiología Clínica, Departamento de Medicina y Psiquiatría. Universidad de Alicante: 1995. p. 25-47. (Actualizado 28/02/2001) 2. Comité Científico de la Investigación. Manual de procedimientos para la elaboración de trabajos de investigación. Complejo hospitalario Dr. A. Arias M. Panamá.2004. III. CONCEPTOS BÁSICOS “El investigador debe enunciar con claridad el tipo de estudio que realizará y una explicación detallada de su diseño. En este punto el investigador debe también enunciar las estratégicas y los mecanismos que va a poner en práctica para reducir o suprimir las amenazas a la validez de los resultados, o sea, los llamados factores confusores (en la selección y asignación de los sujetos, pérdida de casos, control de instrumentos, de los observadores, etc.)”. El tipo de estudio se relaciona con el tipo de hipótesis a probar con respecto a la relación entre las variables. Si la hipótesis se limita a describir las características de las variables se requiere un estudio de tipo descriptivo. Si la hipótesis plantea explicación o predicción en la relación entre las variables, requerimos un estudio de tipo analítico, lo que conlleva a una comparación de grupos o conjuntos. La tipificación de un estudio depende de cuatro aspectos: simple observación (observacional) vs. intervención controlada (experimental), descripción (descriptivo) vs. comparación de grupos (analítico), secuencia en el tiempo de las variables (longitudinal) vs. medición en un mismo lapso (transversal), ocurrencia de los hechos en el pasado (retrospectivo) vs. hechos por ocurrir (prospectivo). III. PROCEDIMIENTO: 1. Revise la(s) hipótesis de la investigación especificando la forma de medir las variables. 2. Establezca si para probar la hipótesis requiere realizar un procedimiento de intervención que los investigadores deban controlar (puede ser preventivo, diagnóstico, terapéutico o de rehabilitación). De ser así, se trata de un estudio de intervención. Si no lo requiere, estamos ante un estudio de observación… pase al punto 5. 3. Si el estudio es de intervención el diseño puede ser sin grupo de comparación o con grupo de comparación. Si no hay grupo de comparación, se requiere una medición inicial y, al menos, una medición posteriormente a la intervención. A este estudio, sin grupo de comparación corresponde un diseño de antes y después o pre-experimental. 4. Si el estudio requiere un grupo de comparación la selección de una intervención u otra (así sea simplemente un placebo), el estudio requiere establecer un procedimiento de asignación. Si la asignación se establece al azahar, estamos ante un experimento verdadero. Si es de tipo terapéutico, se trata de un Ensayo Clínico Aleatorizado (ECA) y su diseño, de acuerdo con el 99 conocimiento que tengan los participantes (investigados) o investigadores, será de tipo ciego o doble ciego. Si el estudio no es aleatorizado estamos haciendo un cuasiexperimento (estudio cuasiexperimental). 5. Los estudios sin intervención del investigador son estudios de Observación. Cuando no hay grupos de comparación estamos ante un estudio de casos o un estudio ecológico. El estudio de casos describe uno o varios casos con alguna característica común (generalmente una enfermedad o un trastorno). El estudio ecológico (es un estudio epidemiológico) describe un conjunto o una colectividad sin hacer atribuciones individuales. Estos son los usualmente llamados estudios descriptivos. Cuando se busca medir las características de una población, ya sea a través de un Censo o de una muestra representativa de la misma, estamos ante un estudio de prevalencia simple. 6. Los estudios sin intervención manipulada por el investigador en los cuales se hacen comparaciones entre grupos han sido denominados por los epidemiólogos como analíticos. Estos comprenden, hoy día, estudios de prevalencia híbrido (o analítico), estudios de casos y controles y estudios de cohortes. 7. En los estudios de prevalencia híbridos se requiere considerara la separación de casos y no casos para su comparación por lo que implica un cálculo de muestra para comparar dos proporciones. En este estudio interesa la prevalencia tanto de la enfermedad como del Factor de Riesgo, las cuales se identifican simultáneamente. La muestra debe ser representativa de la población blanco. Por naturaleza son estudios transversales. 8. Los estudios de casos y controles requieren la comparación de un grupo de enfermos (o con el efecto) vs un grupo sin la enfermedad en estudio (o sin el efecto). En ambos grupos se busca la presencia o ausencia anterior del Factor de Riesgo que se supone causa el efecto. Se trata por naturaleza de un estudio retrospectivo en el tiempo. 9. Los estudios de cohortes comparan un grupo con el Factor de Riesgo vs un grupo sin el factor de riesgo, a los cuales se les da seguimiento (Follow-up) por un tiempo determinado para establecer si se presenta o no la enfermedad o el efecto. Son por naturaleza prospectivos pero, en casos históricos, puede hacerse retrospectivamente (no concurrentes). 10. La otra característica del tipo de estudio está ligada a la ocurrencia de los hechos en el tiempo. Si los hechos que estamos midiendo ya han ocurrido, el estudio es retrospectivo, tal como señalamos para los estudios de casos y controles. Un estudio de casos puede ser retrospectivo (como se hace mediante la revisión de expedientes) o prospectivo, como ocurre en los estudios de vigilancia epidemiológica. En efecto, si los hechos no han ocurrido, como generalmente vemos en los estudios de cohortes, estamos ante un estudio prospectivo. Los estudios de intervención, son, por defecto, prospectivos, salvo que la intervención no haya sido controlada por el investigador, lo que en el concepto de algunos autores, se considera un experimento post-facto (Carlos Sabino, “El diseño de Investigación, capítulo 6, freeserfvers.com, 2004). 11. De acuerdo con la secuencia de las variables, el estudio puede ser Transversal o Longitudinal. En el transversal no hay relación de secuencia mientras que en el longitudinal sí la hay por lo que requiere mediciones en tiempos diferentes, aunque ya haya ocurrido los hechos. 100 CURSO DE METODOLOGÍA DE LA INVESTIGACIÓN PRACTICA No 13 LA DEFINICIÓN OPERACIONAL DE LAS VARIABLES I. OBJETIVOS: 1. Definir las variables conceptualmente 2. Elaborar una definición operacional que permita medirlas II. CONSIDERACIONES CONCEPTUALES Del planteamiento de la hipótesis se derivan las variables de la investigación las cuales podemos diferenciar en dependiente(s) e independiente(s). Es necesario concluir, como corolario del marco teórico, cuál es el concepto fundamental de cada una de las variables que han sido consideradas en la investigación. Se entiende por variable "una entidad abstracta que adquiere distintos valores, se refiere a una cualidad, propiedad o características de personas o cosas en estudio y varía de un sujeto a otro o en un mismo sujeto en diferentes momentos" (Pineda, 1994 pág. 60). La definición operacional va dirigida a la medición de la variable de manera que en la misma se debe indicar su indicador si es necesario, sus categorías y los valores correspondientes. Los valores de las variables se expresan en datos, los cuales pueden ser continuos o discontinuos de acuerdo con la escala de medición que se utilice. Los datos continuos corresponden a un valor numérico real con respecto a otro y pueden ser medidos a nivel de razón o a nivel de intervalos. El nivel de razón es un número absoluto, mientras que el nivel de intervalo expresa un valor contenido en un rango del mismo, el cual puede ir desde el límite inferior hasta el superior. Los datos discretos corresponden a valores que expresan orden o cualidades de las variables denominándoseles respectivamente ordinales y nominales. En algunos casos se requiere establecer un indicador que exprese un valor relativo que señale las posibles categorías de la variable. Entonces, el proceso requiere este paso intermedio para identificar los datos necesarios para construir este indicador. El estado nutricional de un sujeto puede categorizarse mediante la relación entre el peso y la talla, constituyéndose la misma en el indicador (peso/talla2), también conocido como índice de Quetelet o Índice de Masa Corporal (IMC). Entonces, los datos lo constituyen el peso y la talla, cuyos valores corresponden a datos continuos. El índice, por su lado, genera datos nominales que permiten categorizaciones como obeso, sobrepeso, normal, bajo peso y desnutrido, de acuerdo con el percentil en que se ubique el valor relativo del indicador. Los datos continuos pueden ser transformados de nivel de razón o a nivel de intervalo, los cuales pueden ser expresados de manera discreta como valores nominales, sin embargo no puede transformarse los datos de manera inversa. Las variables pueden generar, a través de sus indicadores, subvariables, las cuales pueden ser tratadas como otras variables. III. PROCEDIMIENTO: 1. Cada una de las variables a considerar debe ser definida conceptualmente, fundamentándose en la revisión bibliográfica. 101 2. 3. 4. 5. 6. 7. 8. 9. Defina la(s) variable(s) dependiente(s). Ejemplo "La desnutrición es una deficiencia de nutrientes para el normal funcionamiento y desarrollo de un individuo de acuerdo con sus necesidades para la edad y el sexo". Defina la(s) variable(s) independiente(s).de la misma manera. Señale su naturaleza y la escala de medición Establezca, de ser necesario, el indicador de la variable Indique las categorías de la variable según la escala de medición establecida Señale los valores correspondientes a cada categoría. Qué instrumento, de ser necesario, utilizará para medir los valores de la variable? Elabore la definición operacional de manera que nos permita identificar su indicador, las categorías y sus valores. Ejemplo de definición operacional de una variable y sus características Nombre Definición de la conceptual variable Nivel de ingreso Nivel con económico relación a la satisfacció n de las necesidade s básicas Sexo Estado Nutricional Indicador Categorías Relación entre el ingreso familiar y el número de miembros de la familia NI= ingreso familiar / N° de miembros Pobreza extrema Valores Ingreso per cápita <50 al mes Ingreso per Pobreza cápita < 75 al mes Ingreso per No pobreza cápita > 75 al mes Masculino Masculino Condición orgánica que determina el género. Fenotipo Equilibrio entre la ingesta de alimentos y el consumo de energía necesario para mantener las funciones del organismo Indice de Bajo Peso masa coporal Normal IMC = Peso (Kg) / Sobrepeso 2 2 Talla (m) Femenino Obesidad Femenino Definición operacional Ingreso familiar per cápita de acuerdo con la satisfacción de la canasta básica familiar estableciendo las categorías pobreza extrema (<50), pobreza (50-<75) y no pobreza (>75) Condición orgánica que determina el género. Masculino o femenino < 18.5 2 Kg/m Equilibrio de ingesta vs 18.5 – 24.9 consumo de energía según IMC: < 18.5 Kg/m2 Bajo Kg/m2 peso, 18.5 – 24.9 Kg/m2 25 – 29.9 Normal, 25 – 29.9 Kg/m2 Kg/m2 Sobrepeso, > 30 Kg/m2 2 > 30 Kg/m Obesidad. 102 CURSO DE METODOLOGÍA DE LA INVESTIGACIÓN PRACTICA No 14 CRITERIOS DE INCLUSIÓN Y EXCLUSIÓN Especifica los criterios de inclusión y exclusión Identifica aparatos y procedimientos con detalle I. OBJETIVOS: Establecer los criterios de inclusión y exclusión de los sujetos II. DOCUMENTO DE REFERENCIA: 1. Smith PG, Morrow RH. Ensayos de campo de intervenciones en salud en países en desarrollo. 2ª edición. Washington: OPS, 1998:27-28. III. PROCEDIMIENTO: Una vez determinado el tamaño de la muestra debemos especificar los requisitos de los sujetos para ser incluidos en el estudio. Estos requisitos corresponden a los criterios de inclusión y de exclusión de los sujetos de la investigación. Los estudios poblacionales no requieren otros criterios diferentes de los que determinan la(s) hipótesis de la investigación. En estos casos, al menos que se determine previamente que el estudio se hará en determinado grupo de edad y sexo, el criterio de inclusión y exclusión estará determinado por la procedencia de los sujetos. Los estudios analíticos comparan grupos por lo que se requiere establecer los requisitos de cada grupo, de tal manera que no se produzca errores en la comparación durante el análisis. 1. Considere el tipo y diseño de estudio establecido para la investigación. 2. Si el estudio es descriptivo, señale si hay algún requisito que cumplir para ser incluido en el mismo, como por ejemplo, vivir en la localidad desde al menos 3 meses. 3. Si el estudio es analítico considere la fuente de los sujetos. 4. En casos y controles , los casos son los que presentan el efecto ( enfermedad, complicación o consecuencia) y los controles los que no lo presentan. Los mejores controles son sujetos sanos, sin embargo, puede seleccionarse pacientes con otra enfermedad siempre que sus factores de riesgo no sean los mismos según la revisión de la literatura. 5. En los estudios de cohortes los criterios de inclusión en cada grupo corresponden en primer lugar a la exposición y a la no exposición al factor de riesgo en estudio. Además deben establecerse otras características que se haya determinado previamente. 6. En los estudios experimentales, los grupos han de ser lo más semejante posibles, procurando que la variable diferente sea la intervención. 103 TEMA No 15 EL UNIVERSO Y LA MUESTRA OBJETIVO GENERAL: Describir el universo plantear la muestra OBJETIVOS OPERACIONALES 1. Diferenciar los tipos de hipótesis a comprobar. 2. Calcular el tamaño de la muestra para estimar parámetros 3. Calcular el tamaño de la muestra para INFORMACIÓN contrastar hipótesis. CONTENIDO 1. Tipos de situaciones 2. Estimación de parámetros 3. Contraste de hipótesis Determinación del tamaño muestral Pita Fernández S. Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A Coruña CAD ATEN PRIMARIA 1996; 3: 138-14. Todo estudio epidemiológico lleva implícito en la fase de diseño la determinación del tamaño muestral necesario para la ejecución del mismo (1-4). El no realizar dicho proceso, puede llevarnos a dos situaciones diferentes: primera que realicemos el estudio sin el número adecuado de pacientes, con lo cual no podremos ser precisos al estimar los parámetros y además no encontraremos diferencias significativas cuando en la realidad sí existen. La segunda situación es que podríamos estudiar un número innecesario de pacientes, lo cual lleva implícito no solo la pérdida de tiempo e incremento de recursos innecesarios sino que además la calidad del estudio, dado dicho incremento, puede verse afectada en sentido negativo. Para determinar el tamaño muestral de un estudio, debemos considerar diferentes situaciones (5-7) : A. Estudios para determinar parámetros. Es decir pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra (Tabla 1). B. Estudios para contraste de hipótesis. Es decir pretendemos comparar si las medias o las proporciones de las muestras son diferentes. 104 Tabla 1. Elementos de la Inferencia Estadística A. Estudios para determinar parámetros Con estos estudios pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra. A.1. Estimar una proporción: Si deseamos estimar una proporción, debemos saber: a) El nivel de confianza o seguridad (1(Z ). Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58. b) La precisión que deseamos para nuestro estudio. c) Una idea del valor aproximado del parámetro que queremos medir (en este caso una proporción). Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha información utilizaremos el valor p = 0.5 (50%). Ejemplo: ¿A cuantas personas tendríamos que estudiar para conocer la prevalencia de diabetes? Seguridad = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0,5 (50%) que maximiza el tamaño muestral: donde: 2 = 1.962 (ya que la seguridad es del 95%) Z p = proporción esperada (en este caso 5% = 0.05) q = 1 – p (en este caso 1 – 0.05 = 0.95) d = precisión (en este caso deseamos un 3%) 105 Si la población es finita, es decir conocemos el total de la población y deseásemos saber cuántos del total tendremos que estudiar la respuesta seria: donde: N = Total de la población Z p = proporción esperada (en este caso 5% = 0.05) q = 1 – p (en este caso 1-0.05 = 0.95) d = precisión (en este caso deseamos un 3%). 2 = 1.962 (si la seguridad es del 95%) ¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes? Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral. Según diferentes seguridades el coeficiente de Z varía, así: Si la seguridad Z fuese del 90% el coeficiente sería 1.645 Si la seguridad Z fuese del 95% el coeficiente sería 1.96 Si la seguridad Z fuese del 97.5% el coeficiente sería 2.24 Si la seguridad Z fuese del 99% el coeficiente sería 2.576 A.2. Estimar una media: Si deseamos estimar una media: debemos saber: a. El nivel de confianza o seguridad (1lugar a un coeficiente (Z ). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58. b. La precisión con que se desea estimar el parámetro (2 intervalo de confianza). * d es la amplitud del c. Una idea de la varianza S2 de la distribución de la variable cuantitativa que se supone existe en la población. 106 Ejemplo: Si deseamos conocer la media de la glucemia basal de una población, con una seguridad del 95 % y una precisión de bibliográfica que la varianza es de 250 mg/dl Si la población es finita, como previamente se señaló, es decir conocemos el total de la población y desearíamos saber cuantos del total tendríamos que estudiar, la respuesta sería: B. Estudios para contraste de hipótesis: Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes. Habitualmente el investigador pretende comparar dos tratamientos. Para el cálculo del tamaño muestral se precisa conocer: a. Magnitud de la diferencia a detectar que tenga interés clínicamente relevante. Se pueden comparar dos proporciones o dos medias. b. Tener una idea aproximada de los parámetros de la variable que se estudia (bibliografía, estudios previos). c. Seguridad del estudio (riesgo de cometer un error d. Poder estadístico (1 e. Definir si la hipótesis va a ser unilateral o bilateral. Bilateral: Cualquiera de los dos parámetros a comparar (medias o proporciones) puede ser mayor o menor que el otro. No se establece dirección. Unilateral: Cuando se considera que uno de los parámetros debe ser mayor que el otro, indicando por tanto una dirección de las diferencias. La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de cometer un error de tipo I (rechazar la H0 cuando en realidad es verdadera). 107 B.1. Comparación de dos proporciones: Donde: n = sujetos necesarios en cada una de las muestras Z = Valor Z correspondiente al riesgo deseado Z = Valor Z correspondiente al riesgo deseado p1 = Valor de la proporción en el grupo de referencia, placebo, control o tratamiento habitual. p2 = Valor de la proporción en el grupo del nuevo tratamiento, intervención o técnica. p = Media de las dos proporciones p1 y p2 Los valores Z según la seguridad y Z según el poder se indican en la Tabla 2 (8) . B.2. Comparación de dos medias: Donde: n = sujetos necesarios en cada una de las muestras Z = Valor Z correspondiente al riesgo deseado Z = Valor Z correspondiente al riesgo deseado S2 = Varianza de la variable cuantitativa que tiene el grupo control o de referencia. d = Valor mínimo de la diferencia que se desea detectar (datos cuantitativos) Los valores Z según la seguridad y Z según el poder se indican en la Tabla 2 Tabla 2. Valores de Z y Z más frecuentemente utilizados Z 0.200 Test unilateral Test bilateral 0.842 1.282 (8) . 108 0.150 0.100 0.050 0.025 0.010 1.036 1.282 1.645 1.960 2.326 1.440 1.645 1.960 2.240 2.576 Potencia 0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 (1- Z 0.99 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 2.326 1.645 1.282 1.036 0.842 0.674 0.524 0.385 0.253 0.126 0.000 Ejemplo de comparación de dos medias: Deseamos utilizar un nuevo fármaco antidiabético y consideramos que seria clínicamente eficaz si lograse un descenso de 15 mg/dl respecto al tto. Habitual con el antidiabético estándar. Por estudios previos sabemos que la desviación típica de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Aceptamos un riesgo de 0.05 y deseamos un poder estadístico de 90% para detectar diferencias si es que existen. precisamos 20 pacientes en cada grupo. Ejemplo de comparación de dos proporciones: Deseamos evaluar si el Tratamiento T2 es mejor que el tratamiento T1 para el alivio del dolor para lo que diseñamos un ensayo clínico. Sabemos por datos previos que la eficacia del fármaco habitual está alrededor del 70% y consideramos clínicamente relevante si el nuevo fármaco alivia el dolor en un 90%. Nuestro nivel de riesgo lo fijamos en 0.05 y deseamos un poder estadístico de un 80%. 109 n = 48 pacientes. En cada grupo precisamos 48 pacientes. El tamaño muestral ajustado a las pérdidas: En todos los estudios es preciso estimar las posibles perdidas de pacientes por razones diversas (pérdida de información, abandono, no respuesta….) por lo que se debe incrementar el tamaño muestral respecto a dichas pérdidas. El tamaño muestral ajustado a las pérdidas se puede calcular: Muestra ajustada a las pérdidas = n (1 / 1–R) n = número de sujetos sin pérdidas R = proporción esperada de pérdidas Así por ejemplo si en el estudio anterior esperamos tener un 15% de pérdidas el tamaño muestral necesario seria: 48 (1 / 1-0.15) = 56 pacientes en cada grupo. Bibliografía 1 - Contandriopoulos AP, Champagne F, Potvin L, Denis JL, Boyle P. Preparar un proyecto de investigación. Barcelona: SG Editores ; 1991. 2 - Hulley SB, Cummings SR. Diseño de la investigación clínica. Un enfoque epidemiológico. Barcelona: Doyma; 1993. 3 – Cook TD., Campbell DT. Quasi-Experimentation. Design & Analysis Issues for Field Settings. Boston: Houghton Mifflin Company; 1979. 4 - Kleinbaum DG., Kupper LL., Morgenstern H. Epidemiologic Research. Principles and Quantitative Methods. Belmont, California: Lifetime Learning Publications. Wadsworth; 1982. 5 – Dawson-Saunders B, Trapp RG. Bioestadística Médica . 2ª ed. México: Editorial el Manual Moderno; 1996. 6 – Milton JS, Tsokos JO. Estadística para biología y ciencias de la salud. Madrid: Interamericana McGraw Hill; 2001. 7 - Martín Andrés A, Luna del Castillo JD. Bioestadística para las ciencias de la salud. 4ª ed. Madrid: NORMA; 1993. 8 – Argimón Pallas J.M., Jiménez Villa J. Métodos de investigación aplicados a la atención primaria de salud. 2ª ed. Barcelona: Mosby-Doyma; 1994. 110 CURSO DE METODOLOGÍA DE LA INVESTIGACIÓN PRACTICA No 15 DEFINICIÓN DEL UNIVERSO Y LA MUESTRA I. OBJETIVOS: 1. Establecer la población de referencia del estudio 2. Estimar el tamaño de la muestra. II. DOCUMENTOS DE REFERENCIA: 1. Pita Fernández S. Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A Coruña. CAD ATEN PRIMARIA 1996; 3: 138-14. 2. Pértigas Diaz, S., Pita Fernández, S. Cálculo de tamaño muestral en estudios de casos y controles. Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A Coruña, España, 2002. 3. Pértigas Diaz, S. Pita Fernández, S. Cálculo de tamaño muestral para la determinación de factores pronósticos. Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A Coruña, España, 2002 III. PROCEDIMIENTO: El Universo corresponde al conjunto o población de donde proceden los sujetos del estudio, el cual puede tratarse de la población de una división política administrativa, una localidad, o un grupo de individuos que acude a un sitio de atención en un período determinado. El universo es más amplio en los estudios descriptivos y más específico en los analíticos. La muestra es un conjunto extraído del universo que preferiblemente es representativo del mismo aunque no siempre es posible. El muestreo o forma de tomar la muestra determina la representatividad de la muestra con respecto al universo. La muestra puede o no ser aleatoria (tomada al azahar) y por consiguiente representativa o no. Por conveniencia o por dificultad, la muestra puede no ser representativa, pero en todo caso se requiere determinar el tamaño mínimo de la muestra para poder aplicar las pruebas estadísticas que rechacen o acepten la hipótesis. En estudios experimentales, la muestra puede ser correspondiente al universo de estudio, el cual depende de los casos o pacientes disponibles para la investigación, aún así, podemos referirnos a una población de referencia, de donde proceden estos pacientes. 7. Especifique el Universo o, al menos, la población de referencia. 8. Determine el tamaño de la muestra, lo cual depende del tamaño del universo y la prefijación de los valores de alfa y beta para los errores tipo I y II que se esté dispuesto a tolerar, la prevalencia esperada de la variable dependiente, la variable independiente y la precisión del resultado esperado. 9. Utilice el programa Statcal del paquete EpiInfo 3.3.2. en español aplicando automáticamente la formula requerida según el tipo de estudio. También puede usar el programa Epidat. Cuando no se cuenta con estadísticos de estudios anteriores se puede aplicar los criterios de Fraenkel,J.R. & Wallen, N.E. (2000. How to design & evaluate Research in education Boston: McGraw Hill) y con los resultados preliminares ajustar el tamaño de la muestra. a) Estudios descriptivos: 100 unidades b) Estudios de correlación: 50 unidades c) Estudios analíticos (y experimentales): 30 unidades de cada grupo. 111 A continuación ofrecemos un conjunto de fórmulas para estimar el tamaño de la muestra según tipo de estudio utilizadas en los programas EpiInfo y Epidat. Tamaño de la muestra Proporción de una variable en una población n’= Z2 p(1-p) d2 n = n` 1+ ( n`/N) N= Población n`= muestra máxima n= tamaño ajustado de la muestra Z= nivel de confianza p= proporción esperada en la población d= precisión absoluta N= población total 112 Proporción o media de una Población cuando se conoce el tamaño de la Población n = NZ2PQ/ d2 (N-1) + Z2PQ n = NZ2S2/ d2 (N-1) + Z2 S2 Tamaño de la muestra Estudio comparativo de pruebas diagnósticas. Hipótesis sobre características de la nueva prueba n = (n para cada grupo) [( V(p1q1) Vp2(q2)]2 (p1 -p2)2 Za = 1.96 Zb = 0.842 cuando 1-b = 0.80 P es el promedio de P1 y P2 P1 = valor conocido de la sensibilidad, especificidad, valor predictivo, del valor de referencia P2 = valores que se esperan obtener de estos mismos indicadores q1 = 1-p1 q2 = 1-p2 113 Tamaño de la muestra Estudio comparativo de pruebas diagnósticas. Hipótesis sobre concordancia entre las dos pruebas 4pDis(1-pDis) Z 2 N = 1-a/2 (W)2 Za = 1.96 Dis = número de desacuerdo estimados entre las dos pruebas W = amplitud determinada de un intervalo de confianza Tamaño de la muestra Estudio de prevalencia analítico [ ] 2 (PQ) (1+1/k) (Z1-/2) + [(PEo)(QEo) + {(PEe)(QEe/k) (Z1--) no = (PEe – PEo)2 n = no + ne = no + kno n: tamaño total de la muestra no: número de sujetos de la muestra no expuestos ne: número de sujetos de la muestra expuestos k: cociente entre expuestos y no expuestos= ne/no PEe: prevalencia de la enfermedad en los sujetos expuestos PEo: prevalencia de la enfermedad en los sujetos no expuestos P= (PEo + kPEe)/(1+k) Q= 1-P Z1-/2= 1.96 cuando = 0.05 QEo= 1-PEo QEe= 1-PEe Z1--=1.28 si 1--=0.9; 0.84 si 1--=0.8 Rosner, 1995. Fundamentos de bioestadística. 4ta edición. Belmont: Duxbury Press. 114 Tamaño de la muestra Estudio de casos y controles [ Z- (2pq)] + Z- (p1q1) + (p0q0) ]2 no = (p1 – p0)2 p0: proporción de expuestos entre los controles p= (p1 + p0)/2 q= 1-p q1 = 1- p1 p1 = p0 R/ [1+ p0 (R-1)] Tamaño de la muestra Estudio de cohortes no = { Z- (2pq) + Z- (p1[1+ RR –p1) (1+ RR2) ]} p1 2 (1–RR)2 p1= incidencia de la enfermedad en los expuestos p2= incidencia de la enfermedad en los no expuestos p= p1 (1+ RR)/2 q= 1-p RR= p1 - p2 2 115 Tamaño de la muestra Estudio comparativo de dos proporciones 2()2(PP) n = (P1 -P2)2 (n para cada grupo) Za = 1.96 Zb = 1.282 cuando 1-b = 0.90 P es el promedio de P1 y P2 P1 = proporción estimada de un grupo P2 = proporción estimada del otro grupo