Estudios para determinar prevalencia

Anuncio
Dermatología Rev Mex 2005;49:91-93
Metodología de la investigación aplicada a la dermatología
Estudios para determinar prevalencia
María Luisa Peralta*
P
or su finalidad los estudios para determinar
prevalencia son descriptivos. Los estudios
descriptivos, de acuerdo con el número de
puntos en el tiempo en los cuales se
recolectan datos, pueden ser transversales o longitudinales. Son transversales cuando se toman datos de
un momento determinado (una medición) y su
finalidad es describir el nivel o estado de una o
diversas variables en un punto en el tiempo. Son
longitudinales cuando se efectúa seguimiento, es decir,
varias mediciones de la(s) misma(s) variable(s) en
momentos diferentes, con la finalidad de estudiar
cómo evolucionan o cambian a través del tiempo o si
existe relación entre ellas.
ESTUDIOS DE PREVALENCIA Y ASOCIACIÓN
CRUZADA
La prevalencia es la proporción de individuos que
poseen una característica particular en un momento
determinado, por definición son estudios transversales.
Cuando la población de interés es accesible en su
totalidad, por ejemplo, la prevalencia de
Corynebacterium sp en niños con queratosis plantar que
acuden a un determinado centro de atención
dermatológica, por ser poco frecuente, no es necesario
una muestra, simplemente se estudia toda la población.
Se requiere calcular el tamaño de una muestra cuando
estudiar a toda la población es poco práctico o costoso.
Así se obtienen los valores probables de las variables
*
Médica familiar y maestra en ciencias.
Correspondencia: Dra. María Luisa Peralta. Av. Vértiz 464, col.
Buenos Aires, CP 06780, México, DF.
E-mail: [email protected]
Dermatología Rev Mex Volumen 49, Núm. 2, marzo-abril, 2005
de interés de la población a partir de los valores
obtenidos en la muestra; a esto se le llama inferencia o
estimación estadística de la prevalencia. Para que la
estimación sea realmente representativa de la población
es indispensable que el muestreo sea al azar (forma de
pdf elaborado
seleccionar
a los
por
sujetos
medigraphic
de estudio). Requiere también
que se registre el número de no respuestas y las causas
de las mismas. Si es un porcentaje pequeño y sus
motivos no están relacionados con la variable de estudio
la validez de los resultados es mayor. Cuando sólo se
estima la prevalencia se le denomina estudio transversal
descriptivo y cuando, además, se explora la relación
entre dos o más variables se le llama transversal
analítico. El alcance de este diseño permite hacer
conclusiones acerca de la frecuencia probable de la(s)
variable(s) en la población de interés y si es analítico,
sospechar probables factores de riesgo. Los resultados
obtenidos son la base para estudios analíticos
posteriores.
Cuando se planea realizar un estudio de prevalencia debe conocerse perfectamente la variable
motivo del estudio, saber en qué otras poblaciones se
ha medido, de estas poblaciones qué características
son similares a la población que se pretende estudiar,
qué otras variables pueden influir en su manifestación
o son consecuencia de la variable en estudio, etc. Esto
tiene dos objetivos: el primero, establecer qué otras
variables es importante medir, ya que incluir variables
que no tengan utilidad clara para el motivo de estudio
sólo genera mayor gasto de tiempo, dinero y esfuerzo;
favorece que se complique el análisis y que los
resultados principales sean confusos. En segundo
lugar, que el cálculo del tamaño de muestra sea lo más
apegado posible a la realidad.
Para calcular el tamaño de muestra es necesario
revisar los siguientes conceptos: identificar la
naturaleza de la variable de interés, su escala de
medición, las medidas de resumen y dispersión y, en
91
Peralta ML
caso de duda, consultar los números anteriores de esta
serie. Si se tiene más de una variable de interés deberá
realizarse el cálculo para todas y utilizar el mayor
tamaño obtenido.
Con las mediciones efectuadas en la muestra se
obtiene el valor de la variable de interés, que puede
ser una media o una proporción; esto se conoce como
estimación puntual. Sin embargo, a partir del valor
observado en una única muestra no puede conocerse
con exactitud el verdadero valor en la población de
origen, es tan sólo una aproximación, pero puede
calcularse un intervalo de valores en el cual es muy
probable que se encuentre la estimación puntual real
de la población; a esto se le llama intervalo de
confianza. Para calcular el tamaño de muestra se
toman en cuenta la amplitud y el nivel de confianza de
este intervalo. Ambos valores se fijan en función de los
intereses del investigador, respetando ciertas normas.
La amplitud del intervalo se establece de acuerdo con
la magnitud de la precisión que desea obtenerse en la
estimación; a medida que el investigador requiera
mayor precisión tendrá que establecer un intervalo más
estrecho y, por lo tanto, aumentará el tamaño de
muestra. El nivel de confianza es la probabilidad de
que el valor real de la población se encuentre dentro
del intervalo de confianza. Por consenso se ha aceptado
como ideal un intervalo de confianza del 95% (IC95%),
lo cual quiere decir que hay 95% de probabilidad de
que la media o proporción real de la población se
encuentre dentro de los límites del intervalo calculado.
El investigador puede aumentar la confianza pero el
resultado será un mayor tamaño de muestra. Al 5%
complemento de la confianza se le denomina alfa y es
el riesgo que existe de que la prevalencia real de la
población se encuentre fuera del intervalo determinado
por la muestra, este 5% se traduce en una distribución
zeta de dos colas como 1.96.
Por último, será necesario determinar la
variabilidad de la variable de interés en la población.
En caso de variables cuantitativas es la variancia, si es
cualitativa la proporción que se supone existe en la
población. En la mayor parte de los casos este dato no
se conoce, pero puede obtenerse de poblaciones
similares, mediante revisión bibliográfica o, en última
instancia, tomar al azar 10 a 30 sujetos para medir la
variable y calcular su variación. A mayor variabilidad
92
o frecuencia de la variable, mayor tamaño de muestra
(ejemplos 1 y 2).
En los cálculos anteriores no se toma en cuenta el
tamaño de la población, se asume que es infinito.
Cuando se conoce el número total de sujetos de una
población de estudio puede hacerse una corrección,
para ajustar el número de sujetos necesarios en función
del tamaño de la población: n 2 = n 1/ [1+(n 1/N), donde
n 1 es el tamaño de muestra calculado para poblaciones
infinitas y N el tamaño de la población.
RESULTADOS Y ANÁLISIS ESTADÍSTICO
En la sección de resultados debe tenerse especial
pdf elaborado
por
cuidado
en que
semedigraphic
presenten en forma sistemática y
sin comentarios. Se inicia por describir las características generales de la muestra que se estudió, ya sea en
forma numérica, con medidas de resumen, en cuadros
o gráficas; un mismo resultado no debe presentarse
en más de una de estas tres formas. En seguida, el
resultado de la estimación motivo del estudio, el
porcentaje o promedio encontrado en la muestra con
su desviación estándar y sus intervalos de confianza.
Y, por último, si se hallaron relaciones entre los
resultados del análisis bivariado o multivariado.
Se describió otra variedad de estudios transversales
en la cual el objetivo no fue determinar la prevalencia,
sino comparar una o más variables de dos o más
grupos. Estos estudios se denominan transversales
comparativos y también son de tipo exploratorio. Su
muestreo es no probabilístico y, por lo regular, de casos
consecutivos. En este tipo de diseño lo esencial es
obtener grupos que sean comparables.
Entre los estudios descriptivos se encuentra el
reporte de casos, que puede ser transversal o
longitudinal. El primer caso consiste en la descripción
de las variables de interés de un grupo de personas
en un momento determinado. Un reporte longitudinal
de casos, también llamado seguimiento de cohorte,
describe la evolución de las variables de interés de un
grupo de personas que tienen una determinada
enfermedad en común. En ambos casos son los
estudios que tienen menor alcance, no permiten
determinar prevalencias, comparaciones y, mucho
menos, determinar eficacia e inocuidad de ningún
tratamiento. Sólo son informativos.
Dermatología Rev Mex Volumen 49, Núm. 2, marzo-abril, 2005
Estudios para determinar prevalencia
Ejemplo 1
Estimar la media de la concentración urinaria de
arsénico de los habitantes de un poblado en que se
sospecha contaminación del agua potable.
Como no se conoce la variabilidad en una situación
similar se efectuó determinación urinaria de arsénico
a 10 personas e hipotéticamente se obtuvieron, en
promedio, 100 µg/dL y desviación estándar de 70 µg/
dL.
La precisión deseada era de ± 30 µg/dL.
Fórmula para estimar una media
n=
Zα2 S2
e2
n=
(1.96)2(70)2
30 2
n = 21 personas
Resultados: el promedio y desviación estándar de
arsénico en los sujetos de la muestra fue de 150 ± 50
µg/dL (IC95% 127-173).
Interpretación: con 95% de probabilidad la
concentración promedio de arsénico en orina de los
habitantes de esa población se encontró entre 127 y 173
µg/dL. Para calcular el tamaño de la muestra se utilizó
una desviación estándar mayor a la que en realidad se
encontró, lo cual quiere decir que la variación de las
concentraciones de arsénico en la población es menor a
la que se sospechó y ocasiona que la estimación tenga
mayor precisión (para el cálculo se utilizó precisión de
± 30 µg/dL y el intervalo de confianza obtenido con la
muestra fue de ± 23 µg/dL).
Ejemplo 2
Determinar la prevalencia de dermatitis atópica en
lactantes hijos de mujeres con trabajo remunerado.
La prevalencia de dermatitis atópica en la infancia
reportada en la bibliografía va del 5 al 20%, aunque se
supone que entre los niños hijos de madres
trabajadoras podría ser mayor, por lo que se utilizará
30% como prevalencia probable. En la fórmula se saca
Dermatología Rev Mex Volumen 49, Núm. 2, marzo-abril, 2005
su complemento 30-100 = 70, donde p es la prevalencia
probable y q es su complemento en su forma decimal.
Se desea precisión de ± 5%, que en decimales es 0.05.
Fórmula para estimar una proporción
n=
Zα2 p(q)
e2
n=
(1.96)2 (0.30)(0.70)
(0.05)2
n = 323 pacientes
En el programa Epi Info se ingresa en statcalc el
tamaño de muestra y los estudios de población. Solicita
cuatro datos, el primero es el tamaño de la población,
si se conoce se anota y se efectúa el cálculo con ajuste
pdf
elaborado finita,
por medigraphic
de población
si no se conoce no se llena ese
campo. El segundo dato es la prevalencia que se
sospecha en la población (variabilidad); si no se conoce
se deja 50%, que dará el máximo tamaño de muestra
necesario. El tercero es el error máximo aceptable en la
estimación, es decir, la precisión. Por último se
selecciona el nivel de confianza deseado. En el caso del
ejemplo 2 no se llena el tamaño de población, enexpected
frequency se anota la prevalencia probable en el ejemplo
30.0; worst acceptable corresponde a la precisión, como
se estipuló del 5%, y esto se le resta a la prevalencia
probable, por lo tanto sería 25.0. El resultado se busca
en la confianza, que corresponde a 95%.
Resultados: la prevalencia de dermatitis atópica en
los sujetos de la muestra fue de 25% (IC95% 20-30%).
Interpretación: con probabilidad de 95% la
prevalencia de dermatitis atópica en lactantes hijos de
mujeres con trabajo remunerado se encuentra entre
20 y 30%.
BIBLIOGRAFÍA
1.
2.
Clayton D, Hills M. Statistical models in epidemiology. Oxford:
Oxford University Press, 1993.
McNeil D. Epidemiological research methods. New York: John
Wiley & Sons, 1999.
93
Descargar