Investigaciones y Estadística.
Raúl Felipe Señor García.
Master en Informática en Salud.
Introducción
Los profesionales de las ciencias de la salud especialmente los que se
desempeñan en la atención primaria deben poseer como instrumentos de su
trabajo habitual, los fundamentos de la epidemiología y la estadística. Su
conocimiento permitirá confeccionar y valorar proyectos de investigación y
redactar o evaluar artículos para ser publicados.
Los términos estadísticos se encuentran con frecuencia en la literatura médica. En
la medicina se aplica cada vez más el paradigma cuantitativo y permitirá
interpretar las publicaciones de las ciencias de la salud, con pensamiento crítico
para detectar errores e incongruencias. Será útil también para tomar decisiones
correctas acerca de procedimientos para el diagnóstico y del resultado de las
pruebas complementarias e intervenciones 1,2.
Se pretende que el lector se familiarice con elementos estadísticos que los
ayudarán a describir y analizar los datos obtenidos en el proceso de investigación.
Es imprescindible conocer los términos e identificar las posibilidades de realizar
análisis estadísticos con ayuda de profesionales de esta especialidad.
Población y muestra.
Cuando se realiza una investigación, generalmente se pretende generalizar
atribuir los resultados encontrados una muestra a una población. Se estudia en
particular a un reducido número de individuos a los que se tiene acceso para
generalizar los resultados a la población de la cual esa muestra procede. El
proceso de inferencia se efectúa utilizando procedimientos estadísticos basados
en la probabilidad.
La población, también llamada por otros, universo, es el conjunto de individuos
que se desea estudiar, un grupo homogéneo que reúne características
determinadas. Generalmente no es posible estudiar todos los individuos, por su
gran número, o no ser suficientes el tiempo y los recursos disponibles.
La muestra es el subconjunto de la población accesible y limitado constituido por
individuos o unidades de observación sobre los que se realizan las mediciones.
La muestra debe ser representativa de la población, dicho de otra forma, cualquier
individuo de la población en estudio debe haber tenido la misma probabilidad de
ser elegido como integrante de la muestra.
1
Motivos para estudiar muestras en lugar de poblaciones se pueden señalar 3:
a. Estudiar menos individuos es evidente que lleva menos
tiempo.
b. Se requiere menor cantidad de recursos humanos materiales y
financieros.
c. El estudio de la totalidad de personas con una característica
determinada puede ser una tarea imposible de realizar.
d. Aumentar la calidad del estudio. Las mediciones realizadas
pueden ser más exactas y amplias.
Tipos de datos
Lo que se observa en cada integrante de la muestra son las variables (edad, sexo,
peso, talla, tensión arterial sistólica, entre otras). Los datos son los valores que
toma la variable en cada caso. Lo que se realizará es medir o asignar valores a
las variables a investigar. Se debe concretar la escala de medida de cada variable.
Al elegir el método estadístico apropiado para realizar el análisis, se clasificarán
las variables, en dos tipos: 3-5
a) Variables cuantitativas. Son las variables que pueden medirse, cuantificarse
o expresarse numéricamente. Las variables cuantitativas pueden ser de dos tipos:

Continuas: Si admiten tomar cualquier valor dentro de
un rango numérico determinado (edad, peso, talla).
 Discretas: Si no admiten todos los valores intermedios
en un rango. Suelen tomar solamente valores enteros
(número de hijos, número de partos, número de
hermanos).
b) Variables cualitativas. Este tipo de variables representan una cualidad o
atributo que clasifica a cada caso en una de varias categorías. La situación más
sencilla es aquella en la que se clasifica cada caso en uno de dos grupos
(hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotómicos o
binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificación no es
suficiente y se requiere de un mayor número de categorías (color de los ojos,
grupo sanguíneo, profesión). En el proceso de medición de estas variables, se
pueden utilizar dos escalas:

Escalas nominales: La forma de observar o medir, en
la que los datos se ajustan por categorías que no
mantienen una relación de orden entre sí (color de los
2
ojos, sexo, profesión, presencia o ausencia de un factor
de riesgo o enfermedad).
 Escalas ordinales: Existe un cierto orden o jerarquía
entre las categorías (grados de disnea, estadiaje de un
tumor).
Estadística descriptiva
Una vez recogidos los valores que toman las variables del estudio (datos), se
procederá al análisis descriptivo de los mismos.
Variables cuantitativas
Para variables cuantitativas, en las que puede haber un gran número de valores
observados distintos, se ha de optar por un método de análisis distinto,
respondiendo a las siguientes preguntas:
a. ¿Alrededor de qué valor se agrupan los datos?
b. Los datos agrupados alrededor de un número, ¿cómo lo
hacen? ¿muy concentrados? ¿muy dispersos?
a. Medidas de tendencia central
Responden a la primera pregunta.
- La media es la suma de todos los valores de una variable, dividida entre el
número observaciones de la variable realizadas. Constituye la medida más
evidente que podemos calcular para describir un conjunto de observaciones
numéricas es su valor medio.
Ejemplo; considere 10 pacientes de edades 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80
años. La media de edad de estos sujetos será de:
Si se denota (X1, X2,...,Xn) los n datos obtenidos de la variable en cuestión, el valor
medio estará dado por:
3
- La mediana es otra medida de tendencia central que se utiliza habitualmente.
Es la observación equidistante de los extremos. La mediana del ejemplo anterior
sería el valor que deja a la mitad de los datos por encima de dicho valor y a la otra
mitad por debajo. Es necesario ordenar los datos de mayor a menor, observamos
la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
En este ejemplo el número de observaciones es par (10 individuos), los dos
valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la
media de estos dos valores nos dará a su vez 60, que es el valor de la mediana.
Si la media y la mediana son iguales, la distribución de la variable es simétrica.
La media es muy sensible a la variación de las puntuaciones. La mediana no es
afectada por valores extremos.
- La moda es otra medida de tendencia central. No es tan utilizada como las
anteriores. Constituye el valor de la variable que presenta una mayor frecuencia.
En el ejemplo anterior el valor que más se repite es 60, que es la moda.
b. Medidas de dispersión
Otro aspecto a tener en cuenta al procesar datos continuos, son los valores de
dispersión de los mismos. Existen distintas formas de cuantificar esa variabilidad.
- La varianza (S2) es la media de los cuadrados de las diferencias entre cada
valor de la variable y la media aritmética de la distribución.
La varianza muestral se obtiene como la suma de las de las diferencias de
cuadrados y por tanto tiene como unidades de medida el cuadrado de las
unidades de medida en que se mide la variable estudiada.
En el ejemplo anterior la varianza sería:
Sx2=
4
- La desviación típica (S) es la raíz cuadrada de la varianza. Expresa la
dispersión de la distribución y se expresa en las mismas unidades de medida de la
variable. La desviación típica es la medida de dispersión más utilizada en
estadística.
La medida que se utiliza es:
El haber cambiado el denominador de n por n-1 está en relación al hecho de que
esta segunda fórmula es una estimación más precisa de la desviación estándar
verdadera de la población y posee las propiedades que se necesitan para realizar
inferencias a la población.
- La amplitud o rango es la diferencia entre el valor mayor y el menor de la
distribución. Cuando se quieren señalar valores extremos en una distribución de
datos, se suele utilizar la amplitud como medida de dispersión.
Ejemplo: Si utiliza los datos del ejemplo previo tendremos 80-15 =65.
Como medidas de variabilidad más importantes, conviene destacar las
características de la varianza y desviación típica:
1. Son indicadores que describen la variabilidad o dispersión y por tanto
cuando los datos están muy alejados de la media, el numerador de sus
fórmulas será grande y la varianza y la desviación típica lo serán.
2. Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación
típica. Para reducir a la mitad la desviación típica, es necesario multiplicar la
muestra por 4.
3. Cuando todos los datos de la distribución son iguales, la varianza y la
desviación típica son iguales a 0.
4. Para su cálculo se utilizan todos los datos de la distribución; por tanto,
cualquier cambio de valor será detectado.
- El coeficiente de variación (CV) es una medida de dispersión relativa de los
datos y se calcula dividiendo la desviación típica muestral entre la media y
multiplicando el cociente por 100. Su utilidad consiste en que permite comparar la
dispersión o variabilidad de dos o más grupos.
Ejemplo: Si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya
media es de 69,6 kg. y su desviación típica (s) = 10,44 y la TAS de los mismos
(150, 170, 135, 180 y 195 mmHg) cuya media es de 166 mmHg y su desviación
5
típica de 21,3. La pregunta sería: ¿qué distribución es más dispersa, el peso o la
tensión arterial?
Si comparamos las desviaciones típicas observamos que la desviación típica de la
tensión arterial es mucho mayor; sin embargo, no podemos comparar dos
variables que tienen escalas de medidas diferentes, por lo que calculamos los
coeficientes de variación:
CV de la variable peso =
CV de la variable TAS =
A la vista de los resultados, observamos que la variable peso tiene mayor
dispersión.
Cuando los datos se distribuyen de forma simétrica, se utilizan para describir esa
variable su media y desviación típica. En el caso de distribuciones asimétricas, la
mediana y la amplitud son medidas más adecuadas. En este caso, se suelen
utilizar además los cuartiles y percentiles.
Los cuartiles y percentiles son medidas de posición. El percentil es el valor de
la variable que indica el porcentaje de una distribución que es igual o menor a esa
cifra.
Ejemplo: El percentil 80 es el valor de la variable que es igual o deja por debajo de
sí al 80% del total de las puntuaciones. Los cuartiles son los valores de la variable
que dejan por debajo de sí el 25%, 50% y el 75% del total de las puntuaciones y
así tenemos por tanto el primer cuartil (Q1), el segundo (Q2) y el tercer cuartil
(Q3).
Variables cualitativas
Para variables cualitativas, se quiere conocer el número de casos en cada una de
las clases o categorías, expresándolo en una tabla de frecuencias y calculando el
porcentaje que representan del total.
- Frecuencia Absoluta es la medida más elemental de frecuencia de una
enfermedad, o de cualquier otro evento en general, es el número de personas que
la padecen o lo presentan, llamada también, (el número de pacientes con
hipertensión arterial, el número de fallecidos por accidentes de tráfico o el número
de pacientes con algún tipo de cáncer en los que se ha registrado una recidiva).
6
- Proporción es un cociente en el que el numerador está incluido en el
denominador.
Ejemplo: Si en una población de 25.000 habitantes se diagnostican 1.500
pacientes con diabetes, la proporción de diabetes en esa población es de
1.500/25.000 = 0.06 (6%). El valor de una proporción puede variar así de 0 a 1, y
suele expresarse como un porcentaje.
- Razón es el cociente en el que el numerador no forma parte del denominador, el
primero es la frecuencia con que ocurre un evento y el segundo, la frecuencia en
que éste no ocurre .
En el ejemplo anterior, la razón entre la población con diabetes y la población no
diabética es de 1.500/23.500 = 3/47 =0,064. Explicado de forma diferente, en el
área estudiada, por cada 16,7 pacientes no diabéticos hay 1 que sí lo es.
- Tasa: El concepto de tasa es similar al de una proporción, con la diferencia de
que las tasas llevan incorporado el concepto de tiempo. El numerador lo constituye
la frecuencia absoluta de casos del problema a estudiar, el denominador está
constituido por los sujetos susceptibles de la población a estudio. El resultado se
multiplica por potencias del 10 de acuerdo a la magnitud de la población. De su
cálculo se desprende la velocidad con que se produce el cambio de una situación
clínica a otra.
- Prevalencia (P) cuantifica la proporción de individuos de una población que
padecen una enfermedad en un momento o periodo de tiempo determinado. Su
cálculo se estima mediante la expresión:
Ejemplo: En una muestra de 270 habitantes aleatoriamente seleccionada de una
población de 65 y más años se objetivó que 111 presentaban obesidad (IMC³30).
En este caso, la prevalencia de obesidad en ese grupo de edad y en esa
población sería de:
Como todas las proporciones, la prevalencia no tiene dimensión y nunca toma
valores menores de 0 ó mayores de 1, siendo frecuente expresarla en términos de
porcentaje, en tanto por ciento, tanto por mil,... en función de la “rareza” de la
enfermedad estudiada. La prevalencia de un problema de salud en una comunidad
determinada suele estimarse a partir de estudios transversales para determinar su
importancia en un momento concreto, y no con fines predictivos.
7
- Incidencia 8 se define como el número de casos nuevos de una enfermedad que
se desarrollan en una población durante un período de tiempo determinado.
La incidencia proporciona una estimación de la probabilidad o el riesgo de que un
individuo libre de una determinada enfermedad, la desarrolle durante un período
especificado de tiempo. Como cualquier proporción, suele venir dada en términos
de porcentaje. Es imprescindible que se acompañe del periodo de observación
para poder ser interpretada.
Ejemplo: Durante un período de 6 años se siguió a 431 varones entre 40 y 59
años sanos, con colesterol sérico normal y tensión arterial normal, para detectar la
presencia de cardiopatía isquémica, registrándose al final del período l0 casos de
cardiopatía isquémica. La incidencia en este caso sería:
en seis años
Conclusiones
En este documento se revisaron los cálculos más utilizados en el procesamiento
estadístico, de tipo descriptivo, de los datos durante las investigaciones que se
realizan con mayor frecuencia en el nivel primario del sistema de salud.
¡Que les sea de utilidad!
Quedan pendientes para otro documento, la presentación de la información en
tablas o cuadros estadísticos y la representación gráfica. También se presentarán
próximamente algunos elementos de estadística inferencial de utilidad para los
profesionales de la salud.
8
Referencias bibliográficas.
1. Sackett, D.L., Haynes, R.B., Guyatt, G.H., Tugwell, P. Epidemiología clínica.
Ciencia básica para la medicina clínica. 2ª ed. Madrid : Médica Panamericana;
1994.
2. Fletcher RH., Fletcher SW., Wagner E.H. Epidemiología clínica. 2ª ed.
Barcelona: Masson, Williams & Wilkins; 1998.
3. Dawson-Saunders B, Trapp RG. Bioestadística Médica . 2ª ed. México: Editorial
el Manual Moderno; 1996.
4. Milton JS, Tsokos JO. Estadística para biología y ciencias de la salud. Madrid:
Interamericana McGraw Hill; 2001.
5. Martín Andrés A, Luna del Castillo JD. Bioestadística para las ciencias de la
salud. 4ª ed. Madrid: NORMA; 1993.
6. Bayarre Vea H. y Col. Libro de Texto Metodología de la Investigación en APS.
Tema 3. La Investigación en APS. Anexo 1: Perfil de Proyecto de Investigación.
Anexo 2: Guía para la evaluación de artículos. En CD para la formación a distancia
de los profesionales de la salud (primera versión) Cursos de Maestrías.
7. Jiménez Paneque R. Metodología de la Investigación. Elementos básicos para
la
investigación
clínica.
Ciencias
Médicas.
1998.
Disponible
en:
http://www.bvs.sld.cu Consultado el: 7 de enero de 2010
8.
Vice Rectoría de Investigaciones. ISCM-H. Guía para la elaboración de
proyectos de investigación.
9. Artiles Visbal L, Otero Iglesias J, Barrios Osuna I. Metodología de la
Investigación para las Ciencias de la Salud. Ciencias Médicas. 2007. Capítulo2.
Disponible en: http://www.bvs.sld.cu Consultado el: 7 de enero de 2010
10. Martínez Pérez R, Rodríguez Esponda E. Metodología de la Investigación.
Disponible en: http://www.cpicmha.sld.cu Consultado el: 7 de enero de 2010
11. Colectivo de autores. Informática Médica. Bioestadística. Tomo II. Ciencias
Médicas. Ciudad de la Habana.2004.
9
Descargar

Investigaciones y Estadística.

Matemáticas y Estadística

Matemáticas y Estadística

Media aritméticaVarianza de la SerieCuartilMedia GeométricaPercentilesGrado de AsimetríaDistribuciónDesviación media

Series de mediciones

Series de mediciones

Desviación estándarErrorMedia o promedio aritmético, mediana, modaTendencia centralDispersiónEstadísticaVarianzaDistribución

Estadística descriptiva

Estadística descriptiva

Desviación estándarMétodos estadísticosVarianzaMedidas de tendencia centralPromedio matemático y geométricoTabla dinámica

1 Ejercicios de Matemáticas. Distribuciones de probabilidad Distribución normal

1 Ejercicios de Matemáticas. Distribuciones de probabilidad Distribución normal

TemperaturaVarianza y desviación típicaTabla de distribuciónDuraciónPesoDistribución binomial