manual de estadística - Facultad de Odontología

Anuncio
UNIVERSIDAD DE BUENOS AIRES
CÁTEDRA DE BIOFÍSICA
FACULTAD DE ODONTOLOGÍA
MANUAL DE ESTADÍSTICA PRÁCTICA
para estudiantes y profesionales de la salud
Prof. Dr. JUAN PEDRO HECHT
Edición v.1.02 (Marzo 2008)
AÑO 2008
PROLOGO
La estadística es la matemática de la experimentación. Los experimentos son la base del
progreso de las ciencias naturales, a las cuales pertenecen las disciplinas vinculadas al
arte de curar. Este libro está dedicado especialmente a los profesionales (o futuros
profesionales) de las ciencias de la salud que necesiten cubrir su formación básica en
esta disciplina, pero también aporta lo suficiente como para capacitar con lo esencial al
investigador que desee complementar sus conocimientos específicos con la base
metodológica mínima de estadística aplicada. El objetivo de mínima es dar a conocer
los fundamentos de la estadística que permitan orientar al lector en el amplio abanico de
técnicas disponibles y permitirle consultar (llegado el caso) a la bibliografía específica o
pedir el asesoramiento de docentes e investigadores vinculados a la práctica de la
estadística.
Los experimentos se llevan a cabo con el objeto de contestar alguna pregunta o
preguntas en las cuales esté interesado el investigador, pero es raro que las respuestas a
esos interrogantes se puedan conocer antes de efectuarse un análisis estadístico
adecuado. Resulta que los resultados de los experimentos en ciencias naturales (física,
química y biología entre otras) normalmente son afectados por muchos factores ajenos a
los propios de interés, y en mayor o menor grado esos factores son desconocidos por el
investigador. Cada uno de esos múltiples factores suele influir los resultados en modo
reducido pero absolutamente impredecible y constituyen una fuente potencial y
continua de errores en la interpretación de los resultados. La situación sería difícil de
controlar si no existiese una herramienta que auxilie en el filtrado del “ruido” y la
potenciación de las reales “señales” buscadas por el investigador.
La estadística es la herramienta o la disciplina que se ocupa de describir en forma
racional y objetiva los sistemas sometidos al azar y que permite la toma de decisiones
con riesgo calculado en ambientes de incertidumbre. Los objetivos del análisis
estadístico son (1) reducir la complejidad de los datos obtenidos que normalmente
escaparían a la capacidad de comprensión del investigador y presentarlos como datos
elaborados en un formato accesible y objetivo y (2) estimar el significado y la
importancia de esos datos elaborados indicando adecuadamente la participación del azar
involucrado en los experimentos y permitiendo por ende tomar decisiones
independiente del mismo y fundamentadas sobre el comportamiento de los sistemas en
estudio.
La estadística no es buena ni mala, es simplemente una herramienta que mal usada
puede servir para engañar, vender, ocultar o dominar mediante la desinformación y
usada por inexpertos puede llevar a conclusiones tan falsas como complicadas. Bien
usada es una panacea que permite tomar decisiones fundamentadas y objetivas,
definiendo el progreso de todas las ciencias naturales. La estadística es uno de los
factores más importantes que ayudan al progreso en cirugía, en farmacología o en
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 2 -175
diagnóstico por imágenes. Si la medicina progresa con la velocidad con la cual lo hace,
lo es en gran parte gracias a que cada día, en cada experimento, desde un hospital, desde
el ignoto laboratorio de la Universidad o desde el centro de investigación y desarrollo
de las grandes compañías farmacéuticas, se emplea estadística para todo tipo de
investigación.
Para el desarrollo de los tópicos, se trató de respetar la rigurosidad del tratamiento
brindando todos los medios para que el lector pueda entender cada técnica y resolver
por analogía cualquiera de los modelos aquí presentados, ya sea en forma manual o para
validar los resultados que le brinden programas estadísticos de computación. Sin
embargo este libro, aunque bien intencionado, es forzosamente incompleto. Sólo se
pretende presentar lo clásico y fundamental, pero debe recordarse que la estadística es
dinámica y continuamente se desarrollan nuevas técnicas y ensayos. Además, cuando
requiera resolver temas específicos que no estén aquí cubiertos, recurra a la bibliografía
de nivel intermedio que recomendamos, y cuando fuese posible recurra al
asesoramiento y la guía de investigadores con experiencia.
Se dio un énfasis particular a la inclusión de ejemplos numéricos resueltos paso a paso
para cada ensayo o tema bajo estudio. El lector podrá reemplazar sus propios datos en
cada modelo y obtener los resultados correspondientes en forma autosuficiente.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 3 -175
COMO LEER ESTE MANUAL
Este libro sirve a un doble propósito: iniciar al lector en el criterio estadístico y servir
como libro de consulta por los detalles de algún ensayo en particular, cuando se
presente esa necesidad. Mas allá de lo que sucede con muchos libros de introducción a
la estadística, esta obra no quiere quedarse a mitad de camino sacrificando la
rigurosidad o los detalles en aras de una fácil (y a veces errada) comprensión
superficial.
Pero, la estadística es una parte de la matemática aplicada y por ende es una disciplina
que posee un formalismo a veces oscuro para el lector inadvertido y otras veces
exigente con algunos temas básicos del álgebra lineal, la combinatoria y el análisis
matemático. Obviamente no podemos ni pretendemos enseñar matemáticas para lograr
nuestro propósito, pero agregamos las aclaraciones del caso cuando recurramos a
técnicas matemáticas no habituales para los estudiantes y graduados de las ciencias
vinculadas a la salud. Además incluimos en la bibliografía libros de fácil lectura donde
el lector interesado podrá adquirir lo que le falte por auto capacitación.
Desde el punto de vista conceptual, este libro está claramente dividido en dos partes.
Los Capítulos I, II y V son eminentemente formativos y los Capítulos III y IV
informativos. Los primeros están dedicados a la formación de criterio estadístico y los
segundos a servir como base de consulta.
Además, en el texto se han intercalado “bloques formales” que requieren ciertos conocimientos previos de
matemáticas por parte del lector. Estos detalles pueden ser obviados en una primer lectura y ser consultados cuando
sea menester entrar en detalles. Estor “bloques” aparecen con letra chica, recuadrados y grisados como el presente
párrafo. No se preocupe por ellos si tiene dificultad en entenderlos, le serán útiles cuando decida profundizar el tema.
Por lo tanto, recomendamos especialmente a los alumnos de pregrado y posgrado de las
ciencias de la salud y que se recién se inician en estadística, a no dejarse llevar por los
detalles computacionales sino más bien intentar captar los fundamentos y la esencia del
criterio estadístico que se pretende enseñar.
No hay posibilidad de comprensión de ninguna disciplina sin el consabido esfuerzo por
parte del alumno o cursante. Deseamos haber sido útiles para facilitarles el camino.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 4 -175
TABLA DE SIMBOLOS Y ABREVIATURAS FRECUENTES
Nota: En este libro nos tomamos la libertad literaria de usar determinados vocablos de la estadística
como “test” y “standard” en su forma habitual y no traducida al español. Desde luego se trata de
una excepción y en general estos términos aparecerán en itálicas y entre comillas.
x, y, z Variables estadísticas
N, n Tamaño muestral (cantidad de observaciones individuales que contiene)
n
∑x
i =1
i
Sumatoria (suma) de las n observaciones individuales xi (donde 1 ≤ i ≤ n)
μ Media Poblacional
n
x Promedio muestral (=
∑x
i =1
i
)
n
σ 2 Varianza poblacional
n
s2 Varianza muestral ( =
∑x
i =1
2
i
n
− (∑ x i ) 2 / n
i =1
)
n −1
N(μ, σ) Distribución normal (promedio, desvío standard)
DS Desviación Standard muestral (=s)
ES Error Standard muestral (= s / n )
x−x
)
z Variable normalizada N(0,1) (=
s
t Estadístico de ensayo de la prueba t-Student
F Estadístico de ensayo de la prueba F-Snedecor (Fisher)
χ2 Estadístico de ensayo de la prueba ji-cuadrado
g.de l. Grados de libertad asociados a un estadístico de ensayo
H0, H1 Hipótesis estadísticas nula y alternativa
p
Probabilidad
α, β Error de Tipo I (nivel de significación), Error del Tipo II
ANOVA, ANCOVA Análisis de varianza, análisis de covarianza
SC (o SS), MC (o MS) Suma de cuadrados, Media cuadrada
ex, exp(x) Función exponencial base e=2,7182818284590452353602874713527+
log(x), ln(x) Función logaritmo decimal (base 10), Función logaritmo natural (base e)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 5 -175
INDICE GENERAL
PROLOGO............................................................................................................................ 2
COMO LEER ESTE MANUAL ............................................................................................. 4
TABLA DE SIMBOLOS Y ABREVIATURAS FRECUENTES............................................. 5
INDICE GENERAL ............................................................................................................... 6
CAPITULO 1: ESTADISTICA DESCRIPTIVA..................................................................... 9
1.1. ESTADÍSTICA BUENA Y ESTADISTICA MALA................................................10
1.2. DETERMINISMO Y AZAR..................................................................................11
1.3. NOCIONES ELEMENTALES DEL CALCULO DE PROBABILIDADES ............11
1.4. PROBABILIDADES COMPUESTAS: LEY DE LA SUMA Y DEL PRODUCTO DE
PROBABILIDADES ............................................................................................12
1.5. PROBABILIDAD CONDICIONAL .......................................................................13
1.6. DEFINICIÓN DE ESTADÍSTICA Y VARIABLES ESTADÍSTICAS ....................14
1.7. ESTADÍSTICA APLICADA A UNA MEDIDA INDIVIDUAL.................................14
1.8. ESTADÍSTICA APLICADA A UN GRAN NÚMERO DE MEDIDAS U
OBSERVACIONES INDIVIDUALES ..................................................................16
1.9. REPRESENTACIÓN ANALÍTICA Y GRÁFICA DE DATOS ESTADÍSTICOS
OBTENIDOS A PARTIR DE UN CONJUNTO DE OBSERVACIONES
INDIVIDUALES ...................................................................................................17
1.10. DISTRIBUCIONES ESTADISTICAS ..................................................................21
1.11. PARÁMETROS ESTADÍSTICOS .......................................................................22
1.12. DISTRIBUCIÓN NORMAL O DE GAUSS ..........................................................25
1.13. PRECISION Y EXACTITUD DE UNA SERIE DE MEDIDAS REPETIDAS Y LA
CORRECTA EXPRESIÓN DE LOS RESULTADOS EXPERIMENTALES........28
1.14. VALORES NORMALES EN MEDICINA.............................................................29
CAPITULO 2: GENERALIDADES DE LA ESTADISTICA INFERENCIAL ...................... 30
2.1. ESTADÍSTICA INFERENCIAL ...........................................................................31
2.2. ENSAYOS O “TEST” ESTADÍSTICOS ..............................................................32
2.3. LAS HIPOTESIS ESTADISTICAS......................................................................33
2.4. ERRORES DE TIPO I Y DE TIPO II EN LA TOMA DE DECISIONES ..............34
2.5. TEST DE UNA COLA Y DE DOS COLAS..........................................................36
2.6. CÓMO ELEGIR LA H1 CORRECTA ................................................................37
2.7. ACEPTACION Y RECHAZO DE HIPOTESIS Y EL PROGRESO DE LAS
CIENCIAS EXPERIMENTALES .........................................................................37
2.8. ENSAYOS APAREADOS Y ENSAYOS AGRUPADOS.....................................38
2.9. EL MUESTREO Y EL DISEÑO DE LAS PRUEBAS A CIEGO, DOBLE CIEGO Y
TRIPLE CIEGO...................................................................................................38
2.10. ARQUITECTURA GENERAL DE LAS PRUEBAS DE INFERENCIA................41
2.11. DISEÑOS SIMETRICOS, ASIMETRICOS Y MANEJO DE LOS DATOS
FALTANTES .......................................................................................................42
CAPITULO 3: TEST PARAMETRICOS............................................................................. 44
3.1. POBLACIONES NORMALES : LA DISTRIBUCION ZETA................................45
3.2. COMPARACIÓN DE DOS GRUPOS NORMALES: TEST t-STUDENT............49
3.3. PRUEBA DE ASOCIACIÓN Y CORRELACIÓN LINEAL ENTRE VARIABLES
CUANTITATIVAS ...............................................................................................52
3.4. CORRELACIÓN LINEAL MÚLTIPLE Y CORRELACIÓN NO LINEAL ..............54
3.5. LA DISTRIBUCIÓN BINOMIAL Y LA DISTRIBUCIÓN DE POISSON...............55
3.6. ANOVA: FUNDAMENTOS DEL FRACCIONAMIENTO DE LA VARIANZA ......59
3.7. ANOVA DE UNA VÍA..........................................................................................66
3.8. ANOVA DE DOS VÍAS .......................................................................................68
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 6 -175
3.9. ANOVA FACTORIAL ..........................................................................................69
3.10. ANCOVA: EL ANÁLISIS DE COVARIANZA ......................................................73
3.11. ENSAYO DE RECTAS PARALELAS: PRUEBA DE DOCIMASIA BIOLÓGICA75
3.12. GRÁFICOS DE CONTROL DE CALIDAD (6σ).................................................77
3.13. MUESTREO SECUENCIAL ...............................................................................81
CAPITULO 4: TEST NO PARAMETRICOS ...................................................................... 87
4.1. GENERALIDADES ACERCA DE LOS ENSAYOS NO PARAMÉTRICOS........88
4.2. TABLAS DE CONTINGENCIA: LA DISTRIBUCIÓN χ2 (JI-CUADRADO) ........89
4.3. PRUEBA DE McNEMAR PARA LA SIGNIFICACIÓN DE CAMBIOS................91
4.4. PRUEBA DE LOS SIGNOS................................................................................92
4.5. PRUEBA DE LOS RANGOS DE WILCOXON ...................................................93
4.6. PRUEBA U DE MANN-WHITNEY......................................................................95
4.7. PRUEBA DE UNA Y DOS MUESTRAS DE KOLMOGOROV-SMIRNOV .........96
4.8. PRUEBA DE LAS RACHAS DE WALD-WOLFOWITZ ......................................97
4.9. PRUEBA DE MOSES DE LAS REACCIONES EXTREMAS .............................98
4.10. PRUEBA DE WALSH .........................................................................................99
4.11. PRUEBA Q DE COCHRAN ..............................................................................100
4.12. ANOVA DE DOS VÍAS POR RANGOS DE FRIEDMAN .................................101
4.13. ANOVA DE UNA VÍA POR RANGOS DE KRUSKAL-WALLIS........................102
4.14. COEFICIENTE DE CONTINGENCIA C ...........................................................103
4.15. COEFICIENTE DE CORRELACION DE RANGOS DE SPEARMAN (rS) .......104
4.16. COEFICIENTE DE CORRELACION DE RANGOS DE KENDALL (τ).............106
4.17. COEFICIENTE DE CORRELACION PARCIAL DE RANGO DE KENDALL (rxy.z)
..........................................................................................................................107
4.18. COEFICIENTE DE CONCORDANCIA DE KENDALL (W) ..............................108
CAPITULO 5: NOCIONES DE EPIDEMIOLOGIA..........................................................110
5.1. DEFINICION DE LA EPIDEMIOLOGIA............................................................111
5.2. GENERALIDADES ACERCA DE LA EPIDEMIOLOGÍA..................................112
5.3. DEFINICION Y OBJETIVO DE LA SALUD PUBLICA......................................112
5.4. EL METODO DE LA EPIDEMIOLOGIA ...........................................................115
5.5. ESTRATEGIA EPIDEMIOLÓGICA...................................................................115
5.6. CONDICIONES BÁSICAS EN LA DEFINICIÓN, REGISTRO Y MEDICIÓN DE
VARIABLES ......................................................................................................116
5.7. LAS MEDICIONES EN EPIDEMIOLOGIA .......................................................118
5.8. PRINCIPALES INDICADORES SANITARIOS.................................................119
5.9. INTRODUCCION AL ESTUDIO DE COHORTES............................................122
5.10. MEDIDAS OBTENIDAS DE LOS ESTUDIOS DE COHORTES (Riesgos e
Incidencias).......................................................................................................127
5.11. ANALISIS DE CASOS Y CONTROLES (C&C)................................................131
5.12. CALCULO DE LA RAZON DE CHANCES u “ODDS RATIO” (OR) .................135
5.13. INDICES HOSPITALARIOS .............................................................................139
5.14. ANALISIS DE CURVAS DE SUPERVIVENCIA ...............................................140
APÉNDICE: TABLAS ESTADISTICAS ...........................................................................141
TABLA I: Numeros Aleatorios.....................................................................................142
TABLA II: Distribucion Normal (z)................................................................................143
TABLA III: Distribucion t-Student (test de dos colas) .................................................144
TABLA IV: Distribución F-Snedecor (p=0.05) ............................................................145
TABLA V: Distribución F-Snedecor (p=0.01) .............................................................146
TABLA VI: Distribución χ2-ji cuadrado (dos colas) .....................................................147
TABLA VII: Probabilidad Binomial Acumulada (para H0: p =q = 0,5) ........................150
TABLA VIII: Prueba de rangos señalados de Wilcoxon.............................................151
TABLA IX: Prueba U de Mann-Whitney (rango n2 3-8)...............................................152
TABLA X: Prueba U de Mann-Whitney (rango n2 9-20)..............................................155
TABLA XI: Prueba de dos muestras de Kolmogorov-Smirnov ...................................157
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 7 -175
TABLA XII: Prueba de rachas de Wald-Wolfowitz ......................................................160
TABLA XIII: Prueba de Walsh .....................................................................................162
TABLA XIV: Prueba de Kruskal-Wallis (para muestras pequeñas) ...........................163
TABLA XV: Valores críticos del coeficiente de correlación de Spearman ..................166
TABLA XVI: Tabla de valores críticos del coeficiente de correlación (tau) de Kendall167
TABLA XVII: Valores críticos para el coeficiente de correlación (r) de Pearson ........168
TABLA XVIII: Valores críticos de s en el coeficiente de concordancia de Kendall.....170
BIBLIOGRAFIA ................................................................................................................174
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 8 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
9-175
CAPITULO 1: ESTADISTICA DESCRIPTIVA
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 9 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
10-175
1.1. ESTADÍSTICA BUENA Y ESTADISTICA MALA
La estadística no tiene valoración ética asociada. No es buena ni es mala, simplemente depende de
cómo se la use. La estadística es sólo una herramienta, como lo es un martillo, muy útil para clavar
un clavo y construir un mueble, usado sin experiencia puede resultar en un dedo golpeado y mal
usado puede servir para matar intencionalmente de un golpe a una persona. La estadística es
igualmente flexible: bien usada sirve para el progreso de las ciencias experimentales (a las cuales
pertenece la medicina en todas sus fases), para el control de calidad de producción industrial o para
desarrollar tecnologías novedosas. La estadística usada sin experiencia irá a entorpecerá el desarrollo
ya que dará información falsa La estadística mal usada sirve para engañar a los inadvertidos, para
falsear la realidad y vender una imagen engañosa con fines políticos o simplemente para lucrar en
forma deshonesta.
Veremos que la estadística inferencial se ocupa de demostrar que ciertas preguntas son ciertas y que
otras son falsas. Es una herramienta muy poderosa y gran parte de la misma se automatiza a través
de software específico en el cual se simplifica al máximo la obtención de resultados, por una punta
entran datos y por la otra salen conclusiones. Muy poderoso y muy simple, pero sólo en buenas
manos. Si se hace un abuso estadístico, podremos demostrar falsamente que lo blanco es negro, que
el SIDA se cura tomando agua tibia, que la desocupación ha dejado de existir, que el nuevo
medicamento DENTOPLUS cura cualquier clase de patología oral u otro absurdo. Por eso es
necesario que todo profesional vinculado al arte de curar posea una capacitación mínima pero sólida
en esta disciplina, simplemente para no ser víctima del consumo de estadística mendaz y estar en
condiciones de entender y desarrollar investigaciones con rigurosidad.
Muchas veces se confunden los objetivos, no es necesario que un médico, un odontólogo o un
bioquímico sean estadísticos. Eso es poco rentable y altamente improbable. Simplemente se requiere
que los profesionales vinculados al arte y ciencia de la salud posean un CRITERIO ESTADISTICO
mínimo. Ese criterio no consiste en conocer fórmulas estadísticas ni recetas de métodos
memorizadas. Eso sencillamente no sirve para nada. Lo que hay que lograr es:
•
•
•
•
El profesional debe tener un mínimo conceptual de conocimientos de estadística descriptiva e
inferencial, sin formulas memorizadas. Para esto es que se desarrolló este libro.
El profesional debe saber a dónde recurrir y a quien consultar si llegado al caso debiese poner
en práctica lo que conoce. Un asesoramiento oportuno por parte de docentes e investigadores
más experimentados permitirán que el profesional se concentre en lo que más sabe que es su
especialidad y deje los detalles de métodos y cálculos en manos y programas más expertos.
El profesional debe saber interpretar resultados estadísticos, tanto propios como los ajenos,
digamos que en especial a los ajenos. Una buena fuente de cultura informática surge de leer y
analizar regularmente trabajos de investigación de revistas serias con referato de su
especialidad. También el análisis crítico de fuentes poco confiables como ser los periódicos y
los folletos de propaganda médica sirven por oposición a elaborar un criterio propio que
permita separar lo útil de lo superfluo o simplemente dañino.
El profesional debe saber formular la pregunta a ser analizada estadísticamente con suma
claridad. Es importante tener en cuenta que si la pregunta está mal formulada, el método
estadístico no dejara de otorgar una respuesta, el problema es que esa respuesta NO SERA
VALIDA (al menos no lo será para la pregunta que se deseaba formular, aunque sea valida
para la formulada).
En este capítulo comenzaremos tratando algunos conceptos y fundamentos básicos de la estadística
para luego pasar a los temas más específicos vinculados a esta disciplina.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 10 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
11-175
1.2. DETERMINISMO Y AZAR
¿Qué es el determinismo?
El determinismo o CAUSALIDAD es el modelo conceptual que define que a todo efecto le
corresponde su causa. En las ciencias naturales (física, química, biología), la mayoría de las leyes
macroscópicas (involucran una gran cantidad de partículas) y que explican el comportamiento de
dichos sistemas son deterministas, es decir, se predice en forma exacta la dinámica de los mismos.
Aquí si se da una causa, se producen sus efectos (Ej: ley de la gravedad, Principio de Arquímedes,
etc.)
¿Qué es el azar o la aleatoriedad?
Cuando sobre un sistema actúan causas desconocidas (CASUALIDAD) (generalmente múltiples) y
que afectan su evolución, las predicciones se vuelven inseguras. Lo mismo sucede en los sistemas
naturales microscópicos (involucran un numero reducido de partículas), en los cuales conocer la
evolución precisa es imposible (Ej: principio de incertidumbre, trayectoria de una molécula en un
gas ideal, etc.) Para lograr predicciones en esta clase de modelos, se recurre a dos ramas de la
matemática: el cálculo de probabilidades y la estadística.
1.3. NOCIONES ELEMENTALES DEL CALCULO DE PROBABILIDADES
Definicion teórica de probabilidad:
Probabilidad Teórica de un suceso es la relación entre el número de casos favorables y el número de
casos posibles (donde cada uno de ellos tiene la misma esperanza de ocurrir).
no de casos favorables
p=
no de casos posibles
Esta definición es aplicable a los juegos de azar en los cuales se conocen de antemano las
posibilidades que pueden presentarse, y a todos aquellos casos en los cuales el sistema se conoce a
priori.
Ejemplo: ¿qué probabilidad tenemos de extraer al azar una bolilla roja de un bolillero que
contiene cinco bolillas rojas, tres verdes, y dos amarillas?
5
p=
5
=
5+3+2
= 0,5
10
Definición empírica de probabilidad:
Cuando desconocemos de antemano si todas las posibilidades tienen la misma esperanza de ocurrir,
no podemos utilizar para el cálculo de probabilidad la definición teórica. Lo que haremos será
observar un buen número de casos en las mismas condiciones, y con los datos obtenidos de esta
observación, calcular la frecuencia relativa. La frecuencia relativa (o probabilidad empírica) se
acerca al verdadero valor de probabilidad teórica de un suceso cuando el número de observaciones o
de experiencias tiende a infinito.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 11 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
12-175
Ejemplo: ¿qué probabilidad tiene un estudiante que ingresa a la facultad de Odontología de finalizar
la carrera al cabo de 5 años, con el actual plan de estudios?
Lo que haremos primero será investigar cuánto ha tardado en recibirse un número grande de
odontólogos que hayan hecho la carrera con el mismo plan . La relación entre los que obtuvieron su
título en 5 años y el total de individuos nos dará la probabilidad buscada.
La probabilidad adquiere aquí un criterio experimental y se define a posteriori de la experiencia. La
definición empírica de probabilidad es entonces:
“Frecuencia relativa (FR) o probabilidad empírica, es la relación entre el número de casos
favorables (cfav) y el número de observaciones o experiencias realizadas (nobs), La probabilidad
teórica es su límite cuando el número de observaciones tiende a infinito”.
FR =
cfav
nobs
;
p=
lim
nobs → ∞
( FR ) ;
0≤ p≤ 1
La probabilidad es un número abstracto, que puede variar entre cero y uno: el uno representa la
certeza absoluta de ocurrencia de un evento; y el cero la seguridad de que no ocurrirá. La
probabilidad de que sí ocurra un evento, más la probabilidad de que no ocurra es siempre igual a
uno. Por ejemplo, la probabilidad de que salga el número cinco al arrojar un dado es un sexto, y la
probabilidad de que no salga el cinco es de cinco sextos. ¿Para qué sirve determinar la probabilidad
de un suceso que ya ocurrió? Sirve para estimar la probabilidad de que ese hecho ocurra
nuevamente en la población de la cual fue extraída la muestra en estudio.
Probabilidades compuestas
Son las probabilidades asociadas a la ocurrencia combinada (por unión o intersección) de dos o mas
eventos, por ejemplo la probabilidad de ocurrencia de un evento entre dos sucesos (Tiramos dos
dados y exactamente uno sale 3) o la probabilidad de ocurrencia simultánea de dos eventos (Tiramos
dos dados y ambos salen 3).
1.4. PROBABILIDADES COMPUESTAS: LEY DE LA SUMA Y DEL PRODUCTO DE
PROBABILIDADES
•
La probabilidad que ocurra uno de entre varios sucesos mutuamente excluyentes es igual a la
suma de sus probabilidades individuales.
EJEMPLO: Tirando un dado, la probabilidad que salga un 5 es EXCLUYENTE de
que haya salido otro número (como el 6, por ejemplo); por lo tanto, la probabilidad
que salga 5 ó 6 es la suma de ambas probabilidades (=1/6 + 1/6 = 1/3)
•
La probabilidad que ocurran simultáneamente dos o más sucesos mutuamente independientes
es igual al producto de sus probabilidades individuales.
EJEMPLO: Tirando dos dados, la probabilidad que en uno salga un 5 es
INDEPENDIENTE de que haya salido otro número (como el 6) en el segundo; por lo
tanto, la probabilidad que salgan 5 y 6 simultáneamente en ambos es el producto de
ambas probabilidades (= 1/6 x 1/6 = 1/36)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 12 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
13-175
En el siguiente punto se verán las leyes generales vinculadas a las probabilidades compuestas (por
unión o por intersección de eventos de cualquier clase)
1.5. PROBABILIDAD CONDICIONAL
Es la probabilidad que ocurra un suceso habiendo ocurrido otro: Sea A: hoy está nublado y B:
hoy llueve, entonces p(B| A) = p (llueva si está nublado) = p(A y B)/p(A), es decir la
probabilidad que esté nublado y que llueva al mismo tiempo, dividido a la probabilidad de estar
nublado. Esto se lee como la probabilidad condicional que ocurra B si ya ocurrió A. Por
ejemplo si p(A y B)=0.1 y p(A)=0.4 entonces p(B|A)=0.1/0.4=0.25
PROBABILIDAD CONDICIONAL
es la probabilidad de un suceso habiendo ocurrido otro
U
A
B
p(A)
p(B|A)=p(A y B)/p(A)
Si elegimos un punto al azar en A, p(B|A) es la probabilidad
(condicional) que ocurra B habiendo ocurrido A, p(A y B) la
probabilidad que ocurran ambos simultáneamente y la p(A) la
probabilidad que ocurra A o sea el área de casos posibles.
La probabilidad condicional de dos sucesos mutuamente independientes es igual a su
probabilidad absoluta: p(A|B)=p(A) (si A y B son independientes)
Las leyes de la suma y del producto para las probabilidades compuestas se generalizan
cuando se las aplica a sucesos de cualquier clase, sean excluyentes o no y sean
independientes o no.
EN GENERAL:
esta es la generalización de las leyes de la suma y del
producto para sucesos de cualquier clase
p(A o B)=p(A)+p(B)-p(A y B)
p(U)=1
p(A)
p(B)
p(A y B)=p(A).p(B|A)
=p(B).p(A|B)
MUESTREOS CON O SIN REPOSICIÓN
Al resolver problemas de probabilidades compuestas hay que tener en cuenta si se reponen (o no)
las extracciones previas de un conjunto porque eso modifica las probabilidades de las extracciones
consecuentes. Técnicamente hay que pensar si el primer resultado condiciona o no al segundo, es
decir si hay que usar probabilidades condicionales (en caso de duda siempre hay que usarlas).
Ejemplo: En una bolsa hay 3 bolillas negras y dos blancas
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 13 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
14-175
a) Cual es la probabilidad de sacar dos bolillas negras? (Respuesta: p= (3/5)(2/4)=3/10 )
b) Cuál es esa misma probabilidad si después de sacar la primer bolilla se la repone en la bolsa?
(Respuesta: p= (3/5)(3/5)=9/25 )
1.6. DEFINICIÓN DE ESTADÍSTICA Y VARIABLES ESTADÍSTICAS
Definición de la estadística:
“Es una herramienta matemática que permite describir y tomar decisiones de riesgo calculado en
sistemas afectados por la incertidumbre”
Conceptos descriptivos de la estadística:
“Es la rama de la matemática que permite conocer el comportamiento de la naturaleza a través de
la obtención de datos afectados por el azar, separando causas legítimas de la simple casualidad”
“La estadística es la reina del método experimental, filtra la información útil del ruido (aleatorio
y/o sistemático) y permite transformar superstición o adivinación en ciencia sólida”
“La estadística de por sí no prueba nada pero usada con criterio resulta ser una herramienta
valiosa al tomar decisiones”
Objetivo de su estudio:
La estadística tiene por objeto extraer información confiable de datos obtenidos de variables
aleatorias. Una variable es aleatoria si fluctúa en forma impredecible o depende de factores fuera de
control por parte del observador. Por ejemplo: el resultado del Quini6, el clima dentro de un mes, las
mediciones físicas, químicas y biológicas de cualquier tipo y con cualquier instrumento, la duración
de una pila, la aparición de una enfermedad, etc.
VARIABLES ESTADÍSTICAS
Son magnitudes sujetas al azar, pasibles de ser medidas y luego controladas por medio de técnicas
estadísticas. Se clasifican de la siguiente manera:
•
CUALITATIVAS: sexo, nacionalidad, etc.
•
SEMICUANTITATIVAS : (escalas) tipo grande, mediano, chico, etc.
•
CUANTITATIVAS: (numéricas). Se pueden considerar dos casos:
DISCRETAS : (N° enteros) número de piezas dentales, de caries, etc.
CONTINUAS : (N° reales) masa, longitud, peso, temperatura , etc
1.7. ESTADÍSTICA APLICADA A UNA MEDIDA INDIVIDUAL
Medición es la comparación de una magnitud contra otra que se toma como patrón. En toda
medición física, química y biológica, se cometen errores. Los errores pueden ser SISTEMÁTICOS
(dependen de fallas del instrumento de medida o del observador que hace esas medidas) o
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 14 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
15-175
ALEATORIOS (siempre presentes). Los errores sistemáticos se controlan calibrando (midiendo la
falla del sistema de medición: observador + instrumento) y los aleatorios se controlan por medio de
la estadística.
Definiciones básicas de la teoría de errores de medición:
Valor Verdadero o Teórico (VT): es el valor exacto de una medida, generalmente desconocido.
Como el valor verdadero (en general) es un número real y posee infinitos decimales, siempre se lo
indica como un número racional con una dada cantidad de cifras significativas, considerándose que
el último dígito es aproximado (por ejemplo, la estatura real de una persona es 1,72453673 metros, el
último 3 es aproximado)
Cifras significativas: es el número total de dígitos empleados para expresar un resultado de una
medida, nunca debe superar a lo que permita la sensibilidad del instrumento de medida (por ejemplo,
si la estatura de una persona es 1,72453673 metros, se están empleando 9 cifras significativas)
Importancia de la expresión de las medidas individuales:
no es lo mismo 2.31 que 2.310, 2.31000 o 2.3100000000 metros.
En esta sucesión, matemáticamente todos expresan el mismo número racional 231/100, pero si se
trata de medidas, la sensibilidad del instrumento de medida ha aumentado ya que se supone que sólo
el último dígito es aproximado (por redondeo). No es lo mismo medir un objeto muy pequeño con
una regla milimetrada que con un microscopio con una lente con escala al diezmilésimo de
milímetro. Los resultados de una medición que son transformados luego por operaciones
matemáticas, no deben ser expresados con más decimales que la sensibilidad permitida por el
instrumento de medida en la obtención de ese dato.
Sensibilidad (de un instrumento de medida): La sensibilidad es directamente proporcional al número
de decimales (o cifras significativas) con el cual se exprese el resultado de la medida. Es la mínima
diferencia que el instrumento puede detectar. Por ejemplo, una regla milimetrada (cuya sensibilidad
es 1 mm) no permite diferenciar entre las longitudes de 2 elementos que se diferencian entre sí en 0,1
mm; se requiere para ello un instrumento con mayor sensibilidad.
Valor Medido (VM): es lo que se obtiene midiendo (intentando obtener el VT)
Error Absoluto (EA): es la diferencia entre el valor verdadero y el valor medido, en valor absoluto
(es decir con signo positivo). La fórmula es EA= | VT-VM |, no importa el orden de los términos.
Error Relativo (ER): es el cociente entre el EA y el VT. La fórmula es ER = EA/VT.
Error Porcentual (EP): es el ER multiplicado por 100 y expresado como porcentaje
Exactitud (de una medida): es inversamente proporcional al error absoluto. Una medida es más
exacta cuanto más cercano es el valor medido al valor verdadero.
Ejemplo de aplicación de errores de medición individuales:
VT = 1,7234 m (altura de una persona, el último dígito – en negritas - es aproximado)
Este resultado se está expresando con 5 (CINCO) dígitos o cifras significativas
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 15 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
16-175
VM = 1,7420 m (lo que se midió al décimo de milímetro, que es la sensibilidad del instrumento)
EA = | VT-VM | = 0,0186 m
ER = EA / VT = 0,0108 (no tiene unidades y no se ponen más decimales que los que la
sensibilidad indicada por el instrumento de medida, aquí décimo de
milímetro)
EP = ER . 100 = 1,08 % .
Error relativo de aproximación (ERA)
Es igual a la unidad dividida al valor medido expresado con todas sus cifras significativas (sin usar
la coma decimal) Por ejemplo, si se mide una masa en una balanza analítica y se obtiene un valor
de 23,6491 g, el ERA = 1/236491
Regla general de propagación de errores
Cuando se efectúan operaciones matemáticas con valores medidos, vale la siguiente regla general
para la mayoría de los casos: El ERA del resultado de una operación numérica (no el
obtenido por una medición directa) tiene que ser mayor o igual al máximo ERA de
los datos usados.
Ejemplo: Se desea medir el volumen de un recipiente cilíndrico de 6,55 cm de altura y 5,3 cm2 de
base. El producto de esas medidas da 34,715 cm3, cuantos decimales conservamos? El ERA de la
altura es 1/655, el ERA de la base es 1/53. El mayor de estos ERA es 1/53, por lo tanto el volumen
no puede tener un ERA menor que ese. Si conservaríamos (digamos) un decimal en el resultado, su
ERA sería 1/347 pero ese valor es menor que el que se necesita, por eso quitamos una cifra
significativa (el decimal 7) con lo cual el volumen (que se redondea) queda 35 cm3 y que tiene un
ERA de 1/35 el que efectivamente es mayor que 1/53.
1.8. ESTADÍSTICA APLICADA A UN
OBSERVACIONES INDIVIDUALES
GRAN
NÚMERO
DE
MEDIDAS
U
Estas son las definiciones básicas y más importantes de la estadística.
1. Población:
Es el conjunto de todas las observaciones (o medidas) posibles correspondientes a individuos o
cosas que son investigadas . En estadística la población no son los individuos sino las mediciones
hechas sobre individuos o cosas. Ejemplo: El número de piezas dentales sanas de todos los
habitantes de la República Argentina.
2. Muestra:
Como generalmente es imposible estudiar a toda una población, recabar los datos de cada uno de
sus integrantes y procesarlos, se toma una muestra (subconjunto de tamaño finito “n”) de esa
población. De las conclusiones obtenidas a partir del estudio de la muestra, tratamos de inferir
una conclusión sobre la población. En la obtención de la muestra, sus integrantes se eligen al
azar (en forma aleatoria), de modo tal que cada individuo tenga igual posibilidad de ser elegido.
Y cuando mayor sea el tamaño de la muestra, más valederas serán las conclusiones acerca de la
población total. Por ejemplo una muestra de la población ya definida podrá ser el número de
piezas dentales sanas de 1.500 habitantes de la Provincia de Buenos Aires.
3. Observación individual:
Es cada uno de los valores medidos dentro de una muestra.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 16 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
17-175
1.9. REPRESENTACIÓN ANALÍTICA Y GRÁFICA DE DATOS ESTADÍSTICOS
OBTENIDOS A PARTIR DE UN CONJUNTO DE OBSERVACIONES INDIVIDUALES
Los datos obtenidos se ordenan y se agrupan formando un cuadro o tabla de valores, o bien se
representan mediante un gráfico.
Si la variable es discreta lo que se construye es una tabla de
frecuencias no agrupadas. Se ordenan las observaciones en orden creciente y en una columna
contigua se explicita el número de veces que apareció cada una de las observaciones (frecuencia
absoluta, Fi), en otra columna contigua se calcula la frecuencia relativa de cada observación (fi =
Fi/n), donde n es el número total de observaciones). Obviamente:
ΣFi = n
y
Σfi = 1
A partir de esta tabla puede construirse un histograma de barras que consiste en graficar en
ordenadas la Fi o fi de cada observación individual y en abscisas la observación correspondiente.
Veamos un ejemplo: sea X: “calificación (nota) obtenida por alumnos de Biofísica de la Facultad de
Odontología en la primera evaluación parcial”.
Tabla de frecuencias no agrupadas
X
0
1
2
3
4
5
6
7
8
9
10
Fi
0
4
11
15
6
3
20
8
5
2
1
fi
0
0.053
0.147
0.2
0.08
0.04
0.267
0.107
0.067
0.027
0.013
Histogramas de barras
0.30
fi
20
Fi
0.15
0
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 17 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
18-175
Si la variable es continua y se tiene un gran número de observaciones es muy poco probable que se
repita un mismo valor muchas veces por lo que los datos se agrupan formando lo que se llama tabla
de frecuencias agrupadas. Esta tabla consiste en agrupar las observaciones en intervalos de clase.
Para construir esta tabla y a partir de ella graficar los valores en un histograma debemos hallar los
intervalos de clase. Estos deben ser contiguos (el límite superior de cada uno de ellos debe coincidir
con el límite inferior del siguiente) y excluyentes, es decir, que ninguna observación pertenezca a
dos intervalos simultáneamente (“caiga” en un límite). Para construir los intervalos de clase vamos a
adoptar un criterio que tiene en cuenta las dos características antes mencionadas y el número de
observaciones individuales (n) realizadas.
1) se ordenan los datos en orden creciente y se calcula el rango (w) de la muestra, que es la
diferencia entre los valores extremos.
w = xmáx –x mín
2) se calcula el número de intervalos de clase (k) a través de la siguiente expresión:
k = 1 + 3,3 log n
k debe ser un número entero, por lo que el resultado en caso de no ser entero se trunca o redondea.
3) se calcula la longitud de cada intervalo de clase (h) dividiendo el rango por el número de
intervalos de clase antes hallado:
h = w/k
h debe tener el mismo número de cifras decimales que los datos (obtenido con redondeo o truncado
del resultado aritmético obtenido)
4) se verifica que todas las observaciones esten incluídas en los intervalos de clase, es decir que se
cumpla que:
xmín + k.h > xmáx
Si esto no se cumple se incrementa h en una unidad de cifra decimal (si el muestreo de datos
contiene cifras decimales) o entera (en caso que las observaciones sean números enteros) sin cambiar
k.
5) se construyen los intervalos de clase aparentes tomando como límite inferior del primer intervalo
la observación menor (xmín) y, sumando sucesivamente el tamaño del intervalo, se obtienen los
límites inferiores de los intervalos aparentes sucesivos. Los límites superiores de los mismos se
obtienen sumando al límite inferior de cada intervalo h menos una unidad de cifra decimal o entera
(según corresponda dependiendo del muestreo de datos). Los intervalos aparentes asi construidos no
son contiguos y excluyentes.
6) a partir de los intervalos aparentes se construyen los intervalos reales (estos sí son contiguos y
excluyentes). Para obtener los intervalos reales, al límite inferior de cada intervalo aparente se le
resta la mitad de unidad de cifra decimal o entera (dependiendo del muestreo de datos) y al límite
superior de cada intervalo aparente se le suma la mitad de unidad de cifra decimal o entera. De esta
forma los intervalos reales tienen todos longitud h, son contiguos (el límite superior de un intervalo
coincide con el límite inferior del siguiente) y son excluyentes ya que los límites contienen una cifra
significativa más que el muestreo de datos por lo que nos aseguramos que ninguna de las
observaciones caiga en un límite.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 18 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
19-175
7) se halla la frecuencia absoluta (Fi) y relativa (fi = Fi/n) de cada intervalo de clase. La frecuencia
absoluta de un intervalo de clase es el número de observaciones incluidas en ese intervalo de clase.
8) se calcula la marca de clase ( i) que es el punto medio del intervalo de clase :
i
= limite inferior + h/2
9) se calcula la frecuencia acumulada absoluta (Fi(a) ) y relativa (fi(a)) hasta el límite superior de cada
intervalo sumando sucesivamente las frecuencias absolutas o relativas de los sucesivos intervalos.
Entonces, la tabla de frecuencias agrupadas consistiría en un arreglo como el siguiente:
Intervalos aparentes
Intervalos reales
Fi
fi
Fi(a)
fi(a)
marca de clase
A partir de la tabla de frecuencias agrupadas se grafica el histograma ordinario que consiste en
graficar en ordenadas Fi o fi de cada intervalo de clase y en absisas los intervalos de clase
correspondientes. Sobre el histograma ordinario se traza el polígono de frecuencias agregando dos
intervalos de clase mas (de Fi = 0) uno a la izquierda y otro derecha del histograma con sus
respectivas marcas de clase, y uniendo con trazos rectos las marcas de clase de los sucesivos
intervalos de clase.
Por otra parte puede construirse el polígono de frecuencias acumuladas graficando el ordenadas Fi(a)
o fi(a) y en absisas los intervalos de clase correspondientes.
Tanto en el histograma de barras (para variable discreta) como en el histograma ordinario (para
variable continua), si se representa en ordenadas las frecuencias relativas (fi) es posible visualizar la
distribución en probabilidades de la variable.
Un ejemplo detallado de estudio estadístico grafico: la talla de un conjunto de alumnos
Supongamos X:“talla (en metros) de los alumnos de la facultad de Odontología”. Extraemos de esta
población una muestra de tamaño 100, y obtenemos las tallas (no listadas aquí) de los 100 alumnos
tomados al azar. Una vez ordenadas las mediciones observamos que xmin = 1,50 m y xmax = 1,92 m.
-Hallamos el rango:
w = 1,92-1,50 = 0,42 m
-Calculamos el número de intervalos de clase:
k = 1 +3,3.log100 =7,6 ⇒ k = 8
-Calculamos el tamaño de los intervalos de clase: h = w/k = 0,42/8 = 0,0525 ⇒ h =0,05
-Verificamos si todas las observaciones están incluidas en los intervalos de clase a construir:
1,50 + 8.0,05 = 1,90 <1,92 ∴la última observación no está incluida en los intervalos,
entonces incrementamos el tamaño del intervalo en una unidad de cifra decimal, o sea:
h= 0,06 m
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 19 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
20-175
-Construimos los intervalos aparentes y luego los reales. Contamos las observaciones incluidas en
cada intervalo (Fi), calculamos la frecuencia relativa (fi), la frecuencia acumulada absoluta y relativa
(Fi(a) y fi(a)) y la marca de clase ( i ). Obtenemos la tabla de frecuencias agrupadas:
Intervalos aparentes
1,50 - 1,55
1,56 - 1,61
1,62 - 1,67
1,68 - 1,73
1,74 - 1,79
1,80 - 1,85
1,86 - 1,91
1,92 - 1,97
Intervalos reales
Fi
fi
Fi(a)
fi(a)
1,495 - 1,555
1,555 - 1,615
1,615 - 1,675
1,675 - 1,735
1,735 - 1,795
1,795 - 1,855
1,855 - 1,915
1,915 - 1,975
2
6
11
33
28
12
7
1
0,02
0,06
0,11
0,33
0,28
0,12
0,07
0,01
2
8
19
52
80
92
99
100
0.02
0,08
0,19
0,52
0,80
0,92
0,99
1,00
i
1,525
1,585
1,645
1,705
1,765
1,825
1,885
1,945
-Graficamos el histograma ordinario, el polígono de frecuencias (panel izquierdo) y el polígono de
frecuencias acumuladas (panel derecho)
40
Fi
100
Fi(a)
30
75
20
50
10
25
1,435
intervalos de clase
2,035
1.495
intervalos de clase
Cuando el número de observaciones tiende a infinito, la longitud de los intervalos de clase tiende a
cero (su tamaño es extremadamente pequeño, es decir infinitesimal) y el polígono de frecuencias
relativas es una línea casi continua que se llama función distribución en probabilidades de la
variable.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 20 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
21-175
1.10. DISTRIBUCIONES ESTADISTICAS
Cuando se representan muestras muy grandes o poblaciones (n Æ ∞), la gráfica obtenida del
polígono de frecuencias define el comportamiento característico de una variable aleatoria bajo
estudio y se la conoce como la DISTRIBUCIÓN ESTADÍSTICA de esa variable, tal como ha sido
citado anteriormente. Obviamente, cuando el número de observaciones tiende a infinito, el polígono
de frecuencias deja de ser una sucesión de segmentos y se transforma en una única curva continua
(sin ángulos). Como el límite (n Æ ∞) lo impone, en la ordenada del gráfico, la frecuencia relativa es
remplazada por la probabilidad,
Las distribuciones estadísticas reciben nombres específicos de acuerdo al perfil de sus gráficas, es así
como se define a la distribución uniforme, la distribución triangular, la distribución de Poisson o la
distribución de Gauss o Normal). Esta última resulta ser LA MAS IMPORTANTE para todas las
ciencias naturales (Física, Química, Biología) y por ende de la Medicina y la Odontología.
distribución uniforme
distribución triangular
distribución de Poisson
distribución de Gauss (Normal)
Las distribuciones estadísticas pueden clasificarse también en uni o multimodales (de acuerdo al
número de “picos” que presenten), en simétricas o asimétricas (de acuerdo a la distribución de los
datos alrededor del “pico”), etc.
Tipos de Distribuciones:
Unimodal
Bimodal
Simétrica
Asimétrica
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 21 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
22-175
Como ejemplo, mostramos la distribución de una variable discreta bimodal (X: “calificación (nota)
obtenida por alumnos de biofísica de la facultad de odontología en la primera evaluación”.)
Como se observa en el histograma existen 2 valores (modas) de la variable que se repiten un gran
número de veces (el 6 y el 3).
0.30
Fi
0.15
0 1 2 3 4 5 6 7 8 9 10
Polígono de frecuencias de calificaciones - Primera Evaluación Biofísica
1.11. PARÁMETROS ESTADÍSTICOS
Son números que describe colectivamente a una muestra (o población). Hay dos clases:
PARAMETROS CENTRALES y PARAMETROS DE DISPERSIÓN. Los primeros “condensan”
muchos números en uno sólo. El más importante es el PROMEDIO o media aritmética, se usa para
expresar en forma compacta el comportamiento de todo el conjunto de números (los individuos u
observaciones individuales). Pero, como se trata de variables aleatorias, el promedio no es
exactamente el valor de todos los individuos de esa colección. Por esa razón existen los parámetros
de dispersión, que miden (en un solo número) el grado de confianza que se puede tener en el
promedio como “representante” de su grupo.
•De posición o centrales (OBJETIVO: obtener valores representativos)
- Media aritmética (promedio)
- Moda
- Mediana
•De dispersión (OBJETIVO: asignar confianza a los parámetros centrales)
- Rango
- Varianza
- Desviación standard
- Error standard
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 22 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
23-175
PARÁMETROS CENTRALES:
1) Media aritmética o promedio: dada una serie de valores (x) de una muestra referente a una
variable, se busca un valor único representativo de los mismos. Se calcula :
n
x=
∑x
i =1
i
n
Cuando nos encontramos frente a una distribución simétrica como lo es la distribución normal, la
media es el valor central y el más frecuente , y por lo tanto el más adecuado para caracterizar a todos
los demás valores de la serie. La media aritmética es un estimador de la media poblacional (μ).
Propiedades de la media :
a) La sumatoria de las desviaciones de los valores respecto de la media es igual a cero .
b) La sumatoria de las desviaciones elevadas al cuadrado da un valor mínimo cuando dichas
desviaciones se tomaron con respecto a la media .
2) Mediana: dada una serie de valores, una vez que ordenamos a éstos en forma creciente, llamamos
mediana al valor central (si el tamaño de la muestra es impar) ,o al promedio de los valores
centrales(cuando el tamaño de la muestra es par). Es la observación de la variable que deja mitad de
las observaciones hacia un lado y mitad de las observaciones hacia el otro lado.
La mediana es el mejor parámetro de posición en cualquier tipo de distribución ya que no es
influenciado por las colas (valores extremos de una distribución) como lo es la media.
3) Modo o Moda: aquel valor que se repite con mayor frecuencia.
PARÁMETROS DE DISPERSIÓN:
A) De las observaciones individuales alrededor de la media:
1) Rango
Es la diferencia entre el valor máximo y mínimo de una muestra (xMAX – x MIN)
2) Desvío standard (DS ó s): para apreciar las variaciones en la distribución de la muestra , es
necesario buscar un nuevo parámetro , índice de la mayor o menor agrupación de los valores
alrededor de la media . Este parámetro es el desvío standard . Y se calcula (por computadora o
calculadora científica) :
DS =
n
1 n
1 ⎛ n 2
⎞
2
(
)
(
−
=
−
X
X
X
X i )2 / n ⎟
∑
∑
∑
i
i
⎜
n − 1 i =1
n − 1 ⎝ i =1
i =1
⎠
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 23 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
24-175
El desvío standard muestral (DS ó s) es un estimador de la desviación standard poblacional (σ).
B) De las medias muestrales alrededor de la media poblacional
Error standard (ES):
Como generalmente es imposible estudiar a toda una población, nunca podremos conocer la media
poblacional. A lo sumo se puede estimar un valor que tienda a ella.
Experimentalmente pudo comprobarse que tomando distintas muestras de una misma población, las
medias de esas muestras tenían una distribución normal, es decir, configuraban una curva de Gauss.
El experimento es el siguiente: se repite m veces la obtención de n observaciones individuales.
Para cada una de las m muestras se calcula un promedio y por último se promedian esos
promedios. La media de la distribución de las medias muestrales (o sea el promedio de m
promedios) se considera asintoticamente igual a la media poblacional:
μ = lim
m , n →∞
∑x
; donde x =
m
1 n
∑ xi
n i =1
donde m es igual al número de muestras consignadas y x cada uno de los promedios considerados.
Aquí el término asintoticamente se refiere a que se trata de una medida insesgada (sin error
sistemático) y que se acerca monótonamente a su valor límite a medida que m y n tiendan a infinito.
El error standard es la desviación standard de la distribución de medias muestrales alrededor de la
media poblacional (μ). Cuanto menor sea el error standard más confiable es la media, es decir que la
media muestral estima mejor a la media poblacional. El cálculo se efectúa por computadora o
calculadora científica.
ES =
DS
n
El error standard depende fuertemente del tamaño de la muestra, y siempre que se calcula el error
standard hay que indicar el tamaño de la muestra. Cuanto mayor sea el n y en consecuencia menor el
valor de ES la media de esa muestra será mejor estimador de la media poblacional (μ).
Existe una forma de inferir cuál sería el error standard de la media poblacional, a partir de los valores
de la media y del desvío standard de una única muestra representativa:
1) se calcula la media de una única muestra
2) se calcula el DS de dicha muestra.
DS =
n
1 n
1 ⎛ n 2
⎞
2
−
=
−
(
)
(
X
X
X
X i )2 / n ⎟
∑ i
∑ i ∑
n − 1 i =1
n − 1 ⎜⎝ i =1
i =1
⎠
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 24 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
25-175
Es interesante destacar que el valor de DS de cualquier muestra de la misma población será el
mismo, independientemente del tamaño de dicha muestra, y se considera como el DS de la
distribución de la población.
3) Se calcula el error standard
ES =
DS
n
Intervalo de confianza: La expresión x ± ES nos dice dentro de qué límites fluctúan las medias
del 68% de las muestras de tamaño n. Este es el intervalo de confianza en el que está contenida la
media de la población o valor verdadero, con un 68% de probabilidad. Como la fórmula del ES lo
indica, a medida que crece n, el intervalo se hace mas “angosto”, es decir crece la confianza que
tenemos en que su valor central sea el promedio poblacional. En el límite (n Æ ∞) el ES se hace cero
y el único punto del intervalo ( x ) es EL PROMEDIO POBLACIONAL (μ ).
Pasamos a ilustrar gráficamente la diferencia conceptual entre los INTERVALOS DE CONFIANZA
x ± DS y x ± ES, ambos calculados con una muestras de tamaño n :
El 68,27% de las observaciones
individuales está dentro de este
intervalo
x ± DS
Si repetimos el muestreo, el
68,27% de los promedios de n
observaciones individuales
estará dentro de este intervalo
x ± ES
1.12. DISTRIBUCIÓN NORMAL O DE GAUSS
En la inmensa mayoría de los fenómenos físicos, químicos y biológicos que se observan en la
naturaleza, existe una única distribución estadística que los representa: es la distribución normal o
curva de Gauss y por eso ocupa un papel central en la estadística. Como se observa en la figura:
p
punto de
inflexión de la
curva
DS
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 25 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
26-175
Es una distribución simétrica, con un eje de simetría vertical que pasa por el promedio. Se conoce
como punto de inflexión de una curva y=f(x) al valor de x para el cual cambia el sentido de la
curvatura de f(x) (La “cuchara para abajo” o concavidad se vuelve “cuchara para arriba” o
convexidad). La desviación standard es gráficamente la distancia entre el promedio y el punto de
inflexión de la curva de Gauss.
En una distribución normal (curva de Gauss), acotar el desvío standard a la media , será trazar dos
verticales , una restando 1 DS a la media, y otra sumando 1 DS a la media. Quedará subtendida
entre ambas verticales un área que es igual al 68,27 % del área total .En el gráfico será así:
El área total bajo la curva representa al número total de observaciones de la muestra, o sea el
100 %.
Si acotamos a ambos lados de la media un desvío standard, el área subtendida entre ambas cotas es
el 68,27 % y esto significa que se obtienen dos valores entre los cuales hay un 68,27 % de los
datos de la muestra . Entonces se puede estimar que hay un 68,27 % de probabilidades de que
aparezca un valor de la población en ese intervalo: un 34,13 % a la derecha de la media, y un 34, 13
% a la izquierda.
Análogamente, si sumamos y restamos a la media 2 DS , el área subtendida entre ambas cotas es del
95,4 % del total, o sea un 47,72 % a la derecha y un 47,72 % a la izquierda. Esto significa que
sumando y restando 2 DS a la media obtenemos dos valores entre los que hay un 95,44 % de
probabilidad de que aparezca un valor de la población en ese intervalo, y tan solo 4,56 % de
probabilidad de que aparezca un valor de la población fuera de ese intervalo.
Por último, si sumamos y restamos a la media 3 DS, el área subtendida por ambas cotas es de 99,74
% del área total, o sea un 49,87 % a cada lado de la media. Esto significa que sumando y restando 3
DS a la media, obtenemos 2 valores entre los cuales hay un 99,74 % de probabilidad de que aparezca
un valor de la población en ese intervalo, y tan solo un 0,26 % de probabilidad de que algún valor
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 26 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
27-175
caiga fuera de ese intervalo. Entonces son pocas las probabilidades de que un valor tan alejado de la
media pertenezca a la misma población.
En el APÉNDICE I, la Tabla II posee los valores precalculados de las áreas bajo la curva de Gauss.
En el Capítulo 3 trataremos en detalle el uso práctico de la distribución normal y esta tabla.
Características de la curva de Gauss
De la misma manera que una recta determina su origen e inclinación por las constantes b y a de su
ecuación lineal:
y=a.x+b
la curva de Gauss tiene sus características dadas por los parámetros μ , σ . Recordemos que la
estimación de la media poblacional ( μ ) es el promedio de promedios (o el único promedio si se
calculó uno sólo) y la estimación del desvío standard poblacional (σ ) es DS. La ecuación que
calcula la frecuencia (u ordenada y) de la distribución normal en función de una observación
individual (o absisa x) es la siguiente
⎛ x−μ ⎞
σ ⎟⎠
− 12 ⎜
1
y=
e ⎝
σ 2π
2
Por ejemplo, a una distribución con un DS (o sea σ ) grande , le corresponderá una curva de Gauss
en forma aplastada, mientras que a una distribución con DS pequeño le corresponderá una curva de
Gauss con un pico acentuado:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 27 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
28-175
1.13. PRECISION Y EXACTITUD DE UNA SERIE DE MEDIDAS REPETIDAS Y LA
CORRECTA EXPRESIÓN DE LOS RESULTADOS EXPERIMENTALES
En general, aunque un instrumento de medida esté bien calibrado (es decir cuando el sistema
formado por el aparato y el observador que lo opera no cometen errores sistemáticos), nunca una
serie de medidas van a dar EXACTAMENTE los mismos valores, ya que todo proceso de medición
queda afectado por errores aleatorios provocados por una infinidad de variables fuera del control del
observador (pequeñas fluctuaciones de temperatura, presión, tiempo, humedad ambiente, etc.)
Se ha tratado en detalle el concepto de sensibilidad y exactitud en las medidas individuales. Como ya
se ha mencionado, la inmensa mayoría de las mediciones corresponden a variables distribuidas
normalmente. Entonces, aprovechando los conocimientos adquiridos en el estudio de las muestras
estadísticas, se pueden formular los conceptos de precisión y exactitud correspondientes a una serie
repetida de mediciones y que reflejan la exactitud y precisión del método de medida utilizado.
Al repetir varias veces una misma medida (buscando estimar un único valor verdadero), se obtiene
un conjunto de valores parecidos. Si se construye un polígono de frecuencias con estos valores. Se
verá que se agrupan simétricamente alrededor de su promedio, siguiendo una distribución normal.
EXACTITUD DE UN METODO DE MEDIDA:
Es inversamente proporcional al promedio del error absoluto cometido, es decir la diferencia en
valor absoluto entre el PROMEDIO de las mediciones efectuadas y el VALOR VERDADERO (o
teórico). Si no se cometieron errores sistemáticos, el promedio de las distintas mediciones debería
ser prácticamente igual al valor verdadero para esa magnitud.
PRECISION DE UN METODO DE MEDIDA:
Es inversamente proporcional a la desviación standard de las mediciones efectuadas; es decir, cuanto
más dispersos sean los datos alrededor de su media, más impreciso será el método de medida.
EXPRESION DE RESULTADOS:
X ± 3 DS: De repetirse nuevamente la medida, existe un 99,7 % de probabilidad de que esté
incluída en este intervalo
X ± 3 ES: Existe un 99,7 % de probabilidad de que el valor verdadero que se intenta conocer esté
comprendido en este intervalo. Cuanto más chico es este intervalo, más confiable es el resultado de
la medida.
Ejercicio:
Si comparamos dos instrumentos de medida , uno puede ser más preciso pero menos exacto que otro.
Como ejemplo, tomemos dos termómetros. Uno está descalibrado y siempre marca 3 grados más que
lo que corresponde (típico caso de error sistemático) y su desviación standard (típica o habitual) es
de 0.0l °C. El segundo está mejor calibrado y marca sólo un grado más (menor error sistemático)
pero su desviación standard típico es de 0.05 °C.
¿Cuál es el más exacto ? (Respuesta = el segundo)
¿Cuál es el mas preciso ? (Respuesta = el primero)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 28 -175
MANUAL DE ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 1 – Estadística descriptiva
29-175
1.14. VALORES NORMALES EN MEDICINA
El estado de salud o enfermedad de un individuo es un concepto estadístico. Para comenzar, se
define a un individuo como sano o normal solamente respecto a algún parámetro clínico (variable
aleatoria), antes que el intentar definir la salud del mismo en forma global. O sea, una persona en un
instante dado puede estar sana conforme a un conjunto de mediciones (temperatura corporal,
glucemia, hematocrito, etc.) y enferma respecto a otros (eritrosedimentación, cantidad de glóbulos
rojos, ácido úrico en sangre, etc.) Si la mayoría de los principales parámetros clínicos se encuentran
en la zona de normalidad, al individuo se lo puede considerar sano. La zona de normalidad de un
parámetro clínico es la definida por el promedio poblacional más (y menos) 1.96 DS, es decir es la
franja de valores dentro de la cual se encuentra el 95% de la humanidad (en estado de salud clínica,
es decir la población que no manifiesta o evidencia patología alguna)
Cabe señalar que los valores medidos en un individuo y que se pretenden comparar contra los VN
poblacionales, dependen de varios factores:
1) De la técnica empleada para medirlos, por ejemplo los VN de Glucemia en ayunas medidos
por método colorimétrico están entre 0.70-1.10 g% en cambio los mismos valores normales
para la Glucemia en ayunas medida por método enzimático (que es mas exacto y mas preciso
como se podrá comprobar) están entre 0.65-1.00 g%.
2) Del ritmo circadiano que regula la actividad metabólico-hormonal de una persona a lo largo
del día, por eso hay que determinar con exactitud la hora y estado de la persona antes de
medir esos parámetros (Para el caso de la glucemia los VN sirven para extracciones
matinales y con 8 Horas de ayuno previo)
3) De la ingesta previa, normalmente los valores se toman en ayunas.
4) De factores iatrogénicos (provocados por la medicina) como ser la administración
concurrente de fármacos que alteran el metabolismo (Para el caso de la glucemia la ingesta
de Metformina, que actúa como hipoglucemiante oral)
Si se controlan los factores para evitar errores (sistemáticos) como los mencionados, la obtención de
valores extremos fuera de la zona 95%, permite sospechar una patología. Esta es la base de
comprobación estadística que se usa universalmente en medicina y odontología clínica para el
diagnóstico. Por ejemplo, si la glucemia de una persona en ayunas, medida por método enzimático
fue de 1,45 g%, tendremos un diagnóstico presuntivo de diabetes, ya que la probabilidad que un
individuo sano tenga (por el mero azar) un valor igual o superior al registrado es de p = 1 x 10-8 es
decir esto debería ocurrir una vez entre cada 100.000.000 de personas, lo cual es altamente
improbable y por eso se hace ese diagnóstico presuntivo. Si por el contrario, se verifica que la
persona desayunó una hora antes de hacerse la extracción de sangre, se debe descartar el resultado y
repetir el análisis porque ese valor sería perfectamente normal (o sea todas las personas tendrían
valores o resultados más o menos similares). Existe una rama de la medicina y odontología clínicas
muy vinculada con la estadística y que se dedica específicamente a la recolección de parámetros de
salud de las poblaciones, tanto las normales como las afectadas por patologías específicas: es la
EPIDEMIOLOGIA. Esta disciplina se ocupa de efectuar muestreos y relevamientos sanitarios en
gran escala y su posterior análisis estadístico para la extracción de VN poblacionales y definir con
cierta precisión el estado de salud de determinadas subpoblaciones. En el Capítulo 5 se desarrollan
los conocimientos básicos de la Epidemiología práctica.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 29 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
30-175
CAPITULO 2: GENERALIDADES DE LA ESTADISTICA
INFERENCIAL
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 30 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
2.1.
31-175
ESTADÍSTICA INFERENCIAL
El objetivo de la estadística inferencial es
permitir la toma de decisiones de riesgo
calculado en un ambiente de incertidumbre.
•
PORQUÉ TOMA DE DECISIONES? Porque permite decidir (con un grado de
incertidumbre aceptado por el operador) si una determinada hipótesis o pregunta dicotómica,
(es decir de respuesta binaria) es verdadera o falsa.
Por ejemplo; una pregunta puede consistir en querer dilucidar si el fármaco A es más activo
que el fármaco B para reducir los síntomas de una patología. Esa pregunta se puede
formular en términos estadísticos como una hipótesis que diga: el promedio de respuesta
obtenida con el fármaco A es igual al promedio de respuesta obtenido con el fármaco B. La
estadística inferencial ratificará o rechazará esta hipótesis estadística y por reflejo
contestará la pregunta original.
•
PORQUÉ AMBIENTE DE INCERTIDUMBRE? Porque interviene el azar y estamos
tratando con variables contaminadas con elementos que la influencian en forma aleatorias. En
el ámbito de la casualidad no hay certeza, en el ámbito de la causalidad sí. La estadística
filtra el ruido estadístico para recuperar señales causales, pero siempre habrá incertidumbre
en los juicios que se abran en esta clase de sistemas.
•
PORQUE RIESGO? Porque cuando hay incertidumbre en un sistema, las conclusiones que
se adopten serán pasibles de ser equivocadas. Por ejemplo; sacamos la conclusión (falsa)
que el fármaco A es más activo que el fármaco B para reducir los síntomas de una
patología, en realidad tuvimos mala suerte en nuestro ensayo y las diferencias observadas se
debieron exclusivamente al azar. Por supuesto para que este razonamiento sea válido
debemos descartar primero que no hayan existido errores sistemáticos involucrados en esas
determinaciones.
•
PORQUE RIESGO CALCULADO? Porque no sólo nos interesa saber que nos podemos
equivocar al tomar decisiones, además nos interesa MEDIR ese riesgo. Por eso, la
conclusión tomada como ejemplo debería ser: el fármaco A es más activo que el fármaco B
para reducir los síntomas de una patología .y la probabilidad de equivocarnos al tomar esa
decisión es de 1:20 (o sea p=0.05). Esto significa que estamos dispuestos de correr un riesgo
de equivocarnos al tomar esa decisión de una vez por cada veinte ensayos similares al
presente.
Hay varios tipos de preguntas que se intentan responder mediante la estadística inferencial, pero las
más frecuentes suelen ser:
1) ¿LAS MUESTRAS SE COMPORTAN COMO ESENCIALMENTE IGUALES (a pesar de
las diferencias aleatorias que se observaron)? Aquí la igualdad puede referirse tanto a
medidas de tendencia central (p.ej.: promedios) como a medidas de dispersión (p.ej:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 31 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
32-175
varianzas), tanto para dos como para más muestras. A esta clase pertenecen pruebas de
inferencia como el test t-Student y el ANOVA (análisis de varianza) (ver Capítulo 3)
2) ¿EXISTE ASOCIACION O VINCULACION ENTRE VARIABLES DE UNA MUESTRA?
Aquí se trata de vincular causalmente dos magnitudes de una muestra, cualitativa y
cuantitativamente, tal vez para efectuar predicciones ulteriores por interpolación o
extrapolación. A este grupo de preguntas pertenece el estudio de la relación funcional que
liga a las variables (p.ej.: buscar la recta o la parábola o en general la función que mejor
describe o se “ajusta a un conjunto de puntos). A esta clase pertenecen pruebas de inferencia
como el test de contingencia X2 (ji-cuadrado) y el ensayo de correlación.
3) ¿LA VARIABLE EN CUESTION SIGUE UNA DISTRIBUCIÓN ESTADÍSTICA
PARTICULAR (p.ej: la normal)? En este caso se intenta verificar en base a parámetros
descriptivos la función de distribución general de dicha variable. A esta clase pertenecen
pruebas de inferencia como test de asociación X2 (ji-cuadrado) y el ensayo de normalidad
de Kolmogorov-Smirnov (ver Capítulo 4)
4) ¿DEL CONJUNTO DE VARIABLES ESTADISTICAS BAJO ESTUDIO, CUALES SON
LAS QUE SE VINCULAN MUTUAMENTE CON MAYOR INTENSIDAD? En este caso
se busca comparar un conjunto de variables de una muestra para buscar similitudes y separar
diferencias entre ellas. A esta clase pertenecen pruebas de inferencia como búsqueda de
“cliques” o “clustering” y análisis de correlación múltiple. (Estos son temas avanzados,
consultar la bibliografía sugerida, p.ejemplo el libro de SOKAL)
5) ¿EXISTE REGULARIDAD O PATRON DE COMPORTAMIENTO EN LA SERIE
TEMPORAL DE ESTA VARIABLE? Aquí se intenta detectar si en una serie de datos
secuenciales existe alguna regularidad interna o se trata sólo de fluctuaciones azarosas. A
esta clase pertenecen pruebas de inferencia como el test de rachas o el análisis de
autocorrelación. (ver Capítulo 4 para el primero, y el libro de FISHMAN para el segundo
tema)
2.2.
ENSAYOS O “TEST” ESTADÍSTICOS
Son técnicas matemáticas que permiten contestar preguntas de comparación o de vinculación sobre
dos o más muestras. Además las respuestas vienen valorizadas con el riesgo que se comete al tomar
justamente esa decisión y no otra (medido como probabilidad).
Hay dos grandes categorías de ensayos estadísticos:
•
•
Paramétricos
No Paramétricos
Dentro de cada categoría se hallan innumerables tipos diversos de ensayos. No existen ensayos
“universales” que sirvan para cualquier caso que se presente. Se requiere estudiar y ganar
experiencia de uso para aplicar estadística válida. Decidir cuando se debe usar una u otra clase
depende del tipo de datos a analizar y requiere de cierto entrenamiento estadístico hallar la clase y
tipo de prueba mas adecuada para un problema en particular. Cuando desee hacer un ensayo de
inferencia, asesórese con docentes o investigadores con experiencia en estadística. Por otra parte,
existen programas de computación que le permiten efectuar todos los cómputos sin errores e incluso
graficar sus resultados. Lamentablemente también estos programas requieren cierto entrenamiento
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 32 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
33-175
para su uso. Presentamos un cuadro que sintetiza las principales diferencias entre ensayos
Paramétricos y No Paramétricos:
TEST
PARAMETRICOS
TEST NO
PARAMETRICOS
POTENCIA
RELATIVA (*)
100%
95%-65%
APLICABILIDAD
SOBRE DATOS
CUANTITATIVOS
Sólo Escala de Intervalo o
Escala de Proporción
CUALI/CUANTITATIVOS
Escala Nominal, Ordinal,
Intervalo o de Proporción
•
•
•
•
Obs. independientes
Poblaciones normales (z)
Varianzas proporcionales
Efectos aditivos de
causas deterministas
sobre los promedios
Poblaciones de cualquier
clase y datos de cualquier
tipo
t-Student, Análisis de Varianza
(ANOVA), F-Snedecor,
MANOVA, ANCOVA, etc.
Prueba de rangos, Prueba
de signos, Ji-cuadrado,
Prueba de Walsh, etc.
PREREQUISITOS
EJEMPLOS
(*) La potencia relativa es inversamente proporcional al tamaño muestral requerido en cada tipo
de test para poder arribar a conclusiones estadísticas equivalentes.
2.3.
LAS HIPOTESIS ESTADISTICAS
Estadística Inferencial: Dos es igual a Tres ?
Supongamos que tenemos dos grupos (A y B) de diez pacientes elegidos al azar, al grupo A se le
suministra un dentífrico con Flúor y a B un dentífrico sin Flúor. El experimento se prolonga durante
dos años, al cabo de los cuales se mide la cantidad de caries en los veinte pacientes. Supongamos
que los datos medidos fueron:
DATOS REALES
Cantidad de caries en A : 0, 2, 3, 1, 3, 2, 1, 0, 5, 3 cuyo promedio es = 20/10 = 2
Cantidad de caries en B : 1, 2, 4, 5, 4, 3, 6, 2, 1, 2 cuyo promedio es = 30/10 = 3
Observemos la fluctuación (dispersión) de los datos alrededor del promedio, si esa dispersión no
existiese y los resultados hubiesen sido:
DATOS IMAGINARIOS
Cantidad de caries en A : 2, 2, 2, 2, 2, 2, 2, 2, 2, 2 cuyo promedio es = 20/10 = 2
Cantidad de caries en B : 3, 3, 3, 3, 3, 3, 3, 3, 3, 3 cuyo promedio es = 30/10 = 3
En este caso imaginario, no hubiésemos requerido estadística para decidir que B tiene más caries que
A (o sea 3 > 2), no hay azar y sólo hay efectos causales que provocaron esos resultados. Pero, en el
mundo real de las ciencias naturales o experimentales, la probabilidad de obtener resultados sin
dispersión sobre variables derivadas de sistemas biológicos es astronómicamente pequeña. Lo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 33 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
34-175
habitual es encontrar muestras como la primera y es allí donde hace falta alguna técnica que nos
permita decidir si el Fluor (la única diferencia sistemática entre los tratamientos de A y B) previene o
no las caries.
Por eso se han desarrollado métodos que permiten tomar decisiones de riesgo calculado como que el
promedio de caries en A es menor (o al menos distinto) que el promedio en B. Por eso, en nuestro
ejemplo se puede sintetizar con una respuesta (valorizada) a la pregunta “DOS ES MENOR (O
DISTINTO) A TRES?”
En estadística, al contrario que en la aritmética, 2 puede ser “igual” a 3 si de promedios se trata.
El motivo es que la diferencia entre ambos números se debe exclusivamente a la casualidad, pero en
el fondo se trata de promedios equivalentes de una misma muestra o población. Por eso si un
fármaco preventivo de caries como el Flúor da un promedio de respuesta 2 y los controles
(individuos no tratados) da un promedio 3, son posibles dos casos mutuamente excluyentes:
a. H0 (HIPOTESIS NULA)
“Los promedios son iguales, las diferencias se deben sólo al azar” O sea 2=3.
b. H1 (HIPOTESIS ALTERNATIVA)
“Los promedios son distintos, existe una causa que provoca la diferencia” O sea 2 ≠ 3 o tal vez
2 < 3 (Ver ensayos de una o dos colas, presentado mas adelante).
2.4.
ERRORES DE TIPO I Y DE TIPO II EN LA TOMA DE DECISIONES
Como se ha dicho, los ensayos estadísticos se diseñan para responder a una de estas dos alternativas
mutuamente excluyentes:
a. ACEPTAR H0 (HIPOTESIS NULA) (es decir, rechazar H1), equivale a concluir que las
discrepancias observadas entre las muestras en estudio se deben exclusivamente al azar y no
existe una causa sistemática para esas discrepancias.
b. RECHAZAR H0 (HIPOTESIS NULA) (es decir, aceptar H1), equivale a concluir que las
discrepancias observadas entre las muestras en estudio no se deben exclusivamente al azar y si
existe una causa sistemática para esas discrepancias.
Pero, cuando se toma una decisión (en un ambiente de riesgo generado por el azar) siempre hay
riesgo de equivocarse. Se llama ERROR DE TIPO I o nivel de significación (simbolizado como
alfa = α) a la probabilidad de equivocarse cuando se rechaza una H0 siendo que es realmente
verdadera.
Obviamente existe otra forma de equivocarse. Se llama ERROR DE TIPO II (simbolizado como
beta = β) a la probabilidad de equivocarse cuando se acepta una H0 siendo que es realmente falsa. Al
valor complementario de este valor (1-β) se lo conoce como POTENCIA DEL ENSAYO de
inferencia, ya que es proporcional a la capacidad de detectar diferencias entre muestras (cuando
existe un motivo real para las mismas). La POTENCIA DEL ENSAYO es (por definición) la
probabilidad de rechazar una H0 siendo que es realmente falsa, o sea la probabilidad de detectar
diferencias reales entre las muestras. Otro factor determinante para la potencia de los ensayos es el
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 34 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
35-175
tamaño de la muestra empleada. La potencia de una prueba crece al aumentar el tamaño de la
muestra empleada. Los errores α y β son inversamente proporcionales, al aumentar uno disminuye el
otro. O sea no podemos optimizar simultáneamente ambos tipos de errores y debemos optar por
reducir uno sólo (a expensas del otro). El tema es cuál conviene reducir, alfa o beta. En ciencias
naturales (física, química, biología, etc.) la respuesta está bien definida.
En general es más importante reducir el riesgo del error de tipo I que el error de tipo II, porque en
ciencias naturales se adopta el punto de vista “CONSERVADOR” frente al punto de vista
“LIBERAL”.
•
Punto de vista “CONSERVADOR”: si algo es distinto a lo establecido, tiene que
demostrarlo fehacientemente, caso contrario nos quedamos con lo que está establecido.
En términos estadísticos, nos preocupa más rechazar una H0 siendo que es realmente
verdadera (estamos detectando un falso positivo, es decir una diferencia entre muestras
que no existe) y por ende nos preocupa mantener α en el mínimo posible.
•
Punto de vista “LIBERAL”: si algo es igual a lo establecido, tiene que demostrarlo
fehacientemente, caso contrario nos quedamos con que es distinto. En términos
estadísticos, nos preocupa más aceptar una H0 siendo que es realmente falsa (estamos
detectando un falso negativo, es decir una igualdad entre muestras que no existe) y por
ende nos preocupa mantener β en el mínimo posible.
Entonces, para la medicina, porqué no se fija α = 0 o en algún valor muy pequeño como α = 10-30 ?
Ciertamente ese sería lo ideal para la hipótesis conservadora, pero como dijimos, alfa y beta están
enlazados y si se elige un alfa demasiado pequeño beta crece demasiado (tiende a uno) y el
complemento de beta (o sea la potencia del ensayo) tiende a cero. Que un ensayo de inferencia tenga
potencia cercana a cero significa que será prácticamente incapaz de revelar diferencias reales entre
muestras, o sea que pierde su utilidad práctica. Por ese motivo, se debe buscar un límite superior de
alfa que sea suficientemente bajo como para ser “conservador” pero sin dañar la potencia del ensayo.
ESTANDAR DE SEGURIDAD EN CIENCIAS NATURALES: siempre se mantiene a alfa (o sea
el nivel de significación o error del tipo I) menor o igual a 0.05, nunca mayor a ese valor límite
superior.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 35 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
36-175
Las decisiones de riesgo que permite tomar la estadística caerán en cuatro categorías
LA REALIDAD
ACEPTAR H0
H0 ES
VERDADERA
H0 ES FALSA
CORRECTA
ERROR TIPO II
(=beta)
LA DECISION
(basada en un
CORRECTA
ensayo
ERROR TIPO I (región de la
inferencial) RECHAZAR H0
potencia del
(=alfa)
ensayo)
2.5.
TEST DE UNA COLA Y DE DOS COLAS
En general, los ensayos de significación estadísticos buscan diferencias entre parámetros estadísticos
o entre atributos de comparación de dos o más muestras. Como ejemplo, los ensayos paramétricos,
es decir los test aplicados a variables que se distribuyen “normalmente” alrededor de su promedio
(como la propia distribución normal -Gauss- o la distribución de “t” de muestras pequeñas), se
pueden formular en dos formas de H1 , como Test de una cola o como Test de dos colas. Estos
nombres provienen de considerar que los datos que se desviaron del promedio pueden estar en una o
en las dos “colas” de la curva normal:
1-Alfa
1-Alfa
Alfa
Alfa/2
TEST DE UNA COLA (2<3)
Alfa/2
TEST DE DOS COLAS (2≠3)
El nivel de significación (alfa) (o sea el error de tipo I vinculado a la hipótesis nula) equivale al área
de una cola de la campana de Gauss o de ambas, según el caso y representa la “región de rechazo” de
la H0. Su complemento (=1-alfa) es la “región de aceptación” de la hipótesis nula.
Supongamos que comparamos ( x ± DS ) dos muestras:
Entonces podemos formular:
( H1
( H1
: TEST DE UNA COLA)
: TEST DE DOS COLAS)
2 ± 1
y 3 ± 2
El primer promedio (2) es menor que el segundo (3)
El primer promedio (2) es distinto al segundo (3)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 36 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
2.6.
37-175
CÓMO ELEGIR LA H1 CORRECTA
El test de una cola es más preciso que el de dos colas, y debe ser aplicado siempre que A PRIORI
exista la sospecha de una “causa sistemática” que generó esa diferencia. Por ejemplo si medimos el
umbral de dolor de un grupo (una muestra) de pacientes medicados con un analgésico o probable
analgésico respecto del observado en un grupo control (no medicado o medicado con un placebo), es
razonable que el umbral de dolor sea mayor en los medicados que viceversa. En este caso se puede
aplicar el test de una cola. Pero, si antes de comenzar con el ensayo estadístico no hay motivo para
pensar que un dato será mayor a otro (no hay razón suficiente), se debe emplear siempre el Test de
dos colas.
Vamos a aclarar qué queremos decir con la frase “no hay razón suficiente”. Si se dispone de
antemano de algún indicio del sentido que debería tener una diferencia entre el grupo de ensayo y el
grupo control, entonces habrá razón suficiente para diseñar un ensayo de una cola (por ejemplo si
probamos un hipotensor, la presión de los tratados debería ser con razón suficiente menor que la de
los pacientes control) Pero, si no hubiese indicio a priori de cual debería ser la (supuesta)
discrepancia entre los grupos bajo estudio, siempre se debe optar por una prueba de dos colas.
Resumiendo todo lo dicho acerca de la significación y del tamaño de las muestras, deberán
recordarse estos cinco puntos:
El nivel de significación (α) mide el error de tipo I (rechazar H0 siendo verdadera)
El valor beta (β) mide el error de tipo II (aceptar H0 siendo falsa)
La potencia de una prueba consiste en rechazar acertadamente una H0 siendo falsa (=1- β)
La potencia de una prueba está relacionada con su naturaleza y con la H1, las pruebas de
una cola son más potentes que las pruebas de dos colas.
5. En términos generales, la potencia de una prueba se incrementa al aumentar el tamaño de
las nuestras involucradas.
1.
2.
3.
4.
L muy importante!!
Las hipótesis estadísticas H y H y el nivel de significación α de un ensayo de estadística
L
inferencial SIEMPRE deben ser fijadas de antemano, es decir antes de efectuar el
0
1
análisis propiamente dicho. Bajo ningún concepto se debe cambiar una hipótesis
estadística o fijar el nivel de significación una vez conocidos los valores numéricos del
ensayo. Las reglas del juego no se modifican sobre la marcha, se imponen antes de
comenzarlo. Caso contrario el análisis estadístico se convierte de objetivo en subjetivo.
2.7. ACEPTACION Y RECHAZO DE HIPOTESIS Y EL PROGRESO DE LAS
CIENCIAS EXPERIMENTALES
La aceptación y rechazo de hipótesis traducidas al formato estadístico (recordemos que las hipótesis
generalmente no son estadísticas pero que se formulan luego en formato estadístico para proceder
al análisis inferencial) siempre se produce a través de un ensayo estadístico de inferencia
(paramétrico o no paramétrico, según corresponda). Para decidir que clase y tipo de ensayo conviene
usar, es recomendable el asesoramiento de docentes o científicos con experiencia en estadística. Los
ensayos de inferencia estadística son el método mediante los cuales se ayuda muchas veces a
descubrir nuevos fármacos, se mejoran los materiales de implante dental, se ayuda a prevenir las
caries o se determina que una técnica quirúrgica es mejor que otra. También servirá para que el
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 37 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
38-175
profesional de la salud juzgue con criterio propio si una propaganda de un visitador es engañosa o
no.
Como se indicó previamente, la mejor manera de prevenirse para el consumo de estadística mendaz
es capacitarse por medio de la lectura crítica de trabajos de investigación serios de su especialidad.
“Actualmente, el progreso de la medicina se basa en la utilización de tests de inferencia
estadísticos, no existe otra metodología que la suplante y es un real fundamento del progreso de
toda ciencia experimental. Si no existiese, la medicina sería tema del curanderismo y la
adivinación, no la ciencia que conocemos. Por eso es fundamental para la formación del futuro
profesional de la salud aprehender sus fundamentos. No importa tanto la técnica numérica que
llegado el caso se encuentra en la bibliografía específica, lo que si importa y mucho son los
conceptos que le permitirán plantear dudas fundamentadas en su práctica profesional y acudir a las
diferentes formas de información como el libro, Internet o el especialista llegado el caso.”
2.8.
ENSAYOS APAREADOS Y ENSAYOS AGRUPADOS
Cuando se comparan dos grupos y siempre que sea naturalmente posible, se debe trabajar sobre las
diferencias (aparear los datos), y de esa forma el ensayo será más eficiente. (Ej: antes y después de
un tratamiento en cada paciente) Del apareamiento surge que mediante el mismo cada observación
de un grupo sirve como control para esa misma observación en el otro grupo haciéndolo así mas
eficiente (requiere menos observaciones). Por ejemplo, si medimos la respuesta a un tratamiento
antes de comenzarlo y al finalizarlo sobre un grupo de pacientes, medir las diferencias apareadas
significa eliminar efectos sistemáticos no controlados dependientes del genotipo y del ambiente de
desarrollo de cada paciente (obviamente variables que no están bajo nuestro control) y que
determinan que cada paciente responda al tratamiento en forma mas o menos personal, aunque si el
efecto sistemático y causal del tratamiento existe, este se verá reflejado en mayor o menor grado en
cada uno de los pacientes y por ende en las diferencias registradas.
Por otra parte si se mide el efecto de dos tratamientos distintos en dos grupos separados de pacientes
seleccionados al azar, no existe motivo suficiente para aparear los pacientes del primer grupo con los
del segundo o sea no se puede ni debe aparear datos en este caso. Por el contrario, debe quedar claro
que se puede dejar de aparear datos apareables y simplemente agruparlos dentro de cada grupo al
azar, aunque por razones de eficiencia obviamente esto no será recomendable.
Se puede demostrar que si un ensayo de inferencia permite aparear datos (por ejemplo, el test
paramétrico t-Student para medir diferencias de promedios entre dos grupos), la potencia del ensayo
(1-β) apareado siempre será mayor o igual a la potencia del ensayo agrupado. Por ese motivo hay
que aparear siempre que sea factible.
2.9. EL MUESTREO Y EL DISEÑO DE LAS PRUEBAS A CIEGO, DOBLE CIEGO Y
TRIPLE CIEGO
Una de las condiciones más importantes para que una prueba de inferencia tenga valor es que las
observaciones individuales sean extraídas al azar de su población de origen (población sobre la que
se desean hacer inferencias). Esto se aplica tanto a ensayos paramétricos como a los no paramétricos
y su incumplimiento atenta contra la validez fundamental del ensayo. Debe tenerse en cuenta que su
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 38 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
39-175
incumplimiento no impedirá la generación de un resultado matemático, pero este resultado carecerá
de validez.
Supongamos que se necesitan seleccionar dos grupos de diez (10) pacientes para efectuar un ensayo
comparativo de dos tratamientos dentro de un grupo de quinientos veintitrés (523) disponibles. El
problema es cómo se seleccionan al azar, lo que es más fácil enunciar que concretar.
Para comenzar indicaremos un método simple aunque menos riguroso respecto del que se indica más
adelante. Simplemente vaya a la tabla de números aleatorios (TABLA I del APÉNDICE ) y apunte el
dedo al azar (en lo posible sin mirar) sobre la misma y anote el dígito que quedó apuntando. Repita
tantas veces como sea necesario hasta completar su muestra de números aleatorios.
Ahora vamos a indicar un procedimiento más riguroso y que también usa la tabla de números
aleatorios (Ver TABLA I del APENDICE)
a. Lo primero que tiene que hacer es asignar números a cada individuo (u observación
individual extraíble) de su población. Por ejemplo, si se trata de pacientes argentinos, use los
cinco últimos (o más si hace falta) dígitos del DNI de cada uno (o sea un 21.234.905 se
transforma en 34905). Si dos pacientes resultasen con igual número, se modifica al segundo
sumando uno a su número hasta que sea único. A este nivel no puede haber duplicados
(Tenemos 523 números asignados). Si se tratase de animales de experimentación,
simplemente se los debería identificar por marcas y numerar al azar.
b. Ordene secuencialmente (de menor a mayor) su lista de números de la población (de 00000 a
99999), de manera que Ud. terminará con una lista de pacientes numerada del 1 al 523.
c. Obtenga en la forma más casual que se le ocurra (o pídale a alguien ajeno al tema) cuatro
números del 1 al 10 y anótelos (A, B, C y D). Después vaya a la TABLA I del APENDICE y
seleccione la columna A (Observe que hay 10 columnas con números de 5 cifras). Ahora
seleccione la fila B.C+D y si ese número fuese mayor que 50 réstele 50 (Observe que hay 50
filas de números, agrupadas de a cinco). Se acaba de seleccionar el primer número de su
muestra que obviamente tiene 5 cifras. Supongamos que A=9, B=7, C=9 y D=2; entonces se
acabó de seleccionar la columna 9 y la fila 7.9+2=65-50=15, o sea el número 45276.
Olvídese de los dos últimos dígitos, se acaba de seleccionar el número 452. Como ese
número es menor que el tamaño de la población (523) y como no ha sido elegido antes (por
ser el primero!) se lo acepta y así resulta que el paciente #452 es el primer seleccionado de
los diez buscados.
d. Ahora seleccione el número inmediato inferior a ese (06028). Repitiendo el procedimiento de
selección resulta que el paciente #060 es el segundo elegido. Si se alcanza el último número
de alguna columna, se avanza a la primer fila de la columna siguiente, y si se agota la última
columna se va a la primer fila de la primer columna.
e. Repita ocho veces mas, salteando aquellos números que superen 523 y los que hayan sido
elegidos antes. Al concluir se tendrá la muestra de 10 pacientes elegidas al azar.
Resulta fácil adaptar este procedimiento a cualquier tamaño de población y muestra y aún modificar
el sistema cambiando las direcciones de avance, la selección de las coordenadas iniciales, los dígitos
significativos a usar dentro del grupo de cinco, etc. Será válido cualquier método que conduzca a la
selección de muestras en forma tal que a priori cualquier individuo posea la misma probabilidad que
otro de pasar a integrar la muestra.
Un problema potencial que altera dramáticamente los resultados aparece cuando un paciente conoce
de antemano con qué ha sido tratado y por efecto psicosomático reacciona según la tendencia que él
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 39 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
40-175
mismo espera. Por ejemplo, si un paciente sabe que se está haciendo un estudio sobre el poder
analgésico de una droga y sabe que él esta ingiriendo esa droga y no un placebo (especie
farmacéutica con igual aspecto y caracteres organolépticos que el tratamiento pero sin su principio
activo), entonces es posible que espontáneamente sienta menos dolor (aún como mecanismo
inconsciente). Este efecto alterará totalmente los resultados y falsea las conclusiones. Otro tema a
considerar pasa cuando el observador que registra los datos de los pacientes conoce de antemano si
los pacientes han sido tratados o son controles con placebos. En ese caso, es imposible que el
observador (que conoce cuál es la respuesta deseada) no posea algún tipo de prejuicio sobre lo que
está midiendo, conciente o inconsciente. Como hay que eliminar estos sesgos (en estadística se llama
así a cualquier tendencia sistemática que desvía el valor de las mediciones) se han diseñado métodos
que quitan esa fuente de problemas. En grado creciente de utilidad, los diseños se clasifican en:
•
Ensayo CIEGO: El individuo no sabe a qué categoría pertenece, es decir si pertenece al
grupo control o al grupo tratamiento y por ende no está prejuiciado a-priori.
•
Ensayo DOBLE CIEGO: Ni el individuo ni el observador que registra las mediciones saben
a que categoría pertenece cada uno y por ende no están prejuiciados a-priori.
•
Ensayo TRIPLE CIEGO: Ni el individuo ni el observador ni el estadístico que efectúa el
análisis de inferencia saben a que categoría pertenece cada uno y por ende no están
prejuiciados a-priori.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 40 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
41-175
2.10. ARQUITECTURA GENERAL DE LAS PRUEBAS DE INFERENCIA
Las múltiples pruebas de inferencia responden todas a un patrón común, lo que simplifica
enormemente su estudio sistemático. Cualquiera sea la clase de prueba de inferencia, ya sea
paramétrica o no-paramétrica, existen reglas generales que permiten racionalizar su lógica y de esa
manera ganar experiencia para capturar la esencia de cualquiera de ellas. En general los ensayos se
efectúan por medios informáticos lo que simplifica todo el proceso y evita los errores
computacionales.
INGRESO ORDENADO DE LOS
DATOS DEL ENSAYO Y EL NIVEL DE
SIGNIFICACION A USAR
COMPUTO DEL ESTADISTICO DE
ENSAYO
COMPUTO DE LA PROBABILIDAD
ASOCIADA AL ESTADISTICO DE
ENSAYO
ACEPTAR O RECHAZAR H0
Los datos se ingresan según el
protocolo del ensayo elegido, el
α se fija siempre de antemano
Cada ensayo tiene algún
parámetro de salida que
concentra la información. Por
ejemplo puede ser x2, t, F, r, R,
H, W, etc.
El valor obtenido del estadístico
de ensayo siempre posee una
probabilidad asociada (p), en
general función de los tamaños
muestrales. Esto se computa por
programa o se consulta en
tablas como las del APENDICE.
Si el p obtenido alcanza o
supera al α definido, se acepta
Ho, si el p fuese menor que el
α, se rechaza H0
Vamos a dar un ejemplo de interpretación práctica de este cuadro. Supongamos que tenemos diez
pacientes diabéticos y a cinco les suministramos u hipoglucemiante, a la hora las medidas de
glucemia fueron (en g/l) 1,32 - 1,22 - 1,05 - 1,53 y 1.16. El resto control arrojó los resultados
1,55 - 1,69 - 2,13 - 1,62 y 1,81. Ingresamos los datos en dos columnas paralelas y fijamos la
H0:tratados=control vs. H1:tratados<control (de 1 cola!). Además fijamos nuestro nivel de
significación en 0,01. Ahora computamos el estadístico de prueba t-Student (agrupado) (ver
Capítulo 3) y nos dá el valor t=5,76 con 8 grados de libertad y una probabilidad asociada de
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 41 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
42-175
0,00032. Como ese valor de probabilidad es menor que el nivel de significación, se rechaza H0 y se
acepta H1.
2.11. DISEÑOS
FALTANTES
SIMETRICOS,
ASIMETRICOS
Y
MANEJO
DE
LOS
DATOS
Cuando se quiere comprobar el efecto de dos o mas intervenciones sobre una población, se puede
optar por seleccionar muestras de igual tamaño para cada caso o dejar ese número librado al azar.
Desde el punto de vista de la potencia de los ensayos de inferencia, la opción no admite dudas. La
primer variante debe ser siempre la preferida y se la conoce como diseño experimental simétrico. El
motivo de su mayor eficiencia es que al asignar el mismo tamaño a cada clase o categoría, todas las
opciones reciben a priori el mismo peso estadístico y se optimiza la flexibilidad del ensayo frente a
todas las alternativas. Por ejemplo, si un grupo A posee una respuesta débil frente a otro grupo B
con una respuesta mucho más manifiesta y si la influencia del azar es proporcionalmente importante
frente a la influencia causal medida, elegir un tamaño muestral más pequeño para A que el elegido
para B debilitará sensiblemente la potencia del ensayo.
Si se piensa en términos económicos, cada observación individual cuesta dinero además de otros
recursos escasos como tiempo de trabajo y recursos humanos. Por eso, la mejor manera de distribuir
el presupuesto para el ensayo es asignar recursos equivalentes para cada alternativa considerada.
Esto es, todo experimento debe ser diseñado en forma simétrica a menos que exista una buena
razón para no hacerlo.
Sin embargo, a veces no se puede evitar que el diseño termine siendo asimétrico, aún a pesar del
investigador. Muchas veces es imposible pensar en simetrizar un diseño a priori, por ejemplo si se
estuviese efectuando un estudio sobre una enfermedad muy poco frecuente, es improbable que se
pueda obtener suficientes recursos como para que el diseño quede simétrico. Otras veces los
pacientes fallecen, se pierden o desaparecen de un ensayo. Hay factores imprevistos, las
observaciones de destruyen o se agotan los recursos para obtenerlos. Entonces aparecen huecos o
datos faltantes en diseños que de otra manera serían absolutamente simétricos. El tema es cómo
completar esos huecos y cuándo decidir que es imprescindible hacerlo.
En primer lugar, si se producen huecos en un diseño simétrico lo primero que debe considerarse es
reponer el dato faltante. A veces es posible hacerlo, a veces no. Esta es la mejor opción, con un
poco de esfuerzo adicional se consigue otro paciente y se repite su tratamiento o se adquiere por la
vía habitual una nueva observación. Si eso no fuese posible, considere la alternativa de seguir
adelante con el diseño asimétrico. Pero, si decide que la simetría debe ser recuperada a toda costa,
existe una técnica que le permite simular uno o mas (nunca más del 5% del total) de los datos
faltantes.
El método es simple, el número o dato reemplazante debe provenir de una fuente (artificial en este
caso) que tenga la misma estructura que la natural u original. Por eso, si el resto de los “datos
colegas”, es decir aquellos que acompañan al faltante, posee una cierta estructura detectable, esa
misma estructura debe ser empleada para generar al dato que falta. Por ejemplo, si dentro de un
grupo o tratamiento debiesen existir 15 observaciones pero se perdieron 2, lo que hay que hacer es
investigar la clase de distribución que cumplen los 13 “datos colegas”. Supongamos que esos datos
responden a una distribución normal definida por una media y la varianza N(μ,σ2) lo que
corresponde es generar dos nuevos números que respondan a esa misma distribución.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 42 -175
ESTADISTICA PRÁCTICA para profesionales de la salud
CAPITULO 2 – Generalidades de la estadística inferencial
43-175
Para generar una secuencia de números aleatorios con distribución uniforme, basta usar un
programa generador de números seudoaleatorios por computadora o recurrir a la TABLA I del
APENDICE.
Aquí seudoaleatorio es un tecnicismo estadístico que se aplica a la generación determinista de
secuencias caóticas, pero a los fines prácticos, cuando mencionemos esta palabra se deberá
entender como equivalente a la palabra aleatorio.
Para generar una secuencia de números distribuidos normalmente con media μ y varianza σ2, se procede de la
siguiente manera:
1. Generar n números al azar (TABLA I ) definidos comoU 1 U 2 …U n
2. X j = μ + − 2σ 2 ln(U j ) cos(2πU j +1 ) ⎫⎪
⎬ j = 1,3,5,..., n
X j +1 = μ + − 2σ 2 ln(U j ) sin(2πU j +1 )⎪⎭
Los números de entrada Uj son números aleatorios uniformemente distribuídos entre cero y uno. Se puede usar la
TABLA I para obtenerlos, simplemente agregue un punto decimal en donde prefiera. Los números de salida Xj
estarán distribuídos N(μ,σ2) según lo requerido.
Otra situación que suele repetirse y en la cual resulta de interés completar datos faltantes aparece en
cuadros de frecuencia. Por ejemplo, en una matriz numérica (tabla rectangular de valores) donde
cada celda contiene la frecuencia registrada para esa fila y esa columna y cuando lo que se busca
comprobar es que esas frecuencias están distribuídas en forma uniforme, se calculan celdas faltantes
de la misma forma que se procede para calcular frecuencias esperadas en la prueba no paramétrica
de contingencia chi-cuadrado (χ2) (ver Capítulo 4). El método es simple, para cada fila y cada
columna se suman los valores (esto se conoce como sumas marginales). Obviamente la suma de las
sumas dan el total general. Entonces, si falta el dato de frecuencia de una columna cuya suma es m
y la fila cuya suma es n, y además el total general es k, la frecuencia faltante (usando la hipótesis de
independencia) será = (m.n)/k.
En otros casos podría ocurrir que hiciese falta obtener números aleatorios distribuidos según
cualquier otra función estadística. En esos casos se recomienda recurrir al libro que trata en
profundidad este tema (FISHMAN, 1978).
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 43 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 44-175
CAPITULO 3: TEST PARAMETRICOS
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 44 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
3.1.
Pag 45-175
POBLACIONES NORMALES : LA DISTRIBUCION ZETA
Vamos a comenzar con un análisis general de una técnica de transformación de variables en el formato
de la distribución normal (Ver Capítulo 1) ¿Porqué es importante transformar datos provenientes de
mediciones sobre sistemas biológicos en datos compatibles con la distribución normal? Porque esa
distribución es la más importante de las ciencias experimentales y porque permite sacar fácilmente
conclusiones acerca del comportamiento general de una muestra que de otra forma no sería posible o
llevaría un esfuerzo considerable.
Se conoce como distribución z a la distribución normalizada (media cero, desviación standard 1) de
cualquier variable que cumpla con las hipótesis de la distribución normal o Gaussiana. Cuando una
muestra de la cual se intuye de antemano que proviene de una población que sigue la distribución
normal y ya se han calculado su media y la desviación standard, se normaliza la misma a través de la
siguiente transformación de datos que pasan los valores x iniciales a valores z:
z=
x− X
DS
“z” indica la desviación del valor x respecto de la media , medida en unidades de DS, o sea, indica a
cuántas DS está el valor x del promedio.
Ejemplo: la cantidad de PABA (ácido p-amino benzoico) excretada por la orina en una muestra de
1000 hombres cuyas edades están comprendidas entre 50 y 55 años fue de 151,0± 15,0 μg / 24 Hs
( x = 151,0 μg / 24 Hs ; DS = 15,0 μg / 24 Hs ). Considerando que esa tasa de excreción se encuentra
distribuida normalmente, ¿cuántos hombres de la muestra dada presentan una tasa de excreción de
PABA ubicada entre 119,5 μg / 24 Hs y 155,5 μg / 24 Hs ?
Antes de comenzar valga la acotación que si aquí no se aplica la transformación normal (z) arriba
detallada, no sería posible responder a esta pregunta. La única forma viable de lograr esa respuesta es
suponer que la tasa de excreción de ese metabolito por orina sigue una distribución Gaussiana. Una vez
asumida esta hipótesis (que por otra parte resulta verificablemente verdadera) pasamos a resolver este
interrogante.
1) Se calculan los valores de z para cada uno de los extremos del intervalo teniendo en cuenta que la
variable es continua:
Entonces :
z1 = (119,5 –151) / 15 = -2,1 y
z2 = (155,5-151)/ 15 = 0,3
lo que indica que el valor 119,5 está a 2,1 DS por debajo del promedio, y el valor 155,5 está a 0,3 DS
por encima del promedio.
2 ) Luego se buscan las probabilidades respectivas para z1 y para z2 en la tabla correspondiente. Para
obtenerlos, acudimos al APENDICE - TABLA II: DISTRIBUCION NORMAL (z) donde se encuentra
la probabilidad de que un valor z dado esté entre cero y un límite a tabulado. Gráficamente:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 45 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 46-175
Para z1 = -2,1
•
la probabilidad tabulada de z entre 0 y +2,1 que es 0,4821, pero la curva normal es simétrica,
por eso el área entre 0 y +2,1 es igual al área entre -2,1 y 0. Se concluye que el 48,21 % de los
individuos de la población excretan PABA por orina entre 119,5 y 151,0 μg / 24 Hs ).
Para z2 = 0,3
• La probabilidad tabulada es 0,1179 (11,79%)
Se concluye entonces que el 11,79% de los individuos de la población tienen excreción urinaria de
PABA entre 151,0 y 155,5 μg / 24 Hs )
3 ) El número de hombres de la muestra que tienen excreción de PABA entre 119,5 y 155,5 μg / 24 Hs ,
se calcula sumando las dos probabilidades anteriores y multiplicando la probabilidad hallada por el
tamaño de las muestra :
n = [p( -2,1 ≥ z ≥ 0) + p( 0 ≤ z ≤ 0,3) ] x 1000 = (0,4821 +0,1179) x 1000 = 600 hombres.
Pruebas de significación basadas en z
Con frecuencia en medicina se plantea la siguiente pregunta: ¿cuándo un valor dado representa
solamente una variación normal con respecto al promedio y cuándo ese valor se considera
patológico?
Entre los valores considerados normales hay un valor promedio y el resto de los valores se distribuyen
alrededor del promedio según un valor de DS. Un valor alejado del promedio, ¿es necesariamente
patológico o puede ser un valor normal con poca probabilidad de ocurrencia? Si bien no puede darse
una respuesta absoluta, la estadística permite calcular cuál es la probabilidad de que un valor pertenezca
a la población de los valores normales; si esa probabilidad es muy baja se asumirá que el valor es
patológico.
Como ya hemos indicado (en el ámbito biológico), se han fijado convencionalmente los siguientes
niveles de significación :
•
probabilidad ≥ 0,05 (≥5 % de probabilidad de que la diferencia del promedio de un
grupo bajo estudio con respecto al promedio de otro grupo bajo estudio esté dentro del
rango normal y se haya debido al azar) – NIVEL NO SIGNIFICATIVO – (N.S.), o sea,
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 46 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
•
Pag 47-175
“LA DIFERENCIA NO ES SISTEMÁTICA, Y POR LO TANTO NO EXISTE
ESTADÍSTICAMENTE HABLANDO”.
probabilidad < 0,05 (5 % de probabilidad de que la desviación con respecto al
promedio esté dentro del rango normal y se haya debido al azar) – NIVEL
SIGNIFICATIVO – (*)
•
probabilidad < 0,01 (1 % de probabilidad de que la desviación esté dentro del rango
normal y se haya debido al azar) – NIVEL MUY SIGNIFICATIVO - (**)
•
probabilidad < 0,001 (0,1 % de probabilidad de que la desviación esté dentro del
rango normal y se haya debido al azar) – NIVEL ALTAMENTE SIGNIFICATIVO (***)
Para saber donde están los límites de significación de z, consultamos la tabla y vemos que:
a) ENSAYO DE DOS COLAS
z = 1,96
z = 2,58
z = 3,29
(p tabulada de 0.4750 x 2 = 0,95 = 95%, o sea entre las 2 colas suman 5%)
(p tabulada de 0.4951 x 2 = 0,99 = 99%, o sea entre las 2 colas suman 1%)
(p extraída de otra tabla mas extensa = 99,9%, o sea entre las 2 colas suman 0,1%)
Interpretación para el ensayo de dos colas:
H0: “la desviación (z) observada es igual a cero”
H1: “la desviación (z) observada es distinta a cero”
Si un z experimental se encuentra dentro del intervalo [-1,96, +1,96] el desvío registrado
no es significativo y se acepta H0. Si el valor de z está dentro del intervalo [-2,58, -1,96)
o dentro del intervalo [+2,58, +1,96) el desvío registrado es significativo y se rechaza H0
al nivel 5%. Si el valor de z está dentro del intervalo [-3,29, -2,58) o dentro del intervalo
[+3,29, +2,58) el desvío registrado es muy significativo y se rechaza H0 al nivel 1%. Si el
valor de z está dentro del intervalo (-∞, -3,29) o dentro del intervalo (+∞, +3,29) el
desvío registrado es altamente significativo y se rechaza H0 al nivel 0,1%.
b) ENSAYO DE UNA COLA
z = 1,65
z = 2,33
z = 3.08
(p tabulada de 0.4501 = 45%, o sea 1 cola es de 5%)
(p tabulada de 0.4901 = 49%, o sea 1 cola es de 1%)
(p tabulada de 0.4990 = 49,9%, o sea 1 cola es de 0,1%)
b1) Interpretación para el ensayo de una cola para el caso z positivo:
H0: “la desviación (z) observada es igual a cero”
H1: “la desviación (z) observada es MAYOR a cero”
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 47 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 48-175
Si un z experimental se encuentra dentro del intervalo (0, +1,65] el desvío registrado no
es significativo y se acepta H0. Si el valor de z está dentro del intervalo (+1,65, +2,33] el
desvío registrado es significativo y se rechaza H0 al nivel 5%. Si el valor de z está dentro
del intervalo (+2,33, +3,08] el desvío registrado es muy significativo y se rechaza H0 al
nivel 1%. Si el valor de z está dentro del intervalo (+3,08, +∞) el desvío registrado es
altamente significativo y se rechaza H0 al nivel 0,1%.
b2) Interpretación para el ensayo de una cola para el caso z negativo:
H0: “la desviación (z) observada es igual a cero”
H1: “la desviación (z) observada es MENOR a cero”
Si un z experimental se encuentra dentro del intervalo (0, -1,65] el desvío registrado no
es significativo y se acepta H0. Si el valor de z está dentro del intervalo (-1,65, -2,33] el
desvío registrado es significativo y se rechaza H0 al nivel 5%. Si el valor de z está dentro
del intervalo (-2,33, -3,08] el desvío registrado es muy significativo y se rechaza H0 al
nivel 1%. Si el valor de z está dentro del intervalo (-3,08, -∞) el desvío registrado es
altamente significativo y se rechaza H0 al nivel 0,1%.
Vamos a ejercitar estos conocimientos con dos ejemplos de aplicación. El primero está referido a los
“valores normales” que en medicina sirven para clasificar a los pacientes en sanos o enfermos respecto
de distintas variables estadísticas o indicadores del estado de salud.
Valores normales en medicina
Por convención, se consideran normales a los valores de cualquier indicador que presenta el 95%
de la población (humana) carente de toda sintomatología patológica evidente. Estos valores se
distribuyen (normalmente) dentro de un rango conocido como intervalo de confianza 95% y deben
ser medidos en condiciones bien estandarizadas por un protocolo universalmente aceptado
(por ejemplo, para glucemia – glucosa circulante en sangre - se toma una muestra de sangre venosa
en un tubo conteniendo un agente glucostático como flúor durante las primeras horas de la mañana y
en condiciones de ayuno de 8 horas)
Aceptando esa convención y volviendo al ejemplo de la excreción urinaria de PABA de los 1000
pacientes, ¿cuáles son los valores normales de este indicador? Obviamente, si miramos los valores
límites de z con dos colas, el intervalo de confianza 95% se establece si z está dentro del intervalo [1,96, +1,96]. Sólo nos resta traducir esos límites en términos de excreción:
Límite Inferior 95% = x – 1,96 DS = 151,0 – 1,96 . 15,0 = 121,6 μg / 24 Hs (ensayo de 2 colas)
Límite Superior 95% = x + 1,96 DS = 151,0 + 1,96 . 15,0 = 180,4 μg / 24 Hs (ensayo de 2 colas)
O sea el intervalo de confianza 95% y rango de la normalidad es [121,6 a 180,4] μg / 24 Hs . Por lo
tanto si una persona posee una tasa de excreción de PABA de 117,0 μg / 24 Hs se lo considera
ANORMAL (patológico, al nivel 5% de dos colas) y si tuviese una excreción de 194,0 μg / 24 Hs
ídem. Obsérvese que (por ahora) decimos que es ANORMAL y no aclaramos HIPOEXCRETOR o
HIPEREXCRETOR respectivamente, ya que sólo hemos efectuado un ensayo de dos colas. Sin
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 48 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 49-175
embargo, si nosotros tuviésemos la sospecha previa que se trata de un paciente HIPOEXCRETOR o
HIPEREXCRETOR, entonces podríamos buscar los intervalos de confianza de una cola, sabiendo que
los valores de z límites son ahora -1,65 y +1,65:
Límite Inferior 95% = x – 1,65 DS = 151,0 – 1,65 . 15,0 = 126,3 μg / 24 Hs (ensayo de 1cola)
Límite Superior 95% = x + 1,65 DS = 151,0 + 1,65 . 15,0 = 175,8 μg / 24 Hs (ensayo de 1 cola)
Ahora sí podemos llamar al paciente de 117,0 μg / 24 Hs HIPOEXCRETOR (es menor a 126,3) y al de
194,0 μg / 24 Hs HIPEREXCRETOR (es mayor a 175,8). Esto parece ser una complicación adicional
al tratar de definir patologías, porque aparte de definir un intervalo de confianza 95% de dos colas,
aparentemente habría que definir además el intervalo de confianza 95% de una cola. Pero eso no es así,
ya que siempre que un ensayo de 2 colas registre una diferencia significativa a un dado nivel,
automáticamente también será significativa esa diferencia al mismo nivel para el ensayo de 1 cola.
Resumiendo, si un paciente registra un valor menor al intervalo de confianza 95% de normalidad de un
parámetro (por ejemplo Glucemia) será automáticamente Hipoglucémico al nivel 5% (en realidad lo es
al nivel 2,5%) y si lo supera al intervalo, será Hiperglucémico (o Diabético) al nivel 5%. En realidad,
vale la siguiente regla general de significación:
si un ensayo de 2 colas es
significativo (rechazo de H0) al nivel
1%
su interpretación como ensayo de 1
cola será significativa (rechazo de
H0) al nivel 0,5%
si un ensayo de 1 cola es
significativo (rechazo de H0) al nivel
1%
su interpretación como ensayo de 2
colas será significativa (rechazo de
H0) al nivel 2%
Obviamente en estos cuadros se puede cambiar el valor 1% del cuadro de la izquierda por cualquier
otro (≤5%) pero se deberá ajustar convenientemente el valor del cuadro de la derecha.
3.2. COMPARACIÓN DE DOS GRUPOS NORMALES: TEST t-STUDENT
Cuando se trata de comparar el promedio de dos muestras provenientes de poblaciones distribuidas
normalmente (recordemos que esa es una condición necesaria para poder aplicar ensayos de tipo
paramétrico) disponemos de un ensayo muy eficaz conocido como el test t-Student. Este ensayo está
basado en una distribución estadística de muestras de pequeño tamaño y se acerca asintoticamente a la
distribución normal a medida que el número de observaciones comparadas tiende a infinito. A los fines
prácticos si dos muestras independientes a comparar tienen más de 30 observaciones individuales en
conjunto o si las dos muestras fuesen dependientes y se efectuasen más de 30 comparaciones entre
ambas se las puede considerar distribuidas normalmente.
La distribución t-Student utiliza para el indicador “t” que se calcula:
t=
x1 − x2
ES
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 49 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 50-175
“t” brinda la desviación del valor promedio x1 con respecto al valor promedio x2 , medida en unidades
de ES (error standard). Los valores típicos de esta distribución están tabulados, en el APENDICE –
TABLA III se presenta un extracto de esta tabla. En esta tabla de t-Student se encuentran las
probabilidades que tiene el valor dado de pertenecer a la distribución “t”, según el valor de “t”
calculado, y los grados de libertad. Los grados de libertad, término vinculado a los valores que se
pueden elegir libremente una vez fijadas ciertas restricciones sobre los parámetros, toman valores
vinculados a los tamaños de las muestras, como ser ν= n-1 o ν=n1+n2-2. Entonces se buscan en la
primera columna esos grados de libertad y en el cuerpo de la tabla, se busca el valor “t” (que fuera
calculado previamente) y para ese grado de libertad. Las probabilidades de que ese valor x pertenezca a
la población se encontrarán en la parte superior, horizontalmente y encabezando la columna de “t” o
interpolando.
Básicamente existen dos variantes para la prueba de inferencia t-Student, el TEST AGRUPADO y el
TEST APAREADO. Estas variantes se refieren al tema de apareamiento de datos que ya ha sido
discutido en un punto previo del capítulo anterior. Sólo nos limitaremos a recordar dos hechos: el test
apareado que trabaja sobre las diferencias entre dos grupos, es más potente que el agrupado pero sólo se
puede efectuar si hay justificación para proceder a ese apareamiento. Vamos a ver ejemplos de ambas
variantes.
a) TEST t-STUDENT AGRUPADO
Tenemos dos muestras A y B cuyos promedios se desean comparar. En este caso (no hay
razones para aparear), los tamaños de dos muestras A y B (que llamaremos nA y nB) pueden
incluso llegar a ser diferentes. Lo primero que se hace es calcular el parámetro de dispersión que
es el error standard de la diferencia:
1) Para asegurar una mejor estimación del significado de la diferencia entre las medias, se
calcula un ES combinado a partir de los DS (desvío standard) de ambas muestras:
DS comb =
∑( x
A
− X A )2 + ( x B − X B )2
( n A − 1 ). DS A 2 + ( n B − 1 ). DS B 2
=
( n A + nB − 2 )
n A + nB − 2
2) Se calcula el error standard de la diferencia
ESdif = DS .
nA + nB
nA . nB
3) Se calcula el estadístico o indicador “t”:
t=
XA − XB
XA − XB
=
ES dif
DS comb
n A .n B
n A + nB
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 50 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 51-175
Grados de libertad: son (n-1) para cada muestra, pues están dados por el número de diferencias
independientes (x-X) utilizadas para determinar el DS. Si se consideran las 2 muestras, los
grados de libertad serán:
ν = nA + nB - 2
Uso de la tabla de Student:
• Se busca en la tabla el número de grados de libertad en la primera columna.
• Se busca en la fila correspondiente a los grados de libertad, el valor más próximo al valor de
”t”calculado por la fórmula.
• Se encontrará la probabilidad (correspondiente a las dos colas de la distribución t-Student)
encabezando la columna correspondiente.
• Se interpreta estadísticamente la probabilidad hallada con respecto al nivel de significación fijado de
antemano de 0,05, 0,01 o bien, más estricto, de 0,001, para decidir aceptar o rechazar la hipótesis
nula.
a) TEST t-STUDENT APAREADO
En medicina es frecuente considerar un mismo grupo de individuos que es a la vez sujeto de la
acción que se está estudiando y control. Es el típico caso “antes y después”. Como ambas
determinaciones son realizadas sobre el mismo individuo, se calcula la diferencia (d) entre los
pares de valores de antes y después, para cada uno de los integrantes de la muestra:
d1 = x1 antes - x1 después
d2 = x2 antes - x2 después
d3 = x3 antes - x3 después
.....................................
.....................................
dn = xn antes - xn después
Se calcula la media de la diferencias:
d=
∑d
n
Se calcula el parámetro de dispersión que es el error standard de las diferencias:
1) Se calcula el DS de las diferencias
DS =
( d − d )2
n−1
2) Se calcula el error Standard
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 51 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
ES =
Pag 52-175
DS
n
3) Se calcula el indicador “t” como sigue:
t=
d
ES
Cálculo de los grados de libertad: teniendo en cuenta que trabajamos con una sola muestra, los
grados de libertad son:
ν =n-1
Para interpretar el resultado, consultamos como antes la tabla t-Student. En la fila
correspondiente al número de grados de libertad, buscamos en la tabla el valor más próximo al
“t” calculado, y leemos la probabilidad que le corresponde. Luego interpretamos
estadísticamente este valor de probabilidad comparado con el nivel exigido de antemano de
0,05, 0,01 o 0,001 para concluir si se cumple la hipótesis de nulidad H0 (diferencia nula) o si el
tratamiento ha sido efectivo.
3.3. PRUEBA DE ASOCIACIÓN Y CORRELACIÓN LINEAL ENTRE VARIABLES
CUANTITATIVAS
Nos enfrentamos en investigaciones científicas con el problema de medir el grado de relación existente
entre dos variables de una misma población. Esto se define como una clase de análisis de asociación
cuantitativo entre las variables. Este ANÁLISIS DE ASOCIACIÓN recibe el nombre de ANALISIS
DE CORRELACIÓN cuando se desconoce la relación funcional entre las mismas y como ANALISIS
DE REGRESIÓN si ya se conoce la relación funcional (recta, parábola, polinomio, exponencial, etc.)
entre las variables. Generalmente se comienza con el Análisis de Correlación y una vez demostrada se
pasa al Análisis de Regresión con un modelo lineal (recta) o no lineal (otra)
Por ejemplo, queremos investigar si existe una relación entre el nivel de colesterol y la frecuencia de
crisis cardiovasculares de un grupo de pacientes. Si esta relación existe y puede expresarse
matemáticamente mediante la ecuación de una recta, se dirá: la correlación es lineal. Cabe aclarar
que es el único tipo de correlación que estudiaremos en este trabajo.
Gráfico:
En principio, para visualizar la relación entre los dos grupos de valores, se le asigna cada grupo un eje
de un par de ejes coordenados. A cada par de datos, formado por un dato de cada grupo que se
correspondan entre sí, le asignamos un punto en el diagrama.
y
G
E
*
C
*
*
*
A
F
*
*
D
*
B
x
Se obtiene así un conjunto de puntos del plano, que pueden estar alineados o no. Aunque todos los
puntos no queden sobre una misma recta, supongamos que observamos por su ubicación una tendencia
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 52 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 53-175
lineal. Nos preguntamos: ¿existirá una recta que corresponda a la correlación lineal entre ambas
variables? De existir esta recta, pasaría por todos los puntos si éstos no hubiesen sufrido desviaciones
por azar.
Para determinar si existe correlación lineal entre los dos grupos de datos de la muestra calculamos el así
llamado coeficiente de correlación del producto-momento de Pearson ( r ) con la fórmula:
1
∑ ( x − x )( y − y )
r= n
DS x DS y
El numerador es la “covarianza” de (x, y) donde n es el número de pares de puntos, y el denominador
el producto de los desvíos standard de x y de y tomados en forma aislada. Interpretamos el valor de r
para determinar en qué nivel se correlacionan las dos variables de la muestra, de la siguiente forma:
Consultamos la TABLA XVII del APENDICE que para los grados de libertad involucrados nos da los
límites inferiores de significación de r, si nuestro valor alcanza o supera algún límite tabulado se
rechaza H0 de independencia (H0: r = 0 ) y aceptamos H1: r ≠ 0 (dos colas).
Si r toma valores positivos, la recta tiene pendiente positiva, y se dice que la correlación es directa; si r
toma valores negativos, la recta tiene pendiente negativa y la correlación se llama inversa.
El coeficiente r es un estimador del coeficiente de correlación poblacional (ρ). Si queremos averiguar
ahora si la correlación entre ambas variables es estadísticamente significativa verificamos la hipótesis
nula H0: (r = 0), siendo la alternativa H1: (r ≠ 0). Como se puede apreciar, hemos planteado un ensayo
de dos colas. Para ello, o bien consultamos la TABLA XVII o calculamos el siguiente estadístico “t”
descripto en el apartado previo:
t=r
n−2
1− r 2
Se busca en la tabla de distribución de t-Student (APENDICE-TABLA III) para (ν=n-2) grados de
libertad, qué probabilidad hay de que esa correlación fuera hallada por azar.
Prueba de nivel
Determinados los niveles de significación de 0,05, 0,01 y 0,001 (prueba de dos colas), según el
criterio del profesional como exigencia impuesta al problema, resulta:
- si la probabilidad es más alta que el nivel impuesto, se concluye que la correlación no es
significativa, o sea, la asociación fue por azar.
- si en cambio, la probabilidad hallada fuera menor que el nivel marcado, la correlación es
significativa, es decir, hay un grado de asociación lineal entre las dos variables estudiadas.
REGRESIÓN LINEAL
Si la correlación lineal entre ambas variables fue aceptada, nos veremos en el problema de hallar la
ecuación de la recta que las vincula (pendiente y ordenada al origen). La solución gráfica aproximada
se obtiene trazando la recta que mejor se ajuste a la distribución de los puntos experimentales. Los
cálculos de los parámetros a y b de la recta son:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 53 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
a=
n.∑ ( x. y ) − ∑ x.∑ y
n.∑ x − (∑ x)
2
b=
2
Pag 54-175
∑ y − a.∑x
n
Conocidos los parámetros, la ecuación de la recta es:
y=a.x+b
3.4. CORRELACIÓN LINEAL MÚLTIPLE Y CORRELACIÓN NO LINEAL
Muchas veces surgen situaciones en las cuales se desea verificar la regresión lineal entre un conjunto
de variables independientes (x1, x2, x3, …, xn) y una variable dependiente (y). Por ejemplo si se
sospecha que el nivel de colesterol (x1), la presión arterial (x2) y la temperatura corporal (x3) definen
linealmente el grado de obstrucción venosa (y), se podría plantear el siguiente modelo de correlación
múltiple:
y = a 0 + a1 x1 + a 2 x 2 + a 3 x 3
donde a0 es el término independiente y a1, a2 y a3 son los coeficientes lineales, todos a determinarse si
se dan como dato un conjunto de grupos de valores (x1, x2, x3, y) . Otras veces, surge la necesidad de
buscar los coeficientes polinómicos que mejor se ajustan a un conjunto de puntos experimentales (x,
y). Por ejemplo, si tuviésemos algún fundamento para pensar que la inflamación de un órgano (y)
depende de una ecuación de tercer grado (polinomio cúbico) con respecto al número de leucocitos
circulantes (x), podríamos plantear el siguiente modelo de correlación no lineal:
y = a 0 + a1 x + a 2 x 2 + a 3 x 3
donde ahora a0, a1, a2 y a3 son respectivamente el término independiente, el término lineal, el término
cuadrático y el término cúbico a determinar si se da como dato un conjunto de pares de valores (x, y).
Si observamos las ecuaciones de los dos modelos planteados, surgen similitudes que nos hacen pensar
en que ambos modelos se resuelven por la misma vía computacional. En efecto, apelamos a un
procedimiento muy empleado en estadística que es el cambio de variables. Si a la variable lineal, en el
segundo caso, la llamamos x Æ x1, al cuadrado x2 Æ x2 y al cubo x3 Æ x3 vemos que precalculando
el cuadrado y el cubo de cada x experimental, obtenemos el mismo caso del primer modelo.
Correlación lineal múltiple y regresión no lineal son problemas isomorfos y poseen una misma
solución.
El método de resolución general se conoce como método de mínimos cuadrados (del cual la regresión
lineal es sólo el caso particular para polinomios de grado uno), ya que busca minimizar los cuadrados
de las distancias entre los puntos experimentales y los de la función que se calcula. Como caso
particular vamos a resolver el modelo arriba planteado, aunque es fácil generalizarlo a cualquier grado
de polinomio o cantidad de variables independientes.
1) Se comienza con el primer modelo (el de regresión lineal múltiple) y si hiciese falta se hace el cambio de variables para
llegar a él. Vamos a considerar m=3 el número de variables independientes y n el número de repeticiones o puntos
utilizados. Como primer paso se debe calcular la “matriz” (cuadro rectangular de valores) de covarianzas:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 54 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
⎛ SS 11
⎜
⎜ SS 21
⎜ SS
⎝ 31
SS 12
SS 22
SS 32
Pag 55-175
SS 13 ⎞
⎟
∑ xi ∑ x j ; SS = x 2 − (∑ xi ) 2
SS 23 ⎟ ; donde SS ij = ∑ x i x j −
∑ i
ii
n
n
SS 33 ⎟⎠
observar que la matriz es simétrica (respecto de la diagonal principal), o sea p.ej: SS31=SS13 y los elementos de la diagonal
principal, p. ej: SS22 son las varianzas de cada variable.
2) Se calcula el “vector independiente” (columna de valores) de términos independientes:
⎛ SS 1 y ⎞
⎜
⎟
∑ xi ∑ y
⎜ SS 2 y ⎟ ; donde SS iy = ∑ x i y −
n
⎜ SS ⎟
⎝ 3y ⎠
3) Se obtiene el “vector solución” de los tres coeficientes (a1 a2 a3) por “inversión matricial” (una operación numérica
efectuada sobre matrices, normalmente realizada por medio de un programa de computación) y producto de la “matriz
inversa” con el “vector independiente” (también efectuado por computadora)
⎛ a1 ⎞ ⎛ SS 11
⎜ ⎟ ⎜
⎜ a 2 ⎟ = ⎜ SS 21
⎜ a ⎟ ⎜ SS
⎝ 3 ⎠ ⎝ 31
SS 12
SS 22
SS 32
SS 13 ⎞
⎟
SS 23 ⎟
SS 33 ⎟⎠
−1
⎛ SS 1 y ⎞
⎜
⎟
⎜ SS 2 y ⎟
⎜ SS ⎟
⎝ 3y ⎠
4) Habiendo resuelto los valores de (a1 a2 a3) obtenemos el valor del término independiente
a 0 = y − ∑m bi x i ; donde y =
∑y
n
y xi =
5) Se calcula la varianza residual del sistema
Vy =
SS r
ν
; donde SS r = SS yy − ∑m a i SS iy
; SS yy = ∑ y 2 −
∑x
i
n
(∑ y ) 2
n
; ( g . de l.) ν = n − m − 1
6) Se calculan las varianzas asociadas a cada coeficiente ai
V ai = c iiV y ; donde c ii es el i − ésimo elemento diagonal de la matriz inversa calculada
7) Computar la significación (frente a cero, test de dos colas) de cada coeficiente ai por medio del test t-Student
t=
ai
Vbi
; con ν ( g. de l.) = n − m − 1
y si alguno de estos coeficientes resultase N.S. (no significativo al nivel p=0,05) se lo debe eliminar del modelo. Por eso,
suponiendo que a1, a2 son significativamente diferentes a cero pero a3 no lo fuese, el sistema quedaría reducido a
y = a 0 + a1 x1 + a 2 x 2
o según el caso a
y = a 0 + a1 x + a 2 x 2
En caso de requerir la inversión matricial (y el producto matricial de esa matriz por un vector) puede emplear un
programa matemático específico o una planilla de cálculos como Excel, Lotus, etc. Si no supiese operar con esos
programas, simplemente consulte a quien pueda asistirlo.
3.5. LA DISTRIBUCIÓN BINOMIAL Y LA DISTRIBUCIÓN DE POISSON
A pesar que la distribución normal es en general la más utilizada en las ciencias experimentales, hay
otras distribuciones de frecuencia estadística que también deben ser conocidas ya que su aplicación es
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 55 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 56-175
mandatoria en muchos casos. Comencemos describiendo la distribución binomial. Supongamos que
estamos estudiando un fenómeno dicotómico, es decir donde sus resultados pueden ocurrir sólo de dos
formas mutuamente excluyentes.
Por ejemplo, supongamos que en una población, la proporción teórica de enfermos de Mononucleosis
Infecciosa (MI) es de 0,25%, es decir 25 de cada 10.000 individuos elegidos al azar. En término de
probabilidades, podemos decir que la probabilidad que un individuo extraído al azar de esa población
padezca MI es p=0,0025. Es inmediato deducir que la probabilidad que ese mismo individuo no tenga
MI es q=0,9975, o sea se se cumple que
p+q=1
Este es un típico ejemplo de dicotomía. Si pensamos podremos hallar cientos o miles de ejemplos
equivalentes, y a estos sistemas se le aplica la distribución binomial. Su nombre deriva del desarrollo
de las potencias del binomio.
Es decir, considerando las sucesivas potencias del binomio (cualesquiera sean los valores p y q de probabilidad)
serán:
( p + q) = 1
( p + q ) 2 = p 2 + 2 pq + q 2 = 1
( p + q ) 3 = p 3 + 3 p 2 q + 3 pq 2 + q 3 = 1
…
⎛ n⎞
⎛ n⎞
⎛ n⎞
( p + q ) n = ⎜⎜ ⎟⎟ p n q 0 + ⎜⎜ ⎟⎟ p n −1 q 1 + ⎜⎜ ⎟⎟ p n − 2 q 2 +
⎝ 0⎠
⎝1⎠
⎝ 2⎠
n
⎛ n⎞
⎛ n⎞
+ ⎜⎜ ⎟⎟ p n − n q n = ∑ ⎜⎜ ⎟⎟ p n −i q i = 1
i =0 ⎝ i ⎠
⎝ n⎠
En la última expresión aparecen los “coeficientes binomiales” que dependen de la “función factorial”, a saber:
⎛ n⎞
n!
⎜⎜ ⎟⎟ =
; donde n! = 1.2.3.....(n − 1).n y por definición 0! = 1
⎝ i ⎠ i! (n − i )!
Como en cada potencia del binomio la suma de todos sus términos sigue dando uno, es lógico pensar
que cada uno de esos términos representa un valor de probabilidad y su conjunto (es decir esa
expansión del binomio) una distribución estadística de frecuencias. Esto es así y a esa distribución se la
conoce como binomial. Veremos que esa distribución (al igual que la normal) es simétrica y su forma
tiende a la clásica “campana” de Gauss a medida que nÆ∞. Vamos a interpretar lo que significa cada
término en una de esas expansiones. Por motivos de simplicidad, elegimos la expansión cúbica
(p + q)3 = p3 + 3p2q + 3pq2 + q3
Esto se interpreta así:
p, q = probabilidades individuales (y complementarias) de cualquier dicotomía, en particular e caso de
la MI (p=enfermo, q=sano) y 3 (el exponente)= tamaño de la muestra extraída al azar de la población
(o sea 3 personas):
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 56 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 57-175
[ p3 ]=probabilidad de ocurrencia de tres enfermos en el grupo de tres
[3p2q]=probabilidad de de ocurrencia de dos enfermos y un sano en el grupo de tres
[3pq2]= probabilidad de de ocurrencia de un enfermo y dos sanos en el grupo de tres
[ q3 ]=probabilidad de ocurrencia de tres sanos en el grupo de tres
Es fácil comprobar que estos cuatro casos cubren todas las posibilidades existentes al elegir tres
individuos de esa población y por lo tanto la suma de sus probabilidades da uno. Ahora podremos
generalizar el tema y contestar preguntas como:
¿Cuál es la probabilidad de en una muestra de 215 personas elegidas al azar 2 estén enfermas de MI?
Notar la relevancia de la aplicación de este tipo de análisis en áreas como la epidemiología. En
particular notar su relevancia por ejemplo para determinar la aparición de enfermedades asociadas
a periodos definidos del año o epidemias localizadas como el SARS o pandemias como el HIV. A
partir de este tipo de evaluaciones es que los gobiernos deben tomar medidas precautorias
decidiendo la generación de campañas de prevención para asistir a las poblaciones sujetas al riesgo.
Aplicando los conceptos discutidos, vemos que:
⎛ 215 ⎞ 2 213 214.215 2 213
⎟⎟ p q =
p (2,215) = ⎜⎜
. p q = 23005 (0.0025) 2 (0.9975) 23 ≅ 0.14
213
1
.
2
⎝
⎠
¿y cuál es la probabilidad de en una muestra de 2150 personas elegidas al azar 2 estén enfermas de
MI?
⎛ 2150 ⎞ 2 2148 2149.2150 2 2148
⎟⎟ p q
p (2,2150) = ⎜⎜
=
.p q
= 23005 (0.0025) 2 (0.9975) 2148 ≅ 0.067
1.2
⎝ 2148 ⎠
Obsérvese que esta última probabilidad nos sorprende por su bajo valor, el motivo es que en una
población de ese tamaño sería raro encontrar tan pocos (sólo dos) enfermos de MI. Otro tipo de
preguntas referidas a la distribución binomial requieren el cómputo de la distribución binomial
acumulada. Estas probabilidades están registradas en la TABLA VII del APENDICE. Por ejemplo:
¿Cuál es la probabilidad de en una muestra de 2150 personas elegidas al azar al menos 2 estén
enfermas de MI?
Podemos deducir que para contestar esta pregunta deberíamos calcular la probabilidad de aparición de
2, 3, 4, ….., 2150 enfermos en esa muestra y sumarlas porque todos esos casos son mutuamente
excluyentes (recordemos la ley de la suma de probabilidades que ya ha sido vista). O sea:
2150
⎛ 2150 ⎞ i 2150 −i
⎟⎟ p q
p (≥ 2,2150) = ∑ ⎜⎜
≅ 0,97
i = 2 ⎝ 2150 − i ⎠
Este tipo de cuentas puede ser engorrosa de resolver y normalmente requiere la consulta a la TABLA
VII del APENDICE o de una computadora con un programa estadístico adecuado como las planillas de
cálculo fáciles de acceder como Excel o Lotus. Sin embargo, si se piensa un poco, muchas veces se
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 57 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 58-175
pueden economizar los cómputos. Por ejemplo con esta última pregunta, la respuesta es más fácil de
computar si se formula el caso complementario.
La probabilidad de hallar dos o más enfermos de MI en 2150 personas es igual a uno menos la
probabilidad de hallar 0 o 1 enfermos.
Evidentemente esta versión requiere (manualmente) solo 2 cómputos, es decir:
⎛ 2150 ⎞ 2150 ⎛ 2150 ⎞ 2149
⎟⎟q
⎟⎟ pq
p (≥ 2,2150) = 1 − ⎜⎜
− ⎜⎜
≅ 0,97
⎝ 2150 ⎠
⎝ 2149 ⎠
aunque con el programa se obtiene el resultado en fracción de segundos. La distribución binomial
tiende a la distribución normal como caso límite cuando pÆ0 (o sea qÆ1) y nÆ∞.
Nótese a esta altura la importancia de una correcta formulación de la pregunta ya que ello no solo
contribuye a la obtención de la respuesta adecuada sino que nos permite aun simplificar la
propuesta matemática de abordaje.
Otra distribución estadística interesante es la distribución de Poisson, que se conoce como la
“distribución estadística de los eventos raros” y que posee bastante aplicación en las ciencias
naturales. A diferencia de lo que ocurre con la distribución normal y la binomial, esta es asimétrica,
con la característica adicional que su media y su varianza (calculada como en la distribución normal)
coinciden en un mismo valor. El nombre de “evento raro” se refiere a que la probabilidad de
ocurrencia de casos favorables suele ser “relativamente” baja. Por ejemplo, si se hace una estadística
del número de goles en partidos de football profesional, se vería que la probabilidad de goles crece
desde cero por partido hasta un máximo (digamos 3 por partido) y luego decrece mucho más
lentamente a medida que ese número tiende a infinito. Por ejemplo, la probabilidad de existencia de
200 goles (o más) en un partido ya es a todo efecto igual a cero. Este es un típico ejemplo de esta
distribución. En medicina esta distribución aparece en el número de células por mm3 que se miden en
un contador hematológico, el número de colonias bacterianas por placa de cultivo en medio sólido, el
número de pacientes que concurren por día a un consultorio, número de óbitos hospitalarios por día,
cantidad de cirugías efectuadas por semana, la tasa de mortalidad por accidentes, número de
infecciones por área geográfica en epidemias, etc.
La probabilidad de aparición de 0, 1, 2, 3, … casos favorables en la distribución de Poisson es
respectivamente
e − z , ze − z ,
z 2 −z z 3 −z
e , e ,...
2!
3!
donde z es el promedio registrado (igual a su varianza, o sea el DS es su raíz cuadrada). Este es un
hecho bastante inusual e interesante, para obtener toda la distribución basta calcular un promedio.
Por ejemplo, vamos a ejercitar la distribución de Poisson con una estadística efectuada acerca del
número de decesos quirúrgicos por año en intervenciones de transplante cardíaco que se han registrado
en un pool de diez hospitales de alta complejidad, desde el año 1981 al 2000 inclusive ( o sea, se han
censado 200 años de actividad).
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 58 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
decesos
quirúrgicos
0
1
2
3
4
5
6
Pag 59-175
número de años en los
cuales ocurrieron ese
número de decesos
109
65
22
3
1
0
0
En total tenemos 122 decesos, o sea el promedio (z) de muertes por hospital y por año es 0,61. En este
caso, el valor de e-z ≈ 0,543 y el valor computado (teórico) de 0, 1, 2, 3, 4, 5 y 6 óbitos es en términos
de probabilidades 0,543, 0,331, 0,101, 0,021, 0,003 , 0,0004 y 0,00004. Traducido en decesos
(por 200 años de actividad) los valores computados (teóricos) son 109, 66, 20, 4, 0,6, 0,08 y 0,0008.
Podemos comparar estos datos con los realmente registrados y vemos que la coincidencia es muy
buena. Mas adelante se verá un método no paramétrico (prueba x2-Chi cuadrado de bondad de ajuste)
que permitirá verificar objetivamente la H0: ajuste bueno versus H1: ajuste malo con un test de dos
colas.
También para esta distribución puede ser de interés conocer la probabilidad de la distribución
acumulada. Nuevamente acceder a programas como Lotus o Excel resuelve ese problema con una
simple función. Por ejemplo
¿Cuál es la probabilidad que haya 3 o más decesos quirúrgicos por año en los servicios de transplante
cardíaco?
∞
p (≥ 3, z = 0.61) = ∑
i =3
z i −z
e ≅ 0,024
i!
Este cómputo se efectúa en forma simple e inmediata usando esas planillas de cálculo.
3.6. ANOVA: FUNDAMENTOS DEL FRACCIONAMIENTO DE LA VARIANZA
ANOVA es una sigla universalmente adoptada y que significa análisis de varianza. Se refiere a una
familia de técnicas estadísticas paramétricas destinada a la comparación simultánea de dos o más
promedios muestrales, extrayendo toda la información estadística disponible de esas muestras siempre
que se cumplan un mínimo de condiciones que vamos a detallar.
Los ANOVA no son un ensayo estadístico más. Estamos frente a la metodología estadística más
sofisticada disponible en el arsenal de la estadística inferencial paramétrica. Representan una familia
muy potente de detección de diferencias muestrales, un muy eficiente filtro estadístico del “ruido
aleatorio” y que permite recuperar y amplificar “señales causales” débiles pero reales. Con casi 80
años desde su creación por el padre de la estadística moderna R. A. Fisher, ha sido sucesivamente
perfeccionada por generaciones de estadísticos.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 59 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 60-175
Las condiciones mínimas exigidas por el ANOVA para que se puedan comparar (por ensayos de una y
dos colas) a un conjunto de muestras experimentales son las siguientes:
1) Las muestras provienen de poblaciones normalmente distribuidas. Existen ensayos
específicos que responden a esta cuestión con precisión (prueba Kolmogorov-Smirnov, test
Lilliefors y prueba W de Shapiro-Wilks amén del Chi-cuadrado de bondad de ajuste)
2) Las muestras poseen homogeneidad de varianza residual debida al error (aleatorio). Existe
un test paramétrico (test de Bartlett) que permite controlar esta condición en caso de dudas.
3) Los efectos causales son aditivos, o sea que si hay causas que desplazan a los promedios de
las muestras, estos se suman y restan algebraicamente (esta condición se cumple siempre
que no exista el fenómeno de “interacción” que generalmente el propio ANOVA se encarga
de controlar)
En general ninguna de estas condiciones (salvo la primera) es demasiado restrictiva ya que la casi
totalidad de los fenómenos normalmente distribuidos en ciencias naturales cumplen el papel de
“buenas” y permiten la aplicación del ANOVA. Por otra parte, cuando aparece alguna anomalía que
atenta contra la validez del ANOVA, aparecen otras al unísono.
¿Porqué el ANOVA es tan eficiente en la comparación de varias muestras simultáneas? Queda claro
que para dos muestras existe una sola comparación posible y esta la efectúa un test t-Student con toda
eficiencia. Pero si tuviésemos tres muestras hay tres comparaciones internas posibles, por eso o se
efectúa un ANOVA que las hace todas en un solo ensayo o se hacen 3 test t-Student. La situación se
complica si comparamos más muestras simultáneas, por ejemplo diez muestras comparadas todas
contra todas:
⎛10 ⎞
aquí se deberían efectuar ⎜⎜ ⎟⎟ = 45 test t-Student o un único ANOVA
⎝2⎠
La elección es clara. Y la situación se complica cada vez más a medida que crece el número de
muestras (y el número combinatorio) y esa es la razón principal de la eficiencia de un ANOVA. Otra
razón se verá más adelante y consiste en que permite detectar y separar la acción de varios factores o
causas independientes (y aditivas) sobre una misma muestra lo que no permite el test t-Student.
Finalmente el ANOVA permite detectar desviaciones de la aditividad (interacciones) entre los factores
en estudio, nada de esto se detecta con el t-Student. Resumiendo, el test t-Student se reserva
exclusivamente a la comparación de dos grupos y nunca se replica para comparar un conjunto mayor de
muestras, sencillamente se emplea un ANOVA.
El lenguaje ANOVA
Vamos a ilustrar ahora el lenguaje particular del ANOVA (análisis de varianza). Primero repasemos el
concepto de varianza, una de las medidas de dispersión de los datos alrededor de su promedio.
s
2
∑ (x − x)
=
n −1
2
=
1
( ∑ x 2 − (∑ x ) 2 / n)
n −1
Esta es la fórmula del estimador de la varianza poblacional (σ2) para muestras pequeñas (n<30),
sencillamente llamada varianza muestral. Si observamos la fórmula desarrollada de la derecha vemos
que la varianza se comienza obteniendo de la diferencia entre la suma de cuadrados y la suma al
cuadrado dividida por el tamaño muestral. Finalmente la varianza muestral será esa diferencia dividida
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 60 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 61-175
al tamaño muestral menos uno, lo que coincide con los grados de libertad de ese parámetro de
dispersión. En el lenguaje ANOVA, estos términos reciben otros nombres:
SC = ∑ x 2 − (∑ x) 2 / n
G.de L. = n − 1
MC = SC / G.de L.
A la varianza se la llama MEDIA CUADRADA (MC o MS siguiendo la notación sajona), a la suma de
los cuadrados de x menos la suma de x elevada al cuadrado y dividida por n se la llama SUMA DE
CUADRADOS CORREGIDA o como la llamaremos de aquí en adelante SUMA DE CUADRADOS
(SC o SS siguiendo la notación sajona) y por último al denominador GRADOS DE LIBERTAD. O sea,
una MEDIA CUADRADA se obtiene dividiendo una SC por los grados de libertad. Este lenguaje es
útil para poder interpretar los cuadros ANOVA. Se llaman cuadros ANOVA a los resúmenes sintéticos
de los resultados de este ensayo de inferencia.
Tratamiento algebraico del fraccionamiento de la varianza
Para llegar a entender más acabadamente la lógica del ANOVA se requiere profundizar en
ciertos aspectos algebraicos vinculados al fraccionamiento de la varianza. Aquel lector que no se
sienta demasiado cómodo con la formulación matemática puede saltear este apartado aunque
resultaría provechoso realizar el esfuerzo de entenderlo.
Hecha la advertencia, vamos a efectuar una aproximación más empírica que rigurosa al tema. Ante
todo, como se discutirá más adelante, ANOVA es el fraccionamiento de variabilidad total y grados de
libertad totales en partes linealmente aditivas (o sea que sumadas dan el total). Supongamos que
comenzamos con una única observación de una variable x (=a). Obviamente, la media de esa muestra
tan elemental será a, su varianza cero y los g. de l. también nulos.
Data : (a ) ; n = 1 ; x = a ; s 2 = 0;
g .de l. = n − 1 = 0
Esto nos sugiere que si dispusiésemos de una muestra de cualquier tamaño (n) en la cual todos los
valores fuesen idénticos, la dispersión sería nula y no habría materia fraccionable, es decir la varianza
total no sería distribuible (y los g. de l.) en términos aditivos menores (obviamente una varianza nunca
será negativa). Supongamos que tenemos ahora dos valores distintos de x
Data : (a1 a 2 );
g .de l. = 1;
(a1 + a 2 )
;
2
− (a1 + a 2 ) 2 / 2 = (a1 − a 2 ) 2 / 2
x=
SC = ∑ x 2 − (∑ x) 2 / n = a1 + a 2
2
2
Por lo expuesto, la suma de cuadrados con un solo grado de libertad corresponde a una única
comparación entre a1 y a2.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 61 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 62-175
La siguiente situación en grado de complejidad creciente consiste en tres valores diferentes de x
Data : (a1 a 2 a 3 );
g.de l. = 2;
x=
SC = ∑ x 2 − (∑ x) 2 / n = a1 + a 2 + a 3
2
=
2
2
(a1 + a 2 + a 3 )
;
3
− (a1 + a 2 + a 3 ) 2 / 3 =
2 2
2
2
(a1 + a 2 + a 3 − a1 a 2 − a1 a 3 − a 2 a 3 )
3
Ahora esta suma de cuadrados está basada en 2 grados de libertad o comparaciones. Como se ha visto, la
comparación entre dos valores, digamos 1 y 2 es (a1–a2)2/2, por lo tanto podemos deducir el valor de la
comparación restante como (a1+a2-2a3)2/6, dado que la suma de ambos términos reconstituye la SC. Si en vez de
elegir 1 y 2 para la comparación original se elige cualquier otra de las tres posibles, las comparaciones restantes
son
SC1 = (a1 − a 2 ) 2 / 2
;
SC 2 = (a1 + a 2 − 2a 3 ) 2 / 6
SC1 = (a1 − a 3 ) 2 / 2
;
SC 2 = (a1 − 2a 2 + a 3 ) 2 / 6
SC1 = (a 2 − a 3 ) 2 / 2
;
SC 2 = (−2a1 + a 2 + a 3 ) 2 / 6
Sólo nos resta interpretar que es lo que efectúa en cada caso la segunda comparación. Se puede deducir que se
trata de una comparación entre el valor no considerado por la primera y el promedio de los dos primeros valores
comparados. Resulta interesante saber que no son estas tres las únicas formas de particionar la SC, se pueden
inventar otras menos obvias y menos útiles. Lo interesante es que vamos entendiendo paulatina e intuitivamente lo
que es el análisis de varianza, un fraccionamiento de SC en tantas comparaciones como lo permitan los grados de
libertad involucrados. Queda claro que las sumas de cuadrados son aditivas al igual que los grados de libertad (o
comparaciones) particionados.
Ahora analizaremos el caso de cuatro valores diferentes para x. No es difícil verificar que así como existen tres
comparaciones posibles con dos grados de libertad, con tres grados de libertad hay doce comparaciones posibles de
la clase vista hasta ahora:
SC1 = (a1 − a 2 ) 2 / 2
;
SC 2 = (a1 + a 2 − 2a 3 ) 2 / 6 ;
SC 3 = (a1 + a 2 + a 3 − 3a 4 ) / 12
;
SC 2 = (a1 + a 2 − 2a 4 ) / 6 ;
SC 3 = (a1 + a 2 − 3a 3 + a 4 ) / 12
SC1 = (a1 − a 3 ) / 2
;
SC 2 = (a1 − 2a 2 + a 3 ) / 6 ;
SC 3 = (a1 + a 2 + a 3 − 3a 4 ) / 12
SC1 = (a1 − a 3 ) 2 / 2
;
SC 2 = (a1 + a 3 − 2a 4 ) 2 / 6 ;
SC 3 = ( a1 − 3a 2 + a 3 + a 4 ) / 12
;
SC 2 = ( a1 − 2a 2 + a 3 ) / 6 ;
SC 3 = ( a1 + a 2 − 3a 3 + a 4 ) / 12
SC1 = (a1 − a 4 ) / 2
;
SC 2 = ( a1 − 2a 3 + a 4 ) / 6 ;
SC 3 = ( a1 − 3a 2 + a 3 + a 4 ) / 12
SC1 = (a 2 − a 3 ) 2 / 2
;
SC 2 = ( −2a1 + a 2 + a 3 ) 2 / 6 ;
SC 3 = ( a1 + a 2 + a 3 − 3a 4 ) / 12
;
SC 2 = ( a 2 + a 3 − 2a 4 ) / 6 ;
SC 3 = (−3a1 + a 2 + a 3 + a 4 ) / 12
SC1 = (a 2 − a 4 ) / 2
;
SC 2 = (−2a1 + a 2 + a 4 ) / 6 ;
SC 3 = (a1 + a 2 − 3a 3 + a 4 ) / 12
SC1 = (a 2 − a 4 ) 2 / 2
;
SC 2 = (a 2 − 2a 3 + a 4 ) 2 / 6 ;
SC 3 = (−3a1 + a 2 + a 3 + a 4 ) / 12
;
SC 2 = (−2a1 + a 3 + a 4 ) / 6 ;
SC 3 = (a1 − 3a 2 + a 3 + a 4 ) / 12
;
SC 2 = (−2a 2 + a 3 + a 4 ) / 6 ;
SC 3 = (−3a1 + a 2 + a 3 + a 4 ) / 12
SC1 = (a1 − a 2 ) / 2
2
2
SC1 = (a1 − a 4 ) / 2
2
2
SC1 = (a 2 − a 3 ) / 2
2
2
SC1 = (a 3 − a 4 ) / 2
2
SC1 = (a 3 − a 4 ) / 2
2
2
2
2
2
2
2
2
2
Aquí la lógica indica que en cada comparación del tipo 1 se confrontan dos valores, en la del tipo 2 se
confrontan un tercer valor con el promedio de los dos primeros y en la del tipo 3 se confronta el valor
restante contra el promedio de los tres primeros que se han usado. Lo interesante es que esta no es la
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 62 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 63-175
única forma de particionar la SC, se pueden hacer otras comparaciones, como ser usar las dos primeras
para comparar dos pares diferentes y en la restante el promedio de las dos primeras contra el promedio
de las dos segundas, a saber:
SC1 = (a1 − a 2 ) 2 / 2
; SC 2 = (a 3 − a 4 ) 2 / 2
;
SC 3 = (a1 + a 2 − a 3 − a 4 ) 2 / 4
SC1 = (a1 − a 3 ) 2 / 2
; SC 2 = (a 2 − a 4 ) 2 / 2
;
SC 3 = (a1 + a 3 − a 2 − a 4 ) 2 / 4
SC1 = (a1 − a 4 ) 2 / 2
; SC 2 = (a 2 − a 3 ) 2 / 2
;
SC 3 = (a1 + a 4 − a 2 − a 3 ) 2 / 4
Hay una forma adicional de particionar con tres grados de libertad y es usando todos los valores en cada
comparación
SC1 = (a1 + a 2 − a 3 − a 4 ) / 4
;
SC 2 = (a1 − a 2 + a 3 − a 4 ) / 4 ; SC 3 = (a1 − a 2 − a 3 + a 4 ) / 4
A pesar de no ser la mas intuitiva, esta forma de partición es una de las más usadas por el ANOVA.
Además se puede demostrar que cada una de estas particiones sumadas da la SC total.
Vamos a extraer conclusiones generales acerca de todo lo visto. Primero, la variabilidad total
representada por la SC total puede ser fragmentada o particionada en un conjunto de contrastes
o comparaciones entre los valores de la muestra. Segundo, el número de comparaciones es como
mínimo igual a los grados de libertad existentes. Tercero, las comparaciones son ortogonales (o
independientes) entre sí. Cuarto, se pueden “armar” comparaciones de distinto tipo, lo que
permite por ejemplo contrastar los valores de un subconjunto de la muestra contra otro
subconjunto de la misma muestra. En conjunto, estos cuatro atributos son el fundamento del
análisis de varianza. El ANOVA será diseñado de tal forma que los contrastes que se armen
permitan verificar la significación o no (frente al azar) de cualquier factor causal (y una regla
simple que permita armar esos subgrupos internos de valores en la muestra).
¿En qué consiste un ANOVA?
Esencialmente consiste en fraccionar (analizar= disgregar o repartir en fragmentos linealmente
aditivos) la suma general de cuadrados (SC total del ensayo) en una suma de SC parciales atribuíbles
a los distintos factores en estudio y verificar si esas SC parciales son estadísticamente significativas.
En caso de serlo, los factores que las causaron existen realmente (aceptar H1) y esas fluctuaciones no
se debieron al azar (rechazar H0) Junto con la fragmentación de la SC total, se reparten
proporcionalmente los grados de libertad.
La idea es que si en un grupo inicialmente homogéneo se gesta un cambio en los valores de un
subgrupo, la varianza del conjunto aumenta. Por ejemplo, supongamos que tenemos un grupo de 20
pacientes con un cierto valor de colesterolemia normalmente distribuido. Obviamente, ese grupo será
unimodal con una moda (= promedio) cercana al valor medio poblacional de ese parámetro y una
dispersión (varianza) cercana a los valores poblacionales. Ahora supongamos que elegimos al azar la
mitad de pacientes y les suministramos un fármaco que baja el tenor de colesterol en sangre. Después
de un tiempo prudencial repetimos las medias de colesterol a los 20 pacientes (ahora se trata de 10
pacientes tratados y 10 pacientes control) y obtenemos nuevamente la media y la varianza del conjunto.
Si el fármaco actuó, el promedio del conjunto debe haber disminuido (en realidad bajó en los 10
tratados y en el resto no se modificó, pero como conjunto hubo un descenso) y la varianza del conjunto
aumentó. Es más, la distribución del conjunto pasó de unimodal a bimodal. Estrictamente hablando,
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 63 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 64-175
como los grados de libertad (20-1=19) del conjunto no variaron, al aumentar la varianza (MC) lo que
aumentó es la suma de cuadrados corregida (SC). Entonces podremos fraccionar (o analizar) la suma de
cuadrados (SC Total) del conjunto de veinte pacientes en dos componentes aditivos:
SC total = SC factor + SC error experimental
Donde la SC Factor es la dispersión debida al grupo tratado y SC error experimental la dispersión del
grupo control (o del conjunto antes del tratamiento) y que recibe ese nombre particular en el lenguaje
ANOVA. Cada vez que en ANOVA se mencione error experimental se estará haciendo referencia al
efecto puro del azar. Si se dividen esas sumas de cuadrados por los respectivos grados de libertad,
obtenemos las varianzas (MC) del factor y del azar o error experimental
MC total = SC Total / 19
MC factor = SC Factor / 1
MC error = ( SC Total- SC Factor)/(19-1)= SC error experimental / 18
Observemos que en total hay 19 grados de libertad (=20-1). Para el factor hay un solo grado de libertad,
dado que su presencia divide al conjunto de pacientes en dos clases, los tratados y los controles (=2-1).
Para el error experimental, tanto la SC como los grados de libertad se llevan el resto disponible del total
inicial, o sea se obtienen por diferencia.
Notemos estos hechos importantes:
•
El ANOVA fracciona la variabilidad total (SC total) y los grados de libertad totales en tantas
partes como factores haya bajo estudio, dejando como residuo de esa fragmentación una
variabilidad residual (SC error experimental). Dividiendo esas SC por los g. de l. se obtienen
las varianzas (MC) respectivas.
•
Las SC y los g. de l. son siempre aditivos ( las MC no lo son, no tiene sentido sumarlas!).
•
Cuanto mayor sea la varianza debida a algún factor (MC factor), menor será la varianza
residual (MC error experimental) por lo cual el cociente de varianzas (MC factor / MC error
experimental) crece (Æ ∞) si el efecto del factor es significativo y disminuye (Æ 0) si el efecto
no fuese significativo.
El último punto enunciado forma la base de las pruebas de inferencia que se efectúan en un ANOVA.
El cociente de medias cuadradas (varianzas) se conoce como el estadístico de ensayo (o indicador) F
de Snedecor (la F en honor de R.A. Fisher). Se han tabulado los valores críticos de probabilidad de F
para los cuales una MC factor se vuelve significativamente mayor a la MC error experimental. Esto
lógicamente sirve para aceptar o rechazar en un test de una cola a la H0: MC factor = MC error
experimental.
Uso de las tablas de la distribución F-Snedecor
En el APENDICE – TABLA IV y TABLA V se presentan las tablas de los valores críticos de F para los
niveles de significación del 5% y 1% respectivamente. Nuevamente hacemos hincapié que se pueden
obtener valores para cualquier otra condición si se recurre a las funciones estadísticas incorporadas en
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 64 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 65-175
una planilla de cálculo tipo Excel o Lotus. Sin embargo, estas tablas permitirán al lector buscar la
significación de cualquier cociente de medias cuadradas (o varianzas) que aparezcan en los ANOVA en
los dos niveles de significación mas frecuentes.
Si se observan esas tablas, se ve que poseen doble entrada en función de los grados de libertad del
numerador y denominador del cociente F. En la intersección de la fila con la columna que corresponda
se hallará el valor critico de F que si fuese alcanzado o superado por el F obtenido, resultará en el
rechazo de la H0 de igualdad de las medias cuadradas (varianzas) al nivel (5% o 1%) que corresponda a
la tabla empleada.
Ejemplo de uso de las Tablas F-Snedecor
Supongamos que en un ANOVA se contrasta una MC tratamiento = 545.5 (g. de l.=3) contra una MC
error experimental = 100.9 (g. de l.=20). El valor F obtenido = 545.5/100.9 = 5.41. Consultando en la
TABLA IV (nivel 5%) el valor crítico de F(3,20)= 3.10 y en la TABLA V (nivel 5%) el valor crítico de
F(3,20)=4.94. Dado que 5.41 supera a ambas, podemos rechazar la H0 de igualdad de ambas MC y
concluir que el tratamiento manifiesta un efecto muy significativo frente a los controles al nivel de
significación p=0.01. Esto es lo mismo que concluir que los datos de tratamiento provienen de una
población con distinta media poblacional (μ) que los datos controles.
El cuadro ANOVA
Finalmente estamos en condiciones de presentar la estructura general del cuadro ANOVA. Según
hemos dicho, en este cuadro se resumen los principales datos, resultados y conclusiones de este ensayo.
Veamos un ejemplo genérico.
CUADRO ANOVA
FUENTE DE VARIACION
Factor N° 1 en estudio
Factor N° 2 en estudio
Error experimental
Total
SC
445.0
21.0
1229.3
1695.3
g. de l.
3
2
115
120
MC
148.3
10.5
10.7
-.-
F
13.9
0.98
-.-.-
SIGNIFICACION
** (p<0.01) (rechazar H0)
No significativo (aceptar H0)
-.-.-
Se puede verificar la aditividad de la suma de cuadrados y de los grados de libertad. Cada factor se
contrasta independientemente contra la MC error experimental. Los ensayos F-Snedecor y su
interpretación son muy simples de entender, el Factor N° 1 resulta muy significativo porque se superan
holgadamente los límites F(3,60,p=0.01)=4.13 y F(3,120,p=0.01)=3.95. Queda claro que el valor crítico
que se necesita F(3,115,p=0.01) se halla en el intervalo (4.13 , 3.95), pero el valor obtenido 13.9 supera
holgadamente ese valor.
Modelos teóricos en ANOVA
Para el ANOVA, existe una MC general que estima a la varianza de la población (σ2). A esa varianza
basal, cada efecto causal (significativo) la modifica (por alterar el promedio), ya sea en ascenso o en
disminución. Se llama Modelo I en ANOVA a la interpretación teórica que el efecto causal en estudio
modifica en forma fija esa varianza y Modelo II a la interpretación que la modifica en forma aleatoria
(normalmente distribuida).
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 65 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 66-175
Supongamos que en el cuadro ANOVA superior suponemos que el Factor N° 1 en estudio responde a
un modelo teórico I de ANOVA y el Factor N° 2 al modelo II. Entonces, las medias cuadradas
correspondientes al ensayo son estimadores de:
FUENTE DE VARIACION
MC
Factor N° 1 en estudio
148.3
Factor N° 2 en estudio
10.5
Error experimental
10.7
Estimador
de:
σ2 + 3 k2 Modelo I : k2 es el componente aditivo
fijo a la varianza poblacional, se
multiplica por el número de niveles del
otro factor (número de datos fusionados
para ese factor)
σ2 + 4 σ22 Modelo II : σ22 es el componente
aditivo fijo a la varianza poblacional, se
multiplica por el número de niveles del
otro factor (número de datos fusionados
para ese factor)
2
σ
Varianza poblacional teórica
Ahora queda claro que para el primer factor el estadístico de Snedecor mide F= (σ2 + 3 k2)/ σ2. A partir
de su significación podemos extraer el valor estimado de k2. De igual manera se procede con la segunda
media cuadrada en el modelo II. Estos dos modelos son los básicos y los más importantes en ANOVA,
aunque hoy día existen hasta cinco modelos teóricos diferentes.
3.7. ANOVA DE UNA VÍA
Ahora que tenemos los conocimientos básicos del ANOVA podemos estudiar las variantes más
importantes de esta familia de ensayos. Por ejemplo, en el ANOVA de una vía es una suerte de
generalización del test t-Student agrupado al caso de más de dos muestras, aunque puede ser aplicado
también con sólo dos muestras. Lo que sigue vale para diseños simétricos como para los asimétricos.
Ejemplo ANOVA de una vía (diseño asimétrico): Supongamos que se prueban 8 fármacos (1,2,3,…,8)
con supuesta actividad hipocalcemiante iónico oral (ingeridos reducen el nivel de calcio iónico en
sangre) sobre ocho grupos de pacientes elegidos al azar. Se trata de un ensayo triple ciego en el cual
uno de esos fármacos es un placebo (inactivo) que servirá como control de la actividad farmacológica.
Los resultados de calcemia iónica (en mEq/l) post-tratamiento fueron los siguientes:
TRATAMIENTO
GRUPO 1
GRUPO 2
GRUPO 3
GRUPO 4
GRUPO 5
GRUPO 6
GRUPO 7
GRUPO 8
SUMA
2.0
3.5
3.3
3.2
2.6
3.1
2.6
2.5
2.8
2.8
3.6
3.3
2.6
2.9
2.2
2.4
3.3
3.2
2.6
3.2
2.9
3.1
2.2
3.0
3.2
3.5
3.1
2.9
2.0
2.5
2.5
1.5
CALCEMIA
4.4 3.6 1.9
2.3 2.4 2.0
3.2 3.3 2.9
3.3 2.5 2.6
2.0 2.1
1.2 1.2
3.3 2.8 1.1
1.6
3.4 3.2 3.2
2.8
SUMA ni promedios
28.4 10
2.8
21.3
8
2.7
31.8 10
3.2
23.8
8
3.0
14.2
6
2.4
11.6
4
2.9
11.9
6
2.0
9.4
4
2.4
152.4 56 SC=439.40
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 66 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 67-175
El objetivo perseguido es someter estos datos a un ANOVA y detectar diferencias significativas entre
los tres grupos al nivel 5%. Una vez concluido el análisis estadístico se dará a conocer cual de los ocho
es el grupo control.
Calculamos:
C(corrección)=Suma(x)2/n = (152.4)2/56=414.75
SCTotal = Suma2(x)-C=2.02+2.82+…+1.52-C=439.40-414.75=24.65
SCTratamientos = Suma (SUMAS2/n)i-C=(28.4)2/10+(21.3)2/8+…+(9.4)2/4-C=422.23-414.75=7.48
SC Error experimental = SC Total – SC Tratamientos = 24.65-7.48=17.17
g.de l. Totales= 56-1=55
g.de l. Tratamientos=8-1=7
g. de l. Error Experimental = g.de l. Totales - g.de l. Tratamientos=55-7=48
y volcamos al cuadro ANOVA completando los cómputos de F y consultando la tabla 5%::
CUADRO ANOVA
FUENTE DE VARIACION
Tratamientos
Error experimental
Total
SC
7.48
17.17
24.65
g. de l.
7
48
55
MC
1.07
0.36
-.-
F
2.97
-.-.-
SIGNIFICACION
* (p<0.05) (rechazar H0)
-.-.-
O sea que hay una diferencia significativa al nivel 5% entre esos fármacos. Solo resta conocer entre qué
tratamientos se verifica esa diferencia. Esta clase de análisis se conoce como post-hoc y está destinado
a buscar los responsables de la diferencia registrada. Un ensayo típico de esta categoría es el test de
Tukey o la prueba de secuencia de Keuls. Para efectuar la primera armamos un cuadro que ordena los 8
promedios de mayor a menor y calcula sus diferencias sucesivas
ANALISIS POST-HOC
CUADRO DE DIFERENCIAS DE PROMEDIOS GRUPALES
GRUPO
N°
3
4
6
1
2
5
8
7
p
(prom)
3.2
3.0
2.9
2.8
2.7
2.4
2.4
2.0
p-2.0
p-2.4
p-2.7
p-2.8
p-2.9
p-3.0
1.2
1.0
0.9
0.8
0.7
0.4
0.4
0.8
0.6
0.5
0.4
0.3
0.5
0.3
0.2
0.1
0.4
0.2
0.1
0.3
0.1
0.2
Ahora calculamos el valor DSM (Diferencia de Significación Mínima) que nos marca el nivel mínimo
de significación del cuadro de diferencias, aquellas que lo superen son significativas, caso contrario
esas diferencias se deben al azar. Para ello necesitamos estimar el error standard. Conocemos la
varianza global debida al azar MC error experimental = 0.36. Entonces DS=(0.36)0.5=0.6 y ES=
0.6/(48)0.5≈0.09 (valores estimados).
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 67 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 68-175
DSM ≈ t0.05, ν=48 (ES) 1.41= 2.02 x (0.09) x 1.41 = 0.26 ≈ 0.3
Con lo cual todas las diferencias iguales o superiores a 0.3 son significativas, el resto no lo es.
Observando la tabla vemos que el análisis post-hoc arroja:
1. El promedio del grupo 7 es significativamente menor al del todo el resto
2. Los promedios de los grupos 5 y 8 son significativamente menores al de los grupos 2, 1, 6,
4 y 3 y no difieren entre sí.
3. El promedio del grupo 2 es significativamente menor al de los grupos 4 y 3.
4. El promedio del grupo 1 es significativamente menor al del grupo 3.
5. El promedio del grupo 6 es significativamente menor al del grupo 3.
6. Ninguna otra comparación es significativa
Conclusiones finales
Como último paso de este ensayo triple ciego se nos informa que el grupo control era el número 3,
por lo cual deducimos que todos los hipocalcemiantes probados fueron efectivos, con excepción
del usado en el grupo 4 cuyos resultados no difieren de los valores del control. Evidentemente el
que tuvo resultados más marcados fue el hipocalcemiante del grupo 7.
Por último una advertencia, el método de Tukey aquí empleado es aproximado cuando el número de
grupos comparados es mayor a dos, para aquellos que requieran una prueba post-hoc más precisa se
recomienda prueba de secuencia de Keuls (ver SNEDECOR, 1964) o recurrir a un programa estadístico
adecuado como el Statistica© v.6.0 de StatSoft©. Sin embargo, vale advertir que el empleo de esta
clase de herramienta de alta potencia requiere un cierto entrenamiento previo, tanto estadístico en
general como en el empleo de las múltiples opciones que ofrece este software y otros equivalentes. De
todas maneras el uso cauto de la técnica manual aquí descripta servirá en la mayoría de los análisis que
se efectúen, basta incrementar el margen de seguridad usando DSM un 50% mayor al calculado, lo que
disminuye el error de Tipo I y incrementa el error de Tipo II, bajando la potencia del ensayo.
3.8. ANOVA DE DOS VÍAS
Este tipo de ensayo busca hallar diferencias significativas entre las filas y entre las columnas de una
matriz de datos (o tabla numérica rectangular). Esta analogía geométrica permitirá reconocer muchos
campos de aplicación del ANOVA de dos vías.
Ejemplo ANOVA de 2 vías: Se administran tres medicamentos a un grupo de cuatro pacientes. En el
siguiente cuadro se registran las respuestas farmacológicas medidas junto a los totales marginales.
FARMACO FARMACO FARMACO
PACIENTE
suma
N°1
N°2
N°3
23
44
34
101
PEREZ
27
40
45
112
GOMEZ
DIAZ
32
38
39
109
GIMENEZ
26
37
31
94
108
159
149
416
suma
El investigador desea saber si los tres fármacos actúan en forma similar y si los pacientes responden
de la misma manera a los medicamentos.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 68 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 69-175
Calculamos:
C=(23+44+…+31)2/ 12= 4162/12=14421
SC Total = 232+442+…+312-C=3440
SC Farmacos = (1082+1592+1492)/4-C=366
SC Pacientes=(1012+1122+1092+942)/3-C=66
SC Error experimental= SS Total – (SS Tratamientos + SS Pacientes)=3008
g.de l. Totales= 12-1=11
g.de l. Farmacos=3-1=2
g.de l Pacientes=4-1=3
g. de l. Error Experimental = g.de l. Totales – (g.de l. Farmacos+ g.de l. Pacientes) =11-5=6
y volcamos al cuadro ANOVA completando los cómputos de F y consultando la tabla 5%::
CUADRO ANOVA
FUENTE DE VARIACION
Fármacos
Pacientes
Error experimental
Total
SC
366
66
3008
3440
g. de l.
2
3
6
11
MC
183
22
501
-.-
F
0.36
0.04
-.-.-
SIGNIFICACION
N.S. (aceptar H0)
N.S. (aceptar H0)
-.-.-
En este caso, no se detectan diferencias significativas ni entre los fármacos ni entre los pacientes. En
caso de haberse detectado alguna diferencia, hubiésemos aplicado el análisis post-hoc como en el
ANOVA de una vía.
3.9. ANOVA FACTORIAL
Este es uno de los ensayos más sofisticados de la familia ANOVA ya que es capaz de extraer toda la
información extraíble de una muestra sometida a varios tratamientos independientes (ortogonales). Esta
clase de ANOVA posee como condición ineludible que el diseño sea simétrico. Lógicamente, si por
alguna causa se hubiese perdido esa simetría, se deberán completar los datos faltantes según lo
detallado en el apartado correspondiente .
En forma sintética, el ANOVA factorial se caracteriza por:
•
•
•
•
•
Probar un conjunto (ilimitado) de factores (P.Ej.: tratamientos, agentes causales, variables
independientes que modifican la media poblacional), todos ortogonales (independientes) entre
sí.
Cada factor está presente en un número (ilimitado) de niveles, al menos dos.
A cada combinación de factores le corresponde al menos un valor de una variable dependiente.
Esa variable es cuantitativa, continua y normalmente distribuida (para el ANOVA clásico, hay
variantes no paramétricas que no requieren esta restricción)
Puede haber réplicas de la variable dependiente, en ese caso las réplicas se tratan como un
factor (aleatorio) adicional y su número de niveles será el tamaño de esa muestra replicada.
El diseño es totalmente simétrico
Hay dos clases de ANOVA factorial:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 69 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 70-175
•
COMPLETO: Todas las combinaciones de factores y niveles están presentes y representadas
por al menos un valor de la variable dependiente. Este es el diseño más simétrico y eficaz del
ANOVA factorial
•
INCOMPLETO y/o BALANCEADO: Sólo están presentes algunas de las combinaciones
posibles. Este diseño se prefiere si el número de factores y/o niveles fuese tan grande que
dificulta su inclusión completa. A veces las dificultades o el costo en la obtención de datos de
un espectro muy amplio de posibilidades obliga a recurrir a este diseño. El diseño recibe el
nombre de BALANCEADO si los factores/niveles que sí se han incorporado al ensayo
provienen de una selección aleatoria de todos los casos potencialmente posibles.
Un resultado interesante del ANOVA factorial es que se obtiene una cuantificación precisa de las
interacciones entre factores. Esas interacciones pueden ser de primer orden si intervienen dos factores,
segundo orden si intervienen tres, etc. Cada interacción representa una desviación de la aditividad del
ensayo y por ende son efectos generalmente no deseados. Su presencia anula la eventual significación
(rechazo de H0 de inexistencia o inefectividad) que pudiesen tener los efectos principales. Sin embargo,
a veces el investigador persigue precisamente demostrar la existencia de esas interacciones. Una
interacción entre dos factores se interpreta de la siguiente manera: supongamos que un factor A tiende a
aumentar la media poblacional y un factor B no la modifica. Entonces una interacción significativa A x
B implica que A aumenta el promedio en algunos niveles de B y lo mantiene constante o disminuye en
otros niveles de B. Esto es claramente un efecto paradójico que merece ser investigado y que muchas
veces se constituye en una conclusión más interesante para el observador que un simple resultado lineal
y aditivo según lo esperado.
El lector no debe memorizar procedimientos complejos como el que se expone a continuación. En una lectura
general del presente Capítulo puede pasar por alto los detalles computacionales del siguiente ejemplo, sólo
debe intentar entender la lógica general del ANOVA.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 70 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 71-175
Ejemplo ANOVA FACTORIAL COMPLETO 2x3x4: Un investigador desea probar la acción de dos
fármacos (Levotonina y Metoformazina) (en distintas dosis) sobre una patología específica, tanto en
hombres como en mujeres. Para cada factor y nivel, elige dos pacientes al azar (repeticiones) y
registra los resultados de una variable vinculada a esa patología. El diseño del ANOVA factorial
completo y los resultados obtenidos son:
Tratamientos o Factores
L mg / día
(Levotonina)
M mg / día
(Metoformazina)
0
0
25
50
0
5
25
50
0
10
25
50
0
15
25
50
Sexo
Masc
Fem
Masc
Fem
Masc
Fem
Masc
Fem
Masc
Fem
Masc
Fem
Masc
Fem
Masc
Fem
Masc
Fem
Masc
Fem
Masc
Fem
Masc
Fem
TOTAL
Repeticiones
(variable dependiente
medida)
Paciente
Paciente 1
2
111
97
152
145
109
99
127
122
85
121
167
124
130
100
155
153
103
121
124
134
112
96
176
127
122
113
138
108
134
141
140
121
134
119
146
139
119
103
80
129
136
116
142
139
146
103
162
127
3150
2897
Total
208
297
208
249
206
291
230
308
224
258
208
303
235
246
275
261
253
285
222
209
252
281
249
289
6047
Primero calculamos sobre la tabla principal:
C=(6047)2/48=761796
SC Total= 1112+972+…+1622+1272 - C=20409
SC Tratamientos= (2082+2972+…+2892)/2 –C=12756
SC Repeticiones= (31502+28972)/24 – C=1334
SC Error= 20409-(12756+1334)=6319
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 71 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 72-175
Ahora calculamos sobre la primer tabla resumen A:
M
(Metoformazina)
0
25
50
Total
0
505
457
497
1459
L (Levotonina)
5
10
538
481
482
536
511
538
1531
1555
15
431
533
538
1502
Total
1955
2008
2084
6047
Cada dato es la suma de 4 valores originales
SC Total A = (5052+…+5382)/4 –C=3496
SC L, Levotonina= (14592+…+15022)/12 –C=427
SC M, Metoformazina=(19552+…+20842)/16 –C=526
SC LM (interacción)=3496-(427+526)=2543
Ahora calculamos sobre la segunda tabla resumen B:
M
(Metoformazina)
0
25
50
Total
S (Sexo)
Masc
895
959
916
2770
Fem
1060
1049
1168
3277
Total
1955
2008
2084
6047
Cada dato es la suma de 8 valores originales
SC Total B = (8952+…+11682)/8 –C=6702
SC S, Sexo= (27702+32772)/24 –C=5355
SC MS (interacción)=6702-(5355+526)=821
Finalmente calculamos sobre la tercera tabla resumen C:
S
(Sexo)
Masc
Fem
Total
0
622
837
1459
L (Levotonina)
5
10
662
763
869
792
1531
1555
15
723
779
1502
Total
2770
3277
6047
Cada dato es la suma de 6 valores originales
SC Total C = (6222+…+7792)/8 –C=8181
SC LS (interacción)=8181-(427+5355)=2399
SC LMS (interacción)=12756-(427+526+5355+2543+821+2399)=685
y volcamos al cuadro ANOVA completando los cómputos de F y consultando la tabla 5%::
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 72 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 73-175
CUADRO ANOVA
FUENTE DE VARIACION
Repeticiones (entre Pacientes)
L (Levotonina)
M (Metoformazina)
S (Sexo)
LM (interacción)
LS (interacción)
MS (interacción)
LMS (interacción)
Error experimental
SC
1334
427
526
5355
2543
2399
821
685
6319
g. de l.
1
3
2
1
6
3
2
6
23
MC
1334
142
263
5355
424
800
410
114
275
F
4.85
0.51
0.86
19.47
1.54
2.91
1.49
0.41
-.-
SIGNIFICACION
* (p<0.05) (rechazar H0)
N.S. (aceptar H0)
N.S. (aceptar H0)
** (p<0.01) (rechazar H0)
N.S. (aceptar H0)
N.S. (aceptar H0)
N.S. (aceptar H0)
N.S. (aceptar H0)
-.-
(los g. de l. de las interacciones se obtienen multiplicando los g. de l. de los factores involucrados)
Las conclusiones son: Hay una diferencia entre los pacientes 1 y 2, es como si el ordenamiento tuviese
algún significado que el experimentador deberá evaluar. No existen diferencias significativas entre las
interacciones, lo que brinda validez a las comparaciones de los efectos principales. Respecto a los
mismos, no hay diferencias entre las dosis suministradas de Levotonina. Lo mismo ocurre con la
Metoformazina, pero como una de esas dosis era 0 y servía de control podremos afirmar que a la luz del
presente ensayo ambas drogas carecieron de efecto farmacológico significativo. El único factor
significativo resultó ser el sexo. Inspeccionando las tablas resume podremos afirmar que la respuesta es
muy significativamente menor en los hombres que en las mujeres.
3.10. ANCOVA: EL ANÁLISIS DE COVARIANZA
Hemos visto los tipos principales de ensayos de la familia ANOVA. Ahora trataremos un caso especial
de ANOVA aplicado a la correlación lineal conocido como análisis de covarianza o ANCOVA. En
realidad se trata de una ampliación a los métodos de regresión lineal ya vistos. La medición del
ambiente es la variable independiente X y el resultado de la medición la variable dependiente Y.
Supongamos que hay dos tratamientos que supuestamente afectan a la relación (X, Y). El objetivo será
entonces comparar el efecto de los dos tratamientos sobre Y. En otras palabras, dadas dos regresiones
lineales debidas a dos tratamientos, el objetivo del ANCOVA es determinar si las regresiones de
ambas son iguales o no. Las regresiones pueden diferir por su pendiente, por su ordenada al origen o
por su correlación, el ANCOVA las verifica todas.
Ejemplo ANCOVA: Se estudió el efecto de dos tratamientos de quimioterapia (Vinblastina y
Hidroxiurea) en pacientes oncológicos y en ambos casos se midió la correlación entre dosis (mg/Kg
peso) y la densidad del tumor a los 10 días del tratamiento. En la siguiente tabla están los resultados:
V
X (dosis)
(Vinblastina) Y (respuesta)
H
X (dosis)
(Hidroxiurea) Y (respuesta)
29
22
15
30
20
22
9
32
14
20
1
26
21
24
6
25
6
12
19
37
Si se grafican los datos se observa que las regresiones no están lejos de ser paralelas (igual pendiente)
pero con distinta ordenada al origen. Luego pasamos al cuadro de covarianza para efectuar las
verificaciones cuantitativas.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 73 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 74-175
38
36
34
VINBLASTINA
HIDROXIUREA
32
DENSITOMETRIA
30
28
26
24
22
20
18
16
14
12
0
5
10
15
20
25
30
DOSIS (mg/Kg Peso)
CUADRO ANCOVA
b=
∑ xy
Fuente de
variación
Recta V
Recta H
Dentro
b
coeficientes
de regresión
coeficiente
de regresión
común
(x Suma de
Rectas V y
H)
Medias
ajustadas
Total
(pool V y H)
f
∑x
4
4
294
204
2
∑ xy
∑y
134
117
88
94
2
SC =
∑ y − (∑ xy) 2 / ∑ x 2
MC
26.93
26.90
53.83
8.98
8.97
8.97
1.66
1.66
7
55.49
7.93
x Diferencia 1
372.56
372.56
8
428.05
∑ x2
ν
(pendiente o
coeficiente de
regresión)
0.456
3
0.574
3
x Suma 6
2
x Diferencia 1
8
9
498
658
251
51
182
432
0.504
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 74 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
HOMOGENEIDAD DE
VARIANZA
(las dos muestras provienen de
poblaciones normales con σ2
comunes)
IGUALDAD DE INCLINACION
(pendiente)
IGUALDAD DE ELEVACION
(ordenadas al origen)
Pag 75-175
Para la diferencia de σ2
F(3,3) = 8.98/8.97 ≈1 N.S.
(aceptar H0 de igualdad)
Para la diferencia de b (coeficientes de regresión)
F(1,6) = 1.66/8.97 <1 N.S.
(aceptar H0 de igualdad)
Para la diferencia de medias ajustadas
F(1,7) = 352.56/7,93 = 47.0 ** (p<0.01)
(rechazar H0 de igualdad)
Aquí observamos que los cómputos son algo más engorrosos que en el ANOVA, pero siguiendo
cuidadosamente este modelo el lector podrá efectuar sus ANCOVA con toda facilidad.
3.11. ENSAYO DE RECTAS PARALELAS: PRUEBA DE DOCIMASIA BIOLÓGICA
Una de las aplicaciones más importantes de la estadística inferencial en la medicina pertenece al campo
de la farmacología experimental. El problema fundamental es valorar la potencia biológica de alguna
partida de un preparado o contrastar la potencia de una droga contra los patrones internacionales. Esta
clase de estudio se resuelve por medio de un ANOVA particularmente diseñado para contrastar
diferencias. Como hipótesis se supone que la droga desconocida y el patrón de calibración poseen el
mismo principio activo por lo cual es de suponer que el desconocido es una suerte de “concentrado” o
“diluido” del patrón de calibración. Esto implica que las relaciones dosis-respuesta de ambos sean en
principio paralelas (de igual pendiente) pero diferente ordenada al origen. Es decir la potencia
intrínseca es la misma, varía la dosis efectiva suministrada.
En el punto anterior vimos como un ANCOVA puede decidir si dos regresiones son paralelas y si
difieren en su ordenada al origen. Ahora vamos a ver un caso similar pero orientado a calcular la
“potencia relativa” del desconocido frente al patrón de calibración y validar todo con un ANOVA. La
clase de ensayo que vamos a emplear se conoce como test de rectas paralelas (vamos a descontar por
hipótesis que sí los son, caso contrario efectuamos un ANCOVA previo). Vale la pena acotar que este
tema de la docimasia biológica tiene muchísimas variantes y para el que necesite profundizar este
capítulo se le recomienda enfáticamente el libro de (FINNEY, 1964), íntegramente dedicado a estos
temas. Vamos a resolver un caso práctico que ilustra lo principal del ensayo de rectas paralelas y del
cálculo de potencia biológica.
Ejemplo ENSAYO DE RECTAS PARALELAS (de 4 puntos): un farmacólogo responsable de un
laboratorio de especialidades medicinales acaba de sintetizar una nueva partida de penicilina que
desea valorar frente a su patrón internacional. Los ensayos se efectúan a través de antibiogramas,
midiendo el diámetro del halo de inhibición de colonias (en décimas de mm) en un cultivo en placa de
Petri. El investigador siembra 8 placas control y 8 desconocidos. 4 controles tienen un disco con 200
UI/ml del antibiótico, los otro 4 controles un disco con 50UI (dilución 1:4), 4 desconocidos un disco
con la solución desconocida 1:1 y los 4 desconocidos restantes un disco con esa solución diluida 1:4
(la dilución D=4 es igual a la dilución de potencia del patrón). Los resultados y el análisis son los
siguientes:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 75 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 76-175
ENSAYO DE RECTAS PARALELAS
(diámetros en décimas de mm de inhibición por penicilina)
STANDARD
(UI por ml)
50
200
92
108
95
111
93
108
90
107
370
434
Placa N°
(al azar)
I
II
III
IV
Total
TEST
(Dilución)
0.25
1
68
90
74
91
72
91
75
88
289
360
Lp=
-S1-S2
+T1+T2
-42
-41
-38
-34
-155
L1=
-S1+S2
-T1+T2
38
33
34
30
135
L’1=
+S1-S2
-T1+T2
6
1
4
-4
7
Calculamos:
R (potencia relativa del desconocido) = (Zs/Zt) antilog (Lp.logD/L1)
=(200/1) antilog( -155. log 4 / 135)=200 x 0.2036= 40.7
O sea que la mejor estimación (promedio) para la potencia del desconocido es de 40.7 UI/ml. Ahora
pasamos al cómputo del intervalo de confianza 95% (o límites fiduciarios 95%) de esta estimación.
Primero calculamos la varianza poblacional usando las tres últimas columnas:
SC Lp =( (-42)2+(-41)2+(-38)2+(-34)2)/3= 38.75
SC L1 =( 382+332+342+302)/3= 32.75
SC L’1 =( 62+12+42+(-4)2)/3= 56.75
s2=(38.75+32.75+56.75)/(3+3+3)=3.562
Luego calculamos valores auxiliares usando t-Student (p=0.05, con 9 g. de l.) = 2.26 (ver TABLA III)
N t2 s2 = 16 x (2.26)2 x 3.562 = 291.6
y por último el intervalo de confianza 95% de la potencia relativa
{
⎡ log D L L ± Nt 2 s 2 ( L 2 + L 2 − Nt 2 s 2 )
ZS
p 1
p
10
1
R L , RU =
anti log ⎢
2
2
2
⎢
ZT
L1 − Nt s
⎣
}⎤⎥ = 30.3, 52.0
⎥
⎦
por lo tanto la potencia biológica del desconocido es de 40.7 y su intervalo de confianza 95% es
(30.3 , 52.0). Esto completa la primer parte del ensayo. Ahora pasamos a la validación:
Calculamos:
SC Preparaciones= Lp2 /N = (-155)2/16=1501.56
SC Regresión= L12 /N = 1352/16=1139.06
SC Paralelismo= L1’2 /N = 72/16=3.06
SC Entre dosis= SC Preparaciones+ SC Regresión+ SC Paralelismo
SC Total= ∑ x 2 − (∑ x) 2 / n (para los 16 datos) = 2700.44 (g. de l.=15)
MC Error =3.562 (fue calculada previamente)
SC Error = MC Error x (g.de l.=9)=32.06
SC Entre placas= SC Total – (SC Entre dosis+SC Error) = 8.23
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 76 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 77-175
CUADRO ANOVA
FUENTE DE VARIACION
SC
g. de
MC
l.
1
1501,56
F
SIGNIFICACION
422
** (p<0.01)
(rechazar H0)
** (p<0.01)
(rechazar H0)
N.S.
(aceptar H0)
Preparaciones
1501.56
Regresión
1139.06
1
1139.06
320
3.07
1
3.07
<1
2.643.69
3
881.23
247
Entre placas
24.69
3
8.23
2.31
Error experimental (SC s2)
32.06
9
3.56
2700.44
15
Paralelismo
Entre dosis
TOTAL
x Suma
x Suma
** (p<0.01)
(rechazar H0)
N.S.
(aceptar H0)
Ahora podremos interpretar este ensayo. Primero, no es conveniente que ninguna de las tres primeras
MC sean significativas, aquí parecen indicar un problema de linealidad de respuesta (lo que
lógicamente no se prueba explícitamente en un ensayo de 4 puntos, ya que por dos puntos siempre pasa
una recta óptima). Por suerte no hay falla de paralelismo y esa es la condición fundamental de validez
de esta clase de ensayo. Es lógico que entre dosis haya habido diferencias, reflejo de lo ocurrido con los
dos primeros contrastes. A su vez, no hay diferencias entre las réplicas (es decir las placas repetidas al
azar) lo cual es conveniente y esperado. Esta es toda la información extraíble de esta clase de prueba de
docimasia biológica.
3.12. GRÁFICOS DE CONTROL DE CALIDAD (6σ)
Uno de los problemas principales en la medición de variables biológicas lo constituye la necesidad de
controlar la calidad estadística de las mediciones. Este punto es crítico en un laboratorio de análisis
clínicos que informa resultados a cientos de pacientes diarios y requiere conocer con que precisión y
exactitud está produciendo esos resultados.
Para resolver este problema (y similares que aparecen en cualquier proceso industrial de fabricación) se
desarrollaron técnicas de control de calidad estadístico (SQC en inglés) de las cuales una de de las más
simples se conoce como tablas seis sigma (6σ) en alusión al control de bandas de DS y que sirve para
controlar la precisión de salida. Recordemos que la precisión de una serie de medidas es inversamente
proporcional a la dispersión de esos datos, lo que en variables normalmente distribuidas se mide a
través del desvío Standard (DS) como estimador de l valor poblacional sigma (σ). Quede claro que, en
principio, esta técnica controla precisión pero no la exactitud o sesgo que puede tener el promedio
respecto a su valor verdadero. La exactitud se controla en los laboratorios por medio del control de
calidad externo (muestras valoradas de título secreto que remite un ente central a un conjunto de
laboratorios) o por la calibración (o medición de patrones de valor conocido) de todas sus técnicas.
Pero, de aquí en más, supondremos que la exactitud está relativamente garantizada por esos controles y
por ende, las desviaciones que se registren podrán ser interpretadas como fallas de exactitud y de
precisión del sistema de medición.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 77 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 78-175
Para controlar al sistema de medición se requiere repetir las mediciones y vamos a presentar los
fundamentos del método de control seis sigma. Supongamos que un laboratorio desea controlar el
funcionamiento de un aparato autoanalizador químico (bien calibrado en cuanto a exactitud) que entre
otras mediciones calcula glucemia (glucosa sanguínea). Supongamos que, después de efectuar 1000
mediciones sobre pacientes clínicamente sanos (se descartan a los diabéticos) se obtuvieron los
siguientes datos descriptivos:
promedio (μ)
DS (σ)
n
82 mg%
7 mg%
1000
En este caso, el tamaño muestral justifica considerar a los valores de los parámetros como los
poblacionales. Sobre estos datos podríamos efectuar verificaciones empleando la variable normalizada
z (TABLA II del APENDICE). Por ejemplo, el intervalo de confianza 2 σ (82 ± 14 mg%) contiene al
95,5% de los datos y el intervalo de confianza 3 σ (82 ± 21 mg%) contiene al 99,7% de los datos. En
control de calidad a los intervalos 2 y 3 σ se los conoce como bandas 4 y 6 σ porque cada intervalo
ocupa 2 y 3 desvíos en cada dirección. Con esa definición, definimos los siguientes límites del cuadro
de control de calidad:
LIMITES DE CONTROL 6 σ
Límite de acción superior
μ +3 σ
Límite de advertencia superior
μ +2 σ
Límite de advertencia inferior
μ -2 σ
Límite de acción inferior
μ -3 σ
103 mg%
96 mg%
68 mg%
61 mg%
Debe quedar claro que si descontamos que la exactitud del método es aceptable, cualquier valor de
glucemia fuera del rango 68-96 mg% es sospechosamente anormal (al nivel p=0.045 de dos colas) y
cualquier valor de glucemia fuera del rango 61-103 mg% definitivamente anormal (al nivel 0=0.003 de
dos colas). Esta es la base del Cuadro de Control de Calidad seis sigma. Sólo nos resta crear esa tabla y
emplearla, graficando un punto por cada valor muestral. En la siguiente figura aparece el Cuadro:
CUADRO DE CONTROL DE CALIDAD 6 σ
GLUCEMIA (mg%)
103
96
82
68
61
LIMITE DE ACCION
LIMITE DE ADVERTENCIA
N° DE ENSAYO
LIMITE DE ADVERTENCIA
LIMITE DE ACCION
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 78 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 79-175
Ahora se grafican sucesivamente los valores de glucemia de pacientes de la misma población, es decir
se descartan los que clínicamente posean antecedentes o síntomas patológicos. Por supuesto que no se
descartan datos de pacientes que sean patológicos pero sin antecedentes. El criterio de aceptación pasa
por descartar pacientes con diagnóstico cierto de diabetes (en este caso no hay patología específica de
hipoglucemia) y simplemente aceptar todo el resto. O sea, si usamos pacientes para controlar al sistema
de medida, nos tenemos que asegurar que pertenezcan a una población homogénea y normal. Para cada
medida, existen criterios adecuados para este fin. Por ejemplo, para la glucemia sabemos que hay dos
clases de hiperglicémicos: Diabetes Tipo I (o juvenil) y Diabetes Tipo II (del adulto). La Diabetes Tipo
I se manifiesta desde temprana edad, la Tipo II rara vez antes de los 50 años. Por lo tanto, si se
seleccionan datos de personas clínicamente sanas entre 15 y 30 años de edad, obtenemos exactamente
lo que buscamos, una población homogénea que nos servirá en nuestro control.
Ahora vamos a la interpretación del Cuadro de Control. Si los datos oscilan en las bandas internas
(entre los límites de advertencia) podemos estar tranquilos que el equipo está trabajando bajo control
(exactitud y precisión medias de salida normales). Cuando un dato supera el límite de advertencia, y la
frecuencia de esas desviaciones sea razonable (no superior al 20% de los datos, en promedio el 5% de
los datos) no nos debe preocupar a menos que alcance o supere el límite de acción. Aún superado este
límite, si el sobrepaso es esporádico (<5%) podrá ser ignorado. Lo principal a controlar son dos
aspectos:
1. Cambios de exactitud: esta clase de sesgo o tendencia se detecta al analizar si hay cambios
persistentes en los promedios obtenidos. Esto indica una descalibración del sistema de medida.
2. Cambios de precisión: se observan fluctuaciones (en ambos sentidos) superiores a las
habituales, indicando un malfuncionamiento (inestabilidad) del sistema de medida.
Por ejemplo, vemos los siguientes patrones de comportamiento y su correspondiente interpretación:
GLUCEMIA (mg%)
103
96
LIMITE DE ACCION
LIMITE DE ADVERTENCIA
82
68
61
LIMITE DE ADVERTENCIA
LIMITE DE ACCION
CUADRO DE CONTROL NORMAL (Proceso bajo control)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 79 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
GLUCEMIA (mg%)
103
96
Pag 80-175
LIMITE DE ACCION
LIMITE DE ADVERTENCIA
82
68
61
LIMITE DE ADVERTENCIA
LIMITE DE ACCION
PERTURBACION: CUADRO DE CONTROL SESGADO (Probable descalibración)
GLUCEMIA (mg%)
103
96
LIMITE DE ACCION
LIMITE DE ADVERTENCIA
82
68
61
LIMITE DE ADVERTENCIA
LIMITE DE ACCION
PERTURBACION: CUADRO DE CONTROL INESTABLE (Probable falla)
De esta forma, el reconocimiento de patrones auxilia en el control de calidad de un sistema de
medición. En la mayoría de los equipos autoanalizadores computarizados, estas funciones ya se
encuentran incorporadas en forma automática y el propio equipo registra y advierte al operador sobre
las perturbaciones que puede estar sufriendo.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 80 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 81-175
3.13. MUESTREO SECUENCIAL
Una interesante aplicación de la investigación operativa aplicada a la optimización de la información
adquirida la representa el muestreo secuencial. En principio se trata de un sistema que permite tomar
decisiones acerca de alternativas dicotómicas (bueno/malo, sano/enfermo, etc.) mediante la inspección
sucesiva. Vamos a analizar primero el caso del muestreo de inspección en el control de calidad
industrial. Supongamos que el Departamento Producción de un Laboratorio Farmacéutico elabora
ampollas de Ampicilina y el Departamento de Control de Calidad desea revisar los lotes elaborados
para aprobarlos (si no detecta un número insatisfactorio de fallas en él)
Aquí tenemos un clásico modelo de intereses contrapuestos, Producción desea que se apruebe el lote
(así justifica su trabajo y razón de ser) y Control de Calidad exactamente lo opuesto por idéntico
motivo. Cómo se resuelve este dilema de la forma más eficiente y económica? A través del esquema de
muestreo. Existen varios esquemas de muestreo clásico, simple y doble. En la bibliografía se puede
hallar amplia información al respecto (MORONEY, 1968). Aquí nos limitaremos a describir el sistema
más eficiente conocido: el muestreo secuencial.
La idea básica es la siguiente: Control de Calidad inspecciona ampolla tras ampolla producida y las
clasifica en dos categorías: “V°B°” o “DEFECTUOSO”. Supongamos que se fabricaron 1500 ampollas,
ese es el lote a inspeccionar y calificar. Si el número acumulado de “DEFECTUOSOS” supera un cierto
límite, se rechaza a todo el lote de ampollas. Si el número de defectuosos alcanza otro límite (esta vez
inferior), se acepta a todo el lote.
(d=s n + h2)
EN ESTA LINEA O POR DEBAJO DE ELLA, ACEPTACION
(d=s n - h1)
10
20
30
40
50
EN ESTA LINEA O POR SOBRE ELLA, RECHAZO
0
Numero total de
defectuosos encontrados
El siguiente esquema ilustra el proceso de muestreo secuencial:
h1
h2
0
10
20
30
40
50
60
70
80
90
100
110
Tamaño acumulativo de la
muestra (=n)
Podemos describir este cuadro de la siguiente manera: posee dos líneas, la superior es llamada la línea
de rechazo, la inferior de aceptación. El muestreo comienza desde Y (N° defectuosos hallados)=0 y X
(N° de piezas inspeccionadas, o sea tamaño acumulativo de la muestra o n)=0. Se inspecciona la primer
ampolla. Supongamos que se califica “V°B°”, entonces graficamos el primer punto del cuadro en la
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 81 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 82-175
coordenada (X, Y) = (1, 0). Supongamos que el segundo objeto inspeccionado se rechaza, entonces el
segundo punto se ubicará en (X, Y) = (2, 1). Se continúa así hasta alcanzar una de las rectas límites.
Supongamos que después de 65 inspecciones y sólo 3 rechazos se alcanza la recta inferior en (X, Y) =
(65, 3). Entonces se suspende el proceso de inspección y se acepta a todo el lote de 1500 ampollas. Por
el contrario, si con (X, Y) = (43, 32) se hubiese alcanzado el límite de rechazo, se rechaza a todo el lote.
Por supuesto, los número aquí usados sólo sirven como ejemplo didáctico. Demás está por decir que la
selección de muestras a inspeccionar dentro de todo el lote debe ser lo más aleatoria posible, de manera
que la probabilidad de pasar a integrar el control sea a priori igual para todos los objetos.
Observemos los parámetros que definen el Cuadro de Inspección, se trata de dos líneas paralelas, cuyas
ordenadas al origen son respectivamente h2 y h1 y cuya pendiente es s. Como en toda función lineal,
estos dos parámetros alcanzan para definir estas rectas. La fórmula de las rectas para las líneas de
rechazo y aceptación están indicadas a la derecha de cada una. Lo que se necesita ahora es un criterio
para definir esos parámetros de la mejor manera posible.
En el método de muestreo secuencial se halló que bastaban cuatro valores o parámetros para definir un
plan de muestreo como el descripto, a saber
La calidad aceptable, expresada como máxima fracción
de defectuosos permitida (BUENA CALIDAD)
La probabilidad de rechazar un lote de calidad aceptable
(Riesgo del Productor)
La calidad inaceptable, expresada como mínima
fracción de defectuosos tolerada (MALA CALIDAD)
La probabilidad de aceptar un lote de calidad
inaceptable (Riesgo del consumidor)
p1
α
p2
β
En base a la definición de lotes buenos y malos, junto a los errores de Tipo I y II enunciados,
obtenemos los parámetros del plan secuencial de muestreo:
g 1 = log(
h1 =
p2
)
p1
1 − p1
)
g 2 = log(
1− p2
b
g1 + g 2
h2 =
a
g1 + g 2
1− β
a = log(
)
α
s=
1−α
b = log(
)
β
g2
g1 + g 2
O sea, calculando tres valores auxiliares (en la primer línea) obtenemos los tres parámetros que nos
permiten obtener el plan secuencial buscado y que va a cumplir con lo requerido.
Vamos a poner un ejemplo concreto.
Supongamos que se tolera una fracción de defectuosos del 1% (p1=0.01) y se acepta un riesgo de
rechazo de lotes de esa o mejor calidad del 10% (α = 0.10). Supongamos además que se considera
inaceptable una fracción de defectuosos del 5% (p2=0.05) y que el riesgo de aceptar un lote así o peor
sea también del 10% (β = 0.10).
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 82 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 83-175
Resulta ser:
g1=0.699
g2=0.017
a=b=0.954
entonces :
h1=h2= 1.32
s=0.024
NUMERO ACUMULADO DE DEFECTUOSOS
En el gráfico siguiente presentamos el cuadro de inspección resultante:
4
LIMITE DE ACEPTACION DEL LOTE
LIMITE DE RECHAZO DEL LOTE
CAMINO DE LA INSPECCION
3
2
aquí se alcanza la decisión
1
0
-1
0
20
40
60
80
100
TAMAÑO ACUMULATIVO DE MUESTRA (n)
Supongamos que se inspeccionó el lote y al llegar a 15 inspeccionados aparece el segundo defectuoso,
como se cruza la línea, se rechaza el lote.
Otra pregunta que se puede formular el investigador del Departamento de Control de Calidad es saber
cómo opera en general este sistema, es decir cuáles serán las probabilidades de aceptación de lotes
de calidades diferentes. La respuesta la brinda la Curva Operativa del esquema y que se computa en
base a cinco puntos característicos:
FRACCION DE DEFECTUOSOS DEL LOTE
0
p1
s
p2
1
PROBABILIDAD DE ACEPTACION
1
1-α
h2 / (h1 + h2)
β
0
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 83 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 84-175
Si graficamos con los datos de nuestro ejemplo, obtenemos la siguiente Característica Operativa:
PORCENTAJE DE LOTES QUE SERA
ACEPTADO POR LA MUESTRA
100
80
CARACTERISTICA OPERATIVA
DEL PLAN DE INSPECCION
60
40
20
0
0
2
4
6
8
10
PORCENTAJE DE DEFECTUOSOS
EN LOS LOTES ENTREGADOS
Además al investigador le interesa conocer la CMS (Calidad Media de Salida) y la Curva de Números
Muestrales Medios (NMM) (Cantidad media de inspección antes de llegar a una decisión), la que se
obtiene a partir de los siguientes datos:
FRACCION DE
DEFECTUOSOS DEL
LOTE
FRACCION
REMANENTE POSTINSPECCION
DE DEFECTUOSOS
(CMS)
NUMEROS
MUESTRALES
MEDIOS (NMM)
0
p1
s
p2
1
0
p1(1-α)
sh2 / (h1+h2)
βp2
0
h1/s
(h1-α(h1+h2)) / (s-p1)
h1h2 / (s(1-s))
(h2-β(h1+h2)) / (p2-s)
h2/(1-s)
Así obtenemos los gráficos buscados:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 84 -175
CMS COMO % DEFECTUOSOS REMANENTES
DESPUES DE LA INSPECCION
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 85-175
1,2
1,0
0,8
CALIDAD MEDIA DE SALIDA (CMS)
0,6
0,4
0,2
0,0
0
2
4
6
8
10
PORCENTAJE DE DEFECTUOSOS
EN LOS LOTES ENTREGADOS
CANTIDAD MEDIA INSPECCIONADA ANTES
DE LLEGAR A UNA DECISION
Obsérvese que la CMS tiene como máximo al valor 1.19% de salida para s=2.38 % de entrada, o sea
que es imposible que salgan lotes con peor calidad. Respecto al número medio a inspeccionar antes de
llegar a una decisión será:
80
NUMEROS MUESTRALES MEDIOS
ESPERADOS POR EL PLAN
70
60
50
40
30
20
10
0
0
2
4
6
8
10
PORCENTAJE DE DEFECTUOSOS
EN LOS LOTES ENTREGADOS
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 85 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 3 – Test Paramétricos
Pag 86-175
Se puede observar que en base a los cuatro parámetros iniciales, se obtuvo toda la información. Otra
aplicación interesante del mismo concepto lo ofrece el análisis secuencial para diferencia de pares. Se
comienza en el casillero (0, 0) de un cuadriculado (X, Y). En este caso, la idea es comparar el efecto de
dos fármacos (A, B) tomando dos pacientes y dándole al azar uno a cada uno. Luego se comparan los
resultados y se decide cuál de los dos tuvo mejor. Si fuese A se avanza un casillero a la derecha (Δ X =
+1), si fuese B un casillero para arriba (Δ Y = +1). Si hubiese empate, no se avanza. Luego se continúa
hasta llegar a un límite prefijado. Hay tres límites: Superior (B es mejor), Central (Empate) e Inferior
(A es mejor). La ubicación de esos límites depende del nivel de significación que se desee fijar. Como
se trata de tomar decisiones dicotómicas, el mismo sistema puede servir para decidir estas dos opciones
(o ninguna en caso de límite de empate) respecto a un único sistema.
Ejemplo: Calificación de alumnos en un examen oral por análisis secuencial de pares
25
Si queremos tomar una decisión más objetiva acerca de la calificación de un alumno en un examen oral,
le formulamos una serie de preguntas en un cuadro de análisis secuencial. Desde (0, 0), cada vez que
contesta “BIEN” avanzamos un casillero hacia arriba, si contesta “MAL” un casillero a la derecha
(podemos permutar las direcciones) y si no podemos decidir acerca de la respuesta formulamos otra
pregunta. Cuando se alcancen los límites, el alumno saldrá “APROBADO” (sale arriba), “SIN
DECIDIR” o que pase con otro docente (sale por el centro) y “DESAPROBADO” (sale a la derecha).
A continuación presentamos un Cuadro de Análisis Secuencial de Pares adaptado de la bibliografía
(DOCUMENTA GEIGY, 1965, Folia Médica Geigy N° 3)
H0: Y = X
α≈0.05
5
10
15
20
H1: Y > X
α≈0.05
0
H1: X > Y
α≈0.05
0
5
10
15
20
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
25
Página 86 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 87-175
CAPITULO 4: TEST NO PARAMETRICOS
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 87 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
4.1.
Pag 88-175
GENERALIDADES ACERCA DE LOS ENSAYOS NO PARAMÉTRICOS
Entramos ahora en un mundo diferente de las pruebas de inferencia estadística. Un mundo que
ofrece pruebas rápidas, simples, menos restrictivas en sus requerimientos y un poco menos potentes.
Por supuesto que estamos hablando en términos generales, una prueba no paramétrica correctamente
aplicada será más potente que una paramétrica en la cual no se han tomado todos los recaudos del
caso. En inglés diríamos que la estadística no-paramétrica ofrece las soluciones “QUICK & DIRTY”
al investigador, es decir las “sucias y rápidas” en alusión a ser soluciones muchas veces usadas
como de aproximación inicial para ganar información acerca del comportamiento global del sistema,
o soluciones de “screening” (paneo).
Pero muchas veces, el método no paramétrico resuelve problemas que son inabordables por otra vía.
La cuestión es simple de entender si releemos las diferencias entre ambas categorías de ensayo.
TEST
PARAMETRICOS
TEST NO
PARAMETRICOS
POTENCIA
RELATIVA
100%
95%-65%
APLICABILIDAD
SOBRE DATOS
CUANTITATIVOS
Sólo Escala de Intervalo o
Escala de Proporcion
PREREQUISITOS
•
•
•
•
CUALI/CUANTITATIVOS
Escala Nominal, Ordinal,
Intervalo o de
Proporción
Poblaciones de cualquier
clase y datos de
cualquier tipo
EJEMPLOS
Obs. independientes
Poblaciones normales (z)
Varianzas proporcionales
Efectos aditivos de
causas deterministas
sobre los promedios
t-Student, Análisis de Varianza
(ANOVA), F-Snedecor,
MANOVA, ANCOVA, etc.
Prueba de rangos, Prueba
de signos, Ji-cuadrado,
Prueba de Walsh, etc.
La aplicabilidad es universal, datos de cualquier especie y distribuciones de prácticamente cualquier
tipo. En el desarrollo de los métodos estadísticos modernos, las primeras técnicas de inferencia que
aparecieron fueron las paramétricas y que hacían muchas suposiciones acerca de las poblaciones y
datos bajo estudio. El problema es que tales técnicas conducen a conclusiones muchas veces
condicionales en función del cumplimiento de esas premisas. Más recientemente se ha visto aparecer
el desarrollo de un gran número de técnicas no paramétricas que iban planteando paulatinamente
menos condiciones restrictivas y ampliando con ello el horizonte de la estadística aplicada. Mientras
las pruebas paramétricas fijan su atención sobre el comportamiento de las medias y las varianzas,
muchas veces las pruebas no paramétricas se concentran en medianas y rangos. Es decir, se desplaza
el centro de gravedad de lo cuantitativo y Gaussiano a lo semicuantitativo y a veces cualitativo de los
datos.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 88 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 89-175
Vamos a presentar los modelos y ensayos más importantes de esta categoría con la esperanza que el
lector pueda apreciar su utilidad y llegue a emplearlos en su propio entorno.
4.2.
TABLAS DE CONTINGENCIA: LA DISTRIBUCIÓN χ2 (JI-CUADRADO)
La primera distribución estadística no paramétrica y tal vez la más importante es la conocida como
χ2 (ji-cuadrado o “chi-square” en inglés). Frecuentemente el investigador está interesado en el
número de sujetos, objetos o respuestas que se clasifican en diferentes categorías en una tabla
general de clasificación. La prueba ji-cuadrado es adecuada para analizar datos de esta clase. La
técnica básica es la de medir bondad de ajuste, es decir justipreciar si las frecuencias observadas en
cada celda de la tabla de clasificación difieren significativamente de las frecuencias esperadas para
esa celda en base a alguna suposición o hipótesis teórica.
Supongamos por ejemplo que al terminar a un tratamiento médico sobre 60 pacientes de una dada
patología (con un grupo control de otros 60 pacientes tratado con placebo), se efectúa un censo final
y se obtiene el siguiente cuadro de clasificación de frecuencias observadas (a este tipo de cuadro se
lo llama cuadro o tabla de contingencia 2x2):
TABLA DE CONTINGENCIA 2x2
PACIENTES
CURADOS
PACIENTES NO
CURADOS
A=35
B=25
C=12
D=48
PACIENTES
TRATADOS
PACIENTES NO
TRATADOS
Aquí nos interesa saber si el tratamiento ha sido efectivo frente al grupo no tratado (controles con
placebo) y para verificarlo planteamos la H0: independencia Tratamiento vs. Resultados, o sea que
tratados y no tratados responden igual lo que equivale a que las filas y las columnas son
independientes. Si esa H0 fuese cierta, deberíamos esperar proporciones iguales de curados y no
curados en ambos casos, o sea que las frecuencias esperadas de cada celda deberían ser 30 en los
cuatro casos.
La pregunta es, ¿cómo medimos las discrepancias entre las frecuencias observadas en la tabla
superior y las esperadas según la H0 de independencia? Para responder a esta cuestión se desarrolló
un test no paramétrico (ji-cuadrado) y una distribución correspondiente que se presenta en la
TABLA VI del APENDICE. Se computa un indicador o estadístico de prueba conocido como χ2 (jicuadrado):
k
χ2 =∑
i =1
(Oi − E i ) 2
Ei
en el cual Oi y Ei representan las frecuencias observadas y esperadas en la celda i-ésima, esto se
repite para todas las k celdas. Podemos observar que el valor χ2 nunca puede ser negativo por
elevarse todas las diferencias al cuadrado. Por ejemplo, en nuestro caso el valor de χ2 será:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 89 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 90-175
(35 − 30) 2 (25 − 30) 2 (12 − 30) 2 (48 − 30) 2
χ =
+
+
+
= 23.27
30
30
30
30
2
En la práctica, el ji-cuadrado de la tabla de contingencia 2x2 (con una corrección de continuidad de
Yates incorporada) se calcula por esta fórmula mas simple:
χ
2
=
N (| AD − BC | − N / 2) 2
C1 C 2 F1 F 2
; g .de l. = 1
donde N es el total general, C1 y C2 son los totales de columnas y F1 y F2 los totales de filas. A
este valor siempre se le asocian grados de libertad calculados como el número de filas menos uno de
la tabla de contingencia multiplicado por el número de columnas menos uno de la misma tabla y que
en nuestro caso por ser una tabla 2x2 resulta:
ν ( g. de l.) = ( F − 1)(C − 1) = 1
Ahora consultamos la TABLA VI del APENDICE y vemos que para 1 grado de libertad el valor
límite de ji-cuadrado para un nivel de significación α=0.001 es de 10.83. Nuestro χ2 supera ese valor
por lo cual rechazamos la H0 al nivel p=0.001 y concluimos que el tratamiento ha sido eficaz en la
curación de los pacientes. Este cómputo se generaliza rápidamente para tablas de contingencia de
cualquier dimensión, lo único que se deberá ajustar el es número de grados de libertad.
Vamos a describir cómo se calculan las frecuencias esperadas en una tabla de contingencia 2x3 de
acuerdo a la H0 de independencia. Si las dimensiones de la tabla fuesen mayores, se repite este
procedimiento.
FRECUENCIAS OBSERVADAS (Oi)
TABLA 2x3
FILA 1
FILA 2
SUMA
COLUMNA COLUMNA COLUMNA
1
2
3
a
b
c
d
e
f
C1=a+d
C2=b+e
C3=c+f
SUMA
F1=a+b+c
F2=d+e+f
T=a+b+c+d+e+f
FRECUENCIAS ESPERADAS (Ei) DE ACUERDO A H0 INDEPENDENCIA
TABLA 2x3
FILA 1
FILA 2
SUMA
COLUMNA COLUMNA COLUMNA
1
2
3
(F1C1)/T
(F1C2)/T
(F1C3)/T
(F2C1)/T
(F2C2)/T
(F2C3)/T
C1
C2
C3
SUMA
F1
F2
T
Por ejemplo, si F1=32, C1=17 y T=54, entonces la frecuencia esperada para la celda a sería 10.1
Observar que las sumas marginales no varían, lo que sirve para controlar los cómputos. Finalmente
se obtienen los g. de l. = (F-1)(C-1)=(2-1)(3-1)=2
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 90 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 91-175
Prueba de bondad de ajuste
La H0 de independencia no es la única que puede ser verificada por el test ji-cuadrado. Si
tuviesemos por ejemplo un histograma de frecuencias de clase en una distribución cualquiera (por
ejemplo, altura de pacientes sexo masculino)
140149
FRECUENCIA 13
ALTURA (cm)
150159
23
160169
44
170179
65
180189
38
190199
21
200209
9
Podríamos probar la H0: Distribución Normal N(μ,σ) en base a la estadística descriptiva previa.
Entonces podremos calcular las frecuencias esperadas en cada celda del histograma (usando la
distribución z – TABLA II del APENDICE). Una vez calculadas las frecuencias de celda
correspondientes a la distribución normal, calculamos el valor χ2 de la misma manera que lo
efectuado con una tabla de contingencia (en este caso de una fila y 7 columnas). Para tablas como
ésta que poseen una sola fila, los grados de libertad se calculan como el número de celdas menos
uno (g. de l. = k-1 = 7-1 = 6). Si ese χ2 supera al valor límite de 12.59 (g.de l.=6, p=0.05),
rechazamos la H0 de normalidad al nivel p=0.05. Caso contrario concluimos que las alturas se
distribuyen normalmente.
Por supuesto que este mismo método de medida de bondad de ajuste se puede aplicar a cualquier
distribución esperada: Poisson, Uniforme (es decir sin moda) o la que quisiéramos considerar. Se
trata en síntesis de un ensayo muy poderoso. La prueba χ2 es una de las mas empleadas en ciencias
experimentales y la volveremos a ver en numerosas aplicaciones.
Limitación de frecuencias esperadas pequeñas
Cuando k=2 (o sea g. de l.=1) cada frecuencia esperada deberá ser de al menos 5. Cuando los
g. de l. > 1, es decir cuando k>2, la prueba χ2 no debe usarse si más del 20% de las frecuencias
esperadas es menor que 5 o si cualquier frecuencia esperada fuese menor a 1.
Para evitar esta limitación se recomienda agrupar aquellas celdas (sumando las frecuencias
observadas) cuyas frecuencias esperadas fuesen pequeñas hasta eliminar las condiciones que atenten
contra la restricción de frecuencias pequeñas.
4.3. PRUEBA DE McNEMAR PARA LA SIGNIFICACIÓN DE CAMBIOS
Esta prueba es particularmente apropiada para los diseños de “antes y después”, es decir donde cada
persona, objeto unidad de medida es su propio control. Por lo tanto se puede usar para medir la
eficacia de un tratamiento (en una tabla de contingencia), como lo veremos en este ejemplo donde
las frecuencias se expresan algebraicamente:
PRUEBA DE SIGNIFICACION DE LOS
CAMBIOS REGISTRADOS
POSITIVO
ANTES
NEGATIVO
DESPUES
NEGATIVO
A
C
POSITIVO
B
D
Para esta prueba, sólo nos interesa el valor A+D que es el número de individuos que cambiaron. Se
calcula un ji-cuadrado de McNemar con la siguiente fórmula:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 91 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
χ2 =
Pag 92-175
(| A − D | −1) 2
; ν ( g. de l.) = 1
(A + D
Esta fórmula incluye una corrección por continuidad de Yates al ji-cuadrado clásico. Obsérvese que
a la diferencia de A y D en valor absoluto le restamos uno antes de elevar al cuadrado. Veamos un
ejemplo numérico:
EFECTO DE UN FARMACO
APLICADO A UNA
POBLACION DE PACIENTES
DURANTE UN MES
ENFERMOS AL DIA 0
SANOS AL DIA 0
χ2 =
SANOS A
LOS 30
DIAS
ENFERMOS A
LOS 30 DIAS
14
3
4
4
(| A − D | −1) 2 (| 14 − 4 | −1) 2 81
=
= = 4.5
(A + D
14 + 4
18
Consultando la TABLA VI vemos que para g. de l. = 1 ese valor supera el primer límite pero no al
segundo. Como es este caso se requiere un test de una cola y la tabla contiene los valores de
probabilidad de dos colas, en vez de interpretar que el ji-cuadrado es significativo al nivel p=0.05
concluimos que se rechaza H0 y acepta H1, los cambios registrados en este caso son significativos
al nivel p=0.025, el tratamiento es eficaz en su acción de cambio de estado enfermo a sano.
Mayores precisiones sobre esta y demás pruebas no paramétricas pueden consultarse en la
bibliografía (SIEGEL, 1990).
4.4. PRUEBA DE LOS SIGNOS
Supongamos que se quieren comparar N pares (en cualquier orden) de dos series (A y B) de
resultados que ni siquiera necesitan ser cuantitativos, simplemente necesita existir una cierta
relación de orden (mayor, igual o menor) en cada comparación. Si la comparación del par i-ésimo
resultase en que Ai > Bi se le asigna el signo (+). Si la comparación fuese opuesta, se le asigna al
par el signo (-). En caso de empate, se desecha el par. En este caso, la prueba de los signos medirá
la significación de las diferencias globales entre ambas series y para determinarlo usa la distribución
binomial.
Vamos a ilustrar el cómputo con un ejemplo. Un investigador prueba dos antibióticos Alfamicina y
Betamicina sobre 20 placas de cultivo de antibiograma (10 por cada antibiótico) y asigna un valor
de escala (de 0=ausente a 5=maximo) al halo de inhibición de colonias a cada placa. Los resultados
y los signos de comparación son:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 92 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
N° PAR
ALFA
COMPARADO
1
0
2
2
3
3
4
4
5
3
6
4
7
1
8
5
9
4
10
3
Pag 93-175
BETA
SIGNO
2
1
2
4
2
2
3
2
3
1
+
+
0
+
+
+
+
+
De los 10 pares comparados, uno da empate y se descarta por lo cual N=9. Ahora elegimos como
valor x a la menor de las frecuencias de cualquier signo. Como hay 7 (+) y 2 (-) asignamos x=2.
Ahora consultamos la TABLA VII del APENDICE y en la fila 9 columna 2 leemos que la
probabilidad (H0: p=q=½) de obtener un x igual o menor al registrado es de 0.090. Como esa
probabilidad es >0.05, aceptamos H0 de igualdad de efecto entre ambos antibióticos. Sin
embargo, el p obtenido se acerca lo suficiente a 0.05 que uno debería seguir ensayando con
muestras mayores para volver a decidir. Este es el procedimiento habitual recomendado cuando los
resultados son limítrofes.
Puede observarse que esta prueba se efectuó comparando valores de escala y esto indica la utilidad
de esta clase de ensayos. Además apreciamos que la tabla maneja valores de N hasta 25. Para valores
de N>25, usar
z=
( x ± 0.5) − 0.5 N
0.5 N
que está distribuida normalmente con promedio cero y varianza uno N(0,1) (Usar el signo + si
x<0.5N, y – en caso opuesto. La significación de z se consulta como siempre en la TABLA II del
APENDICE.
4.5. PRUEBA DE LOS RANGOS DE WILCOXON
Si aparte de comparar las dos series como se hizo en la prueba de los signos se aporta un dato
cuantitativo acerca del valor de cada diferencia, se dispone de una prueba más eficiente, la prueba
de los rangos señalados y pares igualados de Wilcoxon.
Vamos a seguirlo con un ejemplo. Supongamos que en un ejemplo similar al de los antibióticos
usados en la prueba de los signos, el investigador no se limita a comparar los valores de escala sino
que calcula para cada par de placas comparadas la diferencia de los diámetros de los halos de
inhibición. Los resultados podrían ser:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 93 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 94-175
Rango de
Diámetro del halo de
Rango
de
d
i
N° PAR
signo
inhibición
Diferencia
COMPARADO
menos
(en 0.1mm)
(asignar valores de 1 a N, a
di
frecuente
las diferencias, de menor a
(el
mayor, con signo)
ALFA
BETA
menos!)
1
82
63
19
7
2
69
42
27
8
3
73
74
-1
-1
+1
4
43
37
6
4
5
58
51
7
5
6
56
43
13
6
7
76
80
-4
-3
+3
N=8
65
82
3
2
Valor de suma de rangos T
4
Nota: si hubiese empate de rangos, se les asigna a cada uno de ellos el promedio de los rangos que
les hubiese correspondido. O sea, supongamos que los pares 4, 5, 6 hubiesen dado igual diferencia
(di=6), entonces se les habría asignado a cada uno el rango 5 (=promedio de 4,5 y 6).
Consultando la TABLA VIII del APENDICE, vemos que para N=8 el valor T=4 alcanza (en
general se controla que alcance o rebase) el valor tabulado de p=0.05 para una prueba de dos colas,
por lo cual se rechaza H0 de igualdad entre ambos antibióticos al nivel p=0.05.
Cuando N es mayor que 25 no se puede usar la TABLA VIII. En ese caso, el valor de suma de
rangos T está distribuido normalmente N(μ, σ) pudiendo computarse:
μ=
N ( N + 1)
4
σ=
;
N ( N + 1)(2 N + 1)
24
Por lo tanto
z=
N ( N + 1)
4
N ( N (+1)(2 N + 1)
24
T−
está distribuida normalmente con media 0 y Desvío Standard 1. Para ver lo excelente que es esta
aproximación y practicar este cómputo, lo aplicaremos al caso de los dos antibióticos:
z=
N ( N + 1)
(8)(9)
4−
4
4
=
= −1.96
N ( N (+1)(2 N + 1)
(8)(9)(17)
24
24
T−
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 94 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 95-175
La TABLA II nos informa que un valor tan extremo de z posee un p= 1 - 2(0.4744)=0.05 para una
prueba de dos colas, el mismo valor arrojado por medio de la tabla T de Wilcoxon.
4.6. PRUEBA U DE MANN-WHITNEY
Si se comparan dos grupos independientes y se ha logrado al menos una medida ordinal, se puede
emplear la prueba U de Mann-Whitney. Es una de las pruebas no paramétricas más poderosas y la
alternativa más útil ftrente al test t-Student si no están dadas las condiciones para la misma.
Supongamos que un investigador desea comparar los puntajes asignados al estado de salud
bucodental por un odontólogo a dos grupos de pacientes, uno de 3 pacientes y otro de 4 pacientes.
Definimos como n1 al número de casos del grupo más pequeño (=3) y n2 al número de casos del
grupo mayor (=4). Los puntajes asignados varían de 0: estado pésimo a 15: estado óptimo, y los
resultados obtenidos fueron:
PUNTAJES ASIGNADOS
(ordenados de menor a mayor)
9
11
15
6
8
10
13
PACIENTES A
PACIENTES B
Ahora generamos una lista ordenada de menor a mayor con todos los datos anotando el grupo al que
pertenece
6
B
8
B
9
A
10
B
11
A
13
B
15
A
Ahora se obtiene el indicador o estadístico de prueba U: es la suma del número de A que preceden a
cada B de esa lista. Al primer B no lo precede ninguna A (0), al segundo B tampoco (0), al tercero
lo precede un A (1) y al cuarto (y último) B lo preceden 2 A (2). Por lo tanto
U=0+0+1+2=3
La distribución de U respecto a la H0 de igualdad es conocida y está tabulada en las TABLAS IX y
X del APENDICE, según el tamaño de la muestra mayor (n2). En nuestro caso n1=3, n2=4 y U=3.
En la TABLA IX vemos que la p(U≤3) Æ p=0.200 razón por la cual se acepta H0 de igualdad de
puntajes. Los valores de p de la TABLA IX son de una cola, para usarlos en ensayos de dos colas
hay que duplicar esos valores.
Supongamos que hubiésemos contado la suma de precedencias de B a valores A. La suma hubiese
dado U’=2+3+4=9 valor que excede a la TABLA IX. Ese valor se vuelve a “normalizar” con la
transformación
U = n1n2 - U’=12 - 9 = 3
Para muestras grandes con valores de n2 > 20, se reemplaza la consulta de tablas por la siguiente
transformación:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 95 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
U−
z=
Pag 96-175
n1 n 2
2
(n1 )(n 2 )(n1 + n 2 + 1)
12
que lleva el estadístico U a una distribución normal N(0,1). La prueba U puede a veces ser más
potente que su par paramétrico la prueba t-Student, lo que representa un logro muy importante para
este ensayo no paramétrico.
4.7. PRUEBA DE UNA Y DOS MUESTRAS DE KOLMOGOROV-SMIRNOV
La prueba de dos muestras puede confirmar que esas dos muestras independientes han sido
extraídas de la misma población o por el contrario que difieren significativamente. La prueba está
basada en la distribución de frecuencias acumuladas de las dos muestras.
Supongamos que el investigador ha relevado el numero de pacientes curados a lo largo de 55 meses
de tratamiento (cuando se curaron todos) con dos fármacos A y B. Cada grupo tenía 10 pacientes. El
investigador registró los meses que requirió cada paciente en remitir sus síntomas y luego construyó
esta tabla comparativa de frecuencias acumuladas de casos registrados en cada categoría:
TRATAM A
TRATAM B
discrepancia
FRECUENCIA ACUMULADA DE CASOS REGISTRADOS CON REMISION A
LOS MESES INDICADOS EN CADA CELDA
24-27
28-31
32-35
36-39
40-43
44-47
48-51
52-55
1/10
2/10
5/10
7/10
10/10
10/10
10/10
10/10
0/10
0/10
0/10
0/10
3/10
5/10
8/10
10/10
1/10
2/10
5/10
7/10
7/10
5/10
2/10
0/10
La máxima discrepancia es D = 7/10, su numerador se define como KD=7. La TABLA XI del
APENDICE muestra que para N=10 el valor de KD=7 es significativo al nivel p=0.01 en un ensayo
de una cola. Concluimos que el tratamiento A cura a los pacientes significativamente más
rápido que el tratamiento B al nivel p=0.01.
La prueba de una muestra es esencialmente una prueba de bondad de ajuste entre una distribución
y otra teórica (puede ser la normal, Poisson, etc.) que se fija por hipótesis nula (el objetivo es
similar a la prueba de ji-cuadrado de bondad de ajuste). Los cómputos son iguales a la prueba de
dos muestras, salvo que se en la primer fila van las frecuencias observadas y en la segunda las
frecuencias esperadas por hipótesis. Lo que varía es la consulta en la parte final de la TABLA XI
dedicada a muestras únicas.
Cuando las muestras son grandes (N > 40), se debe usar la siguiente transformación que es
independiente de la igualdad o no de los tamaños muestrales:
χ 2 = 4D 2 H ;
donde H =
n1 n 2
; con g . de l. = 2
n1 + n 2
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 96 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 97-175
generando un valor ji-cuadrado que medirá la significación de la máxima discrepancia (D) en las
frecuencias acumuladas. También podemos consultar la parte final de la TABLA XI que tiene
tabulados los valores de la máxima discrepancia permitida para varios niveles de significación.
4.8. PRUEBA DE LAS RACHAS DE WALD-WOLFOWITZ
Esta prueba es aplicable cuando deseamos probar una hipótesis de nulidad que supone dos muestras
extraídas de la misma población frente a a una hipótesis alternativa que plantea la diferencia de
ambas.
También puede ser aplicada a una única muestra en la cual se quiera verificar si las rachas
generadas a a lo largo del tiempo de algún suceso dicotómico (o binario) como + y -, verdadero y
falso, sano y enfermo, etc. están distribuidas al azar o si se encuentran agrupadas por alguna causa.
Esta prueba tiene como base que la variable medida sea al menos de escala ordinal y su distribución
continua. Como ejemplo, un docente quiere controlar si dos grupos o comisiones de alumnos han
respondido de igual forma cierto examen. Supongamos que elige al azar 12 exámenes al azar de
cada comisión (calificados de 00-100) y los resultados obtenidos (en cualquier orden) son:
COMISION
A
COMISION
B
86
69
72
65
100
65
92
45
94
91
41
50
55
40
22
58
16
07
09
16
26
36
20
15
Ahora ordenamos todos los datos de menor a mayor registrando la clase de pertenencia
07
B
50
A
09
B
55
B
15
B
58
B
16
B
65
A
16
B
65
A
20
B
69
A
22
B
72
A
26
B
86
A
36
B
91
A
40
B
92
A
41
A
94
A
45
A
100
A
Observar que esta sucesión ordenada tiene 4 rachas de longitud 10, 3, 2 y 9 (suma = 24). O sea
definimos r=4. Consultamos en la TABLA XII del APENDICE y vemos en la primer tabla (de
valores menores a) que para n1=12 y n2=12 un r límite de 7 es significativo al nivel p=0.05 (ensayo
de dos colas). Como el r obtenido es menor que ese límite se concluye que la calificación de ambas
comisiones difiere significativamente al nivel p=0.05.
Cuando las muestras son grandes (n>20) no puede usarse la TABLA XII, pero se puede usar una
transformación normal:
| r −(
z=
2n1 n 2
+ 1) | −0.5
n1 + n 2
2n1 n 2 (2n1 n 2 − n1 − n 2 )
(n1 + n 2 ) 2 (n1 + n 2 − 1)
En este caso, se obtiene un z (corregido por continuidad) distribuido normalmente N(0,1) que se
prueba (una o dos colas) como se ha indicado previamente. Por ejemplo, si en un ensayo con n1=8 y
n2=21 se detectaron 8 rachas, resulta z = 2.92, para z ≥2.92, H0 tiene una p=0.0018. Como este
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 97 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 98-175
valor es menor a α =0.01, se decide rechazar H0 de igualdad de comportamiento, las muestras
provienen de poblaciones diferentes.
Vamos a ver un ejemplo aplicado a las rachas de una única muestra. Supongamos que en un
consultorio médico se quiere ver si el sexo de los pacientes que concurren está distribuído al azar o
si existe algún orden interno. Supongamos que los últimos 30 varones y las últimas 20 mujeres que
concurrieron lo hicieron en este orden (aquí ya los agrupamos en rachas):
M F M F MMM FF M F M F M F MMMM F M F M F…
…MM FFF M F M F M F MM F MM F MMMM F M F MM
Este orden determina que r=35 (compruébelo!). Para verificar si este número es significativo,
calculamos p con la fórmula para n grandes y obtenemos:
z (r=35, n1=20, n2=30) =2.98
para z ≥2.98, H0 tiene una p=0.0028. Como este valor es menor a α =0.01, se decide rechazar H0 de
igualdad de comportamiento, las muestras provienen de poblaciones diferentes, es decir la
distribución de llegada de los hombres difiere de la distribución de llegada de mujeres.
Desempates de valores de distintos grupos
Los empates dentro de un mismo grupo no representan problema para esta prueba. Un problema
potencial con esta prueba aparece si hay empates entre valores de distintos grupos. En ese caso las
rachas se pueden descomponer de forma múltiple. Supongamos una serie empatada de 3 valores AA-B, pero este podría generar rachas adicionales si se la ordena A-B-A o B-A-A. La solución es
tantear todas las combinaciones posibles de desempate y ver si coinciden las conclusiones. Si no
coincidiesen las decisiones entonces se tendrá un problema difícil. Si no queda otra alternativa
disponible y se está obligado a decidir, el investigador podrá promediar las p obtenidas de los
ensayos y basarse en ese promedio para decidir acerca de H0. Sin embargo, si el número de empates
fuese grande, se hace inviable la aplicación de esta prueba.
4.9. PRUEBA DE MOSES DE LAS REACCIONES EXTREMAS
Bajo ciertas circunstancias, es posible esperar respuestas diametralmente opuestas en dos grupos,
por ejemplo un grupo control y un grupo experimental. Supongamos que a un grupo de nN=9
pacientes neuróticos y a otro grupo de nC=9 pacientes sanos se los somete a un corto pero intenso
ejercicio aeróbico y al finalizar se les pide que califiquen subjetivamente su estado de cansancio en
una escala de 0 (min.) a 25 (máx.). Se espera que los neuróticos reaccionen subestimando o
sobrestimando su grado de cansancio frente a los normales de comportamiento mas equilibrado, o
sea que incrementen la variabilidad de sus respuestas. Antes de comenzar el análisis el
experimentador elige un número entero h (pequeño) de descarte de rangos extremos del control, si
no hay otro motivo se elige h=1. Los resultados fueron los siguientes:
NEUROTICOS
CONTROL
25
12
5
16
14
6
19
13
0
13
17
3
15
10
8
10
Si ordenamos por rango estos valores conservando el grupo de pertenencia:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 98 -175
8
11
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 99-175
0
3
5
6
8
8
10
10
11
N
C
N
C
N
N
C
C
C
12
13
13
14
15
16
17
19
25
C
C
C
N
N
C
N
N
N
De la sucesión de rangos NC…N se descartan los h valores (en nuestro caso = 1) extremos de los
controles, o sea aquí se eliminan las 2 casillas grisadas que ocupaban la posición 2 y 15. El rango
extremo residual de los controles lo forman las casillas recuadradas y su distancia es sh=12-4+1=9.
El mínimo valor que puede tener esa distancia es (nC-2h)=9-2=7. Computamos ahora el valor g que
es el exceso de sh sobre el valor mínimo, o sea g=sh- nC-2h=9-7=2.
Ahora se determina la probabilidad de ocurrencia conforme a H0 de igualdad de sh ≤ 9, cuando
nN=9, nC=9 y g=2
⎛ i + n C − 2h − 2 ⎞⎛ n N + 2h + 1 − i ⎞
⎟⎟
⎟⎟⎜⎜
nN − i
i
i =0 ⎝
⎠⎝
⎠
g
p ( s h ≤ n C − 2h + g ) =
∑ ⎜⎜
⎛ nC + n N ⎞
⎜⎜
⎟⎟
⎝ nC ⎠
⎛ 5 ⎞⎛12 ⎞ ⎛ 6 ⎞⎛11⎞ ⎛ 7 ⎞⎛10 ⎞
⎜⎜ ⎟⎟⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟⎜⎜ ⎟⎟
⎝ 0 ⎠⎝ 9 ⎠ ⎝ 1 ⎠⎝ 8 ⎠ ⎝ 2 ⎠⎝ 7 ⎠
=
≅ 0.077
⎛18 ⎞
⎜⎜ ⎟⎟
⎝9⎠
Como este valor es superior a α=0.05, se acepta H0 de igualdad de criterio para ambos grupos,
aunque los neuróticos están cerca de diferenciarse significativamente por sus reacciones extremas.
En caso de empates de rangos de valores entre grupos se procede como se indicó en el apartado
anterior.
4.10. PRUEBA DE WALSH
Si el investigador está en condiciones de suponer que los puntajes en diferencia observados entre
dos muestras relacionadas se tomaron de una población simétrica, puede usar una prueba muy
potente desarrollada por Walsh. Se destaca que no se supone que las diferencias di provengan de
poblaciones normales (como en el test de t-Student apareado). La prueba de Walsh requiere la
medición de por lo menos una escala de intervalo para los datos.
Supongamos que un docente compara el número de respuestas incorrectas a un cuestionario de 5
preguntas dadas por un grupo de 15 alumnos, antes y después de recibir una clase de instrucción
sobre el tema. La idea es medir la eficacia de esa instrucción. Las respuestas incorrectas de los 15
alumnos antes y después fueron:
ANTES
5
4
3
5
2
4
2 2
4
4 3 1
5
3 1
DESPUES
2
2
0
3
3
2
3 1
1
3 4 2
2
4 0
diferencia
3
2
3
2
-1
2
-1 1
3
1 -1 -1
3
-1 1
diferencias ordendas
por valor creciente d12 d9 d13 d10 d1 d11 d2 d6 d14 d7 d3 d4 d15 d5 d8
(di)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 99 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 100-175
En la TABLA XIII del APENDICE están tabuladas las condiciones de significación de esta prueba.
Consultamos las casillas correspondientes a N=15 para una prueba de una cola ya que suponemos
que la enseñanza reduce el número de incorrecciones (¡y nunca debería aumentarlo!) o sea en
nuestro caso la media de la diferencia debe ser positiva. Tenemos entonces que
H 0 : μ 1 = 0 ; H 1 : μ 1 > 0 (una cola)
En la tabla vemos que para una cola y p=0.047 la condición es:
min[1 / 2( d 1 + d 12 ) ; 1 / 2( d 2 + d 11 )] > 0
min o mínimo significa que hay que elegir el menor valor de los dos considerados para comparar si
es mayor a cero. En nuestro caso resulta min[½ (-1+3), ½(-1+2)]= ½ (1)=0.5>0. Por lo tanto se
cumple la condición y podemos concluir que la instrucción ha mejorado significativamente el
número de errores al nivel 0.05.
4.11. PRUEBA Q DE COCHRAN
La prueba de McNemar para dos muestras relacionadas puede extenderse para k muestras
vinculadas. Esta generalización que concreta la prueba Q de Cochran permite decidir si tres o mas
conjuntos apareados de frecuencias difieren significativamente entre sí.
Supongamos que el investigador está interesado en saber si un entrevistador amistoso puede
influenciar las respuestas de los pacientes a un cuestionario. Para ello se efectúan tres tipos de
entrevistas (1=muy amistosas 2=simplemente cortes 3=seco y cortante) . En días separados se
consulta (tres veces, una por día) a 18 pacientes por su grado de satisfacción por la atención
recibida. En cada caso se usa una pregunta diferente pero con igual interpretación. Los resultados
son los siguientes donde 1=Satisfactorio, 0=No satisfactorio:
PACIENTE
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Entrevista Entrevista Entrevista
1
2
3
0
0
0
1
1
0
0
1
0
0
0
0
1
0
0
1
1
0
1
1
0
0
1
0
1
0
0
0
0
0
1
1
1
1
1
1
1
1
0
1
1
0
1
1
0
1
1
1
1
1
0
1
1
0
G1=13
G2=13
G3=3
Li
L i2
0
2
1
0
1
2
2
1
1
0
3
3
2
2
2
3
2
2
∑ Li =29
0
4
1
0
1
4
4
1
1
0
9
9
4
4
4
9
4
4
∑ L2i =63
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 100 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 101-175
En nuestro cuadro, llamamos Li a las sumas por paciente y Gi a las sumas por muestra. Ahora
computamos el indicador o estadístico de prueba Q de Cochran como sigue, considerando que en
este caso k= 3 (el número de muestras) y N=18 (tamaño de la muestra de valores apareados):
k
Q=
k
(k − 1)[k ∑ G 2j − (∑ G j ) 2 ]
j =1
j =1
N
N
i =1
i =1
k ∑ Li − ∑ L2i
y usamos Q como un χ2 (ji-cuadrado) con ν = k-1 grados de libertad. En nuestro caso, obtenemos
Q=16.7 con 2 grados de libertad. Consultando la TABLA VI vemos que supera al valor límite 13.82
con p=0.001, con lo cual concluimos rechazando H0 de igualdad y aceptando H1 de diferencia
significativa entre los sistemas de entrevista al nivel p=0.001.
4.12. ANOVA DE DOS VÍAS POR RANGOS DE FRIEDMAN
Cuando los datos de k muestras igualadas (de igual tamaño) están por lo menos en una escala
ordinal, el ANOVA de Friedman es útil para probar la hipótesis de nulidad de que las k muestras
provienen de una misma población. Es interesante comparar la utilidad del test de Friedman con el
ANOVA paramétrico de dos vías, aquí no hacen falta datos normalmente distribuidos y de categoría
escala de proporción (proporcionalidad absoluta), bastan datos de cualquier distribución conocida o
desconocida que pertenezcan a escalas ordinales (relación mayor/menor).
Supongamos que el investigador está interesado en conocer si tres grupos de ratas cepas distintas
responden igual frente a la irradiación con cuatro equipos de rayos X a igual intensidad de
radiación.. En cada cepa y tratamiento irradiamos 4 ratas y le asignamos un store de daño
(0=ausente 1=leve 2=moderado 3=intenso) después del tratamiento. En cada cepa y tratamiento
sumamos los “scores” de las cuatro ratas y obtenemos el siguiente cuadro:
RATAS
CEPA ALFA
CEPA BETA
CEPA GAMMA
TRATAMIENTOS POR IRRADIACION (suma de “scores”)
RX EQUIPO 1
RX EQUIPO 2
RX EQUIPO 3
RX EQUIPO 4
9
4
1
7
6
5
2
8
9
1
2
6
El primer paso en esta prueba es asignar una clasificación por rango de 1 a 4 en cada fila, asignando
1 al dato menor y 4 al dato mayor:
RATAS
CEPA ALFA
CEPA BETA
CEPA GAMMA
Suma de rangos
por columna (Rj)
TRATAMIENTOS POR IRRADIACION (rangos)
RX EQUIPO 1
RX EQUIPO 2
RX EQUIPO 3
RX EQUIPO 4
4
2
1
3
3
2
1
4
4
1
2
3
11
5
4
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
10
Página 101 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 102-175
Cuando el número de filas o de columnas o de ambos no es demasiado pequeño (N=2, k=2 y 4 en
total), se puede calcular un indicador o estadístico de prueba χR2 de Friedman:
χ R2 =
k
12
∑ R 2j − 3N (k + 1)
Nk (k + 1) j =1
donde N = número de filas, k = número de columnas y Rj = la suma de rangos de la columna j. Este
valor se distribuye como un un χ2 (ji-cuadrado) con ν = k-1 grados de libertad. En nuestro ejemplo,
resulta χR2 = 7.4. Este valor, consultado en la TABLA VI con 2 grados de libertad, supera al valor
límite de p=0.05 pero no al valor límite de 0.01. Por lo tanto, se rechaza la H0 de igualdad de
comportamiento de las tres cepas de ratas frente a los cuatro aparatos de Rx al nivel p=0.05.
En la bibliografía (SIEGEL, 1990) se presentan tablas de valores exactos de límites de significación
para muestras pequeñas aunque rara vez hará falta consultarlas.
4.13. ANOVA DE UNA VÍA POR RANGOS DE KRUSKAL-WALLIS
Esta es una prueba extraordinariamente útil para decidir si k muestras independientes provienen de
poblaciones diferentes. La metodología es bastante similar al ANOVA de Friedman. Veamos un
ejemplo:
Un investigador administra tres tratamientos a un conjunto de pacientes. Al cabo de un tiempo
efectúa una evaluación de acuerdo a una escala de score (0-200). Quiere saber si hay diferencia
entre los tres tratamientos. Los datos obtenidos de scores registrados fueron:
GRUPO
GRUPO
FENOTIAZINA BENZODIAZEPAM
96
82
128
124
83
132
61
135
101
109
GRUPO
HALOPIDOL
115
149
166
147
Estos datos se pasan a valores relativos de rangos del 1 a 14 en toda la tabla:
GRUPO
GRUPO
FENOTIAZINA BENZODIAZEPAM
4
2
9
8
3
10
1
11
5
6
R2=37
R1=22
GRUPO
HALOPIDOL
7
13
14
12
R3=46
Ahora calculamos el indicador o estadístico de prueba H de Kruskal-Wallis:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 102 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 103-175
k R2
12
j
H=
− 3( N + 1)
∑
N ( N + 1) j =1 n j
En el cual k = número de grupos (aquí 3), nj = número de datos en el grupo j, N es la suma de todos
los nj (en nuestro caso 14) y como antes Rj la suma de rangos por grupo. Como era de esperar, este
H se distribuye como un un χ2 (ji-cuadrado) con ν = k-1 grados de libertad para tamaños muestrales
suficientemente grandes. En nuestro caso H = 6.4 con 2 g. de l., nuevamente consultamos la
TABLA VI y vemos que ese valor supera al límite 0.05 pero no al límite 0.01. Por lo tanto
concluimos que los tres grupos provienen de poblaciones diferentes, rechazando la Ho de
igualdad al nivel p=0.05.
Para valores muestrales pequeños y hasta 3 grupos (con tamaños n1, n2 y n3) en la TABLA XIV del
APENDICE se presentan los valores límites de H para los niveles de significación indicados.
Observaciones empatadas
Cuando en esta prueba aparecen valores iguales, se les asigna a los mismos el promedio de los
rangos que les hubiesen correspondido, como ya se ha hecho en otros ensayos. Ya que el valor de H
es influido en cierto grado por los empates, se corrige el H calculado:
H
H corregido =
1−
∑T
N2 −N
donde T = t – t (t es el número de observaciones empatadas en algún valor)
y ∑ T = suma de todos los T obtenidos de los empates.
2
Sin embargo, esta corrección no es muy significativa, por ejemplo si hubiese a lo sumo un 25% de
empates, el efecto de la corrección no supera al 10% de la probabilidad asociada al H.
4.14. COEFICIENTE DE CONTINGENCIA C
Este valor es una medida del grado de asociación o relación entre dos conjuntos de atributos. Es
especialmente útil cuando solamente tenemos información clasificatoria (escala nominal) acerca de
uno o de ambos conjuntos de atributos. Esto es, puede usarse cuando la información acerca de los
atributos consiste en una serie no ordenada de frecuencias.
Para calcular este coeficiente ni siquiera se necesita ordenar las categorías de ninguna manera
particular. El coeficiente toma el mismo valor si se reordenan filas y columnas de los conjuntos
considerados.
En general, los datos se presentan en un cuadro rectangular (o cuadrado) de valores en los cuales se
quiere ver qué asociación hay entre las Filas con las Columnas. Como ejemplo, el investigador
quiere conocer que grado de asociación hay entre grupo socio-económico de pacientes y su
concurrencia a cuatro bocas de atención (consultorios) diferentes. Los resultados en número de
pacientes por grupo y consultorio fueron:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 103 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 104-175
GRUPO
CONCURRENCIA A CONSULTORIOS
SOCIOHOSPITAL HOSPITAL HOSPITAL HOSPITAL
ECONOMICO
I
II
III
IV
A1
23
40
16
2
A2-B-C
11
75
107
14
D-F
1
31
60
10
TOTAL
35
146
183
26
TOTAL
81
207
102
N=390
Se comienza calculando el valor χ2 (ji-cuadrado) con ν = k-1 grados de libertad (ji-cuadrado) de esta
tabla de contingencia de 3x4 bajo la H0 de independencia (ver distribución ji-cuadrado), con ν = (R1)(C-1)= 2.3 = 6 grados de libertad, lo que en nuestro caso da χ2 = 69.2, valor que supera
holgadamente al límite tabulado de p=0.001, por lo cual se rechaza la H0 de independencia (filas x
columnas) al nivel p=0.001, o sea la concurrencia a las distintas bocas de atención está
significativamente determinada por el grupo socio-económico al cual pertenece cada paciente.
Ahora computamos el coeficiente de contingencia (C):
C=
χ2
69.2
=
= 0.39
2
390 + 69.2
N+χ
Obviamente este coeficiente debe variar entre cero y uno como el coeficiente de correlación lineal.
Sin embargo, esta suposición es teórica, puede llegar a cero si no hay correlación pero no puede (en
la práctica) llegar a uno en correlación ideal (el ji-cuadrado debería ser ∞). Otra limitación de C es
que requiere el cómputo previo del ji-cuadrado, o sea sólo se puede calcular C si menos del 20%
de las celdas tiene frecuencias esperadas menores a cinco y ninguna menor a uno. Por último,
no es directamente comparable con otras medidas de correlación como el clásico r de Pearson (la
clásica correlación momento-producto), rS de Spearman o el r de Kendall. A pesar de esas
limitaciones este valor es extremadamente útil debido a su aplicabilidad casi universal.
4.15. COEFICIENTE DE CORRELACION DE RANGOS DE SPEARMAN (rS)
Esta es históricamente la primer medida de asociación desarrollada. Aquí reservamos la notación de
SPIEGEL (1990) rS, aunque antiguamente se lo conocía como (ρ) rho. Esta medida también requiere
que ambas variables sean medibles por lo menos en una escala ordinal.
Supongamos que el investigador desea medir el grado de asociación entre el grado de optimismo
(medido por un test sicológico con un score de 0-120) de pacientes afectados por una enfermedad
crónica y su respuesta favorable a un tratamiento a los 120 días (medido por otro score 0-100
derivado de sus datos clínicos y de laboratorio). Los datos obtenidos fueron:
PACIENTE
N°
1
2
3
4
5
6
SCORES
OPTIMISMO CURACION
82
42
98
46
87
39
40
37
116
65
113
88
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 104 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
7
8
9
10
11
12
111
83
85
126
106
117
Pag 105-175
86
56
62
92
54
81
Clasificando cada columna por rangos (1 a 12) , calculando las diferencias de rango, sus cuadrados y
la suma de esos cuadrados:
PACIENTE
N°
1
2
3
4
5
6
7
8
9
10
11
12
SCORES
OPTIMISMO CURACION
2
3
6
4
5
2
1
1
10
8
9
11
8
10
3
6
4
7
12
12
7
5
11
9
di
di2
-1
2
3
0
2
-2
-2
-3
-3
0
2
2
SUMA
1
4
9
0
4
4
4
9
9
0
4
4
52
Ahora calculamos el coeficiente de correlación de rangos de Spearman:
N
rS = 1 −
6∑ d i2
i =1
2
N −N
= 1−
6(52)
= 0.82
12 2 − 12
Para verificar la significación de este coeficiente frente a la H0 de independencia, consultamos la
TABLA XV del APENDICE y observamos para N=12 que este valor supera el valor crítico
tabulado para p=0.01 (prueba de una cola), por lo cual concluimos rechazando la H0 al nivel
p=0.01y aceptando que el grado de optimismo del paciente influye favorablemente en su
evolución..
Para muestras grandes se puede emplear la siguiente transformación:
t = rS
N −2
1 − rS2
parámetro que está distribuido como t-Student con ν = N – 2 grados de libertad. Por lo tanto,
consultando la TABLA III del APENDICE se puede verificar en un test de una cola la significación
del coeficiente de Spearman.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 105 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 106-175
4.16. COEFICIENTE DE CORRELACION DE RANGOS DE KENDALL (τ)
El coeficiente de correlación de rangos de Kendall (τ – tau), es una medida de asociación de la
misma clase que la de Spearman. Sólo requiere medidas ordinales a las variables bajo inspección.
Supongamos que dos odontólogos asignaron un rango (del 1:peor al 4:mejor) respecto al estado de
salud bucodental de cuatro pacientes. El investigador desea verificar el grado de concordancia entre
ambos juicios, con una H0 de igualdad de criterios entre los odontólogos. Los resultados fueron:
PACIENTE
JUICIO DEL
ODONTOLOGO X
JUICIO DEL
ODONTOLOGO Y
a
b
c
d
3
4
2
1
3
1
4
2
a. Primero reordenamos los pacientes de la muestra en orden natural según el Odontólogo X
PACIENTE
JUICIO DEL
ODONTOLOGO X
JUICIO DEL
ODONTOLOGO Y
d
c
a
b
1
2
3
4
2
4
3
1
Ahora que los valores de X están ordenados, computamos un valor S de ordenamientos
apareados en Y (S comienza en 0 y se le van sumando +1 o -1 según el caso)
b. A partir del 2 (primer valor de Y) controlamos el número de pares “bien ordenados”
(ascendientes como 2-4 o 2-3) y el número de pares “mal ordenados” (inversiones como 2-1).
Vemos que: 2-4 es bueno, 2-3 es bueno, 2-1 es malo. Sumamos un +1 por los dos buenos y un -1
por el malo. S = 0 +1+1-1=+1.
c. A partir de 4 (segundo valor de Y) repetimos el proceso anterior. S tenía el valor +1 y se
modifica S = +1-1-1= -1 porque hubo dos malos o inversiones (4-3, 4-1)
d. A partir de 3 (tercer valor de Y) repetimos y obtenemos S= -1-1=-2 (hubo otro malo 3-1). Este es
el último valor comparable con otros en Y, por ello el valor final de S = -2.
Entonces, tomando N como el número de entes comparados, computamos el coeficiente de
correlación de rangos tau de Kendall:
τ=
1
S
=
2 N ( N − 1)
1
(−2)
= −0.33
2 ( 4)(3)
Ahora consultamos la TABLA XVI para controlar si el valor τ = 0.33 (en valor absoluto) supera a
los límites tabulados. Vemos que para ν = N-1 = 3 grados de libertad no hay tabulación disponible,
por lo cual deducimos que no podemos rechazar la H0 de igualdad de criterio al nivel p=0.05.
Por supuesto, si con 8 g. de l. hubiésemos obtenido un tau=0.705, rechazaríamos la H0 de igualdad
de criterio al nivel p=0.05 (pero no al nivel p=0.01).
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 106 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 107-175
Respecto a las repeticiones, se asignan los rangos promedio de los que les hubiese correspondido a
los involucrados y se aplica una fórmula corregida al valor de tau:
τ=
S
1
2
N ( N − 1) − T X
donde T X ,Y =
1
2
1
2
N ( N − 1) − TY
∑ t (t − 1) para todos los grupos de t empates en X o en Y respectivamente
Si el número de grados de libertad fuese grande se puede emplear la aproximación
z=
τ
2(2 N + 5)
9 N ( N − 1)
distribuida normalmente con N(0,1).
4.17. COEFICIENTE DE CORRELACION PARCIAL DE RANGO DE KENDALL (rxy.z)
Cuando se encuentra una correlación entre dos variables, existe la posibilidad que esta correlación
sea debida a la vinculación oculta entre cada una de las variables asociadas con una tercera. Por
ejemplo, se puede verificar que el número de dientes de un niño varía con su estatura, pero en
realidad ambas variables dependen de la edad. Este tipo de interrogante se contesta a través de
estudio de correlaciones parciales. En la correlación parcial, se eliminan los efectos de la tercera
variable (Z) sobre las dos variables en estudio (X, Y). En otras palabras se computa la correlación
entre dos variables manteniendo constante a la tercera.
Supongamos que obtenemos tres rangos de evaluación comparada (por medio de tres variables
clínicas) sobre cuatro pacientes, a los que reordenamos para que queden los rangos de Z en orden
natural:
PACIENTE
VARIABLE Z
VARIABLE X
VARIABLE Y
a
1
3
2
b
2
1
1
c
3
2
3
d
4
4
4
Al considerar las evaluaciones por pares efectuadas por cada variable, podemos clasificarlas en + (si
el rango mas bajo precede a uno mas alto) o – en caso contrario. Resulta:
PAR
VARIABLE Z
VARIABLE X
VARIABLE Y
a,b
+
-
a,c
+
+
a,d
+
+
+
b,c
+
+
+
b,d
+
+
+
c,d
+
+
+
Ahora se puede construir un cuadro de contingencia 2x2 en el cual se incluyan las concordancias y
discrepancias de X e Y con Z:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 107 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 108-175
Pares de Y
concordantes
con Z
Pares de Y
discrepantes
con Z
TOTAL
A=4
B=0
4
C=1
D=1
2
5
1
6
Pares de X
concordantes con Z
Pares de X
discrepantes con Z
TOTAL
Entonces calculamos el coeficiente de correlación parcial de rango de Kendall:
rxy. z =
AD − BC
( A + B )(C + D)( A + C )( B + D)
lo que en nuestro caso da rXY.Z = 0.63. Desafortunadamente aún no se conoce la distribución exacta
de este parámetro y por ende no podremos medir la significación de este coeficiente.
4.18. COEFICIENTE DE CONCORDANCIA DE KENDALL (W)
Esta es una generalización de la comparación de dos (ver apartado previo) a k juicios u
ordenamientos de rangos. Supongamos que un grupo de 3 jueces (investigadores) han calificado a 6
postulantes a una beca través de un orden de mérito relativo. Nos interesa saber si el juicio de los tres
investigadores es concordante (H0) o no (H1). Los resultados fueron los siguientes:
INVESTIGADOR
QUE JUZGÓ
X
Y
Z
Rj (suma de rangos)
a
1
1
6
8
b
6
5
3
14
POSTULANTE A LA BECA
c
d
e
3
2
5
6
4
2
2
5
4
11
11
11
f
4
3
1
8
Ahora calculamos (s) como la suma de cuadrados (SC) de los valores Rj:
s = ∑ R 2j − (∑ R j ) 2 / N
donde N es el número de entes comparados (=6), en este caso resulta s=25.5 y con ese valor
calculamos el coeficiente de concordancia:
W=
1
12
s
k (N 3 − N )
2
en nuestro caso k=3 (el número de juicios) y W=0.16. Para determinar la significación de ese grado
de concordancia consultamos la TABLA XVIII del APENDICE y vemos que para k=3 y N=6 el
valor crítico al 5% de s está en 103.9. Como el valor obtenido es menor (25.5), se rechaza H0 de
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 108 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 4 – Test No Paramétricos
Pag 109-175
concordancia de criterios entre los tres investigadores al nivel p=0.05, o sea los jueces no han
tenido criterios concordantes.
En esta prueba un valor significativamente alto de s (y de W) indica concordancia de criterios. Hay
que tener cuidado que esto no prueba que el juicio concordante sea el correcto, pueden estar todos
equivocados con el mismo criterio uniforme. Pero si confiamos en el buen criterio de los jueces, una
concordancia significativa presta aval a la conclusión general.
Cuando N sea mayor a 7, se puede usar la aproximación
χ2 =
1
12
s
; ν = N − 1 g.de l.
kN ( N + 1)
y consultar la tabla ji-cuadrado tal como ya se ha indicado en otros apartados. Cuando ocurren
empates se corrige el W de manera similar a lo efectuado en el caso del coeficiente de correlación
de rangos de Spearman (rS) :
s
W=
1 k 2 (N 3 − N ) − k
12
∑T
∑ (t
; donde T =
2
− t)
12
y t = número de empates por grupo de valores iguales
Con este valioso ensayo se puede verificar la asociación entre cualquier número de clasificaciones
por rango.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 109 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 110-175
CAPITULO 5: NOCIONES DE EPIDEMIOLOGIA
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 110 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
5.1.
Pag 111-175
DEFINICION DE LA EPIDEMIOLOGIA
La epidemiología es, en la acepción más antigua, el "estudio de las epidemias" es decir, de las
"enfermedades que afectan transitoriamente a muchas personas en un sitio determinado". Su
significado deriva del griego “Epi” (sobre) “Demos” (Pueblo) “Logos” (ciencia). Una definición
técnica es la que propone que la epidemiología es "el estudio de la distribución y determinantes de
enfermedades en poblaciones humanas". Ambas definiciones, se corresponden con el significado
que la disciplina ha tenido en dos momentos históricos muy distintos.
Es así como la primera definición corresponde a la conceptualización surgida en los albores de la
epidemiología, cuando ésta centró su interés en el estudio de procesos infecciosos transmisibles
(pestes) que afectaban grandes grupos humanos. Estas enfermedades, llamadas epidemias,
resultaban en un gran número de muertes frente a las cuales, la medicina de aquella época no tenía
nada efectivo que ofrecer . La literatura científica reconoce en el Inglés John Snow al padre de la
epidemiología. Snow, utilizando magistralmente el método científico, aportó importantes avances al
conocimiento de la epidemia de cólera que, en aquella época, afectaba a la ciudad de Londres. Las
acertadas conclusiones de Snow acerca de la etiología, forma de transmisión y control de la
enfermedad se anticiparon a los progresos que en este sentido hicieran la microbiología, la
infectología y la clínica . La segunda definición constituye una más actualizada y en ese sentido de
mayor amplitud y especificidad. Es posible afirmar que la evolución científica, tecnológica y el
cambio en el nivel de vida de las poblaciones, modificaron el tipo de enfermedades que afectaban
en mayor número y más gravemente a la población. Esta modificación puso de relieve
enfermedades no infecciosas cuya elevada frecuencia de aparición no era consecuencia de los
mecanismos clásicos de transmisión conocidos para las enfermedades infecciosas transmisibles.
Estas enfermedades son conocidas hoy como enfermedades crónicas no transmisibles (ECNT. “Non
Commmunicable Diseases” en (NCD en Inglés) y también son materia importante de estudio en la
epidemiología moderna. De acuerdo con lo expuesto, hoy en día se acepta la siguiente definición de
epidemiología como la más simplificada y completa:
“Epidemiología es la disciplina que estudia la enfermedad en poblaciones humanas”
A partir de ella se mencionan sus principios implícitos: La epidemiología es una disciplina médica o
de las ciencias de la salud. El sujeto de estudio de la epidemiología es un grupo de individuos
(colectivo) que comparten alguna(s) característica(s) que los reúne. La enfermedad y su estudio
toman en esta definición la connotación más amplia. Salud y enfermedad son uno y en ese sentido
deben ser entendidos. El concepto o noción de enfermedad no existe en ausencia del de salud y
viceversa. Sin embargo, esta afirmación, simple en apariencia, encuentra serias limitaciones al
momento de materializar conceptos. La medicina tradicional ha operado considerando a la salud
como la ausencia de enfermedad y en esa consideración ha perdido la identidad de la salud. Esto
tiene profundas raíces filosóficas que no analizaremos en este capítulo. Baste decir que la
enfermedad ha sido un fenómeno vital de fácil identificación y de aparente fácil delimitación. En
cambio, la salud tiene límites más imprecisos y significados más erráticos. La epidemiología
concibe el fenómeno salud y enfermedad como un proceso dinámico. El individuo pasa de un estado
a otro, repetidamente, a lo largo de su vida y en este continuo, identificar los límites de uno u otro se
transforma en un problema de orden técnico. La epidemiología se aboca como desafío científico, a
estudiar el proceso salud-enfermedad en su más amplia conceptualización.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 111 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 112-175
5.2. GENERALIDADES ACERCA DE LA EPIDEMIOLOGÍA
La epidemiología es una rama de la bioestadística médica aplicada especialmente a describir el
estado de salud de la población humana y encargada de efectuar los catastros de patologías que
permitan almacenar censos históricos, monitorear el estado de salud mundial del presente,
clasificado por estratos y por regiones geográficas y lo que es mas importante brindar señales
tempranas en la aparición de brotes epidémicos o riesgos agudos y crónicos de toda clase que
puedan atentar contra la salud de las personas.
Podemos decir que hoy día la epidemiología es universal, no es el problema de un país o de un
continente. La globalización y la revolución de los medios de transporte que hoy día unen en
contacto potencialmente riesgoso a las regiones mas distantes, hacen que un brote de una especie de
neumonía fatal como el SARS (Sídrome respiratorio agudo y severo) acaecida en un lugar tan
distante como una provincia de China, obligue a tomar medidas defensivas en Sudamérica. Hoy día,
la OMS (Organización Mundial de la Salud) pilotea y normaliza la actividad epidemiológica
mundial. A través de programas de computación como el EPI-INFO, releva continuamente y en
escala mundial, el estado de salud de las personas.
La OMS comienza por la base, con su nomenclador universal de patologías, el CIE (Código
Internacional de Enfermedades) de 4 dígitos y que es periódicamente actualizado y mejorado (ver
http://www.who.int/whosis/icd10/). Este Nomenclador permite que un enfermo de cólera en Taiwan
sea reportado y computado igual que un enfermo del mismo mal en Uganda. No hay ambigüedades,
la epidemiología es unívoca y universal, exactamente lo que se necesita.
Las publicaciones anuales de censos y estadísticas sanitarias de la OMS permiten detectar cuales
son las regiones del planeta más expuestas para sus habitantes para afectar su viabilidad, por
ejemplo para fallecer por inanición, por mortalidad infantil, por paludismo, por obesidad, por SIDA,
por cáncer de útero o por tabaquismo. Todo se registra y todo se evalúa, se discrimina por edad, por
sexo y si fuese posible por status socioeconómico. Las predicciones de longevidad por región del
planeta son otras de las valiosas y muy importantes estadísticas resultantes de la epidemiología. Hoy
día las compañías de seguros de riesgo personal, o los gobiernos interesados en fijar las edades
mínimas de retiro o jubilación, se basan exactamente en estos resultados epidemiológicos.
La epidemiología es esencialmente ESTADISTICA DESCRIPTIVA, pero lo hace a través de
parámetros propios, generalmente índices o indicadores de estado sanitario. Sin embargo, otra parte
de la epidemiología se dedica a ESTADISTICA INFERENCIAL como ser la predicción de series
temporales o el cálculo de curvas de supervivencia. Las aplicaciones más importantes de la
epidemiología son la vigilancia epidemiológica y el empleo de la epidemiología en la planificación
sanitaria.
En este capítulo haremos hincapié sobre los conceptos básicos de la epidemiología y sobre los
principales métodos estadísticos por ella aplicados.
5.3. DEFINICION Y OBJETIVO DE LA SALUD PUBLICA
"La enfermedad es el experimento de la naturaleza. Sólo vemos sus resultados, ignorando las
condiciones en que se realizó el experimento". (Klemperer)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 112 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 113-175
La definición más conocida de salud pública, señala que es ésta una rama de la medicina cuyo
interés fundamental es la preocupación por los fenómenos de salud en una perspectiva colectiva,
vale decir, de aquellas situaciones que, por diferentes circunstancias, pueden adoptar patrones
masivos en su desarrollo.
En 1920, Winslow definió la salud pública en los siguientes términos: "la salud pública es la ciencia
y el arte de prevenir las enfermedades, prolongar la vida y fomentar la salud y la eficiencia física
mediante esfuerzos organizados de la comunidad para sanear el medio ambiente, controlar las
infecciones de la comunidad y educar al individuo en cuanto a los principios de la higiene personal;
organizar servicios médicos y de enfermería para el diagnóstico precoz y el tratamiento preventivo
de las enfermedades, así como desarrollar la maquinaria social que le asegure a cada individuo de la
comunidad un nivel de vida adecuado para el mantenimiento de la salud". Posteriormente, Winslow
cambió el término "salud física" por el de "salud física y mental".
La definición de salud propuesta por la Organización Mundial de la Salud (OMS: 1946), que señala
que "salud no es solamente la ausencia de enfermedad, sino el estado de completo bienestar
físico, mental y social del individuo", determina que una buena parte del quehacer de la salud
pública se expanda hacia áreas nuevas y emergentes en las sociedades contemporáneas.
Significa, en buenas cuentas, la manifestación explícita de que la medicina debe preocuparse tanto
de enfermos como sanos. Siguiendo a Milton Terris, quien propone en 1990 una adaptación
contemporánea a la definición de Winslow, la salud pública queda definida como:
"La ciencia y el arte de prevenir las dolencias y las discapacidades, prolongar la vida y fomentar la
salud y la eficiencia física y mental, mediante esfuerzos organizados de la comunidad para sanear el
medio ambiente, controlar las enfermedades infecciosas y no infecciosas, así como las lesiones;
educar al individuo en los principios de la higiene personal, organizar los servicios para el
diagnóstico y tratamiento de las enfermedades y para la rehabilitación, así como desarrollar la
maquinaria social que le asegura a cada miembro de la comunidad un nivel de vida adecuado para el
mantenimiento de la salud".
La salud pública así considerada se constituye a partir del reconocimiento de la existencia de
procesos y problemas colectivos de enfermedad. Esto implicaba que organizaciones, grupos o
instituciones debían hacerse cargo de los mismos, pues éstos no podían ser resueltos en el nivel de
los individuos. Como especialidad no clínica de la medicina, esta disciplina enfoca el tema de la
salud en un contexto colectivo, buscando mediante la aplicación de diversos enfoques de
intervención, influir positivamente para evitar a ocurrencia de enfermedad. Por el carácter "no
clínico" de la salud pública, pudiera pensarse que la acción médica es susceptible de ser
fragmentada en un ambiente individual, de orden clínico, y otro de carácter colectivo, con menos
protagonismo técnico, representado por la salud pública. Sin embargo, hoy es universalmente
aceptado que la salud de los individuos transcurre en un eje vital continuo, en el que se producen
momentos de interacción individual entre éste y su medio así como complejas relaciones colectivas
sustentadas por una intrincada malla de interacciones sociales que los individuos desarrollan en sus
comunidades. Luego, es lógico percibir al individuo como integrante de un colectivo, sin que por
ello pierda su carácter de persona individual. Por tanto desde la perspectiva del cuidado de la salud
de los individuos, conviene enfatizar que sólo existe un tipo de medicina, en la que está presente el
quehacer de disciplinas con alcances diversos y complementarios, que se despliegan de acuerdo a la
naturaleza y desarrollo de los acontecimientos de salud.
Sin embargo el término "salud pública" está, a juicio de otros autores, cargado de significados
ambiguos e imprecisiones diversas. En su historia han sido prominentes cinco connotaciones.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 113 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 114-175
La primera equipara el adjetivo "pública" con la acción gubernamental, esto es, con el sector
público o estatal. Un segundo significado es aún más amplio al incluir no tan sólo la participación
del estado sino la de la comunidad organizada. El tercer uso identifica a la salud pública con los
llamados "servicios no personales de salud", es decir, aquellos que se aplican al medio ambiente
(por ejemplo, el saneamiento ambiental) o a la colectividad (por ejemplo la educación masiva en
salud) y que por lo tanto no son apropiables por un sólo individuo en forma específica, como podría
ser una consulta médica o la aplicación de un procedimiento diagnóstico. El cuarto uso es una
ampliación del tercero en tanto se le añaden una serie de servicios personales de naturaleza
preventiva dirigidos a grupos vulnerables (por ejemplo, los programas de atención maternoinfantiles). Por último, a menudo se utiliza la expresión "problema de salud pública", sobre todo en
el lenguaje no técnico, para referirse a padecimientos de alta frecuencia o peligrosidad en la
población. También existen asociaciones entre estos diferentes significados. Por ejemplo, en
algunos países industrializados ha habido una tendencia a que el sector privado de salud preste la
mayor parte de los servicios terapéuticos personales, mientras que el sector público o estatal ha
asumido la responsabilidad por los servicios preventivos y no personales, tan necesarios para la
comunidad. Ello ha reforzado la idea de la salud pública como un subsistema separado de servicios
proporcionados por el estado y paralelos a la corriente principal de la medicina curativa de alta
tecnología. Recientemente ha surgido un punto de vista más integral sobre el concepto de salud
pública. Este sostiene que el adjetivo "pública" no denota un conjunto de servicios en particular, ni
una forma de propiedad, ni un tipo de problemas, sino; Un nivel específico de análisis, a saber un
nivel poblacional. A diferencia de la medicina clínica, la cual opera en un nivel individual, y de la
investigación biomédica, que analiza el nivel subindividual, la esencia de la salud pública consiste
en que adopta una perspectiva basada en grupos humanos o poblaciones. Esta perspectiva
poblacional inspira sus dos aplicaciones, como campo del conocimiento y como ámbito para la
acción.
La salud pública requiere para su adecuado desarrollo de la colaboración activa de un conjunto de
disciplinas, sin las cuales, la explicación e intervención sobre los problemas de salud sería
materialmente imposible, además de incompleta. Desde sus inicios como materia de estudio y
durante el transcurso de este siglo, la salud pública se ha visto como una ciencia social a la que
concurren un conjunto de disciplinas. Es el aporte conjunto de éstas el que finalmente determina un
nivel de comprensión más integral de los procesos de Salud-enfermedad. Como eje central de estos
aportes se encuentran las disciplinas médico biológicas y particularmente la epidemiología, que
tiene un rol central para la comprensión de una gran parte de los fenómenos de Salud. Entre éstas
disciplinas pueden señalarse algunas ligadas directamente al ámbito biomédico, a las que se han
sumado necesariamente otras provenientes de otras áreas del conocimiento, particularmente las del
campo de las ciencias sociales, postergadas inexplicablemente por largo tiempo.
Un obstáculo importante para lograr la integración de estas diferentes disciplinas ha sido la
tendencia a identificar cada nivel de análisis con alguna de estas disciplinas. Por ejemplo, existe la
confusión de que las ciencias básicas son sólo aplicables a los niveles individuales y subindividual,
mientras que el poblacional es patrimonio absoluto de las ciencias sociales. Todas las poblaciones
humanas se organizan en sociedades, de ahí que las Ciencias Sociales sean indispensables para una
cabal comprensión de la salud de las poblaciones, es decir, de la salud pública. En este ámbito, las
Ciencias Sociales han ejercido notable influencia en el estudio de algunos determinantes psicosociales de salud que comenzaron siendo explorados en forma muy reduccionista en el ambiente
epidemiológico. A modo de ejemplo, en estos últimos años la contribución de estas disciplinas en el
estudio de determinantes socioeconómicos y desigualdades en salud han abierto un mundo nuevo en
la comprensión de interacciones entre factores biológicos y sociales. Sin embargo, también existe
una dimensión biológica de las poblaciones humanas, expresada en sus características genéticas, la
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 114 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 115-175
inmunidad grupal y la interacción de la población humana con otras poblaciones, como por ejemplo
la interacción microbiológica (dimensión que da origen a la seroepidemiología, bioepidemiología y
a la epidemiología genética).
La salud pública del futuro
En el plano recién dibujado se sitúa la actual Salud Pública, acuñando y consolidando los logros del
pasado y proyectando su quehacer en propuestas para el futuro. La salud pública tiene la gran
responsabilidad social de promover el desarrollo pleno y sano de los individuos y las comunidades
en las que ellos se insertan (promoción de la salud). La actual realidad desafía a la salud pública
para que ésta señale los rumbos a seguir en la sociedad en materia de atención y cuidado de la salud
en un escenario de extraordinaria complejidad. En nuestras comunidades hoy se suceden situaciones
muy heterogéneas, en las que coexisten enfermedades infecciosas con otras crónicas, debiendo
adaptarse los sistemas de salud para poder abarcar el control de ellas. Los problemas de salud del
medio ambiente ofrecen otro campo de interés y desafío para esta disciplina. El estudio y manejo de
la salud ambiental constituye una especialidad de la Salud Pública. Finalmente, la introducción del
componente social en el análisis de la situación de salud y de las condiciones de vida de la
población requiere de una salud pública versátil y creativa para poder enfrentar estos y otros
desafíos futuros.
5.4. EL METODO DE LA EPIDEMIOLOGIA
La epidemiología cuenta con un método específico para lograr sus propósitos, constituido por el
denominado método epidemiológico, el que corresponde a una secuencia circular de etapas. Con
fines didácticos podemos interrumpir este círculo para señalar cada una de ellas:
•
En un primer momento la epidemiología observa rigurosamente la realidad sin intentar
modificarla (Nivel descriptivo)
•
En una segunda etapa, se elaboran hipótesis explicatorias sobre la base de los paradigmas
imperantes (nivel analítico)
•
En un siguiente paso la epidemiología intenta verificar la validez de su(s) hipótesis(s)
sometiéndola a la verificación de acuerdo con la estrategia escogida para el caso particular
(Utilizando diferentes diseños de investigación)
•
Luego prosigue la etapa de conclusión, de acuerdo a los resultados obtenidos, aceptándose o
rechazándose la(s) hipótesis original.
•
Con la nueva evidencia la epidemiología elabora nuevas hipótesis que seguirán el mismo
análisis descrito, alimentando el conocimiento y abriendo un nuevo ciclo de investigación.
La secuencia descrita es indistinguible de aquella utilizada por el método científico y en este sentido
es posible afirmar que el método epidemiológico es una aplicación particular del método científico.
La particularidad del método epidemiológico está representada por el carácter propio de su
estrategia y del cuerpo de conocimientos que produce.
5.5. ESTRATEGIA EPIDEMIOLÓGICA
La estrategia epidemiología constituye la operacionalización del método epidemiológico. Esto se
logra reconstituyendo la realidad, mediante la formulación de modelos teóricos que ayudan a
entender la ocurrencia natural de los fenómenos. Estos diferentes modelos son conocidos como
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 115 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 116-175
diseños de investigación epidemiológica los que se corresponden con las etapas descritas para el
método epidemiológico. Es así como la observación de los fenómenos naturales es rigurosa y
sistemáticamente registrada, consolidada y resumida mediante técnicas incluidas en el gran capítulo
de la epidemiología descriptiva. Para ello utiliza procedimientos propios y otros derivados de
disciplinas relacionadas como la bioestadística, la clínica, las ciencias sociales y la informática.
La observación de los fenómenos y la consecuente formulación de hipótesis descansan en el juicio
crítico y creativo del investigador y se apoyan en los llamados estudios de prevalencia y de
incidencia. La verificación de la(s) hipótesis ocupan la atención de la epidemiología analítica la que
cuenta con los diseños de casos y controles, de cohorte y experimentales. Cada uno de ellos genera
evidencia objetivable por indicadores de naturaleza matemática validados por procedimientos
estadísticos de complejidad variable. El conjunto inédito de estos modelos o diseños y la
producción de conocimientos que ha originado su aplicación, han dado identidad y estatura
científica a la epidemiología.
5.6. CONDICIONES BÁSICAS EN LA DEFINICIÓN, REGISTRO Y MEDICIÓN DE
VARIABLES
Al registrar los valores de una variable, existen al menos dos características que la variable definida
debe poseer. En primer término, una variable debe ser exhaustiva, vale decir, debe considerar todas
las posibles alternativas u opciones de respuesta. Si al aplicar un cuestionario e indagar acerca de las
características del nivel socioeconómico como ser tipo de empleo, previamente categorizado, de no
incluirse todas las posibles opciones se corre el riesgo de una errónea clasificación u omisión del
dato.
Simultáneamente los atributos de una variable deben ser mutuamente excluyentes, lo que significa
que un sujeto no debiera identificarse con mas de una categoría al ser encuestado. En el caso de
indagar, por ejemplo, acerca de la situación laboral ofreciendo las siguientes opciones:
•
Empleado
•
Desempleado
•
Buscando empleo
Una persona empleada que desea aumentar su ingreso con un segundo empleo, podría estar en
condiciones de responder a más de una opción en las categorías propuestas arriba.
Unidades de análisis
La unidad de análisis corresponde a la entidad mayor o representativa de lo que va a ser objeto
específico de estudio en una medición y se refiere al qué o quién es objeto de interés en una
investigación. Por ejemplo: Debe estar claramente definida en un protocolo de investigación y el
investigador debe obtener la información a partir de la unidad que haya sido definida como tal, aun
cuando, para acceder a ella, haya debido recorrer pasos intermedios. Las unidades de análisis pueden
corresponder a las siguientes categorías o entidades:
•
Personas
•
Grupos humanos
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 116 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 117-175
•
Poblaciones completas
•
Unidades geográficas determinadas
•
Eventos o interacciones sociales (enfermedades, accidentes, casos de infecciones
intrahospitalarias, etc)
•
Entidades intangibles, susceptibles de medir (exámenes, días camas)
El tipo de análisis al que se someterá la información es determinante para elegir la unidad de
análisis. Por ejemplo, si el objetivo es dar cuenta de la satisfacción del usuario de un servicio
médico, la unidad de análisis natural es el paciente atendido, o la persona que se atiende en ese
servicio médico.
La unidad de muestreo corresponde a la entidad básica mediante la cual se accederá a la unidad de
análisis. En algunos casos, ambas se corresponden. Por ejemplo, si se desea estimar la prevalencia de
daño auditivo en relación con niveles de ruido ambiental en una muestra de trabajadores de una
fábrica, la unidad de muestreo puede corresponder a la entidad "sujeto", si se dispone de un registro
detallado de cada sujeto. La unidad de análisis es por cierto el trabajador de la fábrica.
Si en el mismo ejemplo se conoce de secciones de la fábrica con distinto nivel de exposición al
ruido, podría obtenerse una muestra de cada sección (estratos). En este caso, la unidad de muestreo
corresponde a la "sección", de donde se obtendrá a los sujetos a estudiar de acuerdo a algún
procedimiento aleatorio de selección. La unidad de análisis es también en este caso, el trabajador.
En el caso de encuestas de morbilidad, una tendencia clásica es trabajar con hogares como unidad de
muestreo e individuos de dichos hogares, como unidad de análisis.
Correspondencia entre unidades de análisis y de muestreo
Unidades de muestreo y de análisis deben corresponderse entre sí. En un enfoque "clínico", por
ejemplo, si se desea estudiar el comportamiento de las infecciones hospitalarias de un
establecimiento, la unidad de análisis podría corresponder al evento "infección hospitalaria" o a
"paciente con infección intrahospitalaria". Es evidente que la cifra en ambos casos puede ser
diferente: un "paciente" con infección intrahospitalaria puede tener más de un "evento" de infección
intrahospitalaria.
¿Cómo llegar a identificar estas unidades de análisis?
Si es necesario realizar un muestreo de la población en estudio, la pregunta es ¿Cómo llegar a
identificar a las unidades de análisis propuestas? En este caso es posible obtener un listado detallado
de los pacientes del hospital en un momento determinado. Un muestreo aleatorio simple o
estratificado según servicio clínico permitirá identificar tanto a pacientes afectados como eventos de
infección intrahospitalaria. Si el estudio tiene carácter nacional, es decir, representará el
comportamiento global de la infección intrahospitalaria a partir de una muestra de establecimientos,
la unidad de muestreo podrá ser el establecimiento.
Los estudios ecológicos constituyen un caso particular de investigación en los cuales la unidad de
análisis está constituida por agregados poblaciones, generalmente comunidades completas, ubicadas
espacialmente en un lugar definido. También el meta-análisis es una forma particular de
investigación observacional en la cual la unidad de análisis puede ser el "estudio" seleccionado o los
sujetos contenidos en dicho estudio.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 117 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 118-175
5.7. LAS MEDICIONES EN EPIDEMIOLOGIA
La observación y registro de eventos en epidemiología da origen a un conjunto de medidas que
permiten su descripción, la identificación de asociaciones, la constatación de efectos (riesgo protección) así como la estimación de su magnitud. Un conjunto de diferentes mediciones es
utilizado con esta finalidad.
Medidas de frecuencia de enfermedad:
•
Prevalencia
•
Incidencia
Medidas de Riesgo:
•
Riesgo
•
Chance u “odds”
Riesgo: probabilidad inminente de ocurrencia individual de un evento, por ejemplo, un daño. Note
que es un concepto "prospectivo" y condicionado, por ejemplo, a una determinada exposición.
Factor de Riesgo: condición, característica o atributo que condiciona una mayor probabilidad de
experimentar un daño o problema de salud
Medidas relacionadas con el efecto:
•
Riesgo relativo
•
Riesgo absoluto
Como se ha mencionado en otros capítulos, la definición de "caso" es crucial. Se define como tal
aquel individuo portador de un daño, enfermedad o problema de salud o aquel que sufre el evento.
La definición epidemiológica de caso no siempre es equivalente a la definición clínica (por ejemplo,
en el estudio de un brote epidémico, un caso puede ser definido por la constatación de un
determinado cuadro clínico, más el antecedente de un tipo de exposición determinada o referido a un
periodo de tiempo).
Así, un caso "sospechoso" de intoxicación alimentaria podría corresponder a un cuadro diarreico
agudo determinado, en una persona con antecedente de exposición a una situación de riesgo. Es
importante también la distinción entre casos y eventos. En algunas circunstancias podremos estar
interesados simultáneamente en la determinación de ambas cosas. Es crucial recordar que ambos,
caso o eventos dan cuenta de la variable dependiente u “outcome”, lo que exige absoluta claridad en
relación con lo que se mide y también en cómo se mide.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 118 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 119-175
Ejemplos de formas de medición de variables dependientes
Foco de estudio
Variable dependiente
(“outcome”)
Casos
Eventos
Estudio de brote epidémico
+
-
Evaluación de sobrevida en ensayo clínico
Reducción de lípidos séricos en la prevención de infarto al miocardio
Magnitud de infecciones intrahospitalarias
Recurrencia de trastornos emocionales en familias con distintos tipos de
intervención
+
+
+
+
+
-
+
La epidemiología necesita evaluar el origen a partir del cual los casos se originan y el tiempo durante
el cual los datos fueron recogidos.
5.8. PRINCIPALES INDICADORES SANITARIOS
Un indicador sanitario es un dato de interés para la epidemiología. En la medición de sucesos de
interés sanitarios se utilizan un conjunto reducido de indicadores, los que a su vez se pueden
fragmentar en múltiples subgrupos. En todos los ejemplos numéricos que siguen usaremos datos
simulados para la Provincia de Buenos Aires, Argentina. Para representar adecuadamente un suceso
puede ser necesario, y hasta recomendable, la utilización combinada de alguna de los siguientes
indicadores:
1. Cifras absolutas: éstas dan una idea de la magnitud o volumen real de un suceso. Tienen
utilidad para la asignación de recursos (por ejemplo, el número mensual de partos en un
establecimiento hospitalario da una idea del número de camas, personal y recursos físicos
necesarios para satisfacer esta demanda). Al efectuar comparaciones, el uso de cifras
absolutas tiene limitaciones, puesto que no aluden a la población de la cual se obtienen (así,
40 defunciones anuales en una población de 15.000 habitantes, puede ser proporcionalmente
mayor que 50, ocurridas en una población de 20.000 habitantes). Sin embargo, la
comparación de cifras absolutas referidas a la misma población en periodos cortos de tiempo
puede ser un buen estimador de riesgo al mantenerse constante el denominador.
2. Tasas: están compuestas por un numerador que expresa la frecuencia con que ocurre un
suceso (por ejemplo, 973 muertes por cáncer de mama en 1999 en la Provincia de Bs. Aires,
Argentina) y un denominador, dado por la población que está expuesta a tal suceso
(7.583.443 mujeres). De ésta forma se obtiene un cociente que representa la probabilidad
matemática de ocurrencia de un suceso en una población y tiempo definido. En el ejemplo, la
tasa obtenida estima el riesgo de cada mujer mayor de 30 años en la Provincia de Buenos
Aires, Argentina de fallecer de cáncer de mama en el curso de 1999. Cuando en el
denominador se trata de población general, para fines del cálculo de la población expuesta, se
usa como convención la existente al 30 de junio en ese lugar durante ese año (mitad de año) y
a esa clase de tasa se la define como tasa resumen. Por razones prácticas, el cociente
obtenido se amplifica por algún múltiplo de 10 (ya sea 1.000, 10.000, 100.000). De ésta
forma, la tasa de mortalidad por cáncer de mama en mujeres en 1999 fue de 12,8 muertes por
105 mujeres (12,8 muertes por cada 100.000 mujeres).
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 119 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 120-175
3. Razones: expresan la relación entre dos sucesos. A diferencia de las tasas el numerador no
está incluido en el denominador y no hacen referencia a una población expuesta. En éste
caso, la interpretación del cociente no alude a una probabilidad o a un riesgo, como es el caso
de la tasa. Un ejemplo es la razón de masculinidad, que es el cociente entre la población de
sexo masculino y la población de sexo femenino en un lugar y periodo determinado
(amplificado por 100. En la Provincia de Buenos Aires, Argentina, el año 2000 la razón de
masculinidad fue de 98,1%, es decir, "por cada 100 mujeres había 98 hombres".
4. Proporciones: Expresan simplemente el peso (frecuencia) relativo que tiene un suceso
respecto a otro que lo incluye (el denominador incluye al numerador). Por ejemplo, ¿Qué
proporción de las muertes ocurridas en la Provincia de Buenos Aires, Argentina el año 1999
fue causada por enfermedades cardiovasculares? Esto se calcula construyendo el cociente
entre el número de muertes ocurridas por causa cardiovascular (22.730) y el número total de
muertes ocurridas ese año (81.984) amplificado por 100 (27.7% de las muertes de 1999
fueron causadas por enfermedades cardiovasculares). Las proporciones no se interpretan
como una probabilidad ni tampoco otorgan un riesgo puesto que no se calculan con la
población expuesta al riesgo.
5. Índices: Surgen de la comparación de dos tasas o dos razones. Por ejemplo, el cociente entre
la tasa de mortalidad general en varones respecto de las mujeres en 1999. Este indicador da
una idea de la existencia de mayor o menor riesgo de una condición dependiendo si su valor
es mayo o menor de 1 (o de 100%). En este caso, se tiene para la Provincia de Buenos Aires:
Defunciones
Población
Tasa x 1000
Índice
Hombres
44.424
7.434.317
5.97
1.20 (120%)
Mujeres
37.560
7.583.443
4.95
A continuación se describen en un cuadro resumen algunos indicadores y su forma de cálculo:
Indicadores de natalidad
Tasa bruta de natalidad
Tasa de Fecundidad General
Definición / Cálculo
Nº de recién nacidos vivos / Población estimada
a mitad de periodo
Nº nacimientos/
Nº mujeres en edad fértil (15-49 años)
Amplificación
1.000 habitantes
1.000 mujeres
Nº nacimientos por grupo de edad/
1.000 mujeres
Nº mujeres por grupo de edad
Tasa recién nacidos de bajo
Recién nacidos vivos < 2.500 g/
1.000 nacidos vivos
peso
Nº recién nacidos vivos
Total de defunciones /
Tasa de mortalidad general
1.000 habitantes
Población total a mitad de periodo
Total defunciones por sexo/
1.000 hombres o
Tasa mortalidad según sexo
Pobl. masculina o femenina mitad de periodo
mujeres
Tasa mortalidad por grupo de
Total defunciones por grupo de edad /
100.000 personas
edad
Población del mismo grupo de edad
Defunciones de menores de un año/
1.000 recién nacidos
Tasa de mortalidad Infantil
Total de recién nacidos vivos
vivos
Defunciones niños menores de 28 días /
1.000 recién nacidos
Tasa de mortalidad neonatal
Total de recién nacidos vivos
vivos
Tasas de mortalidad infantil
Defunciones niños > 28 días > 1 año/
1.000 recién nacidos
tardía
Total de recién nacidos vivos
vivos
Tasa de Fecundidad por edad
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 120 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Indicadores de morbilidad
Definición / Cálculo
Nº enfermos por causa /
Tasa de morbilidad por causa
Población total a mitad de periodo
Nº enfermos según edad o sexo/
Tasa de morbilidad específica
Pobl. total a mitad de periodo según edad o
por edad, sexo
sexo
Nº de casos nuevos de enfermedad/
Tasa de incidencia
Población expuesta
Nº casos (nuevos y antiguos)/
Tasa de prevalencia
Población total expuesta
Nº casos enfermedad transmisible /
Tasa ataque primaria
Población expuesta
Nº casos enfermedad transmisible aparecidos
Tasa de ataque secundario
después de casos 1arios/
Población expuesta
Pag 121-175
Amplificación
1.000 habitantes
100.000 habitantes
Variable
Variable
100 expuestos
100 contactos
Las poblaciones utilizadas en el cálculo de tasas globales y específicas (subgrupos poblacionales)
suelen referirse a aquellas estimadas a mitad del período de observación (por ejemplo, a mitad de
año calendario). Este acuerdo se establece para poder neutralizar la posible inestabilidad de los
denominadores en cuanto a sucesos demográficos tales como migraciones, mortalidad y crecimiento
poblacional.
La amplificación de las tasas utilizando múltiplos de 10 constituye sólo un artificio matemático para
facilitar su comprensión y comparación. Las tasas, que matemáticamente corresponden a
probabilidades, pueden tener valores que oscilan entre el valor cero (nula probabilidad de
ocurrencia) y uno (certeza absoluta de ocurrencia). En ocasiones, sea porque los numeradores son
de pequeña magnitud o bien los denominadores son cuantiosos, se obtienen valores reales de tasas
que son difíciles de interpretar y comparar.
Por ejemplo, si se desea calcular la tasa de mortalidad específica por pericarditis aguda en 1991 en
la Provincia de Buenos Aires de la República Argentina y ver la importancia relativa de ella con
respecto al total de muertes cardiovasculares, obtendríamos lo siguiente:
•
Muertes por todas las causas cardiovasculares: 14.628 defunciones
(códigos 140.0- 208.0 de la Clasificación Internacional de Enfermedades (CIE), 9ª Revisión).
•
Muertes por pericarditis aguda : 5
(código 420.0 de la misma clasificación)
•
Población Pcia. Bs. As. en 1991, ambos sexos: 13.385.817 habitantes.
Resultando los índices:
Tasa de mortalidad específica por pericarditis =
5 casos / 13.385.817 personas = 0,000000373
Tasa de mortalidad específica por enf. cardiovascular =
14.628 defunciones / 13.385.817 personas =0,001093
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 121 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 122-175
Numéricamente es complejo evidenciar tan bajos órdenes de magnitud, y más difícil aún, intentar
establecer la importancia relativa de la pericarditis aguda como causa de muerte en relación al total
de muertes cardiovasculares.
En este caso, la amplificación por un múltiplo de 10, podría superar esta dificultad en la
interpretación. El orden de magnitud de dicho múltiplo de 10 dependerá de cuan pequeña es la cifra
obtenida. En este caso, por la baja frecuencia de sujetos considerados en el numerador, conviene
amplificar por un múltiplo de 10 del orden de 100.000, con lo cual las tasas obtenidas se transforman
en:
Tasa de mortalidad específica por pericarditis =
0,037 muertes por 100.000 habitantes .
Tasa de mortalidad específica por enfermedades. cardiovasculares =
109,3 muertes por 100.000 habitantes
Por convención, en la amplificación de tasas brutas, globales o generales se suele utilizar 1.000
como múltiplo amplificador. En estos casos, dado que se trata de tasas resúmenes, los numeradores
suelen ser importantes en número. Ejemplo, tasa de mortalidad general (TMG) en la Provincia de
Buenos Aires de la República Argentina, 1991:
TMG = 74.682 def. x 10
/13.385.817 personas = 5,58 defunciones por 10
hbts.
La mortalidad infantil y aquellas vinculadas con ella (perinatal, neonatal, infantil tardía) suelen
amplificarse también por 1.000 recién nacidos vivos. En aquellos casos en los cuales se trate de
construir tasas específicas por algún atributo, sea sexo, edad, lugar de residencia, tipo de enfermedad
u otro, se suele amplificar por 100.000 la tasa pues los numeradores habitualmente son ser de menor
magnitud que el caso anterior.
Ejemplo: tasa de mortalidad por enfermedades del aparato circulatorio en la Pcia. de Bs. Aires
Argentina, 1999 (TM Cv): .
TM Cv. 1999= 22.730 defunc. x 100.000/15.017.760 personas = 151,3 muertes por 100.000 hbts.
Las tasas destinadas a medir hechos vinculados con el ámbito obstétrico, (como mortalidad materna
o mortalidad por aborto), suelen amplificarse por 10.000. Las tasas de letalidad se amplifican por
convención por 100 (10 ) puesto que el máximo daño que una enfermedad puede producir en
términos de muerte es en el peor de los casos de 100%.
5.9. INTRODUCCION AL ESTUDIO DE COHORTES
A lo largo de su desarrollo, la epidemiología se ha preocupado de dos objetivos fundamentales:
•
•
Probar causalidad e,
Identificar riesgo.
La preeminencia de cada uno de estos objetivos ha estado determinada por el modelo conceptual de
salud-enfermedad imperante. Es así como la causalidad encuentra su mayor protagonismo en las
relaciones mórbidas, entre agente y huésped, formuladas en los modelos de las enfermedades
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 122 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 123-175
infecciosas. El énfasis en el riesgo, en cambio, se desarrolla fuertemente con relación al concepto de
enfermedades crónicas. El logro de los dos objetivos señalados ha obligado a la epidemiología a
formular diseños de investigación de distinto grado de complejidad. Entre estos diseños el estudio
experimental es reconocido como el único capaz de probar causalidad. En cambio una buena
aproximación al riesgo puede obtenerse con los estudios observacionales de casos y controles y, más
rigurosamente desde el punto de vista conceptual, con los estudios de cohorte.
Los estudios de cohorte son planteados una vez que se dispone de información acerca de eventuales
factores asociados al daño a investigar. Por lo tanto, previamente deben haberse recorrido las etapas
propias del ciclo de investigación epidemiológica.
Definición:
Los estudios de cohorte consisten en el seguimiento de una o más cohortes (o grupos de individuos
sanos) que presenta diferentes grados de exposición a un factor de riesgo en quienes se mide la
aparición de la enfermedad o condición en estudio.
Estos diseños de investigación se clasifican, según los criterios taxonómicos clásicos, como estudios
observacionales analíticos y longitudinales prospectivos. La categoría de los observacionales
analíticos se refiere a la imposibilidad que el investigador tiene de manipular la(s) variable(s)
independiente(s), lo cual los distingue de los estudios experimentales. Por tratarse de estudios cuyos
resultados permiten un análisis más sofisticado que el de los estudios descriptivos, son considerados
estudios analíticos. Por definición, deben permitir la verificación de hipótesis de trabajo. Por el
contrario, los estudios longitudinales prospectivos se basan en un seguimiento en el tiempo de uno o
más grupos humanos que difieren entre sí por la presencia de una o más variable(s) independiente(s).
Por esta razón se les denominan estudios prospectivos, concepto que incorpora implícitamente el
carácter longitudinal de los mismos. Otros estudios longitudinales son los de casos y controles (ver
8.11.), sin embargo en éstos el sentido de la observación es retrospectivo.
Diseño
Los estudios de cohorte tienen un diseño o formato fundamental. Se trata del seguimiento de
individuos caracterizados por estar libres del daño en estudio al inicio de la observación. Entre estos
individuos se observa, a medida que pasa el tiempo, la aparición de casos de enfermedad
(“outcome”) a lo largo del tiempo según posean o no un atributo (variable independiente o
exposición) que se cree asociado al desenlace (“outcome”) en estudio. Sólo en contadas ocasiones la
constitución de los grupos considera la exposición como un suceso dicotómico (sí/no o expuesto/noexpuesto). Por su estructura y complejidad el investigador aprovecha este diseño para evaluar con
mayor detalle el resultado de una exposición, lo que supera las limitaciones de exposiciones
dicotómicas del tipo Expuesto/no expuesto.
Lo habitual es que el estudio permita la subdivisión de la cohorte expuesta según diferentes niveles
de exposición (ejemplo de exposición: tabaquismo, el que puede ser categorizado en diferentes
niveles de consumo o tiempo de exposición; exposición laboral a elementos tóxicos, que pueden
categorizarse en magnitud y tiempo de exposición) Para estos efectos los individuos son agrupados
de tal manera que los grupos tengan el máximo de características similares entre si y puedan ser
comparables y así difieran, idealmente, sólo en la variable independiente en estudio.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 123 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 124-175
Esquema básico de estudios de cohorte
Lo habitual en un estudio de cohorte es que el investigador sea contemporáneo con el inicio del
seguimiento de los grupos, vale decir, asista a la agrupación de los individuos sanos. En este caso se
acuña el término de estudio concurrente. Por el contrario, si el investigador no participa en forma
contemporánea de la formación de las cohortes y ésta se formó en el pasado pero es susceptible de
ser seguida en el tiempo, se habla de un estudio no concurrente (“Historical cohort studies”)
Los elementos básicos de un estudio de cohorte pueden resumirse en el siguiente listado:
•
Formulación clara de una hipótesis de trabajo a investigar
•
Identificación de los grupos a ser estudiados
•
Definición de la exposición y de la forma en que ésta será medida
•
Definición y medición de las posibles variables involucradas
•
Definición de la(s) variable(s) dependiente(s) (“outcomes”), así como de la forma en que
será(n) medida(s)
•
Análisis de datos
•
Interpretación de resultados
Estructura adoptada por los estudios de cohortes
Los estudios de cohorte pueden adoptar algunas variaciones en su diseño básico, dependiendo del
número de cohortes involucradas y su origen. Se reconocen en general las siguientes variaciones:
1. Cohorte única (antes y después): el ejemplo más citado para ilustrar esta variante lo
constituye el estudio de incidencia (casos nuevos) de leucemia linfática aguda en la población
Japonesa residente en Hiroshima después de la explosión nuclear. La frecuencia de casos
nuevos se comparó con la existente en el mismo grupo de personas antes de ocurrida la
explosión y posterior exposición masiva a radiación. Como se advierte en el ejemplo, la
cohorte única corresponde a un grupo de individuos que comparten (o compartieron) una
misma condición (exposición) en los cuales se mide la presencia de una variable dependiente
predefinida (“outcome”). En este caso se compara la incidencia (casos nuevos) de la
enfermedad en los mismos individuos antes y después de ocurrida la exposición a la variable
independiente.
2. Dos cohortes: corresponde al formato clásico ya descrito en el cual se seleccionan dos
grupos de individuos sanos que sólo difieren en que uno presenta el factor de exposición
(cohorte expuesta) y el otro no lo presenta (cohorte no expuesta).
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 124 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 125-175
3. Cohortes múltiples: en este caso se trata de generar múltiples grupos, de individuos sanos,
con diferentes grados de exposición al factor de riesgo. En este caso se compara la incidencia
de enfermedad de cada grupo en relación a una cohorte de control, de preferencia la de menor
o con nula exposición al factor de riesgo. Son útiles en la evaluación de relaciones de dosisrespuesta.
4. Estudio de casos y controles anidados (“nested case & control studies”): Los estudios de
cohorte permiten la identificación de un pool de sujetos enfermos concluido el periodo de
observación o seguimiento (“follow-up”). El investigador conoce detalladamente las
características más relevantes de este grupo de personas en cuanto a eventuales exposiciones
y otras covariables. Aprovechando este hecho, es posible constituir un esquema de diseño de
casos y controles seleccionando aleatoriamente controles entre el grupo de sujetos no
afectados después del periodo de seguimiento (Ver el esquema abajo). Tiene especial
aplicación en aquellas situaciones en que los procedimientos diagnósticos para detectar casos
son de elevado costo, en particular en el estudio de enfermedades ocupacionales.
Este diseño híbrido contribuye al control de sesgos, particularmente los vinculados con
medición, problema frecuente de los estudios de caso y controles.
Esquema de un estudio de casos y controles anidados (“nested case& control studies”)
Principales usos de los estudios de cohorte
•
Ensayar hipótesis de causalidad y de riesgo: los estudios de cohorte son, entre los diseños
observacionales, los que proveen la más rigurosa información en favor de la causalidad y del
riesgo. Como ya se ha mencionado, la certeza absoluta del proceso causal sólo es capaz de
proporcionarla el diseño experimental. Tienen la ventaja adicional de seguir el mismo sentido
de la lógica del pensamiento clínico (la exposición precede al desenlace).
•
Medir la incidencia de una enfermedad o condición: uno de los productos de mayor interés en
un estudio de cohorte es la obtención de tasas de incidencia de la enfermedad o condición en
estudio. La tasa de incidencia de una enfermedad corresponde al total de casos nuevos de
enfermedad que se presentan en un grupo de individuos en un período de tiempo
determinado. Dado que una condición indispensable en estos diseños es que las cohortes
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 125 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 126-175
estén constituidas por individuos sanos, en la práctica un estudio de esta naturaleza permite
medir tres tipos de tasas de incidencia : tasa de incidencia de la enfermedad para la cohorte
expuesta al factor de riesgo, para la cohorte no expuesta y para ambos grupos en conjunto.
•
Permiten la cuantificación del riesgo: la relación entre tasa de incidencia de sujetos expuestos
con relación a la de los no expuestos da origen al llamado riego relativo que permite
establecer la magnitud de riesgo asociado a la exposición analizada.
•
Estudiar la historia natural de la enfermedad: los estudios de cohorte permiten realizar un
seguimiento de individuos sanos con criterios y métodos diagnósticos estandarizados. De ésta
manera es posible reconocer precozmente los elementos característicos de una enfermedad,
así como también factores asociados a sus etapas más tempranas.
•
Explorar el efecto de exposiciones de baja frecuencia poblacional: en el campo de
enfermedades ocupacionales, es posible observar el comportamiento de cohortes de sujetas
sometidos a exposiciones de rara ocurrencia en la población general.
•
Estudiar mas de una consecuencia para la salud derivado de exposiciones: en un estudio de
cohorte el investigador puede definir mas de un “outcome” de interés. Por ejemplo, en la
determinación del efecto de un factor de riesgo se puede emplear medidas de incidencia o de
mortalidad. En estudios prospectivos destinados a evaluar el rol de parámetros
antropométricos al nacer y asma bronquial, pueden utilizarse diferentes formas (fenotipos)
para evaluar dicho “outcome” (sibilancias, sibilancias nocturnas, valores espirométricos o
combinaciones entre éstos).
Algunas limitaciones propias de estos diseños
•
No prueban necesariamente causalidad (recordar que la exposición no es asignada
aleatoriamente en la(s) cohorte(s) estudiadas).
•
Pueden requerir de un largo período de seguimiento de la(s) cohorte(s). Esto conspira contra
la integridad del estudio pues durante el seguimiento individuos pueden perderse y/o puede
alterarse su condición de exposición (el sujeto que no fumaba al inicio del seguimiento,
comenzó a hacerlo posteriormente).
•
Tienen utilidad limitada en el estudio de enfermedades de baja prevalencia o de prolongado
período de incubación pues el seguimiento debe ser más prolongado.
•
Son generalmente estudios de mayor complejidad (en cuanto a diseño, costo y análisis)
comparados con otros estudios analíticos.
•
Pueden ser negativamente afectados por la pérdida de sujetos en el seguimiento. Además de
la reducción en la potencia del estudio, si la pérdida de sujetos afecta heterogéneamente a las
cohortes, puede generarse sesgo de selección.
•
Pueden ser afectados por otras exposiciones, eventualmente no consideradas en el diseño que
puedan influir en un mayor o menor riesgo de presentación del desenlace u outcome.
Volveremos más adelante a detallar estos aspectos, pero vale la pena destacar de antemano los
conceptos claves en el estudio de las cohortes:
1. Las cohortes pueden tener una estructura cerrada (igual tiempo de seguimiento) o abiertas o
dinámicas (diferente tiempo de seguimiento)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 126 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 127-175
2. Cohortes cerradas permiten el cálculo de Incidencia acumulada
3. Cohortes abiertas o dinámicas deben incorporar el concepto de tiempo-persona de exposición en
su análisis.
4. Este diseño proporciona una vasta gama de indicadores de frecuencia, de riesgo absoluto y
relativo.
5. Por su estructura los estudios de cohorte son capaces de proveer tasas de incidencia.
5.10. MEDIDAS OBTENIDAS DE LOS ESTUDIOS DE COHORTES (Riesgos
Incidencias)
e
Un estudio de cohorte permite obtener información sobre incidencia y a partir de ésta, indicadores de
riesgos absoluto y relativo.
Tipos de cohorte
Se denomina cohorte cerrada a aquella cuyos miembros son reclutados en el mismo periodo de
tiempo y a la cual no ingresan personas durante el periodo de seguimiento. En consecuencia, en esta
modalidad el total de miembros de la cohorte tiene períodos de seguimiento que comienzan al mismo
tiempo.
Cohorte abierta o dinámica es aquella en la cual sus integrantes pueden ingresar a seguimiento en
diferente momento durante el periodo que este dure. Por tanto, los miembros de esta cohorte pueden
tener tiempos de exposición heterogéneos.
Incidencia
El seguimiento de individuos sanos por un período determinado de tiempo permite medir el número
de casos de una enfermedad que aparecen en dicho período. Esta cifra constituye la tasa de
incidencia de la enfermedad en estudio que puede ser medida para la cohorte expuesta (TI exp), la
no expuesta (TI noexp) y para ambas en conjunto (TI).
La incidencia acumulada se calcula considerando todos los sujetos que presentaron el “outcome” en
estudio independientemente del momento en el cual lo presentaron (“cumulative risk”). Su cálculo
aplica cuando se trate de una cohorte cerrada.
Para el caso particular de un diseño de cohorte en que se permita eliminar o ingresar individuos a las
cohortes después de haber iniciado el seguimiento (cohortes abiertas) seguimiento), se prefiere el
término densidad de incidencia. (“incidence rate”)
La densidad de incidencia suma todos los tiempos con que efectivamente contribuyeron los
individuos estudiados. El indicador se construye dividiendo el total de enfermos encontrados a lo
largo del estudio por el total del tiempo de seguimiento (tiempo -persona) y amplificando según
corresponda.
Riesgo
El cálculo de incidencia de la enfermedad en expuestos y no expuestos permite evaluar riesgo
asociado a la condición de exposición. La relación matemática que se establezca entre estas dos
medidas permite el cálculo de a lo menos seis expresiones de riesgo:
•
Riesgo Relativo (en la literatura anglosajona el término “Risk Ratio” corresponde al cálculo
utilizando incidencia acumulada)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 127 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 128-175
•
El término “Rate Ratio” se utiliza cuando se utiliza densidad de incidencia en el cálculo
•
Riesgo Atribuible,
•
Riesgo Atribuible Porcentual (fracción etiológica)
•
Riesgo Atribuible Poblacional.
•
Riesgo Atribuible Poblacional Porcentual
Para explicar el sentido de cada una de estas medidas se puede recurrir a la tabla tetracórica, de
doble entrada y que nosotros hemos llamado tabla de contingencia 2x2, en este caso, utilizando
incidencia acumulada como medida de riesgo:
EXPUESTOS
NO EXPUESTOS
ENFERMOS
SANOS
A
C
A+C
B
D
B+D
A+B
C+D
A+B+C+D
Observe que en este diseño el sentido de lectura de esta tabla de 2 x 2 es horizontal (filas), a
diferencia del diseño de casos y controles, que en este caso sería vertical (columnas).
Se debe notar que a diferencia de los estudios de caso y controles, el investigador fija el total de
ambas filas, (A + B) y (C + D) respectivamente)
•
Celda A: expuestos que desarrollan la enfermedad (“outcome” positivo)
•
Celda B: expuestos que no desarrollan la enfermedad (“outcome” negativo)
•
Celda C: no expuestos que desarrollan la enfermedad (“outcome” positivo)
•
Celda D: no expuestos que no desarrollan la enfermedad (“outcome” negativo)
- Tasa de incidencia en expuestos: Casos nuevos detectados en el seguimiento en la cohorte de
personas expuestas.
TI Exp = A / (A + B)
- Tasa de incidencia en no expuestos. Corresponde al cociente entre el total de casos detectado en
relación en la cohorte no expuesta a. factor.
TI No Exp = C / (C + D)
- Riesgo Relativo (Risk Ratio): Es el cociente entre la tasa de incidencia de la enfermedad en
expuestos y la incidencia en no expuestos. Permite conocer la magnitud de riesgo o protección
asociada a la exposición estudiada. Carece de unidades de medida.
RR= (A /(A+B)) / (C /(C+D) )
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 128 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 129-175
El Cálculo del Intervalo de confianza para el valor del Riesgo Relativo:
- Riesgo Atribuible (RA): Es la diferencia aritmética entre la incidencia de la enfermedad en
expuestos y la incidencia en no expuestos. Expresa la magnitud de la tasa de incidencia en los
expuestos que es atribuible sólo al factor en estudio. Tiene unidades de medidas.
RA = ( A / (A +B) ) - ( C / (C + D) )
- Riesgo Atribuible Porcentual o fracción etiológica:(RA%): es el cociente entre el Riesgo
Atribuible y la incidencia de la enfermedad en expuestos, amplificado por 100. Expresa el porcentaje
que representa el Riesgo Atribuible respecto de la incidencia de enfermedad en expuestos.
RA% = (( A / (A+B) ) - (C / (C+D) )) / ( A / (A+B) ) x 100
O bien:
RA% = RA / (A/(A+B))
- Riesgo Atribuible Poblacional (RAP): es la diferencia aritmética entre la incidencia de la
enfermedad en la población general y la incidencia en la población no expuesta al factor de riesgo.
Expresa el valor teórico de incidencia imputable al factor de riesgo en la población.
RAP = ( (A+C) / (A+B+C+D) ) - ( C / (C+D) )
- Riesgo Atribuible Poblacional Porcentual: Es el cociente entre el Riesgo Atribuible Poblacional
(RAP) y la incidencia de la enfermedad en la población total, amplificado por 100.
Expresa el porcentaje que representa el Riesgo Atribuible Poblacional respecto de la incidencia de la
enfermedad en el total de individuos.
RAP%= ( (A+C) / (A+B+C+D) ) - (C /(C+D)) / ((A+C) / (A+B+C+D)) x 100
Ejemplo: Un estudio de cohorte diseñado para estudiar en 200 sujetos el riesgo de desarrollo de
cáncer del pulmón según el hábito de fumar de ellos, arrojó los siguientes resultados después del
seguimiento:
EXPOSICIÓN +
EXPOSICIÓN -
CÁNCER
20
5
25
SANOS
80
95
175
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
100
100
200
Página 129 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 130-175
De acuerdo a estos valores se obtienen los siguientes resultados:
• Riesgo Relativo (“Risk Ratio”)= (20/100)/(5/100) = 4
• Riesgo Atribuible = (20/100) - (5/100) = 15 casos por cada 100 personas
• Riesgo Atribuible porcentual (RA%) = ((20/100) - (5/100))/ (20/100) = 0,75 (75%)
• Riesgo Atribuible Poblacional (RAP) = (25/200) - (5/100) = 0,075
• Riesgo Atribuible Poblacional Porcentual (RAP%) =((25/200) - (5/100))/ (25/200)= 0,60 (60%)
Si se utiliza en el seguimiento de los individuos el concepto de tiempo-persona, se puede calcular
densidad de incidencia para los grupos expuestos y no expuestos respectivamente. La estructura de la
tabla de contingencia adopta una forma diferente a la del caso de incidencia acumulada.
EXPOSICIÓN +
EXPOSICIÓN -
CASOS
A
B
TOTAL TIEMPO-PERSONA SEGUIMIENTO
T1
T2
En este caso el cálculo de densidad de incidencia corresponde a:
Densidad de incidencia en expuestos = a/ T1
Densidad de incidencia en no expuestos = b/ T2
«
Rate Ratio » = (a/T1) / ( b/T2 )
Otra forma de presentar los resultados de un estudio de cohortes es mediante la utilización de la
razón de mortalidad estandarizada (RME). La RME compara el número de casos o de muertes por
enfermedad con una población de referencia o estándar y representa la razón entre el número de
casos observados respecto del número de casos esperados de tener la población estudiada el mismo
riesgo de morbilidad o mortalidad de la población de referencia.
A modo de ejemplo, en el siguiente hipotético ejemplo se tiene la información acerca de las tasas de
incidencia, medidas en tiempo-persona de trabajadores expuestos a un determinado agente
ambiental, según tres categorías de edad:
Casos observados después de un periodo t de seguimiento en
trabajadores varones, según grupo de edad
GRUPOS DE EDAD MUERTES OBSERVADAS
30 A 39
40 A 49
50 A 59
TOTAL
6
12
35
53
AÑOS-PERSONA DE
SEGUIMIENTO
10,000
10,000
10,000
Si se utiliza una población de referencia, por ejemplo, proveniente de la población general, de la cual
se conoce las tasas de incidencia, es posible estimar el número esperado de muertes en la población
estudiada.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 130 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 131-175
Casos esperados de enfermedad de acuerdo a tasas de incidencia
de población de referencia, según grupo de edad
GRUPOS DE
EDAD
30 A 39
40 A 49
50 A 59
TOTAL
MUERTES
AÑOS-PERSONA DE
OBSERVADAS
SEGUIMIENTO
(B)
(A)
6
10,000
12
10,000
35
10,000
53
TASA MORTALIDAD
POBLACIÓN
REF ( 10 )
(C)
0,5
1,0
2,5
MUERTES
ESPERADAS
(C X B)/1000
5
10
25
40
Para este ejemplo, la RME corresponderá a:
RME = (53 /40)x 100 = 132,5
En este caso, en comparación con la población de referencia, la población estudiada presenta un
exceso de riesgo de 32,5%, controlado el efecto de la edad en esta comparación.
5.11. ANALISIS DE CASOS Y CONTROLES (C&C)
La lógica de este diseño consiste en comparar la frecuencia de exposición a la(s) variable(s)
independiente(s) estudiadas en casos y controles. Esta comparación, apoyada por la hipótesis de
trabajo, busca encontrar evidencia de una mayor tasa de exposición entre los sujetos casos en
comparación con los controles si el factor estudiado se comporta como un "factor de riesgo".
Si la presencia del factor de exposición reduce el riesgo (factor protector), la frecuencia de
exposición entre los controles debiera ser mayor que la encontrada entre los casos. El análisis
dependerá de la existencia de pareamientos (emparejamientos) o “matching” en el diseño. En el caso
no pareado, la unidad de análisis corresponde a cada individuo en ambos grupos y la comparación de
individuos de uno y otro grupo se efectúa libremente. Si hay “matching” la comparación de las
unidades de análisis se establece entre pares de observaciones (un caso, un control), tríos si la
relación entre casos y controles es 1:2 ( un caso, dos controles) y así sucesivamente. El esquema
general de análisis en una tabla tetracórica o de contingencia 2x2, en un estudio de casos y
controles es el siguiente
Esquema básico de información en un estudio de Casos y Controles (C&C)
VARIABLE
INDEPENDIENTE
PRESENTE
AUSENTE
TOTAL
VARIABLE DEPENDIENTE
PRESENTE
A
C
C1 (A+C)
AUSENTE
B
D
C2 (B+D)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
TOTAL
F1 (A+B)
F2 (C+D)
N
Página 131 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 132-175
En este caso, cada celda corresponde a:
Celda A: Sujetos enfermos con antecedente de exposición
Celda B: Sujetos sanos con antecedente de exposición
Celda C: Sujetos enfermos sin antecedente de exposición
Celda D: Sujetos sanos sin antecedente de exposición.
Celda C1: Total de casos
Celda C2: Total de controles
Celda F1 : Total de sujetos expuestos
Celda F2 : Total de sujetos no expuestos.
Nótese que el número total de sujetos en ambos grupos (Casos y Controles) son fijados a priori por
el investigador (C1 y C2). Un primer análisis de esta tabla, considerando la hipótesis de trabajo,
permite una rápida evaluación de la tendencia de los resultados. Si la exposición estudiada confiere
riesgo, se espera encontrar una concentración de individuos en la celda a (expuestos y enfermos) y
celda d (no expuestos y sanos). En estas celdas se produce concordancia con la hipótesis de trabajo
(exposición / daño, no exposición / no daño).
Caso no pareado: estructura de la tabla tetracórica
En este caso, la comparación de individuos se realiza libremente, comparando la totalidad de los
casos con la totalidad de los controles. Esto es válido independientemente del número de controles
seleccionados por cada caso. Veamos la estructura de los datos en situaciones hipotéticas de estudios
con relación 1:1 y 1:2 entre casos y controles respectivamente:
Caso no pareado, relación 1:1 entre casos y controles.
CASOS
CONTROLES
E
N
1
E
N
2
N
N
3
N
N
4
E
E
5
6
E
N
E
N
7
E
N
8
N
E
9
N
E
10
(E = expuesto N = No expuesto)
Exposición
Positiva
Negativa
Casos
6
4
10
Controles
3
7
10
9
11
20
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 132 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 133-175
Caso no pareado, relación 1:2 entre casos y controles.
CASOS
CONTROLES
E
1-N
11-N
1
E
2-N
12-E
2
N
3-N
13-E
3
N
4-N
14-N
4
E
5-E
15-N
5
E
6-N
16-N
6
E
7-N
17-E
7
E
8-N
18-N
8
N
9-N
19-N
9
N
10-E
20-N
10
EXPOSICIÓN
POSITIVA
NEGATIVA
CASOS
6
4
10
CONTROLES
5
15
20
11
19
30
Caso no pareado: estructura de la tabla tetracórica
En la situación de pareamiento o “matching”, cambia la estructura de la base de datos, las tablas de
distribución de frecuencias, así como las tablas de contingencia (que sólo es de 2 x 2 para el caso de
matching 1 : 1), varían en su estructura general. Se presentan figuras con la apariencia en casos de
matching 1 : 1 y más de un control por cada caso:
Caso pareado, relación 1:1 casos-controles
1
2
3
4
5
6
7
8
9
10
CASOS-CONTROLES
E-N (CASO EXPUESTO; CONTROL NO EXPUESTO)
E-N
N-N (CASO Y CONTROL NO EXPUESTOS)
N-N
E-E (CASO Y CONTROL EXPUESTOS)
E-N
E-N
E-N
N-N
N-E
Originando la siguiente tabla tetracórica:
CONTROLES
EXP +
EXP CASOS
EXP +
1
5
6
EXP 1
3
4
2
8
10*
(*): 10 pares de comparaciones, equivalentes a 20 sujetos
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 133 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 134-175
Caso pareado, relación 1:2 entre casos y controles.
CASOS-CONTROLES
E-N-N
1
E-N-E
2
N-N-N
3
N-N-N
4
E-E-E
5
E-N-N
6
E-N-N
7
E-N-N
8
N-N-E
9
N-E-N
10
Distribuyéndose de esta manera en la tabla de contingencia
CONTROLES EXPUESTOS
0 INDIV 1 INDIV
2 INDIV
TOTAL
CASOS EXP +
4
1
1
6
EXP 2
2
0
4
6
3
1
10*
(*): 10 tríos de observaciones (30 observaciones)
Cálculo de la tasa de exposición
El primer cálculo a desarrollar es el de las tasas de exposición entre los sujetos casos y los controles,
de acuerdo al siguiente planteamiento:
Esquema básico de información en un estudio de casos y controles
VARIABLE
VARIABLE DEPENDIENTE
INDEPENDIENTE
(enfermedad)
(exposición)
PRESENTE
AUSENTE
TOTAL
PRESENTE
A
B
F1 (A+B)
AUSENTE
C
D
F2 (C+D)
TOTAL
C1 (A+C)
C2 (B+D)
N
Tasa Exposición en casos = A / C1 x 100 o bien = A/(A+C)
Tasa Exposición en controles =B / C2 x 100 o bien = B/ (B+D)
La valoración estadística de las tasas de exposición encontradas puede efectuarse mediante la
aplicación de un test de comparación de proporciones, la que determinará si la diferencia existente
puede o no se explicada por el azar (H0) o por la presencia de la variable independiente en estudio
(H1).
Establecimiento de asociación entre las variables en estudio
Luego del paso anterior se procede a establecer la existencia de asociación utilizando el test de jicuadrado, con su correspondiente corrección de continuidad de Yates, según fuese explicado en el
capítulo previo para las clásicas tablas de contingencia 2x2:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 134 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
χ2 =
N (| AD − BC | − N / 2) 2
C1 C 2 F1 F 2
Pag 135-175
; g .de l. = 1
Teniendo como punto de corte 5,991 para este valor, con un 95% de confianza. Vale decir, si el valor
de ji-cuadrado calculado excede este valor, se está en condiciones de poder rechazar la hipótesis de
nulidad H0 (falta de asociación) en favor de H1 (asociación), con 95% de confianza. Habitualmente
en todo caso, la hipótesis de asociación suele haber sido comprobada previamente al desarrollo del
protocolo. El paso siguiente es el cálculo del “odds ratio”. El “odds ratio” tiene la característica de
cuantificar la magnitud de riesgo y a continuación se lo explica en detalle.
5.12. CALCULO DE LA RAZON DE CHANCES u “ODDS RATIO” (OR)
En la literatura epidemiológica esta medida de riesgo es reconocida con las siguientes
denominaciones: “odds ratio”, razón de disparidad, razón de desigualdades, razón de productos
cruzados, riesgo relativo estimado, desigualdad relativa, razón de momios y otras más.
Elaboración de los componentes de esta razón:
La "chance" (“odds”) de tener la enfermedad (Odds1), según se esté o no expuesto al factor
corresponde a:
Odds1 = A/C1 (enfermos expuestos en relación con el total de enfermos) / C/C1 (enfermos
no expuestos en relación con el total de enfermos) = (A/(A+C))/(C/(A+C))
Equivalentemente la "chance" de no tener la enfermedad, según se esté o no expuesto al factor
(Odds2) corresponde a :
Odds2 = B/ C2 (sanos expuestos en relación con el total de sanos) / D/ C2 (sanos no expuestos
en relación con el total de sanos)= (B/(B+D))/(D/(B+D))
Por tanto, el valor del “Odds Ratio”, que corresponde al cociente (razón ) entre estas dos "chances (u
“Odds”), corresponde a:
simplificando, obtenemos la fórmula final del OR (“Odds Ratio”)
OR =
a.d
b.c
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 135 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 136-175
Este indicador de riesgo es llamado también "razón de productos cruzados", aludiendo así a la
distribución que adoptan en la tabla 2 x 2 los términos del numerador y denominador 4 . El valor
calculado carece de unidades de medidas.
Interpretación del valor de OR calculado
Estrictamente hablando el “odds ratio” indica la magnitud de asociación entre exposición y
“outcome” (en otras palabras, el riesgo de haber estado expuesto dada la enfermedad). Esta
interpretación es compleja y difícil de entender, por lo que se permite su interpretación considerando
el riesgo asociado o no a la exposición. Como el “odds ratio” es un buen estimador del riesgo
relativo (calculado en estudios prospectivos), se utiliza esta propiedad para facilitar la comprensión
del indicador. Si el cuociente calculado determina un valor de 1, esto significa que no hay asociación
entre las variables analizadas (la exposición positiva o negativa no hace diferencia respecto al riesgo
de enfermar).
Un valor mayor que 1 indica una mayor frecuencia de exposición de la variable independiente entre
los enfermos (casos). Por tanto, el factor actúa asociándose con un mayor riesgo de enfermar.
Finalmente, si el valor del OR calculado es inferior a 1, esto indica mayor frecuencia de exposición
entre los sujetos sanos (controles). En este caso, la presencia del factor se asocia reduce el riesgo de
enfermar (actuando como un factor de protección). La valoración estadística de las asociaciones
encontradas debe realizarse mediante el cálculo de los correspondientes intervalos de confianza.
De acuerdo con esto, la interpretación final del OR queda dada por el siguiente esquema:
VALOR
”Odds Ratio”
INTERVALO DE CONFIANZA
INFERIOR
SUPERIOR
TIPO DE
ASOCIACIÓN
MAYOR DE 1
>1
>1
NO EVIDENCIA DE
ASOCIACIÓN
SIGNIFICATIVA,
RIESGO
MAYOR DE 1
<1
>1
NO SIGNIFICATIVA
MENOR DE 1
< DE 1
< DE 1
SIGNIFICATIVA,
PROTECCIÓN
MENOR DE 1
< DE 1
> DE 1
NO SIGNIFICATIVA
1
Para el cálculo del intervalo de confianza se recurre a diferentes métodos. Uno de los más utilizado
es el Woolf que utiliza la siguiente fórmula
IC OR = Exp (Ln OR ± z. Ln (ES))
donde z =parámetro de distrib. normal y Ln(ES)= RaizCuadrada(1/a+1/b+1/c+1/d) y Exp(x) es ex
Ejemplo: Un grupo de investigadores estudian y difunden el resultado de una investigación
destinada a valorar el nivel de protección conferido por la vacuna antisarampionosa utilizando un
diseño de estudio de casos y controles. Para ello, los autores identifican a 48 niños con el
antecedente de sarampión y 48 controles, en quienes indagan por el antecedente de vacunación
previa, obteniendo los siguientes resultados:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 136 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 137-175
Asociación sarampión con antecedente de vacunación: casos y controles
ENFERMEDAD
EXPOSICIÓN
TOTAL
(SARAMPIÓN)
SI
NO
VACUNACIÓN +
34
46
80
VACUNACIÓN 14
2
16
TOTAL
48
48
96
En este caso, la "tasa de exposición a la vacuna" equivale a:
Entre los casos : ( 34/48) * 100 = 71%
Entre los controles : (46/48) * 100 = 96%
El cálculo del valor de odds ratio (OR) para este caso en particular está dado por la expresión:
OR=(34x2)/(14x46)=0.10
Respecto al intervalo de confianza para el OR calculado:
.
Ln OR = -2.30
Ln (ES)= RaizCuadrada(1/a+1/b+1/c+1/d)= RaizCuadrada(0.62)=0.789
Intervalo de confianza (IC) calculado al 95%, equivale a:
IC OR = Exp(Ln OR ± z. Ln (ES))= Exp (Ln OR ± 1,96 (0,789)) = Exp (-2.30 ± 1,55)
IC OR =
IC OR = 0,021- 0,470
Luego el intervalo en el cual se mueve el valor de OR calculado fluctúa entre 0,021 y 0,47, ambos
valores inferiores a 1, con un 95% de confianza. Por lo tanto, la asociación encontrada es de
carácter significativo e indica una disminución significativa del riesgo de contraer sarampión
en presencia del factor "vacunación" antisarampionosa.
El test de ji-cuadrado efectuado entre la variable vacunación y sarampión (en la tabla de
contingencia 2x2 tal como se indicó) arroja un valor de p=0.002 (valor de 10,8, con un grado de
libertad), lo que permite rechazar H0 (variables no asociadas) en favor de H1 (las variables están
asociadas). Esto es coincidente con lo obtenido a través del OR.
Finalmente, si quisiéramos calcular el nivel de protección conferido por esta vacuna en la población
estudiada, ésta estaría dada por la siguiente expresión:
Porcentaje de protección = 1 – OR
siendo el valor 1 el valor basal asumiendo que la vacuna no ejerce ningún tipo de protección. En
nuestro caso, se obtiene un valor de 0,9 equivalente a un 90% de protección entre los niños
estudiados en presencia del antecedente de vacunación. Los límites del intervalo de confianza
corresponderían a:
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 137 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 138-175
Límite inferior: 1 - 0,47 = 53% de protección
Límite superior: 1 - 0,021 = 97,9% de protección
En términos de notación, este resultado se expresa en términos de nivel de protección, como 90%
(Intervalo de confianza al 95%: entre: 53% - 97,9%)
Direccionalidad de la asociación estudiada
Dado que este diseño se inicia a partir de la variable dependiente y explora retrospectivamente en el
tiempo la presencia o ausencia de exposición en ambos grupos, no es posible conocer entre los casos
la tasa de incidencia de la enfermedad o daño en cuestión. Para conocer el número de casos nuevos
de la enfermedad o condición en estudio en un período de tiempo determinado se requiere iniciar un
seguimiento de individuos sanos o libres de la condición en estudio, observando la aparición de
eventos a lo largo de un período de tiempo preestablecido.
En el diseño de casos y controles, el estudio se inicia a partir de un número fijo de sujetos enfermos
o portadores de la condición a estudiar, ignorándose el momento en el cual apareció la enfermedad.
Por tanto, por definición, dada la direccionalidad del estudio (retrospectiva), no es posible el cálculo
de tasas de incidencia.
Consideración de variables de confusión
Siendo el objetivo de este diseño establecer la existencia de asociaciones entre variables, es de suma
importancia descartar que las asociaciones evaluadas no estén dadas por variables independientes
que participan indirectamente en la cadena causal pero que en último tiempo, no la explican. Nos
referimos específicamente a aquellas variables que se encuentran vinculadas simultáneamente con la
variable dependiente e independiente en estudio. Estas variables de confusión pueden dar origen al
establecimiento de asociaciones espurias, derivadas del efecto de estas variables. Para su control, se
puede recurrir a:
•
Control a priori de las variables, en la etapa de diseño del estudio (“matching”)
•
Análisis de la exposición y el “outcome” de acuerdo a los niveles o estratos que adopte la
variable de confusión (análisis estratificado),
•
Ajustando los datos, a posteriori utilizando ajuste directo o indirecto,
•
Utilizando técnicas estadísticas multivariadas (análisis multivariado), tratado en textos
avanzados como REMINGTON (1974) o SOKAL (1981),
•
En diseños experimentales, asignando aleatoriamente la exposición entre los sujetos
participantes.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 138 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 139-175
5.13. INDICES HOSPITALARIOS
Para medir la eficiencia en volumen de atención de los servicios de internación, existe un conjunto
de índices desarrollados específicamente con ese fin. A continuación damos una lista de alguno de
los mismos:
Las causas de internación se estudian a través de:
Diagnóstico principal al egreso, de acuerdo a la Clasificación Internacional de Enfermedades (CIE)
novena Revisión (8), y agrupados en los siguientes capítulos (por ejemplo): Respiratorio, Digestivo,
Neurológico, Nefro-urinario, Hemato-oncológico, Alergias-mesenquimopatías, Accidentes y
Miscelánea (enfermedades metabólicas, endocrinológicas, cardiovasculares, dermatológicas,
etcétera).
Para evaluar producción y rendimiento de un servicio hospitalario se usan siguientes indicadores:
Número de camas totales (CT) en cada año (período habitual de estudio) del organismo dedicadas a
internación
Número de camas disponibles (CD) en cada año (período habitual de estudio)es decir contando sólo
las operativas
Egresos totales incluyendo altas, pases a otros servicios y fallecidos.
Días-camas disponibles (DCD) como el número de camas disponibles (CD) por los días del período
considerado
Días-camas ocupadas (DCO) como el número de Días-camas ocupados por pacientes internados
durante los días del período considerado
Porcentaje de ocupación expresado por la relación entre los días-camas ocupadas y los días-camas
disponibles (DCO/DCD). Se calcula para el total del período así como su distribución anual y
mensual.
Tiempo de estadía definido como la duración de la internación de los pacientes en el servicio. Se
calculó la media global del período y por año. Normalmente se clasifica en cuatro categorías: < 2
días, de 3 a 7, de 8 a 15 y más de 15.
Giro cama expresado como la relación existente entre el número de pacientes que egresaron del
servicio y las camas disponibles en el período.
Reingresos. Se considera como tal si había tenido una hospitalización previa, independientemente de
la causa y del tiempo transcurrido.
Queda entendido que estos índices reflejan el volumen de atención y no la calidad de la misma. La
medición de la calidad de atención es sujeta hoy día a un profundo debate en el cual se buscan
definir parámetros que reflejen no sólo el mejoramiento de salud del público cliente del organismo o
servicio hospitalario sino además reflejar el grado de satisfacción que tienen los pacientes sobre la
atención médica recibida.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 139 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
CAPITULO 5 – Nociones de epidemiología
Pag 140-175
5.14. ANALISIS DE CURVAS DE SUPERVIVENCIA
En epidemiología descriptiva muchas veces es necesario realizar un control de sobreviva de postoperatorios, lo que suele vincularse a la eficiencia de una técnica en particular o a la calidad de
atención en ese servicio y sirve como patrón de comparación entre distintas bocas de atención
quirúrgicas. Este no es necesariamente el único uso que se les puede dar a las curvas de
supervivencia, toda vez que sea necesario controlar como evolucionan en el tiempo los individuos o
clientes de un centro de atención, este es un método adecuado para hacerlo. En esencia se trata de
un método inventarial, basado en el censo periódico de los pacientes (o clientes) del sistema. Hay
que considerar que el tema no es sencillo dado que los pacientes no se operan todos al unísono
como en un diseño experimental, las fechas de operación están distribuidas a lo largo de años de
trabajo del servicio.
El sistema se basa en el mantenimiento de un archivo (de tarjetas o base de datos por computadora)
en el cual se registra (entre otras cosas) la fecha en la cual se reporta (vivo o muerto) ese paciente.
No se descartan las fichas de los pacientes muertos. Cuando llega la oportunidad de efectuar una
estadística actualizada se procede con los siguientes pasos:
1. Clasificar los fallecidos por último registro de años completos sobrevividos, así se obtienen los
números de pacientes m0, m1, m2, … (pacientes muertos con 0,1,2, … años completos de
sobrevida)
2. Lo mismo se efectúa con los pacientes vivos según el último registro, obteniendo los números
de pacientes v0, v1, v2, … (pacientes vivos con 0, 1, 2, … años completos de sobrevida)
3. Se construye la TABLA DE SOBREVIDA siguiente:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
PACIENTES
EXPUESTOS
A
SOBREVIDA
PROBABILIDAD
DE MORIR EN
EL AÑO
TASA DE
SOBREVIDA
(%)
q0
q1
q2
q3
…
-.-
p0
p1
p2
p3
…
-.-
r0
r1
r2
r3
…
r10
AÑOS
COMPLETOS
DE
SOBREVIDA
MUERTO
VIVO
TOTAL
VIVOS (AL
COMIENZO
DEL AÑO)
0
1
2
3
…
10 O MAS
m0
m1
m2
m3
…
m10
v0
v1
v2
v3
…
v10
t0
t1
t2
t3
…
t10
ULTIMO REGISTRO
Las flechas indican la dirección de completamiento de cada columna en la tabla.
COLUMNAS:
(2) y (3) Salen del control efectuado
(4) t10 = m10 + v10; luego continuar hacia arriba t9=t10+m9+v9, t8=t9+m8+v8, …
(5) qi = ti – vi/2; para todas las filas salvo la final
(6) pi = mi / vi; para todas las filas salvo la final
(7) r=100 y luego para todas las filas ri = ri-1(1- pi-1)
4. Por último se grafican los datos de la TABLA DE SOBREVIDA (Columna 7 vs. Columna 1)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 140 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 141-175
APÉNDICE: TABLAS ESTADISTICAS
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 141 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 142-175
TABLA I: Numeros Aleatorios
39634
14595
30734
64628
42831
62349
35050
71571
89126
95113
74088
40469
83722
91254
43511
65564
27478
79712
24090
42082
16379
44526
25775
25752
15140
19713
67331
65178
03091
34733
39153
93365
07763
39411
68076
69459
54526
82928
73146
18292
17986
22356
31131
06089
69486
24537
93208
30196
15630
80468
80583
00209
05409
95836
65358
70361
90404
20830
22530
70469
41047
99457
01911
91785
87149
26792
72570
60767
80210
89509
78466
42194
55248
34361
72176
03395
49043
79253
52228
18103
17635
24330
12317
33869
55169
09697
14939
84120
94332
79954
82447
09865
77772
83868
72002
31405
45906
50103
61672
20582
72249
41692
61885
48917
88378
04037
40581
50796
48129
84299
36192
93050
96822
48624
12193
40221
48734
82002
48248
03785
14918
34652
07973
91465
49314
53437
41577
52925
54898
39761
60571
04631
75467
61220
99132
40995
49184
86013
18721
28775
55006
39295
98072
67387
45276
10694
81776
91942
66575
91816
77800
24028
86558
78545
14969
25734
03405
84750
49201
64623
09801
01178
43994
05329
82780
92087
06316
01760
14182
35686
02955
81916
96205
10971
30941
12872
40170
27937
90472
14622
89848
53665
45416
44682
04126
48579
87202
71964
39304
25498
06028
88638
52261
19819
95452
13827
47121
30781
55799
63937
58697
38449
62134
72749
81638
31973
46438
87244
13347
36566
06303
91579
73348
65030
42709
94202
01907
80114
26128
33717
62287
72146
78490
49067
59943
56164
05764
64735
27904
12027
79157
22400
31010
49953
46547
98375
94490
66975
74674
61303
24558
49833
28652
94617
46699
99241
09258
36166
13317
76243
46574
11873
13862
08312
11071
79670
57196
72778
27886
44430
10342
32209
09949
82321
94664
89543
67663
23096
28666
91294
75030
07990
01791
72998
35163
23428
12288
19472
22514
05494
29541
59245
14634
51054
32882
32501
83638
31690
22940
23904
89422
23642
36602
31842
41340
87474
61715
62943
54245
61185
82509
07426
57696
08074
20128
11842
67341
25592
89810
53721
86963
80314
91221
48521
01518
50307
58910
95386
90740
40699
07510
93948
15857
02687
20849
32545
85738
84645
83117
04710
90717
69444
89659
74920
38989
46856
09370
80535
25954
91322
86079
58194
93233
99629
56057
13769
28207
82798
78978
58573
00190
23798
85306
99719
95970
27157
55425
57995
36036
81452
83208
32454
68222
74274
48873
79446
34611
39055
53901
00784
92987
39605
43890
34643
58347
61357
39981
36956
06157
40269
38752
74691
84861
89500
11880
55424
40836
63624
57514
43395
94518
30812
04961
93977
28249
45205
38563
55439
42403
38743
56651
71499
66660
35483
09262
91460
80220
78443
84563
25041
92462
35750
47545
79956
57862
98566
67337
70736
88618
19203
72062
47556
65419
54619
86103
18556
55272
77489
24853
02800
55052
55249
70831
59783
23198
47614
79100
73237
47537
70639
80044
34014
14970
88822
43757
60015
17037
23129
47227
52064
15502
63006
22617
60684
94628
36243
20667
26922
98736
93492
56944
29630
23633
22731
72197
74196
18387
98168
72376
34526
11016
82927
32839
49551
10422
47992
92682
42724
04266
55226
83321
50480
31717
06183
87063
36844
74759
35929
84547
14437
95655
19689
30727
37418
57439
37905
27553
38385
80532
33802
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 142 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 143-175
TABLA II: Distribucion Normal (z)
P(0 z a)
a
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
0.00
0.0000
0.0398
0.0793
0.1179
0.1554
0.1915
0.2257
0.2580
0.2881
0.3159
0.3413
0.3643
0.3849
0.4032
0.4192
0.4332
0.4452
0.4554
0.4641
0.4713
0.4772
0.4821
0.4861
0.4893
0.4918
0.4938
0.4953
0.4965
0.4974
0.4981
0.4987
0.01
0.0040
0.0438
0.0832
0.1217
0.1591
0.1950
0.2291
0.2611
0.2910
0.3186
0.3438
0.3665
0.3869
0.4049
0.4207
0.4345
0.4463
0.4564
0.4649
0.4719
0.4778
0.4826
0.4864
0.4896
0.4920
0.4940
0.4955
0.4966
0.4975
0.4982
0.4987
0.02
0.0080
0.0478
0.0871
0.1255
0.1628
0.1985
0.2324
0.2642
0.2939
0.3212
0.3461
0.3686
0.3888
0.4066
0.4222
0.4357
0.4474
0.4573
0.4656
0.4726
0.4783
0.4830
0.4868
0.4898
0.4922
0.4941
0.4956
0.4967
0.4976
0.4982
0.4987
0.03
0.0120
0.0517
0.0910
0.1293
0.1664
0.2019
0.2357
0.2673
0.2967
0.3238
0.3485
0.3708
0.3907
0.4082
0.4236
0.4370
0.4484
0.4582
0.4664
0.4732
0.4788
0.4834
0.4871
0.4901
0.4925
0.4943
0.4957
0.4968
0.4977
0.4983
0.4988
0.04
0.0160
0.0557
0.0948
0.1331
0.1700
0.2054
0.2389
0.2704
0.2995
0.3264
0.3508
0.3729
0.3925
0.4099
0.4251
0.4382
0.4495
0.4591
0.4671
0.4738
0.4793
0.4838
0.4875
0.4904
0.4927
0.4945
0.4959
0.4969
0.4977
0.4984
0.4988
0.05
0.0199
0.0596
0.0987
0.1368
0.1736
0.2088
0.2422
0.2734
0.3023
0.3289
0.3531
0.3749
0.3944
0.4115
0.4265
0.4394
0.4505
0.4599
0.4678
0.4744
0.4798
0.4842
0.4878
0.4906
0.4929
0.4946
0.4960
0.4970
0.4978
0.4984
0.4989
0.06
0.0239
0.0636
0.1026
0.1406
0.1772
0.2123
0.2454
0.2764
0.3051
0.3315
0.3554
0.3770
0.3962
0.4131
0.4279
0.4406
0.4515
0.4608
0.4686
0.4750
0.4803
0.4846
0.4881
0.4909
0.4931
0.4948
0.4961
0.4971
0.4979
0.4985
0.4989
0.07
0.0279
0.0675
0.1064
0.1443
0.1808
0.2157
0.2486
0.2794
0.3078
0.3340
0.3577
0.3790
0.3980
0.4147
0.4292
0.4418
0.4525
0.4616
0.4693
0.4756
0.4808
0.4850
0.4884
0.4911
0.4932
0.4949
0.4962
0.4972
0.4979
0.4985
0.4989
0.08
0.0319
0.0714
0.1103
0.1480
0.1844
0.2190
0.2517
0.2823
0.3106
0.3365
0.3599
0.3810
0.3997
0.4162
0.4306
0.4429
0.4535
0.4625
0.4699
0.4761
0.4812
0.4854
0.4887
0.4913
0.4934
0.4951
0.4963
0.4973
0.4980
0.4986
0.4990
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
0.09
0.0359
0.0753
0.1141
0.1517
0.1879
0.2224
0.2549
0.2852
0.3133
0.3389
0.3621
0.3830
0.4015
0.4177
0.4319
0.4441
0.4545
0.4633
0.4706
0.4767
0.4817
0.4857
0.4890
0.4916
0.4936
0.4952
0.4964
0.4974
0.4981
0.4986
0.4990
Página 143 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 144-175
TABLA III: Distribucion t-Student (test de dos colas)
Grados de
Libertad (ν)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
60
120
∞
Probabilidad conforme a H0 que el |t| calculado > límite tabulado
0.10
6.31
2.92
2.35
2.13
2.02
1.94
1.89
1.86
1.83
1.81
1.80
1.78
1.77
1.76
1.75
1.75
1.74
1.73
1.73
1.72
1.72
1.72
1.71
1.71
1.71
1.71
1.70
1.70
1.70
1.70
1.67
1.66
1.65
0.05
12.71
4.30
3.18
2.78
2.57
2.45
2.37
2.31
2.26
2.23
2.20
2.18
2.16
2.14
2.13
2.12
2.11
2.10
2.09
2.09
2.08
2.07
2.07
2.06
2.06
2.06
2.05
2.05
2.05
2.04
2.00
1.98
1.96
0.01
63.66
9.93
5.84
4.60
4.03
3.71
3.50
3.36
3.25
3.17
3.11
3.06
3.01
2.98
2.95
2.92
2.90
2.88
2.86
2.85
2.83
2.82
2.82
2.80
2.79
2.78
2.77
2.76
2.76
2.75
2.66
2.62
2.58
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
0.001
636.62
31.60
12.92
8.61
6.87
5.96
5.41
5.04
4.78
4.59
4.44
4.32
4.22
4.14
4.07
4.02
3.97
3.92
3.88
3.85
3.82
3.79
3.77
3.75
3.73
3.71
3.69
3.67
3.66
3.65
3.46
3.37
3.29
Página 144 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 145-175
TABLA IV: Distribución F-Snedecor (p=0.05)
ν2 = Grados de libertad en el denominador
ν1 = Grados de libertad en el numerador
ν1
1
2
3
4
5
6
7
8
9
10
12
15
20
24
30
40
60
120
∞
ν2
1
2
3
4
5
161,4
18,51
10,13
7,71
6,61
199,5
19,00
9,55
6,94
5,79
215,7
19,16
9,28
6,59
5,41
224,6
19,25
9,12
6,39
5,19
230,2
19,30
9,01
6,26
5,05
234,0
19,33
8,94
6,16
4,95
236,8
19,35
8,89
6,09
4,88
238,9
19,37
8,85
6,04
4,82
240,5
19,38
8,81
6,00
4,77
241,9
19,40
8,79
5,96
4,74
243,9
19,41
8,74
5,91
4,68
245,9
19,43
8,70
5,86
4,62
248,0
19,45
8,66
5,80
4,56
249,1
19,45
8,64
5,77
4,53
250,1
19,46
8,62
5,75
4,50
251,1
19,47
8,59
5,72
4,46
252,2
19,48
8,57
5,69
4,43
253,3
19,49
8,55
5,66
4,40
254,3
19,50
8,53
5,63
4,37
6
7
8
9
10
5,99
5,59
5,32
5,12
4,96
5,14
4,74
4,46
4,26
4,10
4,76
4,35
4,07
3,86
3,71
4,53
4,12
3,84
3,63
3,48
4,39
3,97
3,69
3,48
3,33
4,28
3,87
3,58
3,37
3,22
4,21
3,79
3,50
3,29
3,14
4,15
3,73
3,44
3,23
3,07
4,10
3,68
3,39
3,18
3,02
4,06
3,64
3,35
3,14
2,98
4,00
3,57
3,28
3,07
2,91
3,94
3,51
3,22
3,01
2,85
3,87
3,44
3,15
2,94
2,77
3,84
3,41
3,12
2,90
2,74
3,81
3,38
3,08
2,86
2,70
3,77
3,34
3,04
2,83
2,66
3,74
3,30
3,01
2,79
2,62
3,70
3,27
2,97
2,75
2,58
3,67
3,23
2,93
2,71
2,54
11
12
13
14
15
4,84
4,75
4,67
4,60
4,54
3,98
3,89
3,81
3,74
3,68
3,59
3,49
3,41
3,34
3,29
3,36
3,26
3,18
3,11
3,06
3,20
3,11
3,03
2,96
2,90
3,09
3,00
2,92
2,85
2,79
3,01
2,91
2,83
2,76
2,71
2,95
2,85
2,77
2,70
2,64
2,90
2,80
2,71
2,65
2,59
2,85
2,75
2,67
2,60
2,54
2,79
2,69
2,60
2,53
2,48
2,72
2,62
2,53
2,46
2,40
2,65
2,54
2,46
2,39
2,33
2,61
2,51
2,42
2,35
2,29
2,57
2,47
2,38
2,31
2,25
2,53
2,43
2,34
2,27
2,20
2,49
2,38
2,30
2,22
2,16
2,45
2,34
2,25
2,18
2,11
2,41
2,30
2,21
2,13
2,07
16
17
18
19
20
4,49
4,45
4,41
4,38
4,35
3,63
3,59
3,55
3,52
3,49
3,24
3,20
3,16
3,13
3,10
3,01
2,96
2,93
2,90
2,87
2,85
2,81
2,77
2,74
2,71
2,74
2,70
2,66
2,63
2,60
2,66
2,61
2,58
2,54
2,51
2,59
2,55
2,51
2,48
2,45
2,54
2,49
2,46
2,42
2,39
2,49
2,45
2,41
2,38
2,35
2,42
2,38
2,34
2,31
2,28
2,35
2,31
2,27
2,23
2,20
2,28
2,23
2,19
2,16
2,12
2,24
2,19
2,15
2,11
2,08
2,19
2,15
2,11
2,07
2,04
2,15
2,10
2,06
2,03
1,99
2,11
2,06
2,02
1,98
1,95
2,06
2,01
1,97
1,93
1,90
2,01
1,96
1,92
1,88
1,84
21
22
23
24
25
4,32
4,30
4,28
4,26
4,24
3,47
3,44
3,42
3,40
3,39
3,07
3,05
3,03
3,01
2,99
2,84
2,82
2,80
2,78
2,76
2,68
2,66
2,64
2,62
2,60
2,57
2,55
2,53
2,51
2,49
2,49
2,46
2,44
2,42
2,40
2,42
2,40
2,37
2,36
2,34
2,37
2,34
2,32
2,30
2,28
2,32
2,30
2,27
2,25
2,24
2,25
2,23
2,20
2,18
2,16
2,18
2,15
2,13
2,11
2,09
2,10
2,07
2,05
2,03
2,01
2,05
2,03
2,01
1,98
1,96
2,01
1,98
1,96
1,94
1,92
1,96
1,94
1,91
1,89
1,87
1,92
1,89
1,86
1,84
1,82
1,87
1,84
1,81
1,79
1,77
1,81
1,78
1,76
1,73
1,71
26
27
28
29
30
4,23
4,21
4,20
4,18
4,17
3,37
3,35
3,34
3,33
3,32
2,98
2,96
2,95
2,93
2,92
2,74
2,73
2,71
2,70
2,69
2,59
2,57
2,56
2,55
2,53
2,47
2,46
2,45
2,43
2,42
2,39
2,37
2,36
2,35
2,33
2,32
2,31
2,29
2,28
2,27
2,27
2,25
2,24
2,22
2,21
2,22
2,20
2,19
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,07
2,06
2,04
2,03
2,01
1,99
1,97
1,96
1,94
1,93
1,95
1,93
1,91
1,90
1,89
1,90
1,88
1,87
1,85
1,84
1,85
1,84
1,82
1,81
1,79
1,80
1,79
1,77
1,75
1,74
1,75
1,73
1,71
1,70
1,68
1,69
1,67
1,65
1,64
1,62
40
60
120
4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58
4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47
3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35
1,51
1,39
1,26
3,84 3,00 2,61
1,03
∞
2,4
2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,40 1,32 1,22
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 145 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 146-175
TABLA V: Distribución F-Snedecor (p=0.01)
ν1 = Grados de libertad en el numerador
ν1
ν2 = Grados de libertad en el denominador
4
5
6
7
8
9
10
12
15
20
24
30
40
60
120
∞
5404
99,16
29,46
16,69
12,06
5624
99,25
28,71
15,98
11,39
5764
99,30
28,24
15,52
10,97
5859
99,33
27,91
15,21
10,67
5928
99,36
27,67
14,98
10,46
5981
99,38
27,49
14,80
10,29
6022
99,39
27,34
14,66
10,16
6056
99,40
27,23
14,55
10,05
6107
99,42
27,05
14,37
9,89
6157
99,43
26,87
14,20
9,72
6209
99,45
26,69
14,02
9,55
6234
99,46
26,60
13,93
9,47
6260
99,47
26,50
13,84
9,38
6286
99,48
26,41
13,75
9,29
6313
99,48
26,32
13,65
9,20
6340
99,49
26,22
13,56
9,11
6366
99,50
26,13
13,46
9,02
10,92
9,55
8,65
8,02
7,56
9,78
8,45
7,59
6,99
6,55
9,15
7,85
7,01
6,42
5,99
8,75
7,46
6,63
6,06
5,64
8,47
7,19
6,37
5,80
5,39
8,26
6,99
6,18
5,61
5,20
8,10
6,84
6,03
5,47
5,06
7,98
6,72
5,91
5,35
4,94
7,87
6,62
5,81
5,26
4,85
7,72
6,47
5,67
5,11
4,71
7,56
6,31
5,52
4,96
4,56
7,40
6,16
5,36
4,81
4,41
7,31
6,07
5,28
4,73
4,33
7,23
5,99
5,20
4,65
4,25
7,14
5,91
5,12
4,57
4,17
7,06
5,82
5,03
4,48
4,08
6,97
5,74
4,95
4,40
4,00
6,88
5,65
4,86
4,31
3,91
9,65
9,33
9,07
8,86
8,68
7,21
6,93
6,70
6,51
6,36
6,22
5,95
5,74
5,56
5,42
5,67
5,41
5,21
5,04
4,89
5,32
5,06
4,86
4,69
4,56
5,07
4,82
4,62
4,46
4,32
4,89
4,64
4,44
4,28
4,14
4,74
4,50
4,30
4,14
4,00
4,63
4,39
4,19
4,03
3,89
4,54
4,30
4,10
3,94
3,80
4,40
4,16
3,96
3,80
3,67
4,25
4,01
3,82
3,66
3,52
4,10
3,86
3,66
3,51
3,37
4,02
3,78
3,59
3,43
3,29
3,94
3,70
3,51
3,35
3,21
3,86
3,62
3,43
3,27
3,13
3,78
3,54
3,34
3,18
3,05
3,69
3,45
3,25
3,09
2,96
3,60
3,36
3,17
3,01
2,87
16
17
18
19
20
8,53
8,40
8,29
8,18
8,10
6,23
6,11
6,01
5,93
5,85
5,29
5,19
5,09
5,01
4,94
4,77
4,67
4,58
4,50
4,43
4,44
4,34
4,25
4,17
4,10
4,20
4,10
4,01
3,94
3,87
4,03
3,93
3,84
3,77
3,70
3,89
3,79
3,71
3,63
3,56
3,78
3,68
3,60
3,52
3,46
3,69
3,59
3,51
3,43
3,37
3,55
3,46
3,37
3,30
3,23
3,41
3,31
3,23
3,15
3,09
3,26
3,16
3,08
3,00
2,94
3,18
3,08
3,00
2,92
2,86
3,10
3,00
2,92
2,84
2,78
3,02
2,92
2,84
2,76
2,69
2,93
2,83
2,75
2,67
2,61
2,84
2,75
2,66
2,58
2,52
2,75
2,65
2,57
2,49
2,42
21
22
23
24
25
8,02
7,95
7,88
7,82
7,77
5,78
5,72
5,66
5,61
5,57
4,87
4,82
4,76
4,72
4,68
4,37
4,31
4,26
4,22
4,18
4,04
3,99
3,94
3,90
3,85
3,81
3,76
3,71
3,67
3,63
3,64
3,59
3,54
3,50
3,46
3,51
3,45
3,41
3,36
3,32
3,40
3,35
3,30
3,26
3,22
3,31
3,26
3,21
3,17
3,13
3,17
3,12
3,07
3,03
2,99
3,03
2,98
2,93
2,89
2,85
2,88
2,83
2,78
2,74
2,70
2,80
2,75
2,70
2,66
2,62
2,72
2,67
2,62
2,58
2,54
2,64
2,58
2,54
2,49
2,45
2,55
2,50
2,45
2,40
2,36
2,46
2,40
2,35
2,31
2,27
2,36
2,31
2,26
2,21
2,17
26
27
28
29
30
7,72
7,68
7,64
7,60
7,56
5,53
5,49
5,45
5,42
5,39
4,64
4,60
4,57
4,54
4,51
4,14
4,11
4,07
4,04
4,02
3,82
3,78
3,75
3,73
3,70
3,59
3,56
3,53
3,50
3,47
3,42
3,39
3,36
3,33
3,30
3,29
3,26
3,23
3,20
3,17
3,18
3,15
3,12
3,09
3,07
3,09
3,06
3,03
3,00
2,98
2,96
2,93
2,90
2,87
2,84
2,81
2,78
2,75
2,73
2,70
2,66
2,63
2,60
2,57
2,55
2,58
2,55
2,52
2,49
2,47
2,50
2,47
2,44
2,41
2,39
2,42
2,38
2,35
2,33
2,30
2,33
2,29
2,26
2,23
2,21
2,23
2,20
2,17
2,14
2,11
2,13
2,10
2,07
2,04
2,01
40
60
120
7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92
7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73
6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53
1,81
1,60
1,38
∞
6,64 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,19 2,04 1,88 1,79 1,70 1,59 1,48 1,33
1,05
1
2
ν2
1
2
3
4
5
4052
98,50
34,12
21,20
16,26
4999
99,00
30,82
18,00
13,27
6
7
8
9
10
13,75
12,25
11,26
10,56
10,04
11
12
13
14
15
3
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 146 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 147-175
TABLA VI: Distribución χ2-ji cuadrado (dos colas)
probabilidad conforme a H0 que χ2 calculado > límite tabulado
g.de l.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
p= 0.05 p = 0.01 p = 0.001
3.84
5.99
7.82
9.49
11.07
12.59
14.07
15.51
16.92
18.31
19.68
21.03
22.36
23.69
25.00
26.30
27.59
28.87
30.14
31.41
32.67
33.92
35.17
36.42
37.65
38.89
40.11
41.34
42.56
43.77
6.64
9.21
11.35
13.28
15.09
16.81
18.48
20.09
21.67
23.21
24.73
26.22
27.69
29.14
30.58
32.00
33.41
34.81
36.19
37.57
38.93
40.29
41.64
42.98
44.31
45.64
46.96
48.28
49.59
50.89
10.83
13.82
16.27
18.47
20.52
22.46
24.32
26.13
27.88
29.59
31.26
32.91
34.53
36.12
37.70
39.25
40.79
42.31
43.82
45.32
46.80
48.27
49.73
51.18
52.62
54.05
55.48
56.89
58.30
59.70
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 147 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 148-175
(cont.)
g.de l.
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
p= 0.05 p = 0.01 p = 0.001
44.99
46.19
47.40
48.60
49.80
51.00
52.19
53.38
54.57
55.76
56.94
58.12
59.30
60.48
61.66
62.83
64.00
65.17
66.34
67.51
68.67
69.83
70.99
72.15
73.31
74.47
75.62
76.78
77.93
79.08
80.23
81.38
82.53
83.68
84.82
52.19
53.49
54.78
56.06
57.34
58.62
59.89
61.16
62.43
63.69
64.95
66.21
67.46
68.71
69.96
71.20
72.44
73.68
74.92
76.15
77.39
78.62
79.84
81.07
82.29
83.52
84.73
85.95
87.17
88.38
89.59
90.80
92.01
93.22
94.42
61.10
62.49
63.87
65.25
66.62
67.99
69.35
70.71
72.06
73.41
74.75
76.09
77.42
78.75
80.08
81.40
82.72
84.03
85.35
86.66
87.97
89.27
90.57
91.88
93.17
94.47
95.75
97.03
98.34
99.62
100.88
102.15
103.46
104.72
105.97
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 148 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 149-175
(cont.)
g.de l.
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
p= 0.05 p = 0.01 p = 0.001
85.97
87.11
88.25
89.39
90.53
91.67
92.81
93.95
95.08
96.22
97.35
98.49
99.62
100.75
101.88
103.01
104.14
105.27
106.40
107.52
108.65
109.77
110.90
112.02
113.15
114.27
115.39
116.51
117.63
118.75
119.87
120.99
122.11
123.23
124.34
95.63
96.83
98.03
99.23
100.42
101.62
102.82
104.01
105.20
106.39
107.58
108.77
109.96
111.15
112.33
113.51
114.70
115.88
117.06
118.24
119.41
120.59
121.77
122.94
124.12
125.29
126.46
127.63
128.80
129.97
131.14
132.31
133.47
134.64
135.81
107.26
108.54
109.79
111.06
112.31
113.56
114.84
116.08
117.35
118.60
119.85
121.11
122.36
123.60
124.84
126.09
127.33
128.57
129.80
131.04
132.28
133.51
134.74
135.96
137.19
138.45
139.66
140.90
142.12
143.32
144.55
145.78
146.99
148.21
149.48
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 149 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 150-175
TABLA VII: Probabilidad Binomial Acumulada (para H0: p =q = 0,5)
Muestras pequeñas ( n < 26) (prueba de una cola)
x
n
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
0
1
2
3
4
5
6
31 188 500 812 969
16 109 344 656 891 984
8 62 227 500 773 938 992
4 35 145 363 637 855 965
2 20 90 254 500 746 910
1 11 55 172 377 623 828
6
33 113 274 500 726
3
19 73 194 387 613
2
11 46 133 291 500
1
6
29 90 212 395
4
18 59 151 304
2
11 38 105 227
1
6
25 72 166
1
4
15 48 119
2
10 32 84
1
6
21 58
1
4
13 39
2
8
26
1
5
17
1
3
11
2
7
7
8
9
10
11
12
13
14
15
996
980
945
887
806
709
605
500
402
315
240
180
132
95
67
47
32
22
998
989
967
927
867
788
696
598
500
407
324
252
192
143
105
76
54
999
994
981
954
910
849
773
685
593
500
412
332
262
202
154
115
997
989
971
941
895
834
760
676
588
500
416
339
271
212
998
994
982
962
928
881
820
748
668
584
500
419
345
999
996
989
975
952
916
868
808
738
661
581
500
998
994
985
968
942
905
857
798
729
655
999
996
990
970
961
933
895
846
788
999
998
994
987
974
953
924
885
NOTA: Los valores de probabilidad se obtienen dividiendo por 1000 los de cada celda.
Ejemplo: Si n = 23 y x = 7 la probabilidad binomial acumulada p(x≤7|N=23) es 47/1000 = 0,047
Para valores de N>25, usar z =
( x ± 0.5) − 0.5 N
0.5 N
; distribuida normalmente N(0,1) (Usar signo + si x<0.5N)
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 150 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 151-175
TABLA VIII: Prueba de rangos señalados de Wilcoxon
Niveles de significación
de una cola
0,025
0,01
0,005
Niveles de significación
de dos colas
N
0,05
0,02
0,01
6
0
7
2
0
8
4
2
0
9
6
3
2
10
8
5
3
11
11
7
5
12
14
10
7
13
17
13
10
14
21
16
13
15
25
20
16
16
30
24
20
17
35
28
23
18
40
33
28
19
46
38
32
20
52
43
38
21
59
49
43
22
66
56
49
23
73
62
55
24
81
69
61
25
89
77
68
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 151 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 152-175
TABLA IX: Prueba U de Mann-Whitney (rango n2 3-8)
(ensayo de una cola)
n2 = 3
U
0
1
2
3
4
5
1
0,25
0,5
0,75
n1
2
0,1
0,2
0,4
0,6
n2 = 4
3
0,05
0,1
0,2
0,35
0,5
0,65
U
0
1
2
3
4
5
6
7
8
1
0,2
0,4
0,6
n1
2
0,067
0,133
0,267
0,4
0,6
n2 = 5
U
0
1
2
3
4
5
6
7
8
9
10
11
12
13
n1
1
2
3
4
5
0,167 0,047 0,018 0,008 0,004
0,333 0,095 0,036 0,016 0,008
0,5
0,19 0,071 0,032 0,016
0,667 0,286 0,125 0,055 0,028
0,429 0,196 0,095 0,048
0,571 0,286 0,143 0,075
0,393 0,206 0,111
0,5 0,278 0,155
0,607 0,365 0,21
0,452 0,274
0,548 0,345
0,421
0,5
0,579
3
0,028
0,057
0,114
0,2
0,314
0,429
0,571
4
0,014
0,029
0,057
0,1
0,171
0,243
0,343
0,443
0,557
n2 = 6
U
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1
0,143
0,286
0,428
0,571
2
0,036
0,071
0,143
0,214
0,321
0,429
0,571
n1
3
0,012
0,024
0,048
0,083
0,131
0,19
0,274
0,357
0,452
0,548
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
4
0,005
0,01
0,019
0,033
0,057
0,086
0,129
0,176
0,238
0,305
0,381
0,457
0,545
5
0,002
0,004
0,009
0,015
0,026
0,041
0,063
0,089
0,123
0,165
0,214
0,268
0,331
0,396
0,465
0,535
Página 152 -175
6
0,001
0,002
0,004
0,008
0,013
0,021
0,032
0,047
0,066
0,09
0,12
0,155
0,197
0,242
0,294
0,35
0,409
0,469
0,531
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
U
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
1
0,125
0,25
0,375
0,5
0,625
2
0,028
0,56
0,111
0,067
0,25
0,333
0,444
0,556
3
0,008
0,017
0,033
0,058
0,092
0,133
0,192
0,258
0,333
0,417
0,5
0,583
n1
4
0,003
0,006
0,012
0,021
0,036
0,055
0,082
0,115
0,158
0,206
0,264
0,324
0,394
0,464
0,538
5
0,001
0,003
0,005
0,009
0,015
0,024
0,037
0,053
0,074
0,201
0,134
0,172
0,216
0,265
0,319
0,378
0,438
0,5
0,562
6
0,001
0,001
0,002
0,004
0,007
0,011
0,17
0,026
0,037
0,051
0,069
0,09
0,117
0,147
0,183
0,223
0,267
0,314
0,365
0,418
0,473
0,527
7
0
0,001
0,001
0,002
0,003
0,006
0,009
0,013
0,019
0,027
0,036
0,049
0,064
0,082
0,104
0,13
0,159
0,191
0,228
0,267
0,31
0,355
0,402
0,451
0,5
0,549
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Pag 153-175
n2 =7
Página 153 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 154-175
n2 = 8
n1
U 1
2
3
4
5
6
7
8
t Normal
0
0 3,308 0,001
0 0,11 0,022 0,006 0,002 0,001 0
0 3,203 0,001
1 0,022 0,044 0,012 0,004 0,002 0,001 0
2 0,333 0,089 0,024 0,008 0,003 0,001 0,001 0 3,098 0,001
3 0,444 0,133 0,042 0,014 0,005 0,002 0,001 0 2,993 0,001
4 0,556 0,2 0,067 0,024 0,009 0,004 0,002 0 2,888 0,002
0,267 0,097 0,036 0,015 0,006 0,003 0 2,783 0,003
5
0,356 0,139 0,055 0,023 0,01 0,005 0 2,678 0,004
6
0,444 0,188 0,077 0,033 0,015 0,007 0 2,573 0,005
7
0,556 0,248 0,107 0,047 0,021 0,01 0,01 2,468 0,007
8
0,315 0,141 0,064 0,03 0,014 0,01 2,363 0,009
9
0,387 0,184 0,085 0,041 0,02 0,01 2,258 0,012
10
0,461 0,23 0,111 0,054 0,027 0,01 2,153 0,016
11
0,539 0,285 0,142 0,071 0,036 0,02 2,048 0,02
12
0,341 0,177 0,091 0,047 0,03 1,943 0,026
13
0,404 0,217 0,114 0,06 0,03 1,838 0,033
14
0,467 0,262 0,141 0,076 0,04 1,733 0,041
15
0,533 0,311 0,172 0,095 0,05 1,628 0,052
16
17
0,362 0,207 0,116 0,07 1,523 0,064
0,416 0,245 0,14 0,08 1,418 0,068
18
0,472 0,286 0,168 0,1 1,313 0,094
19
0,528 0,331 0,198 0,12 1,208 0,113
20
0,377 0,232 0,14 1,102 0,135
21
22
0,426 0,268 0,16 0,998 0,159
0,475 0,306 0,19 0,893 0,185
23
0,525 0,347 0,22 0,788 0,215
24
0,389 0,25 0,683 0,247
25
0,433 0,29 0,578 0,282
26
27
0,478 0,32 0,473 0,318
0,522 0,36 0,668 0,356
28
0,4 0,263 0,396
29
0,44 0,158 0,437
30
0,48 0,052 0,481
31
0,52
32
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 154 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 155-175
TABLA X: Prueba U de Mann-Whitney (rango n2 9-20)
(ensayo de una y dos colas)
Valores críticos de U para una cola : α = 0,025 y para dos colas: α = 0,05
n1
9
10
11
12
13
14
15
16
17
18
19
20
0
2
4
7
10
12
15
17
20
23
26
28
31
34
37
39
42
45
48
0
3
5
8
11
14
17
20
23
26
29
33
36
39
42
45
48
52
55
0
3
6
9
13
16
19
23
26
30
33
37
40
44
47
51
55
58
62
1
4
7
11
14
18
22
26
29
33
37
41
45
49
53
57
61
65
69
1
4
8
12
16
20
24
28
33
37
41
45
50
54
59
63
67
72
76
1
5
9
13
17
22
26
31
36
40
45
50
55
59
64
67
74
78
83
1
5
10
14
19
24
29
34
39
44
49
54
59
64
70
75
80
85
90
1
6
11
15
21
26
31
37
42
47
53
59
64
70
75
81
86
92
98
2
6
11
17
22
28
34
39
45
51
57
63
67
75
81
87
93
99
105
2
7
12
18
24
30
36
42
48
55
61
67
74
80
86
93
99
106
112
2
7
13
19
25
32
38
45
52
58
65
72
78
85
92
99
106
113
119
2
8
13
20
27
34
41
48
55
62
69
76
83
90
98
105
112
119
127
n2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 155 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 156-175
Valores críticos de U para una cola : α = 0,05 y para dos colas: α = 0,10
n1
9
10
11
12
13
14
15
16
17
18
19
20
1
3
6
9
12
15
18
21
24
27
30
33
36
39
42
45
48
51
54
1
4
7
11
14
17
20
24
27
31
34
37
41
44
48
51
55
58
62
1
5
8
12
16
19
23
27
31
34
38
42
46
50
54
57
61
65
69
2
5
9
13
17
21
26
30
34
38
42
47
51
55
60
64
68
72
77
2
6
10
15
19
24
28
33
37
42
47
51
56
61
65
70
75
80
84
2
7
11
15
21
26
31
36
41
46
51
56
61
66
71
77
82
87
92
3
7
12
18
23
28
33
39
44
50
55
61
66
72
77
83
88
94
100
3
8
14
19
25
30
36
42
48
54
60
65
71
77
83
89
95
101
107
3
9
15
20
26
33
39
45
51
57
64
70
77
83
89
96
102
109
115
4
9
16
22
28
35
41
48
55
61
68
75
82
88
95
102
109
116
123
4
10
17
23
30
37
44
51
58
65
72
80
87
94
101
109
116
123
130
4
11
18
25
32
39
47
54
62
69
77
84
92
100
107
115
123
130
138
n2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 156 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 157-175
TABLA XI: Prueba de dos muestras de Kolmogorov-Smirnov
Valores críticos para Kα
N
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
Una Cola
α = 0.05 α = 0.01
3
4
4
5
5
5
6
6
6
6
7
7
7
7
8
8
8
8
8
9
9
9
9
9
9
10
10
10
11
11
5
6
6
6
7
7
8
8
8
8
9
9
9
10
10
10
10
11
11
11
11
11
12
12
12
12
13
14
Dos Colas
α = 0.05 α = 0.01
4
5
5
6
6
6
7
7
7
7
8
8
8
8
9
9
9
9
9
10
10
10
10
10
11
11
11
12
13
5
6
6
7
7
8
8
8
9
9
9
10
10
10
10
11
11
11
11
12
12
12
12
13
13
13
14
14
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 157 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 158-175
Prueba de dos muestras de Kolmogorov-Smirnov (cont.)
Para muestras grandes (n > 40)
α
Valores de D > D máx
para rechazar Ho
0,10
1.22 H
0,05
1,36 H
0,025
1,48 H
0,01
1,63 H
0,005
1,73 H
0,001
1,95 H
Donde el factor es: H2 = (ν1 + ν2) / (ν1 ν2)
Las muestras pueden ser iguales o distintas
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 158 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 159-175
Tabla de valores críticos de D (máxima discrepancia de frecuencias acumuladas) para una
prueba de una muestra de KOLMOGOROV-SMIRNOV
(prueba de dos colas)
Tamaño
de la
muestra
(N)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
Más de
35
Nivel de significación
para D
0.05
0.01
0.975
0.842
0.708
0.624
0.565
0.521
0.486
0.457
0.432
0.410
0.391
0.375
0.361
0.349
0.338
0.328
0.318
0.309
0.301
0.294
0.27
0.24
0.23
0.995
0.929
0.828
0.733
0.669
0.618
0.577
0.543
0.514
0.490
0.468
0.450
0.433
0.418
0.404
0.392
0.381
0.371
0.363
0.356
0.32
0.29
0.27
1.36 / N
1.63 / N
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 159 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 160-175
TABLA XII: Prueba de rachas de Wald-Wolfowitz
Prueba de rachas para una muestra: α = 0,05 (dos colas)
Tabla para Ho de menor o igual (todo r ≤ límite tabulado es significativo 5%)
n2
n1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2
2
2
2
2
2
2
2
2
2
3
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
4
2
2
2
3
3
3
3
3
3
3
3
4
4
4
4
4
5
2
2
3
3
3
3
3
4
4
4
4
4
4
4
5
5
5
6
2
2
3
3
3
3
4
4
4
4
5
5
5
5
5
5
6
6
7
2
2
3
3
3
4
4
5
5
5
5
5
6
6
6
6
6
6
8
2
3
3
3
4
4
5
5
5
6
6
6
6
6
7
7
7
7
9
2
3
3
4
4
5
5
5
6
6
6
7
7
7
7
8
8
8
10 11 12 13 14 15 16 17 18
2
3
3
4
5
5
5
6
6
7
7
7
7
8
8
8
8
9
2
3
4
4
5
5
6
6
7
7
7
8
8
8
9
9
9
9
2
2
3
4
4
5
6
6
7
7
7
8
8
8
9
9
9
10
10
2
2
3
4
5
5
6
6
7
7
8
8
9
9
9
10
10
10
10
2
2
3
4
5
5
6
7
7
8
8
9
9
9
10
10
10
11
11
2
3
3
4
5
6
6
7
7
8
8
9
9
10
10
11
11
11
12
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
2
3
4
4
5
6
6
7
8
8
9
9
10
10
11
11
11
12
12
2
3
4
4
5
6
7
7
8
9
9
10
10
11
11
11
12
12
13
2
3
4
5
5
6
7
8
8
9
9
10
10
11
11
12
12
13
13
19
20
2
3
4
5
6
6
7
8
8
9
10
10
11
11
12
12
13
13
13
2
3
4
5
6
6
7
8
9
9
10
10
11
12
12
13
13
13
14
Página 160 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 161-175
Tabla para Ho de mayor o igual (todo r ≥ límite tabulado es significativo 5%)
n2
n1
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
3
4
9
9
5
6
9
10
10
11
11
9
10
11
12
12
13
13
13
13
7
8
9
10
11
12
13
14
15
16
17
18
19
20
11
12
13
13
14
14
14
14
15
15
15
11
12
13
14
14
15
15
16
16
16
16
17
17
17
17
17
13
14
14
15
16
16
16
17
17
18
18
18
18
18
18
13
14
15
16
16
17
17
18
18
18
19
19
19
20
20
13
14
15
16
17
17
18
19
19
19
20
20
20
21
21
13
14
16
16
17
18
19
19
20
20
21
21
21
22
22
15
16
17
18
19
19
20
20
21
21
22
22
23
23
15
16
17
18
19
20
20
21
22
22
23
23
23
24
15
16
18
18
19
20
21
22
22
23
23
24
24
25
17
18
19
20
21
21
22
23
23
24
25
25
25
17
18
19
20
21
22
23
23
24
25
25
26
26
17
18
19
20
21
22
23
24
25
25
26
26
27
17
18
20
21
22
23
23
24
25
26
26
27
27
17
18
20
21
22
23
24
25
25
26
27
27
28
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 161 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 162-175
TABLA XIII: Prueba de Walsh
Pruebas
N
4
5
6
7
8
9
10
11
12
13
14
15
Nivel de
significación de las
Dos colas: acéptese μ1 ≠ 0 si ambas
pruebas
1 cola
2 colas
Una cola: acéptese μ1 < 0 si
Una cola: acéptese μ1 > 0 si
0.062
0.125
d4<0
d1>0
0.062
0.125
½(d4+d5)<0
½(d1+d2)>0
0.031
0.062
d6<0
d1>0
min[d2, ½(d1+d3)]>0
max[d5, ½(d4+d6)]<0
0.094
0.047
½(d1+d2)>0
½(d5+d6)<0
0.062
0.031
d1>0
d6<0
0.031
0.016
min[d3, ½(d1+d4)]>0
max[d5, ½(d4+d7)]<0
0.109
0.055
min[d2, ½(d1+d3)]>0
max[d6, ½(d5+d7)]<0
0.047
0.023
½(d1+d2)>0
½(d6+d7)<0
0.031
0.016
d1>0
d7<0
0.016
0.008
0.043
0.086
max[d5, ½(d4+d8)]<0
min[d3, ½(d1+d5)]>0
0.027
0.055
max[d6, ½(d5+d8)]<0
min[d3, ½(d1+d4)]>0
0.012
0.023
max[d7, ½(d6+d8)]<0
min[d2, ½(d1+d3)]>0
0.008
0.016
½(d7+d8)<0
½(d1+d2)>0
0.004
0.008
d8<0
d1>0
min[d4, ½(d1+d6)]>0
max[d6, ½(d4+d9)]<0
0.102
0.051
min[d3, ½(d1+d6)]>0
max[d7, ½(d5+d9)]<0
0.043
0.022
min[d2, ½(d1+d5)]>0
max[d8, ½(d6+d9)]<0
0.020
0.010
min[d2, ½(d1+d3)]>0
max[d8, ½(d7+d9)]<0
0.012
0.006
½(d1+d2)>0
½(d8+d9)<0
0.008
0.004
min[d5, ½(d1+d7)]>0
max[d6, ½(d4+d10)]<0
0.111
0.056
min[d4, ½(d1+d6)]>0
max[d7, ½(d5+d10)]<0
0.051
0,025
min[d3, ½(d1+d5)]>0
max[d8, ½(d6+d10)]<0
0.021
0.011
min[d2, ½(d1+d5)]>0
max[d9, ½(d6+d10)]<0
0.010
0.005
0.048
0.097
max[d7, ½(d4+d11)]<0
min[d5, ½(d1+d8)]>0
0.028
0.056
max[d7, ½(d5+d11)]<0
min[d5, ½(d1+d7)]>0
0.011
0.021
max[½(d6+d11), ½(d8+d9)]<0
min[½(d1+d6), ½(d3+d4)]>0
0.005
0.011
max[d9, ½(d7+d11)]<0
min[d3, ½(d1+d5)]>0
0.047
0.094
max[½(d4+d12), ½(d6+d11)]<0
min[½(d1+d9), ½(d2+d8)]>0
0.024
0.048
max[d8, ½(d5+d12)]<0
min[d5, ½(d1+d8)]>0
0.010
0.020
max[d9, ½(d6+d12)]<0
min[d4, ½(d1+d7)]>0
0.005
0.011
max[½(d7+d12), ½(d9+d10)]<0
min[½(d1+d6), ½(d8+d4)]>0
0.047
0.094
max[½(d4+d13), ½(d6+d12)]<0
min[½(d1+d10), ½(d2+d9)]>0
0.023
0.048
max[½(d5+d13), ½(d6+d12)]<0
min[½(d1+d9), ½(d2+d8)]>0
0.010
0.020
max[½(d6+d12), ½(d9+d10)]<0
min[½(d1+d8), ½(d4+d5)]>0
0.005
0.010
max[d10, ½(d7+d13)]<0
min[d4, ½(d1+d7)]>0
min[½(d1+d11), ½(d2+d10)]>0
max[½(d4+d14), ½(d5+d13)]<0
0.094
0.047
min[½(d1+d10), ½(d2+d9)]>0
max[½(d6+d11), ½(d6+d13)]<0
0.048
0.023
min[d5, ½(d1+d9)]>0
max[d10, ½(d5+d14)]<0
0.020
0.010
min[½(d1+d8), ½(d4+d5)]>0
max[½(d7+d14), ½(d10+d11)]<0
0.010
0.005
0.047
0.094
max[½(d4+d15), ½(d6+d14)]<0
min[½(d1+d12), ½(d2+d11)]>0
0.023
0.048
max[½(d6+d15), ½(d6+d14)]<0
min[½(d1+d11), ½(d2+d10)]>0
0.010
0.020
max[½(d8+d15), ½(d10+d11)]<0
min[½(d1+d10), ½(d5+d6)]>0
0.005
0.010
max[d11, ½(d7+d15)]<0
min[d5, ½(d1+d9)]>0
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 162 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 163-175
Tabla extraída de Walsh, J.E. (1949)
TABLA XIV: Prueba de Kruskal-Wallis (para muestras pequeñas)
Tamaño de
muestras
n
Tamaño de
muestras
n2
n3
H
p
2
1
1
2,700
0,500
2
2
1
3,600
0,200
2
2
2
4,571
3,714
0,067
0,200
1
3
1
1
3,200
0,300
3
2
1
4,286
3,857
0,100
0,133
3
2
2
5,357
4,714
4,500
4,464
0,290
0,480
0,067
0,105
5,143
4,571
4,000
0,043
0,100
0,129
3
3
1
3
3
2
6,250
5,361
5,139
4,556
4,250
0,011
0,032
0,061
0,100
0,121
3
3
3
7,200
6,489
5,689
5,600
5,067
4,622
0,004
0,011
0,029
0,050
0,086
0,100
n
n2
n3
H
p
5
2
1
5,250
5,000
4,450
4,200
4,050
0,036
0,048
0,071
0,095
0,119
5
2
2
6,533
6,133
5,160
5,040
4,373
4,293
0,008
0,013
0,034
0,056
0,090
0,122
5
3
1
6,400
4,960
4,871
4,018
3,840
0,012
0,048
0,052
0,095
0,123
5
3
2
6,910
6,822
5,251
5,106
4,651
4,495
0,009
0,010
0,049
0,052
0,091
0,101
5
3
3
7,079
6,982
5,649
5,515
4,533
4,412
0,009
0,011
0,049
0,051
0,097
0,109
1
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 163 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Tamaño de
muestras
Tamaño de
muestras
4
1
1
3,571
0,200
4
2
1
4,821
4,500
4,018
0,057
0,076
0,114
4
2
2
6,000
5,333
5,125
4,458
4,167
0,014
0,033
0,052
0,100
0,105
4
3
1
5,833
5,208
5,000
4,056
3,889
0,021
0,050
0,057
0,093
0,129
6,444
6,300
5,444
5,400
4,511
4,444
0,008
0,011
0,046
0,051
0,098
0,102
6,745
6,709
5,791
5,727
4,709
4,700
0,010
0,013
0,046
0,050
0,092
0,101
6,667
6,167
0,010
0,022
4
4
4
3
3
4
2
3
1
Pag 164-175
5
4
1
6,955
6,840
4,986
4,860
3,987
3,960
0,008
0,011
0,044
0,056
0,098
0,102
5
4
2
7,205
7,118
5,273
5,268
4,541
4,518
0,009
0,010
0,049
0,050
0,098
0,101
5
4
3
7,445
7,395
5,656
5,631
4,549
4,523
0,010
0,011
0,049
0,050
0,099
0,103
5
4
4
7,760
7,744
5,657
5,617
4,619
4,553
0,009
0,011
0,049
0,050
0,100
0,102
5
5
1
7,309
6,836
5,127
4,909
4,109
4,036
0,009
0,011
0,046
0,053
0,086
0,105
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 164 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Tamaño de
muestras
4
4
4
5
4
4
4
1
2
3
4
1
Pag 165-175
Tamaño de
muestras
4,967
4,867
4,167
4,067
0,048
0,054
0,082
0,102
7,036
6,873
5,455
5,236
4,555
4,445
0,006
0,011
0,046
0,052
0,098
0,103
7,144
7,136
5,599
5,576
4,545
4,477
0,010
0,011
0,049
0,051
0,099
0,102
7,654
7,539
5,692
5,654
4,654
4,500
0,008
0,011
0,049
0,054
0,097
0,104
3,857
0,143
5
5
2
7,339
7,269
5,339
5,246
4,623
4,508
0,010
0,010
0,047
0,051
0,097
0,100
5
5
3
7,578
7,543
5,706
5,626
4,545
4,536
0,010
0,010
0,046
0,051
0,100
0,102
5
5
4
7,823
7,791
5,666
5,643
4,523
4,520
0,010
0,010
0,049
0,050
0,990
0,101
5
5
5
8,000
7,980
5,780
5,660
4,560
4,500
0,090
0,100
0,049
0,051
0,100
0,102
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 165 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 166-175
TABLA XV: Valores críticos del coeficiente de correlación de Spearman
(prueba de una cola)
N
4
5
6
7
8
9
10
12
14
16
18
20
22
24
26
28
30
nivel de significación
(una cola)
0.05
0.01
1.000
.900
1.000
.829
.943
.714
.893
.643
.833
.600
.783
.564
.746
.506
.712
.456
.645
.425
.601
.399
.564
.377
.834
.359
.508
.343
.485
.329
.465
.317
.448
.306
.432
Tabla extraída y adaptada de “Estadística No Paramétrica”, de S. Siegel
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 166 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 167-175
TABLA XVI: Tabla de valores críticos del coeficiente de correlación (tau) de Kendall
(prueba de una cola para |τ| )
α
0,1
0,05
0,01
4
5
1,000
0,800
1,000
6
7
8
9
10
0,733
0,619
0,571
0,500
0,467
0,867
0,714
0,643
0,556
0,511
1,000
0,905
0,786
0,722
0,644
11
12
13
14
15
0,418
0,394
0,359
0,363
0,333
0,491
0,455
0,436
0,407
0,390
0,600
0,576
0,564
0,516
0,505
16
17
18
19
20
0,317
0,309
0,294
0,287
0,274
0,383
0,368
0,346
0,333
0,326
0,483
0,471
0,451
0,439
0,421
21
22
23
24
25
0,267
0,264
0,257
0,246
0,240
0,314
0,307
0,296
0,290
0,287
0,410
0,394
0,391
0,377
0,367
26
27
28
29
30
0,237
0,231
0,228
0,222
0,218
0,280
0,271
0,265
0,261
0,255
0,360
0,356
0,344
0,340
0,333
31
32
33
34
35
0,213
0,210
0,205
0,201
0,197
0,252
0,246
0,242
0,237
0,234
0,325
0,323
0,314
0,312
0,304
36
37
38
39
40
0,194
0,192
0,189
0,188
0,185
0,232
0,228
0,223
0,220
0,218
0,302
0,297
0,292
0,287
0,285
ν=Ν−1
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 167 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 168-175
TABLA XVII: Valores críticos para el coeficiente de correlación (r) de Pearson
(correlación de 2 variables: fórmula del producto-momento)
ν=N−2 α
1
0,05 0,997
0,01 1,000
ν=N−2 α
24 0,05 0,388
0,01 0,496
2
0,05 0,950
0,01 0,990
25
0,05 0,381
0,01 0,487
3
0,05 0,778
0,01 0,959
26
0,05 0,374
0,01 0,478
4
0,05 0,811
0,01 0,917
27
0,05 0,367
0,01 0,470
5
0,05 0,754
0,01 0,874
28
0,05 0,361
0,01 0,463
6
0,05 0,707
0,01 0,834
29
0,05 0,355
0,01 0,456
7
0,05 0,666
0,01 0,798
30
0,05 0,349
0,01 0,449
8
0,05 0,632
0,01 0,765
35
0,05 0,325
0,01 0,418
9
0,05 0,602
0,01 0,735
40
0,05 0,304
0,01 0,393
10
0,05 0,576
0,01 0,708
45
0,05 0,288
0,01 0,372
11
0,05 0,553
0,01 0,684
50
0,05 0,273
0,01 0,354
12
0,05 0,532
0,01 0,661
60
0,05 0,250
0,01 0,325
13
0,05 0,514
0,01 0,641
70
0,05 0,232
0,01 0,302
14
0,05 0,497
0,01 0,623
80
0,05 0,217
0,01 0,283
15
0,05 0,482
0,01 0,606
90
0,05 0,205
0,01 0,267
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 168 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
ν=N−2 α
16 0,05 0,468
0,01 0,590
Pag 169-175
ν=N−2 α
100 0,05 0,195
0,01 0,254
17
0,05 0,456
0,01 0,575
125
0,05 0,174
0,01 0,228
18
0,05 0,444
0,01 0,561
150
0,05 0,159
0,01 0,208
19
0,05 0,433
0,01 0,549
200
0,05 0,138
0,01 0,181
20
0,05 0,423
0,01 0,537
300
0,05 0,113
0,01 0,148
21
0,05 0,413
0,01 0,526
400
0,05 0,098
0,01 0,128
22
0,05 0,404
0,01 0,515
500
0,05 0,088
0,01 0,115
23
0,05 0,396
0,01 0,505
1.000 0,05 0,062
0,01 0,081
Tabla extraída y adaptada de “Bioestadística aplicada a Bioquímica y Farmacia”, de J.C. Azzimonti Renzo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 169 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
APENDICE: TABLAS ESTADISTICAS
Pag 170-175
TABLA XVIII: Valores críticos de s en el coeficiente de concordancia de Kendall
N
k
3
3
4
5
6
8
10
15
20
3
4
5
6
8
10
15
20
48.1
60.0
89.8
119.7
66.8
85.1
131.0
177.0
4
5
6
7
Valores al nivel de significación 0.05
64.4
103.9
157.3
49.5
88.4
143.3
217.0
62.6
112.3
182.4
276.2
75.7
136.1
221.4
335.2
101.7
183.7
299.0
453.1
127.8
231.2
376.7
571.0
192.9
349.8
570.5
864.9
258.0
468.5
764.4
1158.7
Valores al nivel de significación 0.01
75.6
122.8
185.6
61.4
109.3
176.2
265.0
80.5
142.8
229.4
343.8
99.5
176.1
282.4
422.6
137.4
242.7
388.3
579.9
175.3
309.1
494.0
737.0
269.8
475.2
758.2
1129.5
364.2
641.2
1022.2
1521.9
Valores adicionales
para N=3
k
s
9
12
14
16
18
54.0
71.9
83.8
95.8
107.7
9
12
14
16
18
75.9
103.5
121.9
140.2
158.6
Tabla extraída y adaptada de “Estadística No Paramétrica”, de S. Siegel
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 170 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
INDICE ALFABETICO
A
alfa · 34
ANALISIS DE CASOS Y CONTROLES · 131
ANÁLISIS DE COVARIANZA · 73
análisis de varianza · 59
análisis secuencial de pares · 86
ANCOVA · 73
ANOVA · 59
ANOVA DE DOS VÍAS · 69
ANOVA DE DOS VÍAS POR RANGOS · 101
ANOVA de Friedman · 101
ANOVA DE UNA VÍA · 66
ANOVA DE UNA VÍA POR RANGOS · 102
ANOVA FACTORIAL · 70
asociación entre las variables en estudio · 134
ASOCIACIÓN Y CORRELACIÓN LINEAL · 52
azar · 11
B
Binomial Acumulada · 150
C
Calidad Media de Salida · 84
Cantidad media de inspección · 84
casos y controles · 131
Ch
chance · 135
C
CIEGO, DOBLE CIEGO Y TRIPLE CIEGO · 38
Cifras significativas · 14
cociente de medias cuadradas · 64
COEFICIENTE DE CONCORDANCIA · 108
COEFICIENTE DE CONTINGENCIA C · 103
coeficiente de correlación · 53
COEFICIENTE DE CORRELACION DE RANGOS · 106
COEFICIENTE DE CORRELACION PARCIAL DE
RANGO · 107
Cohorte abierta · 127
cohorte cerrada · 127
COHORTES · 122
concordancia · 170
Control de Calidad · 81
CONTROL DE CALIDAD · 77
CORRELACIÓN LINEAL MÚLTIPLE · 54
CORRELACIÓN NO LINEAL · 54
covarianza · 53
CRITERIO ESTADISTICO · 10
cuadro ANOVA · 65
CUADRO DE CONTROL DE CALIDAD 6 σ · 78
Pag 171-175
curva de Gauss · Ver Distribución Normal
CURVAS DE SUPERVIVENCIA · 140
D
desenlace · 123
Desviación standard · 22
Desviación Standard · 5
determinismo · 11
Diagnóstico principal · 139
Días-camas disponibles · 139
Días-camas ocupadas · 139
diferencias entre ensayos Paramétricos y No Paramétricos · 33
DISEÑOS SIMETRICOS · 42
DISTRIBUCIÓN χ2 (JI-CUADRADO) · 89
DISTRIBUCIÓN BINOMIAL · 56
DISTRIBUCIÓN DE POISSON · 56
Distribucion Normal · 143
distribución normal · 25
DISTRIBUCION ZETA · 45
distribuciones estadísticas · 21
DOCIMASIA BIOLÓGICA · 75
E
Egresos totales · 139
ENSAYO DE RECTAS PARALELAS · 75
ENSAYOS · 32
ENSAYOS AGRUPADOS · 38
ENSAYOS APAREADOS · 38
ENSAYOS NO PARAMÉTRICOS · 88
EPIDEMIOLOGIA · 111
Error Absoluto · 15
Error Relativo · 15
Error standard · 22
Error Standard · 5
errores · 14
ERRORES DE TIPO I Y DE TIPO II · 34
estadística · 2, 4, 10
ESTADÍSTICA INFERENCIAL · 31
estrategia epidemiología · 115
estudios de cohorte · 123
EXACTITUD · 28
F
factor causal · 63
Factor de Riesgo · 118
FRACCION DE DEFECTUOSOS DEL LOTE · 83
frecuencia relativa · 12
frecuencias esperadas · 91
F-Snedecor · 65, 145
G
Giro cama · 139
GRADOS DE LIBERTAD · 61
GRÁFICOS DE CONTROL DE CALIDAD · 77
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 171 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
INDICE ALFABETICO
Pag 172-175
H
O
HIPOTESIS ALTERNATIVA · 34
HIPOTESIS ESTADISTICAS · 33
HIPOTESIS NULA · 34
histograma de barras · 19
Observación individual · 16
odds · Ver Chance
ODDS RATIO · Ver Razón de Chances
OR · Ver Razón de Chances
ortogonales · 63
outcomes · Ver desenlace
I
Incidencia · 127
Indicadores de morbilidad · 121
Indicadores de natalidad · 120
INDICADORES SANITARIOS · 119
Índices · 120
INDICES HOSPITALARIOS · 139
interacciones · Ver ANOVA factorial
Intervalo de confianza · 25
J
ji cuadrado · 147
ji-cuadrado · 89
K
Kendall · 167, 170
KENDALL · 108
KENDALL (τ) · 106
Kolmogorov-Smirnov · 157
KOLMOGOROV-SMIRNOV · 96
Kruskal-Wallis · 163
KRUSKAL-WALLIS · 102
L
P
PARÁMETROS ESTADÍSTICOS · 22
pareamientos · 131
Pearson · 168
plan secuencial de muestreo · 82
Población · 16
POBLACIONES NORMALES · 45
polígono de frecuencias · 19
Porcentaje de ocupación · 139
POTENCIA DEL ENSAYO · 34
potencia relativa · 75
PRECISION · 28
probabilidad · 11
producto-momento · 168
Proporciones · 120
Prueba de bondad de ajuste · 91
PRUEBA DE LAS RACHAS · 97
PRUEBA DE LOS RANGOS · 93
PRUEBA DE LOS SIGNOS · 92
PRUEBA DE McNEMAR · 91
PRUEBA DE MOSES · 98
PRUEBA DE WALSH · 99
PRUEBA Q DE COCHRAN · 100
PRUEBA U DE MANN-WHITNEY · 95
Q
Q de Cochran · 100
LIMITES DE CONTROL 6 σ · 78
M
matriz · 55
Media aritmética · 22
MEDIA CUADRADA · 61
Mediana · 22
MEDICIONES EN EPIDEMIOLOGIA · 118
METODO DE LA EPIDEMIOLOGIA · 115
Moda · 22
Modelos teóricos en ANOVA · 66
Muestra · 16
MUESTREO · 38
MUESTREO SECUENCIAL · 81
N
Número de camas disponibles · 139
Número de camas totales · 139
Numeros Aleatorios · 142
R
r · 53
rachas · 98
Rango · 22
RAZON DE CHANCES · 135
razón de mortalidad estandarizada · 130
razón de productos cruzados · Ver Razón de Chances
Razones · 120
REACCIONES EXTREMAS · 98
RECHAZO DE HIPOTESIS · 37
REGRESIÓN LINEAL · 53
Reingresos. · 139
Riesgo · 118
Riesgo absoluto · 118
Riesgo Atribuible · 128, 129
Riesgo Atribuible Poblacional · 128
Riesgo Atribuible Porcentual · 128
RIESGO CALCULADO · 31
Riesgo relativo · 118
Riesgo Relativo · 127, 128
Risk Ratio · Ver Riesgo Relativo
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 172 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
INDICE ALFABETICO
RME · Ver Razón de mortalidad estandarizada
U
S
U de Mann-Whitney · 152
unidad de análisis · 116
unidad de muestreo · 117
sensibilidad del instrumento de medida · 15
sobrevida · 140
Spearman · 166
sucesos mutuamente excluyentes · 13
sucesos mutuamente independientes · 13
SUMA DE CUADRADOS · 61
T
tabla de contingencia 2x2 · 89
tabla tetracórica · Ver tabla de contingencia 2x2
TABLAS DE CONTINGENCIA · 89
tasa de exposición · 134
tasa de incidencia · 127
Tasa de morbilidad · 121
Tasa de mortalidad específica · 122
Tasa de prevalencia · 121
tasa resumen · 119
Tasas · 119
tau · 167
tau de Kendall · 106
TEST DE UNA COLA Y DE DOS COLAS · 36
TEST t-STUDENT · 49
t-Student · 144
Pag 173-175
V
Valores normales · 48
VALORES NORMALES · 29
variables aleatorias · 14
Varianza · 5, 22
vector · 55
W
Wald-Wolfowitz · 160
WALD-WOLFOWITZ · 97
Walsh · 162
WILCOXON · 93
Z
ZETA · 45
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 173 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
BIBLIOGRAFIA
Pag 174-175
BIBLIOGRAFIA
LIBROS INTRODUCTORIOS DE FACIL LECTURA Y COMPRENSION
Para estudiantes, graduados e investigadores del área de las ciencias de la salud ,
el mejor texto introductorio de estadística disponible:
1. NORMAN G.R. & STREINER D.L., Bioestadística, Harcourt-Mosby, 1ra Ed., (1996)
2. MORONEY, M. J., Hechos y estadísticas, EUDEBA, 2da Ed., (1968)
3. LISON, L., Estadística aplicada a la biología experimental, EUDEBA, (1976)
4. MACCHI, R. L.,Introducción a la estadística en ciencias de la salud, Ed. Panamericana,
(2001)
5. JENICEK, M. y CLÉROUX, R., Epidemiología, Ed. Científicas y Técnicas SA, (1993)
6. JUEZ MARTEL, P. y DÍEZ VEGAS, F. J., Probabilidad y estadística en medicina, Ed. Díaz de
Santos, Madrid, (1996)
7. IRALA, J., FERNÁNDEZ-CREHUET, R. Apuntes de Epidemiología general: conceptos
teóricos y ejercicios prácticos. Pamplona: Newbook Ediciones, (1996)
LIBROS
DE
NIVEL
INTERMEDIO
QUE
REQUIEREN
CIERTA
EXPERIENCIA
ESTADISTICA PREVIA
1. SNEDECOR, G. W., Métodos estadísticos, Ed. Continental (México), 5ª Ed, (1964)
2. SIEGEL, S., Estadística no paramétrica, Ed. Trillas (Venezuela), 3ra Ed., (1990)
3. MATHER, K., Statistical Analysis in biology, Chapman & May, 5th Ed., (1972)
4. SOKAL, R. R. y ROHLF, F. J., Biometry, WH Freeman & Co, 2ª Ed., (1981)
5. LEWIS, A. E., Bioestadística, Ed. CECSA, (1969)
6. CONOVER, W. J., Practical Nonparametric Statistics, 3rd Ed., J. Wiley & Sons, (1999)
7. REMINGTON, R. y SCHORK, M., Estadística Biométrica y Sanitaria, Prentice Hall, (1974)
LIBROS AVANZADOS PARA CONSULTA O PERFECCIONAMIENTO
1. CRÁMER, H., Teoría de probabilidad y aplicaciones, Ed. Aguilar, (1966)
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 174 -175
ESTADISTICA PRÁCTICA PARA PROFESIONALES DE LA SALUD
BIBLIOGRAFIA
Pag 175-175
2. PUGACHEV V .S., Introducción a la teoría de probabilidades, MIR (Moscú), (1973)
3. HOLLANDER, M. y WOLFE, D., Nonparametric Statistical Methods, J. Wiley & Sons, (1973)
4. FINNEY, D. J., Statistical method in biological assay, Griffin & Co,2nd Ed., (1964)
5. FEINSTEIN , A. R., Principles of Medical Statistics, Chapman & Hall/CRC, (2002)
6. PAPOULLIS, A., Probability & Statistics, Prentice Hall, (1990)
7. FISHMAN, G. S., Conceptos y métodos en la simulación digital de eventos discretos, Ed.
Limusa, México, (1978)
8. PARZEN, E., Procesos estocásticos, Ed. Paraninfo (Madrid), 1ra Ed., (1972)
9. RIFFEMBURG, R. H.; Statistics in Medicine, Academic Press, (1999)
10. STEEL, R. G. D. y TORRIE, J. H., Bioestadística: Principios y Procedimientos, McGraw-Hill,
(1985)
11. ARMITAGE, P. y BERRY, G., Statistical Methods in Medical Research, Blackwell Science,
Pub., Oxford (London), (1987)
12. DOCUMENTA GEIGY (Sección Estadística-TABLAS ESTADISTICAS), VI Edición, Basilea
(SUIZA), (1965)
LIBROS DE FACIL LECTURA PARA APRENDER LA BASE MATEMÁTICA QUE
REQUIERE LA ESTADISTICA
1. BOUTELOUP, J., Cálculo de matrices, Cuadernos EUDEBA, (1966)
Una fácil introducción al álgebra lineal que no presume ningún conocimiento previo
2. KEMENY, J. G, MIRKIL, H.,SNELL, J, L.,THOMPSON, G. L. Estructuras matemáticas finitas,
Manuales EUDEBA, (1967)
Excelente y muy ameno libro de introducción al álgebra lineal, el análisis combinatorio,
la lógica y el cálculo de probabilidades y que tampoco presume ningún conocimiento
previo por parte del lector más allá de las cuatro operaciones aritméticas. Es la mejor
opción para complementar la cultura matemática. Altamente recomendable.
MANUAL DE ESTADÍSTICA PRACTICA –J.P.Hecht- Biofísica - FOUBA – Ed. v.1.02 (2008)
Página 175 -175
Descargar