Caso 101: Presión sistólica en ancianos

Anuncio
Caso 101 : Presión sistólica en ancianos
1
Caso 101 : Presión sistólica en ancianos
(Exploración de datos: Análisis exhaustivo de un vector )(F.J. Burguillo, USAL)
Caso práctico
Se ha medido la presión sistólica en una muestra de 50 ancianos de una población,
obteniéndose los datos de la tabla adjunta.
Presión Sist.
(cm Hg)
13.5
13.4
16.3
13.8
14.7
9.3
12.8
10.8
13.8
12.7
El objetivo de este ejercicio sería una exploración minuciosa de los datos
con el fin de formarse una idea acerca de su tendencia dentral, su variabilidad, la
forma de su distribución de frecuencias, representaciones gráficas, existencia
de valores atípicos...etc.
Teoría
En general, la exploración de datos en el caso de una variable aborda los
siguientes aspectos:
y Un análisis de estadística descriptiva de los datos: media, mediana,
varianza y desviación estándar, límites de confianza para la media,
cuartiles, recorrido intercuartílico, asimetría y curtosis.
y Un análisis gráfico para tener una referencia visual del
comportamiento de los datos: histograma, histograma aculmulativo,
diagrama de caja (Box and Whisker plot), diagrama de barras,
diagrama de sectores.
y Otros aspectos: Tests de normalidad de Kolmogorov-Smirnov y
Shapiro-Wilks.
13.6
11.0
...etc
Procedimiento paso a paso
1.- Crear un archivo con el vector de datos
• Se podrían teclear los datos de la tabla 1 para crear un archivo de datos tipo “vector”, para
ello bastaría seleccionar en el menú principal las opciones “Archivo” > “Nuevo: archivo
vector/matriz” > “Usuario Normal” > “Vector”...etc. Pero en este caso teclear 50 datos
sería un poco tedioso, por lo que ya se ha preparado dicho archivo con el nombre
“caso101.dat” y bastará con abrirlo en su momento.
2.- Exploración de datos: Análisis exhaustivo de un vector de datos
y
Seleccione en el menú de Simfit la opción “Estadística”, y en el submenú que se despliega a
continuación picar en la opción “Test estadísticos y cálculos matemáticos”, luego picar
“ejecutar”, luego elegir “Exploración de datos” y después “Análisis exhaustivo de un
vector arbitrario”.
y
A continuación se despliega un submenú con las opciones relativas a los datos:
2
y
y
y
y
Caso 101 : Presión sistólica en ancianos
Elegimos primero la opción “Nuevos datos”. El programa nos preguntará si tenemos los
datos en un archivo o los queremos teclear, eligiremos la opción “Archivo/Portapapeles”.
Después se despliega ya la ventana de apertura de archivos, basta con que escribamos el
nombre del archivo: C:\curso\caso101.dat (en realidad no haría falta escribirlo, se puede
buscar el archivo con el botón “Explorar” e importarlo).
A continuación aparecerá el siguiente menú principal para el análisis de un vector:
Elija la opción “Análisis exhaustivo de los datos”. El programa pregunta luego ¿Incluir test
de normalidad de Shapiro-Wilks?, contestaremos “Si”.
La pantalla que sigue nos ofrece los resultados del análisis:
Caso 101 : Presión sistólica en ancianos
y
3
Obervemos los resultados. Por ejemplo la media sería de 13.63 con unos límites de confianza
de 13.15 y 14.12 (es decir 13.63 0.49). Estos límites de confianza se han obtenido como:
= x t (%,)
s
n
siendo t (%, ) el valor de la “ t ” de Student con un riesgo del 5 % y un nº de grados de libertad
% = n − 1, y donde “s” es la desviación estándar de la muestra, “n” el número de datos, x es
la media de la muestra y la estima de la media de la población.
y
También vemos que los coeficientes de asimetría y curtosis son muy pequeños, lo que apunta
hacia una distribución normal de los datos. Supuesto éste que es confirmado por el test de
Shapiro-Wilks con una p = 0.8929 (p >> 0.05)
y
Al pulsar “OK” se vuelve al menú principal. Seleccione ahora la opción “Histograma/Guardar
archivo ajustar pdf”, siga luego pulsando “OK” en las opciones por defecto. Finalmente
aparecerá en pantalla el siguiente histograma:
y
Visto el diagrama anterior sería interesante pulsar “cancelar” y, al regresar al menú principal,
podríamos echar una ojeada a otras opciones como: “Representar como barras centradas
en cero”, “Representar como barras centradas en la media” o “Representar en formato
de aciertos normal”, que son en este caso las más ilustrativas. Para abandonar la última
gráfica y volver al menú general de Estadística basta con seguir la secuencia: Cancelar >
Cancelar > Salir de las opciones de exploración.
3.- Exploración: Otras pruebas acerca de la normalidad de los datos
y
En el menú general de Estadística seleccionar la opción “Tests estadísticos estándar”,
luego elegir “Test de distribución normal de 1 muestra”.
4
Caso 101 : Presión sistólica en ancianos
y
El programa recuerda que tiene en memoria nuestro vector de datos y no hace falta volverlo a
cargar, basta con pulsar en “Analizar serie actual de datos”. Inmediatamente aparece una
pantalla con los resultados del test de Kolmogorov-Smirnov y del test de Shapiro-Wilks:
y
Como puede verse al contrastar Ho frente a H1 por el test de Kolmogorov-Smirnoff se obtine
una p = 0.9418 (p >>0.05), luego no se rechaza la hipótesis nula y por tanto los datos reales y
los teóricos de una distribución normal no son significativamente diferentes. A la misma
conclusión se llega con el test de Shapiro-Wilks: p= 0.8929 (p >>0.05). Nuestros datos pués
siguen una distribución normal.
y
A continuación aparece el siguiente menú de opciones gráficas:
si vamos representando cada una de estas opciones obtendremos el siguiente resultado:
Caso 101 : Presión sistólica en ancianos
5
Todas estas representaciones analizan si los datos siguen o no una distribución normal, las
dos superiores en base a la superposición de los datos reales frente a los esperados de una
distribución normal que tuviera la misma media y desviación estandar que la que tienen los
datos reales, y las dos inferiores en base a una correlación lineal entre los valores observados
y los esperados de la correspondiente distribución normal en forma tipificada.
Descargar