Caso 101 : Presión sistólica en ancianos 1 Caso 101 : Presión sistólica en ancianos (Exploración de datos: Análisis exhaustivo de un vector )(F.J. Burguillo, USAL) Caso práctico Se ha medido la presión sistólica en una muestra de 50 ancianos de una población, obteniéndose los datos de la tabla adjunta. Presión Sist. (cm Hg) 13.5 13.4 16.3 13.8 14.7 9.3 12.8 10.8 13.8 12.7 El objetivo de este ejercicio sería una exploración minuciosa de los datos con el fin de formarse una idea acerca de su tendencia dentral, su variabilidad, la forma de su distribución de frecuencias, representaciones gráficas, existencia de valores atípicos...etc. Teoría En general, la exploración de datos en el caso de una variable aborda los siguientes aspectos: y Un análisis de estadística descriptiva de los datos: media, mediana, varianza y desviación estándar, límites de confianza para la media, cuartiles, recorrido intercuartílico, asimetría y curtosis. y Un análisis gráfico para tener una referencia visual del comportamiento de los datos: histograma, histograma aculmulativo, diagrama de caja (Box and Whisker plot), diagrama de barras, diagrama de sectores. y Otros aspectos: Tests de normalidad de Kolmogorov-Smirnov y Shapiro-Wilks. 13.6 11.0 ...etc Procedimiento paso a paso 1.- Crear un archivo con el vector de datos • Se podrían teclear los datos de la tabla 1 para crear un archivo de datos tipo “vector”, para ello bastaría seleccionar en el menú principal las opciones “Archivo” > “Nuevo: archivo vector/matriz” > “Usuario Normal” > “Vector”...etc. Pero en este caso teclear 50 datos sería un poco tedioso, por lo que ya se ha preparado dicho archivo con el nombre “caso101.dat” y bastará con abrirlo en su momento. 2.- Exploración de datos: Análisis exhaustivo de un vector de datos y Seleccione en el menú de Simfit la opción “Estadística”, y en el submenú que se despliega a continuación picar en la opción “Test estadísticos y cálculos matemáticos”, luego picar “ejecutar”, luego elegir “Exploración de datos” y después “Análisis exhaustivo de un vector arbitrario”. y A continuación se despliega un submenú con las opciones relativas a los datos: 2 y y y y Caso 101 : Presión sistólica en ancianos Elegimos primero la opción “Nuevos datos”. El programa nos preguntará si tenemos los datos en un archivo o los queremos teclear, eligiremos la opción “Archivo/Portapapeles”. Después se despliega ya la ventana de apertura de archivos, basta con que escribamos el nombre del archivo: C:\curso\caso101.dat (en realidad no haría falta escribirlo, se puede buscar el archivo con el botón “Explorar” e importarlo). A continuación aparecerá el siguiente menú principal para el análisis de un vector: Elija la opción “Análisis exhaustivo de los datos”. El programa pregunta luego ¿Incluir test de normalidad de Shapiro-Wilks?, contestaremos “Si”. La pantalla que sigue nos ofrece los resultados del análisis: Caso 101 : Presión sistólica en ancianos y 3 Obervemos los resultados. Por ejemplo la media sería de 13.63 con unos límites de confianza de 13.15 y 14.12 (es decir 13.63 0.49). Estos límites de confianza se han obtenido como: = x t (%,) s n siendo t (%, ) el valor de la “ t ” de Student con un riesgo del 5 % y un nº de grados de libertad % = n − 1, y donde “s” es la desviación estándar de la muestra, “n” el número de datos, x es la media de la muestra y la estima de la media de la población. y También vemos que los coeficientes de asimetría y curtosis son muy pequeños, lo que apunta hacia una distribución normal de los datos. Supuesto éste que es confirmado por el test de Shapiro-Wilks con una p = 0.8929 (p >> 0.05) y Al pulsar “OK” se vuelve al menú principal. Seleccione ahora la opción “Histograma/Guardar archivo ajustar pdf”, siga luego pulsando “OK” en las opciones por defecto. Finalmente aparecerá en pantalla el siguiente histograma: y Visto el diagrama anterior sería interesante pulsar “cancelar” y, al regresar al menú principal, podríamos echar una ojeada a otras opciones como: “Representar como barras centradas en cero”, “Representar como barras centradas en la media” o “Representar en formato de aciertos normal”, que son en este caso las más ilustrativas. Para abandonar la última gráfica y volver al menú general de Estadística basta con seguir la secuencia: Cancelar > Cancelar > Salir de las opciones de exploración. 3.- Exploración: Otras pruebas acerca de la normalidad de los datos y En el menú general de Estadística seleccionar la opción “Tests estadísticos estándar”, luego elegir “Test de distribución normal de 1 muestra”. 4 Caso 101 : Presión sistólica en ancianos y El programa recuerda que tiene en memoria nuestro vector de datos y no hace falta volverlo a cargar, basta con pulsar en “Analizar serie actual de datos”. Inmediatamente aparece una pantalla con los resultados del test de Kolmogorov-Smirnov y del test de Shapiro-Wilks: y Como puede verse al contrastar Ho frente a H1 por el test de Kolmogorov-Smirnoff se obtine una p = 0.9418 (p >>0.05), luego no se rechaza la hipótesis nula y por tanto los datos reales y los teóricos de una distribución normal no son significativamente diferentes. A la misma conclusión se llega con el test de Shapiro-Wilks: p= 0.8929 (p >>0.05). Nuestros datos pués siguen una distribución normal. y A continuación aparece el siguiente menú de opciones gráficas: si vamos representando cada una de estas opciones obtendremos el siguiente resultado: Caso 101 : Presión sistólica en ancianos 5 Todas estas representaciones analizan si los datos siguen o no una distribución normal, las dos superiores en base a la superposición de los datos reales frente a los esperados de una distribución normal que tuviera la misma media y desviación estandar que la que tienen los datos reales, y las dos inferiores en base a una correlación lineal entre los valores observados y los esperados de la correspondiente distribución normal en forma tipificada.