[Index FAC] [Index CCVC] Bioingeniería e Informática Médica/Bioengineering- Medical Informatics Curso: Bioestadística básica para médicos asistenciales Clase Nº 3: Tablas y Gráficos Raul E. Ortego Carlos R. Secotaro Index curso - Clase anterior - Clase siguiente Es un acervo de los pedagogos que "una imagen expresa más que mil palabras". La Estadística incorpora esta idea a su modo de transmitir señales, datos, conclusiones. Tablas Es una manera de presentar datos agrupados para facilitar comparaciones. Se ordenan las Variables en Filas (Horizontales) y los Datos en columnas (Verticales). Los datos de las variables quedan ordenados en Tablas de "Contingencia" (lo que ha sucedido y lo que no ha sucedido). Veamos un ejemplo imaginario utilizando las Columnas para anotar pacientes con y sin Diabetes; las filas para anotar los pacientes con y sin Infarto de Miocardio (IAM). Coordenadas cartesianas Son dos líneas perpendiculares (Ejes) que se cruzan en un punto que funciona como el 0 (cero) para las cuatro semirrectas resultantes. Por convención hacia arriba y hacia la derecha son valores positivos. El Eje horizontal o Eje de las Abscisas o Eje de las X es el Eje de la Variable. El Eje Vertical o Eje de las Ordenadas o Eje de las Y es el Eje de la Frecuencia. Histograma 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology La frecuencia de la variable se expresa con un área determinada (vg: barras) Polígonos de Frecuencia Se unen los extremos de las barras y se puede comparar en un mismo gráfico distintas poblaciones o muestras. Polígonos de distribución acumulativa Son polígonos de frecuencia en los que se coloca en el eje de ordenadas la frecuencia acumulada. Permite observar y eventualmente comparar, la evolución temporal de la variable en una o más muestras simultáneamente. 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology Scatter Se representa cada valor de la variable con un punto en un gráfico de coordenadas cartesianas. Es la imagen de la dispersión de los valores de la variable, del modo de distribución (Simétrica o Asimétrica) y permite observar valores marginales en el contexto global. Trazar lineas de Correlación. Campana de Gauss Los fenómenos biológicos tienen habitualmente la Distribución de Frecuencia de los valores de la variable prácticamente simétrica. El Polígono de Frecuencia resultante adopta una forma particular denominada: " Campana de Gauss " Imágenes e ideas En nuestra idea de estudiar la Estadística como idioma, la "Bioestadística" sería un "dialecto" específico, por el que nos interesamos especialmente. No conviene avanzar en Bioestadística sin reflexionar sobre la "Campana de Gauss". Este simple Polígono de Frecuencia se convierte de un gráfico en una "piedra fundamental" de las ideas, en un cimiento del análisis de fenómenos biológicos. Para tenerla in mente simplificaremos la "campana" a su expresión basal: el par de coordenadas cartesianas tradicionales para Variable y Frecuencia (X e Y) con el agregado de señalar el valor Promedio o Medio o Media ( ) recordando que por ser simétrica la distribución, ese valor es el mismo de 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology la mediana y del modo. La línea de la campana proponemos imaginarla "punteada", siendo cada punto una localización, una ubicación, como veremos a continuación. En la imagen de la Distribución Simétrica que pretendemos instalar como idea, como base de pensamiento y de expresión, agregaremos dos líneas perpendiculares. Una contiene al punto del valor medio, la otra contiene al de mayor frecuencia. Se cortan, coinciden, en un punto cúspide de la campana. Valor y localización En una distribución de frecuencias simétrica, el valor real "x" de frecuencia de aparición "y" se ubica, se localiza, en el punto A ó "xy" de la curva. Para nuestro idioma asumamos que esa es una localización absoluta, "cruda", no referida a ningún otro valor de la variable. Cada punto de la línea de la "campana" es la localización de cada valor de la variable. La línea de puntos es la sucesión de localizaciones del conjunto de valores de la variable. La "campana" es un símbolo gráfico de cómo se distribuye, se dispersa o si se prefiere, cómo se agrupa, la población o muestra estudiada. Proponemos hablar y pensar de cada "campana" como si fuese el "mapa", la "localidad", de una población o de una muestra. 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology Pertenencia por localización En la analogía propuesta pensamos a la localización de un valor concreto como la "residencia" de ese valor de la variable identificado en el Eje de las X. La localización no es el valor de la variable (su identidad), la localización es dónde se ubica ese valor de la variable acorde al número de veces que se repite. Por la ubicación, por la dirección de una residencia, reconocemos a la localidad y dentro de ella al "barrio" (la localidad pequeña, íntima) a la que pertenece. Pensemos al punto A (xy desde ahora) desde la perspectiva de la línea punteada que es la "campana" dónde se localizan el conjunto de valores de la variable (la población). El punto xy pertenece a la localización en general del conjunto de valores de la variable que se está estudiando. El punto xy de una localidad puede pertenecer a más de una población. En realidad a cada localización es mejor aún que nos la imaginemos para nuestras conversaciones y pensamientos como una posada, un albergue, dónde conviven, cohabitan, muchas identidades, miembros de diferentes "comunidades", de diferentes conjuntos de valores de la variable, de diferentes poblaciones o muestras. Un estudio comparó el efecto de una gaseosa "light" sobre la glucemia en ayunas. Analizó una muestra de pacientes diabéticos y una más pequeña de pacientes NO diabéticos como control. En los resultados vieron que un valor absoluto (x) de glucemia de 100 mg% se encontró en la muestra de glucemias de pacientes diabéticos pero también en la muestra de glucemias de pacientes NO diabéticos. Por el valor (x) no se reconoce a la muestra (ó población) de pertenencia. La localización xy "cruda","pura", "absoluta" pertenece a más de una muestra, por ende, tampoco la ubicación aislada indica muestra o población de pertenencia. Observe la localización xy y su relación espacial (distancia) a la vertical (en color rojo) que pasa por el valor medio de cada una de las campana a las que pertenece xy. Sin aplicar fórmulas, con su léxico cotidiano, observando esa relación, piense a cual de las dos muestras descriptas por cada campana (podrían ser poblaciones) tiene más probabilidad de pertenecer el valor x de localización xy. Por la localización relativa de un valor de la variable se puede establecer la probabilidad de pertenecer a determinada población o muestra según corresponda. Valores reales y virtuales Los valores reales se identifican (son), en el Eje de las X. Los valores reales "x" se localizan en un punto xy, se ubican, "existen", conforme a su frecuencia de aparición en la línea de la campana de su población. 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology Se localizan exactamente en el punto de intersección, entre la vertical que pasa por el Eje de las X (su identidad, el "valor") y la horizontal que pasa por el Eje de las Y (su frecuencia de aparición). La línea curva, la " campana ", en esta analogía de ubicaciones, es la línea que recorre las localizaciones de todos y cada uno de los valores reales de la variable. El valor medio, el promedio, la media, como medida de Tendencia Central que es, habíamos propuesto presentarla como el "Km 0", como el centro de referencia. La vertical que pasa por el valor medio es una línea de referencia para localizar con respecto a ella misma a cada uno y al conjunto de valores reales de la variable; esa línea es una referencia para ubicar el conjunto con sus relaciones intrínsecas. El promedio o valor medio o media ( ) es una idea, una construcción, un valor de referencia, un valor virtual, que a veces, puede ser el mismo que uno real; siempre es un valor virtual, puede coincidir con un valor real. Un valor real, aunque eventualmente coincida numéricamente, "no es" el promedio. Proponemos como ejercicio de abstracción abandonar la idea de que el promedio es el valor real más frecuente; resistirse a aceptar al promedio como que "vive", que "existe", que es "real" y que se "localiza" en el punto de mayor frecuencia. Es una trampa intelectual creer que al promedio se lo "encuentra" fabricándolo con los valores reales hallados; es una falacia común creer que el promedio es un valor real que existía y estaba "oculto", disimulado entre esos valores reales. Un simple ejemplo para luego continuar. Suponga una variable discreta con valores siempre PAR, por ejemplo, dados los valores 2, 4, 6, 8; el promedio es 20/4 = ¡¿ 5 ?! Los valores reales son siempre pares, el promedio es impar. NO hay problema, es un valor virtual alrededor del cual se distribuyen los valores reales. El promedio y el conjunto El valor del promedio y la línea vertical que lo contiene es una referencia común a diversas poblaciones o muestras. La coincidencia en el promedio es claramente insuficiente para identificar a un conjunto determinado, específico, de valores de una variable, es decir a una muestra o población. Sólo observar la figura basta como argumento probatorio de estas afirmaciones. El mensaje de la campana Los valores reales de la variable son insuficientes para identificar la muestra o población a la cual 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology pertenecen esos valores. Las localizaciones de los valores reales de la variable son insuficientes para identificar la muestra o población a la cual pertenecen esos valores. Poblaciones o muestras diferentes comparten valores reales, localizaciones de los mismos y pueden compartir también al valor virtual de referencia que se denomina promedio. La localización de un valor de la variable con respecto, referida, al promedio del conjunto de valores de la variable, permite calcular la p robabilidad de pertenencia de ese valor, a ese conjunto de valores de la variable (población o muestra). Index curso - Clase anterior - Clase siguiente Publicación: Septiembre 2005 Tope Preguntas, aportes y comentarios serán respondidos por el relator o por expertos en el tema a través de la lista de Bioingeniería e Informática Médica Llene los campos del formulario y oprima el botón "Enviar" Preguntas, aportes o comentarios: Nombre y apellido: País: Argentina Dirección de E-Mail: Enviar Borrar Dr. Diego Esandi Co-Presidente Comité Científico Dra. Silvia Nanfara Co-Presidente Comité Científico Prof. Dr. Armando Pacher Presidente Comité Técnico/Organizador Correo electrónico Correo electrónico Correo electrónico ©1994-2005 CETIFAC - Bioingeniería UNER Webmaster Actualización: 15-sep-05 4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology