Clase Nº 3: Tablas y Gráficos

Anuncio
[Index FAC] [Index CCVC]
Bioingeniería e Informática Médica/Bioengineering- Medical Informatics
Curso: Bioestadística básica para médicos asistenciales
Clase Nº 3: Tablas y Gráficos
Raul E. Ortego Carlos R. Secotaro
Index curso - Clase anterior - Clase siguiente
Es un acervo de los pedagogos que "una imagen expresa más que mil palabras". La Estadística incorpora
esta idea a su modo de transmitir señales, datos, conclusiones.
Tablas
Es una manera de presentar datos agrupados para facilitar comparaciones.
Se ordenan las Variables en Filas (Horizontales) y los Datos en columnas (Verticales).
Los datos de las variables quedan ordenados en Tablas de "Contingencia" (lo que ha sucedido y lo que
no ha sucedido). Veamos un ejemplo imaginario utilizando las Columnas para anotar pacientes con y sin
Diabetes; las filas para anotar los pacientes con y sin Infarto de Miocardio (IAM).
Coordenadas cartesianas
Son dos líneas perpendiculares (Ejes) que se cruzan en un punto que funciona como el 0 (cero) para las
cuatro semirrectas resultantes. Por convención hacia arriba y hacia la derecha son valores positivos.
El Eje horizontal o Eje de las Abscisas o Eje de las X es el Eje de la Variable.
El Eje Vertical o Eje de las Ordenadas o Eje de las Y es el Eje de la Frecuencia.
Histograma
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
La frecuencia de la variable se expresa con un área determinada (vg: barras)
Polígonos de Frecuencia
Se unen los extremos de las barras y se puede comparar en un mismo gráfico distintas poblaciones o
muestras.
Polígonos de distribución acumulativa
Son polígonos de frecuencia en los que se coloca en el eje de ordenadas la frecuencia acumulada.
Permite observar y eventualmente comparar, la evolución temporal de la variable en una o más muestras
simultáneamente.
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
Scatter
Se representa cada valor de la variable con un punto en un gráfico de coordenadas cartesianas. Es la
imagen de la dispersión de los valores de la variable, del modo de distribución (Simétrica o Asimétrica) y
permite observar valores marginales en el contexto global. Trazar lineas de Correlación.
Campana de Gauss
Los fenómenos biológicos tienen habitualmente la Distribución de Frecuencia de los valores de la
variable prácticamente simétrica.
El Polígono de Frecuencia resultante adopta una forma particular denominada: " Campana de Gauss "
Imágenes e ideas
En nuestra idea de estudiar la Estadística como idioma, la "Bioestadística" sería un "dialecto" específico,
por el que nos interesamos especialmente.
No conviene avanzar en Bioestadística sin reflexionar sobre la "Campana de Gauss".
Este simple Polígono de Frecuencia se convierte de un gráfico en una "piedra fundamental" de
las ideas, en un cimiento del análisis de fenómenos biológicos.
Para tenerla in mente simplificaremos la "campana" a su expresión basal: el par de coordenadas
cartesianas tradicionales para Variable y Frecuencia (X e Y) con el agregado de señalar el valor
Promedio o Medio o Media (
) recordando que por ser simétrica la distribución, ese valor es el mismo de
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
la mediana y del modo.
La línea de la campana proponemos imaginarla "punteada", siendo cada punto una localización,
una ubicación, como veremos a continuación.
En la imagen de la Distribución Simétrica que pretendemos instalar como idea, como base de
pensamiento y de expresión, agregaremos dos líneas perpendiculares.
Una contiene al punto del valor medio, la otra contiene al de mayor frecuencia.
Se cortan, coinciden, en un punto cúspide de la campana.
Valor y localización
En una distribución de frecuencias simétrica, el valor real "x" de frecuencia de aparición "y" se ubica,
se localiza, en el punto A ó "xy" de la curva.
Para nuestro idioma asumamos que esa es una localización absoluta, "cruda", no referida a ningún
otro valor de la variable.
Cada punto de la línea de la "campana" es la localización de cada valor de la variable.
La línea de puntos es la sucesión de localizaciones del conjunto de valores de la variable.
La "campana" es un símbolo gráfico de cómo se distribuye, se dispersa o si se prefiere, cómo se
agrupa, la población o muestra estudiada.
Proponemos hablar y pensar de cada "campana" como si fuese el "mapa", la "localidad", de
una población o de una muestra.
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
Pertenencia por localización
En la analogía propuesta pensamos a la localización de un valor concreto como la "residencia" de ese
valor de la variable identificado en el Eje de las X.
La localización no es el valor de la variable (su identidad), la localización es dónde se ubica ese
valor de la variable acorde al número de veces que se repite.
Por la ubicación, por la dirección de una residencia, reconocemos a la localidad y dentro de ella al
"barrio" (la localidad pequeña, íntima) a la que pertenece.
Pensemos al punto A (xy desde ahora) desde la perspectiva de la línea punteada que es la "campana"
dónde se localizan el conjunto de valores de la variable (la población).
El punto xy pertenece a la localización en general del conjunto de valores de la variable que se está
estudiando.
El punto xy de una localidad puede pertenecer a más de una población.
En realidad a cada localización es mejor aún que nos la imaginemos para nuestras conversaciones y
pensamientos como una posada, un albergue, dónde conviven, cohabitan, muchas identidades, miembros
de diferentes "comunidades", de diferentes conjuntos de valores de la variable, de diferentes
poblaciones o muestras.
Un estudio comparó el efecto de una gaseosa "light" sobre la glucemia en ayunas. Analizó una muestra de
pacientes diabéticos y una más pequeña de pacientes NO diabéticos como control. En los resultados vieron
que un valor absoluto (x) de glucemia de 100 mg% se encontró en la muestra de glucemias de
pacientes diabéticos pero también en la muestra de glucemias de pacientes NO diabéticos.
Por el valor (x) no se reconoce a la muestra (ó población) de pertenencia.
La localización xy "cruda","pura", "absoluta" pertenece a más de una muestra, por ende, tampoco la
ubicación aislada indica muestra o población de pertenencia.
Observe la localización xy y su relación espacial (distancia) a la vertical (en color rojo) que pasa por el
valor medio de cada una de las campana a las que pertenece xy.
Sin aplicar fórmulas, con su léxico cotidiano, observando esa relación, piense a cual de las dos muestras
descriptas por cada campana (podrían ser poblaciones) tiene más probabilidad de pertenecer el valor
x de localización xy.
Por la localización relativa de un valor de la variable se puede establecer la probabilidad de pertenecer
a determinada población o muestra según corresponda.
Valores reales y virtuales
Los valores reales se identifican (son), en el Eje de las X.
Los valores reales "x" se localizan en un punto xy, se ubican, "existen", conforme a su frecuencia de
aparición en la línea de la campana de su población.
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
Se localizan exactamente en el punto de intersección, entre la vertical que pasa por el Eje de las X
(su identidad, el "valor") y la horizontal que pasa por el Eje de las Y (su frecuencia de aparición).
La línea curva, la " campana ", en esta analogía de ubicaciones, es la línea que recorre las
localizaciones de todos y cada uno de los valores reales de la variable.
El valor medio, el promedio, la media, como medida de Tendencia Central que es, habíamos
propuesto presentarla como el "Km 0", como el centro de referencia.
La vertical que pasa por el valor medio es una línea de referencia para localizar con respecto a ella
misma a cada uno y al conjunto de valores reales de la variable; esa línea es una referencia para ubicar
el conjunto con sus relaciones intrínsecas.
El promedio o valor medio o media ( ) es una idea, una construcción, un valor de referencia, un
valor virtual, que a veces, puede ser el mismo que uno real; siempre es un valor virtual, puede
coincidir con un valor real.
Un valor real, aunque eventualmente coincida numéricamente, "no es" el promedio.
Proponemos como ejercicio de abstracción abandonar la idea de que el promedio es el valor real
más frecuente; resistirse a aceptar al promedio como que "vive", que "existe", que es "real" y
que se "localiza" en el punto de mayor frecuencia.
Es una trampa intelectual creer que al promedio se lo "encuentra" fabricándolo con los valores
reales hallados; es una falacia común creer que el promedio es un valor real que existía y
estaba "oculto", disimulado entre esos valores reales.
Un simple ejemplo para luego continuar. Suponga una variable discreta con valores siempre PAR, por
ejemplo, dados los valores 2, 4, 6, 8; el promedio es 20/4 = ¡¿ 5 ?!
Los valores reales son siempre pares, el promedio es impar. NO hay problema, es un valor virtual
alrededor del cual se distribuyen los valores reales.
El promedio y el conjunto
El valor del promedio y la línea vertical que lo contiene es una referencia común a diversas poblaciones o
muestras.
La coincidencia en el promedio es claramente insuficiente para identificar a un conjunto determinado,
específico, de valores de una variable, es decir a una muestra o población.
Sólo observar la figura basta como argumento probatorio de estas afirmaciones.
El mensaje de la campana
Los valores reales de la variable son insuficientes para identificar la muestra o población a la cual
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
pertenecen esos valores.
Las localizaciones de los valores reales de la variable son insuficientes para identificar la muestra o
población a la cual pertenecen esos valores.
Poblaciones o muestras diferentes comparten valores reales, localizaciones de los mismos y
pueden compartir también al valor virtual de referencia que se denomina promedio.
La localización de un valor de la variable con respecto, referida, al promedio del conjunto de
valores de la variable, permite calcular la p robabilidad de pertenencia de ese valor, a ese
conjunto de valores de la variable (población o muestra).
Index curso - Clase anterior - Clase siguiente
Publicación: Septiembre 2005
Tope
Preguntas, aportes y comentarios serán respondidos por el relator
o por expertos en el tema a través de la lista de Bioingeniería e Informática Médica
Llene los campos del formulario y oprima el botón "Enviar"
Preguntas, aportes o
comentarios:
Nombre y apellido:
País: Argentina
Dirección de E-Mail:
Enviar
Borrar
Dr. Diego Esandi
Co-Presidente
Comité Científico
Dra. Silvia Nanfara
Co-Presidente
Comité Científico
Prof. Dr. Armando Pacher
Presidente
Comité Técnico/Organizador
Correo electrónico
Correo electrónico
Correo electrónico
©1994-2005
CETIFAC - Bioingeniería UNER
Webmaster Actualización: 15-sep-05
4to. Congreso Virtual de Cardiología - 4th. Virtual Congress of Cardiology
Descargar