UNIDAD II Técnica antropométrica Capítulo 6. TRATAMIENTO DE LA INFORMACIÓN EN CINEANTROPOMETRÍA COMPENDIO DE CINEANTROPOMETRÍA 2 UNIDAD II. TÉCNICA ANTROPOMÉTRICA Capítulo 6. Tratamiento de la información en Cineantropometría 6 . TRATAMIENTO DE LA INFORMACIÓN EN CINEANTROPOMETRÍA Enrique Ordaz Romay 6.1. Introducción En un proyecto científico actual se conoce como tratamiento de la información a todos los procesos físicos, matemáticos e informáticos que, iniciándose con los datos obtenidos en una serie de medidas concluyen con unos resultados preparados para ser interpretados por los científicos del proyecto. De esta forma, en dicho proyecto tendremos dos tipos de personal cualificado: el científico especialista en la rama a la que pertenece el proyecto (en nuestro caso lo llamaremos cineantropometrista) y el científico especialista en el tratamiento de la información (que por tradición llamaremos estadístico). Este último deberá conocer los procesos físicos de medida (entender su significado), la estadística-matemática y la programación informática (especialmente el manejo de bases de datos); todo ello de cara a ofrecer al cineantropometrista unos resultados interpretables de forma simple y clara. El esquema básico del proyecto, siguiendo el método científico tradicional, está representado en la Figura 6.1. Dentro del tratamiento de la información distinguimos tres partes: 1. Definición y estructuración de la base de datos cineantropométrica. 2. Una vez hecho el registro en la base de datos: tratamiento de los valores y obtención de resultados mediante la Estadística Descriptiva, que aplicaremos en sus pasos tradicionales: a) Descripción y valoración de la muestra, elección de confianza y ρ – valor del estudio. b) Ordenación, clasificación y representación de los datos de la muestra. c) Aplicación de pruebas y contrastes para determinar el comportamiento de la muestra. d) Cálculo de estadísticos que permitan describir los datos obtenidos por aplicación de la técnica cineantropométrica, de forma completa y general. 3. Formulación de hipótesis y obtención de resultados: mediante el contraste de hipótesis que, dentro del método estadístico, se encarga de aplicar las pruebas, test y contrastes necesarios para aceptar o rechazar dichas hipótesis y, en base a ello, plantear resultados estadísticamente coherentes con los datos. Figura 6.1. Esquema básico del proyecto científico cineantropomético Una vez planteados los resultados estadísticamente coherentes con los datos obtenidos, al cineantropometrista le queda la labor de analizarlos, interpretarlos, explicarlos teóricamente y obtener conclusiones coherentes con los resultados obtenidos por otros estudios anteriores. 3 COMPENDIO DE CINEANTROPOMETRÍA En muchas ocasiones, especialmente al principio del proyecto, la discusión y conclusiones preliminares plantearán nuevas hipótesis que deberán ser enunciadas en términos de análisis sobre la base de datos, y remitidas nuevamente al estadístico para su tratamiento, comprobación o verificación. De esta forma, en la actualidad, el tratamiento de la información, y dentro de él, la estadística, son una pieza clave de cualquier trabajo experimental, representando el nexo entre los datos obtenidos durante la investigación y las conclusiones. 6.2. Conceptos básicos de estadística La estadística parte de una serie de definiciones que, de más general a más particular son: • • • • • Población: es el conjunto de todos los elementos que cumplen determinados criterios de definición y entre los cuales se desea estudiar un fenómeno concreto. A sus cualidades estadísticas se les llama parámetros. Muestra: es el subconjunto de la población que será estudiado y a partir del cual se pretenden sacar conclusiones sobre las características de la población. La muestra debe ser representativa, en el sentido de que las conclusiones obtenidas deben servir para el total de la población. A sus cualidades estadísticas se les llama estadísticos. Individuo: elemento concreto dentro de una muestra. Variables: cualidad o magnitud medible en el individuo. Es decir, cada individuo tendrá un valor concreto para cada variable. Normalmente el estudio estadístico se realiza clasificando u ordenado los individuos en función de una o varias variables. Carácter o simplemente valor: cada uno de los valores que puede tomar una variable. Los caracteres nos indican los criterios de inclusión en la población, muestra o grupo. Por tanto, una población está compuesta por todos los individuos, una muestra es un subconjunto dentro de la población y un individuo, finalmente, es un conjunto de variables. Normalmente, el estudio se basará en la comparación, dentro de la muestra, de individuos que cumplan determinada cualidad frente a aquellos que no la cumplan (por ejemplo: deportistas frente a no deportistas). De esta forma la muestra se divide muchas veces en dos grandes grupos: • • Casos: conjunto de individuos dentro de la muestra que verifican cierto criterio de selección. Controles: individuos dentro de la muestra que no verifican cierto criterio de selección o, dependiendo del estudio, será un subconjunto de la muestra tomado al azar, sin tener en cuenta el criterio de selección de los casos. La validez científica de un estudio estará en función directa a la calidad de la muestra, es decir, a cuan representativa es la muestra respecto de la población (error de muestreo) y cómo se haya diseñado la división entre casos y controles. 6.2.1. Clasificación de las variables El núcleo central del análisis estadístico se centra en las variables. Por ello, es muy importante conocer y diferenciar los distintos tipos. Una variable es explicativa o independiente cuado el comportamiento de otras variables depende de ella y, por tanto, es candidata a servir de explicación. Son las causas de las variaciones. Cuando sea una variable discreta normalmente se usará como variable de clasificación (por ejemplo, sexo), pero si es continua, se usará normalmente como variable de ordenación (por ejemplo, talla). Normalmente existen diversas variables explicativas. Las variables respuesta o dependientes son aquellas cuyas variaciones se intentan explicar y sobre las cuales se realizarán los cálculos estadísticos. Causalmente son los efectos. 4 UNIDAD II. TÉCNICA ANTROPOMÉTRICA Capítulo 6. Tratamiento de la información en Cineantropometría Por ejemplo, en un estudio de crecimiento la edad y/o el sexo son variables explicativas, mientras que la altura o el peso son variables respuesta. Igualmente, en estudio sobre deporte, las horas de entrenamiento o la alimentación son variables explicativas y la masa muscular y/o la mesomorfia son variables respuesta. Según los caracteres que pueden tomar las variables, estas se dividen en: cuantitativas, toman valores numéricos continuos (altura, pliegue subescapular,…) y cualitativas, toman valores discretos. La cualitativas se dividen en: dicotómica, toma solo dos valores (por ejemplo: sexo, lateralidad (diestro/zurdo), …); nominal, los diferentes caracteres no tienen orden (color de pelo, raza, …) y ordinal: los caracteres sí tienen orden (edad en años, horas deporte, número de lesiones en rodilla,…). 6.2.2. La elección de la muestra. Errores y técnicas de muestreo Cuando se utilizan valores muestrales o estadísticos para estimar valores poblacionales, o parámetros, pueden ocurrir dos tipos generales de errores. • El error muestral o de muestreo: se refiere a la variación natural existente entre muestras distintas tomadas de la misma población, por el hecho de ser distintas. • Los errores no muestrales: son los demás errores que pueden surgir durante el proceso estadístico; uno de los más importantes es el error de sesgo. El concepto de error muestral se ilustra con el siguiente ejemplo. Aunque se haya tenido gran cuidado para asegurar que dos muestras del mismo tamaño sean representativas de una cierta población, no esperaríamos que las dos fueran idénticas en todos sus detalles. Las diferencias estadísticas entre estas dos muestras serán debidas al error muestral. El error de muestreo debe ser distinguido del sesgo o error sistemático, que se debe a deficiencias técnicas, por ejemplo, de diseño, de conducción del estudio, técnica, instrumento de medida, etc. El sesgo de las muestras es un tipo de error no muestral y se refiere a una tendencia sistemática inherente a un método de medida que proporciona estimaciones de un parámetro que son menores (sesgo negativo), o mayores (sesgo positivo) que el parámetro real. El error muestral puede suprimirse, o minimizarse, usando la técnica de aleatorización. Esta se refiere a cualquier proceso de selección de una muestra de la población en la que la selección es imparcial; una muestra elegida con procedimientos aleatorios se llama muestra aleatoria. Los tipos más comunes de técnicas de muestreo aleatorio son el muestreo aleatorio simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo sistemático. Si una muestra aleatoria se elige de tal forma que todos los elementos de la población tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple. El muestreo estratificado es aquel que atiende a determinados parámetros de distribución por grupos poblacionales dentro de la elección, aunque dentro de cada grupo la elección sea al azar. Por ejemplo: tomar una muestra de un 50% de hombres y el otro 50% de mujeres, aunque tanto los hombres entre sí y las mujeres entre sí sean seleccionados aleatoriamente. De esta forma eliminamos algunos errores muestrales. 6.3. La metodología estadística La metodología estadística son los distintos pasos que conducen desde los datos hasta los resultados preparados para aplicarles una interpretación especializada. 5 COMPENDIO DE CINEANTROPOMETRÍA 6.3.1. Índices de confianza α y ρ – valor. Estimación de parámetros El índice de confianza para los resultados (αresultados) es el grado de certeza que se tiene en que, los estadísticos obtenidos para una muestra, serán aplicables a la población de la cual hemos extraído dicha muestra. En el capítulo de calidad de la medida se introdujo el concepto de índice de confianza para la medida (αmedida). Al producto de ambos índices de confianza se le llama índice de confianza del estudio: αestudio ≤ αresultados • αmedida. Se suele llamar simplemente α al αresultados. La forma de proceder con el cálculo de la confianza de los resultados es análoga a la que se hace con la medida. Sin embargo, ahora los datos que tenemos son los promedios muestrales x, las desviaciones estándar s y el número de individuos de la muestra n. La forma del intervalo de confianza para que el resultado de la muestra coincida con el valor poblacional esperado con una confianza α es: siendo t(1-α/2)(n – 1) la función t de Student. Los valores de t(1-α/2)(n – 1) se pueden obtener en el apéndice A. Al valor p < (1-α)/2 se le llama p – valor y representa el grado de precisión de los resultados. Es una buena práctica establecer al principio del estudio los valores adecuados de α y p para los distintos grupos y subgrupos en función de su número de individuos, como parte de la descripción de la muestra. Una forma de determinar el valor mínimo de α es sabiendo qué confianza deseamos tener en el estudio. Conocida αmedida entonces: α > αestudio/αmedida. 6.3.2. Contraste de hipótesis Dada una muestra, el contraste de hipótesis verifica si una premisa a la que llamamos hipótesis se verifica o no según el grado de certeza con el que estemos trabajando. Dada una muestra de tamaño n (grados de libertad n –1) y un p-valor (p < (1 – α)/2), el contraste de hipótesis constará básicamente de tres partes: • Hipótesis nula (H0): es la hipótesis que se desea verificar. H1 es la contraria. • Estadístico de contraste (x): es la función que equivale matemáticamente a H 0. • Distribución del estadístico (X(1–α)/2; n–1): es la función de distribución que debe seguir el estadístico. Depende del índice de confianza de los resultados α y de n. El contraste se realiza haciendo la desigualdad x < X(1–α)/2; n–1. Si tal desigualdad es cierta se verifica H0 con una precisión p. En caso contrario se verifica H1. 6.3.3. Métodos estadísticos aplicables a una muestra antropométrica La estadística consiste en la utilización de una serie de parámetros, pruebas y contrastes que permitan encontrar relaciones entre las distintas variables. Es decir, patrones que indiquen que existe correlación entre determinadas variaciones en las variables explicativas y variaciones en las variables respuesta. Si en una prueba se supone que la distribución de la variable es normal, se dirá que la prueba es paramétrica. En caso de no hacerse ninguna suposición sobre la distribución, la prueba será no paramétrica. Así, conocer la forma de la distribución de la variable es importante para elegir la prueba adecuada. Por ello, en muchas ocasiones es imprescindible utilizar pruebas previas que nos permitan decidir qué técnica, prueba, test o contraste se utilizará en el análisis. 6 UNIDAD II. TÉCNICA ANTROPOMÉTRICA Capítulo 6. Tratamiento de la información en Cineantropometría La técnica estadística dependerá de: el número de variables (una o más variables), el tipo de variables, la distribución y el tipo de datos. Las Tablas 6.1, 6.2 y 6.3 son tablas de decisión sobre las técnicas más comunes a seguir en cineantropometría. Tipo de variable Tipo de técnica Técnicas Paramétrica Prueba bondad de ajuste: χ2 Paramétrica Estadísticos descriptivos básicos No – paramétrica Estadísticos descriptivos robustos Cualitativa No – paramétrica Test de Smirnov-Kolmogorov (n > 30), Test de Shapiro-Wilk (n < 20) Dicotómica No – paramétrica Prueba z (para una variable) No – paramétrica Test de Wilcoxon (signos) Cuantitativa Ordinal y nominal Tabla 6.1. Técnicas estadísticas para el análisis de una sola variable Variable explicativa Variable /s-respuesta Técnica Cuantitativa Cuantitativa Correlación, Regresión lineal, Técnicas de Cox – Box. Dicotómica Cuantitativa Prueba t – Student, F de Snedecor Cuantitativa (pareada) Test t – Student pareadas Cuantitativa Test ANOVA, MANOVA Ordinal y nominal Tabla 6.2. Técnicas estadísticas paramétricas para el análisis de dos variables Variable explicativa Dicotómica Nominal Variable /s-respuesta Técnica χ2 de Pearson, Test exacto de Fisher Dicotómica Prueba z, (n <<) Dicotómica(pareada) Prueba de McNemar Nominal Prueba χ2 de Pearson Ordinal Pruebas de Mann – Whitney – Wilcoxon Ordinal (pareada) Prueba de signos pareado Dicotómica Prueba χ2 de Pearson Ordinal Test de Kruskal – Wallis Tabla 6.3. Técnicas estadísticas no paramétricas para el análisis de dos variables 6.4. Análisis de las técnicas estadísticas básicas Al asumir que una variable sigue una distribución normal, debido a que las pruebas de bondad de ajuste son positivas, se calculan los estadísticos descriptivos básicos. 6.4.1. Concepto e interpretación de los estadísticos descriptivos básicos A. Medidas centrales. Estiman el valor más probable. Media (x): posición equidistante de todos los valores de la muestra. Su fórmula es: n x= ∑x i =1 i n siendo xi el valor de la variable para el sujeto número i y n tamaño de la muestra o grupo. 7 COMPENDIO DE CINEANTROPOMETRÍA Coeficiente de asimetría de Fisher: indica cuan simétrica es nuestra distribución respecto del valor central. Este coeficiente viene definido por la expresión: 1 ( x i − x ) 3 ni ∑ g1 = n 3/ 2 ⎞ ⎛1 2 ⎜ ∑ ( x i − x ) ni ⎟ ⎠ ⎝n Los resultados pueden ser los siguientes: g1 = 0 distribución simétrica Existe la misma concentración de valores a la derecha y a la izquierda de la media g1 > 0 distribución asimétrica positiva Existe mayor concentración de valores a la derecha de la media que a su izquierda g1 < 0 distribución asimétrica negativa Existe mayor concentración de valores a la izquierda de la media que a su derecha Coeficiente de Curtosis de Fischer: analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Es decir, nos indica si nuestra muestra es homogénea o está distribuida en el rango de valores que toma. 1 ( x i − x ) 4 ni ∑ −3 g2 = n 2 ⎛1 ⎞ 2 ⎜ ∑ ( x i − x ) ni ⎟ ⎝n ⎠ Se definen tres tipos de distribuciones según su grado de curtosis: 8 g2 = 0 distribución mesocúrtica La concentración de valores en torno al valor medio es como la distribución normal g2 > 0 distribución leptocúrtica Los valores se acercan más al valor medio que en la distribución normal g2 < 0 distribución platicúrtica Los valores se acercan menos al valor medio que en la distribución normal UNIDAD II. TÉCNICA ANTROPOMÉTRICA Capítulo 6. Tratamiento de la información en Cineantropometría B. Medidas de posición. Sitúan a un valor dentro de la distribución e informan sobre la posición en la que se encuentra un individuo al pertenecer a una población con distribución normal. Cuartiles: valores que dividen una serie ordenada en cuatro partes iguales. Se usan en muestras pequeñas. Deciles: valores que dividen una serie ordenada en diez partes iguales. Percentiles: valores que dividen una serie ordenada en cien partes iguales. Se usan en muestras grandes. Todos ellos son unidades desiguales de medición, lo cual no permite su tratamiento aritmético, no son medibles, ni combinables, ni pueden realizarse operaciones matemáticas con ellos. No obstante, son de gran utilidad para grandes muestras de valores cineantropométricos que son tomados como valores de referencia poblacional. C. Medidas de dispersión Amplitud: diferencia entre la observación mayor y la menor. Varianza (s2): estadístico que cuantifica la dispersión de una variable alrededor de su media. n s2 = ∑ (x i =1 i − x)2 n −1 Se divide entre n-1 cuando se pretende estimar la varianza poblacional a partir de una muestra. Se divide entre n cuando se trabaja con toda la población. Desviación típica o estándar (s o σ): se calcula como la raíz cuadrada de la varianza. Sus unidades son las mismas que las del promedio. Esto permite la comparación directa con los estadísticos de posición. A partir de ella se calcula el error estándar de la media (EEM). Coeficiente de variación (CV): índice estadístico que nos indica la variabilidad de la muestra. Por ser un índice no tiene unidades y, por ello, se puede utilizar para comparar dispersiones entre variables que tienen diferentes unidades. Por otra parte, al ser dependiente del tamaño de la muestra también se usa para la comparación directa entre resultados de distintas poblaciones. Por ejemplo: para comparar los resultados de dos estudios independientes o de un estudio con valores estándares. La utilidad de este estadístico es relativa, puesto que las comparaciones entre variables se realizan normalmente mediante la prueba F de Snedecor. 6.4.2. Estadísticos descriptivos robustos Se utilizan para describir distribuciones que no se adapten a la distribución normal. Es decir, cuando las pruebas de bondad de ajuste han sido negativas. 9