ESTRUCTURA SOCIAL DE ESPAÑA Curso 2005-2006 Facultad de Ciencias de la Comunicación Comunicación Audiovisual ELABORACIÓN DE UNA TABLA ESTADÍSTICA El problema que trata de resolver una tabla estadística es CÓMO COMPARTIR CON OTROS del mejor modo posible los resultados de una investigación. Se trata de presentar una serie de datos de la manera más clara, concisa y precisa y al mismo tiempo ayudar a los demás a comprender el sentido o el significado de los datos representados en una tabla de tal manera que puedan ser fácilmente interpretados. En gran parte, la comunicación e interpretación de los datos de una investigación dependen de la calidad de la presentación de las tablas estadísticas. Por tanto, cuando elaboramos una tabla estadística, estamos llevando a cabo una sistematización de los datos cuantitativos de una investigación empírica para ofrecer una versión estadística, sintética y global del fenómeno estudiado y de las relaciones entre sus distintos aspectos. El tipo de tabla más conocido es aquel cuyos datos están representados como si de una lista se tratase y está compuesta por COLUMNAS (en sentido vertical) y FILAS (en sentido horizontal). Cada COLUMNA de una tabla representa una variable (característica) distinta y habitualmente las tablas tienes múltiples variable. El hecho de que una tabla contenga en su primera columna una variable concreta (y no otra), proporciona un indicio para la interpretación de los datos: da a entender que la tabla ha sido construida para responder a una pregunta concreta. En la presentación de las tablas hay una serie de aspectos FORMALES que se deben tener en cuenta: 1. Todas las tablas deben numerarse consecutivamente (Tabla 1; Tabla 2; etc.) 2. Cada tabla debe llevar un título en el que se resuma con exactitud la naturaleza de los datos que contiene. Dicho título debe dar al lector información suficiente para decidir si ha de examinar la tabla con detalle, pero no ha de ser tan pormenorizado que ahorre la molestia de hacerlo. En general el TITULO DE UNA TABLA debe indicar solo las principales variables a los que se refiere la tabla concreta. Cuando en una tabla los datos hacen referencia a un periodo de tiempo debe incluirse dicho periodo en el título 3. Cuando una tabla no es de elaboración propia, sino que se ha tomado total o parcialmente de otra fuente, debe indicarse a pie de la misma, la fuente de la que procede. 4. Las notas propiamente dichas de una tabla, se situarán inmediatamente debajo de la tabla, después de la posible identificación de la fuente. 5. Al escribir una tabla, en general, es aconsejable dejar tres espacios encima del titulo de la tabla, dos entre éste y la tabla y tres debajo de la tabla. 6. Lo mejor es que, en lo posible, no trazar líneas verticales para separar las distintas columnas de la tabla. 1 7. Los epígrafes y los datos interiores de la tabla deben ir a doble espacio para facilitar su lectura, a excepción de los títulos y los epígrafes de categoría que no quepan en una línea, que deberán ir a una solo espacio. Las variables o valores de cada categoría se deben describir lo más brevemente posible, aunque de forma que aclare el significado de los datos. Tabla 1. Población de las capitales de provincia en Andalucía , 1900-2001 Capitales Año 1900 Año 2001 Almería 47.326 166.328 Cádiz 69.382 133.363 Córdoba 58.275 308.072 Granada 75.900 240.661 Huelva 21.359 142.284 Jaén 26.434 112.590 Málaga 130.109 524.414 Sevilla 148.315 684.633 Fuente: INE. Censo de Población. En la CONSTRUCCIÓN DE LAS TABLAS hay que tener en cuenta sus diversos elementos y una determinada disposición de los mismos: 1. TITULO: El título de una tabla, debe dar al lector información suficiente para decidir si ha de examinar la tabla con detalle, pero no ha de ser tan pormenorizado que ahorre la molestia de hacerlo. En general el TITULO DE UNA TABLA debe indicar solo las principales variables a las que se refiere la tabla concreta. Cuando en una tabla los datos hacen referencia a un periodo de tiempo debe incluirse dicho periodo en el título. Suele ser frecuente que en el título de una tabla figuren en primer lugar la variable DEPENDIENTE (variable a explicar), después la variable INDEPENDIENTE (variable explicativa), y finalmente la referencia al lugar, año, etc. 2. COLUMNAS: en las columnas se puede distinguir la columna matriz de todas las demás. Es la que aparece a la izquierda de la tabla y contiene las dimensiones de categorías de la VARIABLE DEPENDIENTE que domina el contenido de las demás columnas. Estas se refieren a las dimensiones de la variable independiente. Tanto unas como otras, se deben ordenar conforme a algún criterio. 2 3. DISPOSICIÓN DE LAS VARIABLES: las tablas, como es sabido, se componen de filas y columnas numéricas. Aunque no siempre se cumple, es habitual colocar las frecuencias referidas a cada categoría o dimensión de las variables INDEPENDIENTES, verticalmente (en columnas); y los de cada categoría o dimensión de la variable DEPENDIENTE horizontalmente (en filas). Esto exige que las cabeceras de las filas sean las dimensiones en que se divide la variable dependiente, y las cabeceras de las columnas sean dimensiones de la variable INDEPENDIENTE. Sea o no esta la disposición de la variable dependiente, se suele indicar el sentido horizontal o vertical de sus valores (si figuran en , colocando un 100 en la primera columna si los valores de la variable independiente figuran en sentido vertical, y en la primera fila si figuran en sentido horizontal). 4. UNIDADES QUE REPRESENTAN LAS CIFRAS: es esencial en las tablas que se exprese claramente las unidades que representan las cifras que figuran en las tablas: porcentajes, tasas, coeficientes, unidades simples, etc. Si las unidades son porcentajes y sus totales suman más de 100, por tratarse, por ejemplo, de preguntas de respuesta múltiple, debe advertirse así en la tabla. Si las cifras de las tablas son porcentajes, hay que tener en cuenta la denominada REGLA DE ZEISEL según las cual los se deben hallar y expresar en las tablas en la dirección de la VARIABLE INDEPENDIENTE o causa, utilizando, por tanto, como base para hallar los las cifras totales absolutas de la variable INDEPENDIENTE. 5. Las COLUMNAS DE TOTALES. Es otro de los elementos importantes de las tablas. No solo deben figurar en ellas los totales generales de la tabla en sentido horizontal y vertical, sino también los totales parciales en el caso de que la tabla se componga de varios grupos. Todas estas columnas de totales, que reciben el nombre de MARGINALES, representan agrupados o sintetizados los resultados de las tablas para cada unas de las variables o características que comprenden, y representan los valores de la tabla respecto a una sola variable, si es que la tabla está formada por más de una. 3 LECTURA DE UNA TABLA ESTADÍSTICA Los comentarios de una tabla no deberá limitarse a repetir el contenido de la misma, ya que el lector siempre tiene la posibilidad de ver las tablas. Ni se debe cargar el comentario con porcentajes u otros términos cuantitativos, aunque estos se podrán utilizar. En cambio en el comentario de una tabla se deberán establecer con claridad las relaciones demostradas en ella, llamando la atención sobre los puntos de mayor interés o los hallazgos particularmente notables. Puede abordarse igualmente en el comentario de las tablas, las posibles razones de las semejanzas o diferencias que se hubieran señalado. Igualmente se puede abordar la variedad de variaciones de los datos y ,en su caso, la consistencia de la variación de las variables, las posibles faltas de regularidad en los datos, e incluso la fiabilidad de la fuente de que proceden los datos. Tabla 2.Grado de satisfacción de los ocupados con su trabajo por sexo, edad, nivel de estudios y situación profesional. NUMERO Absoluto TOTAL SEXO Varones Mujeres EDAD 16-19 20-24 25-29 30-44 45-54 55-64 65 y más ESTUDIOS Menos prim. Primarios Secundarios Universita. Otros Ns/nc. S. PROFES Asalariado No asalaria. N.C. TOTAL Muy Poco Non sabe/ satisfecho Satisfecho satisfecho No contesta 6.020 100,0 51,0 38,1 9,5 1,4 3.653 2.367 100,0 100,0 50,9 51,1 38,2 37,9 9,2 10,1 1,7 1,0 102 511 819 2.651 1.283 618 36 100,0 100,0 100,0 100,0 100,0 100,0 100,0 54,5 45,4 47,6 50,6 52,9 56,4 64,8 35,5 44,4 41,4 38,1 36,1 34,0 21,4 9,5 9,3 9,8 9,9 9,8 7,1 13,8 0,5 0,9 1,2 1,5 1,2 2,5 0,0 185 965 3.315 1.350 53 153 100,0 100,0 100,0 100,0 100,0 100,0 43,9 47,6 49,4 57,4 44,7 59,2 40,6 39,6 39,5 34,4 37,3 29,4 13,8 11,5 9,4 7,7 12,9 10,10 1,7 1,5 1,7 0,4 5,1 1,4 4.915 1.063 42 100,0 100,0 100,0 49,7 57,1 46,1 39,3 32,4 38,4 9,7 8,5 14,0 1,3 2,1 1,5 Fuente: Encuesta calidad de vida en el trabajo. Año 2004. Subsecretaria de Trabajo y Asuntos Sociales Leer una tabla es, en primer lugar especificar la pregunta a que dicha tabla puede responder. Su enunciado proporciona ya una primera aproximación, aunque se requiera 4 la consiguiente lectura de control. La pregunta a la que puede responder una tabla está completamente definida por la estructura de las dos variables y por el sentido en el que se calculan los porcentajes (en columna o en filas). Leer una tabla equivale a interpretar, a comparar los resultados de las tablas. Respecto a la lectura de las tablas, se debe tener en cuenta una regla de oro que no se puede olvidar: cuando los porcentajes están calculados en sentido horizontal, los leemos o comparamos verticalmente. Según esta regla indicada por Zeisel (Dígalo con números. F.C.E. México. 1962.), se deben efectuar las comparaciones en la dirección opuesta a la que se han calculado los porcentajes, es decir, si los se han calculado en dirección vertical interesa, antes que comparar unos con otros en esta dirección, comparar horizontalmente los tantos por ciento que figuran en las distintas columnas en nivel similar, o en la misma línea. Como conjunto de reglas generales a seguir en este punto, hay que tener en cuenta las siguientes: 1. Leer detenidamente el título de la tabla. . 2. Leer atentamente las notas o cualquiera otras explicaciones que existan en la tabla. 3. Fijarse en la fuente o el origen de donde se ha tomado la tabla. 4. Fijarse en las notas a pie de página si existen 5. Hallar qué unidades son usadas en las tablas. 6. Fijarse en los promedios totales 7. Ver la variabilidad que existe entre los datos de la tabla. 8. Mirar cómo están relacionados o asociados los porcentajes en cada uno de los criterios principales de clasificación. 9. Examinar la consistencia de los resultados y la interacción entre ellos. 10. Prestar atención a las irregularidades que se observan en los resultados de la tabla. 5 EL ANÁLISIS DE LOS DATOS En el diseño de una investigación ya se prevén los análisis a realizar con la información reunida en el desarrollo de la investigación. No obstante, resulta necesario hacer análisis previos exploratorios como paso previo a la decisión de qué tipo de técnica analítica se va a aplicar: UNIVARIABLE, BIVARIABLE O MULTIVARIABLE. 1. Análisis estadístico univariable: en la exploración de los datos primero se procede al análisis exhaustivo de cada variable Para cada variable se calcula su DISTRIBUCIÓN (o tabla de frecuencias) que incluye los distintos valores que presenta la variable, es decir, el número de veces que aparece Para conocer la importancia de cada valor y a efectos comparativos, se obtienen las frecuencias relativas (porcentuales) que representa cada valor en el conjunto de la muestra. Por último se calculan FRECUENCIAS RELATIVAS ACUMULADAS que denotan la proporción de casos (válidos) que se encuentran por debajo o por encima de un determinado valor de la variable. 2. Análisis estadístico bivariable: después de hacer el análisis univariable (exploratorio), procede hacer el bivariable, tanto con fines descriptivos (descripción de las población observada) como explicativo (análisis de posibles relaciones causales entre variables independientes y dependientes) En la investigación social la práctica habitual es la confección de TABLAS DE CONTINGENCIA (tienen, al menos, dos variables) Además de las variables, ha de delimitarse la información que se precise (frecuencias absolutas, porcentajes (horizontales, verticales, totales), y estadísticas que midan el grado y la significatividad de la relación entre las variables. Cada casilla que resulta del cruce de una FILA con una COLUMNA (es decir, del cruce de un atributo de una variable con el atributo de la otra variable. La lectura de las tablas, con frecuencia se limita a comentarios porcentuales: se contrastan los porcentajes de cada casilla para comprobar la existencia de variaciones entre los distintos atributos de las variables. Con tal fin se calculan los porcentajes a partir de los marginales de la tabla. Si se toma como base el total de filas, el porcentaje será HORIZONTAL, y las comparaciones porcentuales se efectuarán VERTICALMENTE. Por el contrario, cuando la base la constituye el total de COLUMNAS, se procede a la inversa, el porcentaje será VERTICAL y las comparaciones de porcentajes en sentido HORIZONTAL. El investigador deberá escoger entre uno u otro tipo de porcentaje (horizontal o vertical), en conformidad con los objetivos del estudio y las hipótesis que compruebe. Si bien existen mayores restricciones en estudios EXPLICATIVOS que en los DESCRIPTIVOS. Si la finalidad de la investigación es la búsqueda de RELACIONES CAUSALES, los porcentajes se estiman solo en el sentido de la VARIABLES INDEPENDIENTE. Esta suele situarse en las COLUMNAS y la DEPEDIENTE en las FILAS; salvo que el elevado número de atributos de la variable independiente desaconseje su 6 ubicación en las columnas. Esta disposición responde a la mayor facilidad de lectura (en la cultura occidental), en sentido horizontal frente a la vertical. Los porcentajes serían, por tanto, verticales y las comparaciones horizontales. Las diferencias porcentuales deben superar un determinado valor (al menos superior al 5%) para que puedan considerarse importantes. Depende del error muestral que derive del tamaño de las bases sobre la que se calcula los porcentajes. Si los tamaños muestrales son bajos la diferencia porcentual ha de ser superior, si de ella quiere deducirse la existencia de ASOCIACIÓN entre las VARIABLES. En la exposición de la tabla (en el informe de investigación) ha de indicarse, explícitamente, la dirección en la que se han calculado los porcentajes. Como solo se aportan datos porcentuales se recomienda poner entre paréntesis las bases de los porcentajes. Ello ayudará a la interpretación de las diferencias que en ellos se observen También se aconseja encabezar la tabla con un título que describa sucintamente, el contenido de la tabla. En el título han de especificarse las VARIABLES en la tabla y su relación. Pese a la existencia de convencionalismos en el formato de las tablas, el investigador es libre de diseñar el formato que más se ajuste a su estilo particular, y al contenido de la tabla. La lectura porcentual, aunque ilustrativa, resulta, no obstante, insuficiente, precisa del complemento de estadísticos que gradúen la asociación entre variables y su significatividad. Este complemento adquiere un mayor protagonismo cuando de las tablas quiera deducirse una relación causal. Dos variables se hallan relacionadas si sus atributos varían conjuntamente. Para la graduación de esta relación se acude a alguno de los estadísticos de contingencia, dependiendo del nivel de medición de la variable(nominal, ordinal, de intervalo). 3. Análisis multivariable: Los análisis univariables y bivariables con frecuencia se muestran insuficientes para cubrir los objetivos de la investigación. El proporcionar una visión conjunta e integrada que describa o explique la realidad que se analiza, demanda la realización de ANÁLISIS MULTIVARIABLE (de más de dos variables al mismo tiempo). De otra forma no podría medirse las influencias e interrelaciones existentes entre grupos de variables La peculiaridad del análisis multivariable reside en operar con un número elevado de variables, y de manera simultánea, basándose en el cálculo matricial (conjunto de técnicas estadísticas que permite el análisis simultáneo de más de dos variables en una muestra de observaciones) Para el análisis multivariable existe un amplio abanico de técnicas que pueden agruparse en dos grandes categorías (técnicas de dependencia y técnicas de interdependencia), en función de si se diferencia o no, entre variables dependientes e independientes. Málaga octubre 2005 7