Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología 1 INTRODUCCIÓN. 1.1 Historia de la Estadística. Desde los comienzos de la civilización han existido formas sencillas de estadísticas, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año 3000 A.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 A.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el año 594 A.C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales. En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico. 1 Facultad de Trabajo Social, Sociología y Psicología 1.2 Estadística Descriptiva Aplicada a la Psicología Importancia. La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre... y la Estadística ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un determinado grado de confianza. Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa, lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo polifacético de los métodos estadísticos. Sin embargo muchos "investigadores" tendenciosos han cometido abusos con la estadística, elaborando "investigaciones" de intención, teniendo previamente los resultados que les interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de la estadística utilizando modelos inapropiados o razonamientos ilógicos y erróneos que conducen al rotundo fracaso de sus investigaciones. Lincoln L. Chao hace referencia a uno de los más estruendosos fracasos, debido a los abusos en la toma de una muestra: Se trata del error cometido por la Literary Digest que, en sus pronósticos para las elecciones presidenciales en EE.UU. para 1936, afirmó que Franklin D. Roosvelt obtendría 161 votos electorales y Alfred Landon, 370. La realidad mostró a Roosvelt con 523 votos y a Landon con 8 solamente. El error se debió a que la muestra fue tomada telefónicamente a partir de la lista de suscriptores de la Digest y, en 1936, las personas que se daban el lujo de tener teléfonos y suscripciones a revistas no configuraban una muestra representativa de los votantes de EE.UU. y, por ende, no podía hacerse un pronóstico confiable con tan sesgada información. 1.3 El papel de la Estadística en las Ciencias Sociales. En las ciencias sociales se utiliza en la psicología (análisis de los resultados de tests de personalidad o de inteligencia), en las ciencias políticas (medición de la legitimidad del sistema político), en la sociología (medición de las diferencias entre estratos sociales), en la educación (comparación de diversos métodos de enseñanza), en la economía (estimación del crecimiento del P.I.B.), en los negocios (proyección de ventas), en trabajo social (caracterización de grupos marginados), en la geografías( descripción de varias características 1.4 Definición. Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las técnicas que se emplean en los diferentes campos en los que interviene. Sin embargo, diremos, en forma general, que la estadística es un conjunto de técnicas que, partiendo de la observación de fenómenos, permiten al investigador obtener conclusiones útiles sobre ellos. 2 Facultad de Trabajo Social, Sociología y Psicología 1.5 Estadística Descriptiva Aplicada a la Psicología División. El campo de la estadística esta dividido en 2 áreas generales de estudio. La primera es la Estadística Descriptiva cuyo propósito es tomar una gran cantidad de datos, organizarlos y presentarlos de tal forma que revelen información oculta o de interés en la realización de un estudio o investigación. La segunda área es la Estadística Inferencial, que estudia las propiedades de una pequeña muestra de datos seleccionada de una porción mucho mayor para inferir (a través de las matemáticas) la naturaleza de dichas propiedades. Al utilizar la Probabilidad, el investigador puede deducir y algunas veces controlar el error inevitablemente asociado a dichas inferencias. El propósito fundamental de la estadística es revelar la verdad acerca de las propiedades de los datos que están siendo estudiados. Este propósito frecuentemente ignorado de tal manera que no existe manipulación de la información para beneficiar a alguna de las partes. EJEMPLOS No. 1 Estas tratando de determinar el porcentaje de tarjetas de circuitos defectuosas en los lotes que se están produciendo. Las tarjetas son producidas en lotes de 100. Examinas 15 lotes para determinar el número de tarjetas defectuosas en cada lote y la naturaleza del defecto. Suponer que para cada uno de los lotes es generada una forma, en la cual se anotan la naturaleza de los defectos en cada una de las tarjetas defectuosas que hallan sido encontradas. ¿Qué es lo que deberías de hacer con estas formas?. No. 2 En el Departamento de Sociología y Trabajo Social fue aplicada a una encuesta, en la cual a cada estudiante se le preguntaba su sexo, altura, tiempo promedio de descanso, nivel de agrado hacia la estadística, número de CD’s que poseía, importancia de la música o el ejercicio como pasatiempos, No. de veces a la semana que hacía ejercicio. ¿Cómo podemos organizar los datos para poder entenderlos? 1.6 Variables. Una variable es cualquier característica o atributo que difiere para diferentes sujetos. Por ejemplo, si el peso de 30 sujetos fuese medido los pesos varían dependiendo del sujeto, por lo cual el peso es una variable. 1.6.1 Cuantitativas y Cualitativas. Las variables pueden ser cuantitativas y cualitativas. Las variables cualitativas son algunas veces llamadas “variables categóricas”, este tipo de variables son medidas a un nivel de medición nominal. Por otro lado las variables cuantitativas son medidas a un nivel ordinal, por intervalos o proporción (también denominado de razón). Por ejemplo, si a un sujeto le preguntasen cual es su color favorito, entonces la variable sería cualitativa. Si el tiempo que le toma responder fuese medido, entonces la variable sería cuantitativa. 3 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología 1.6.2 Independientes y Dependientes. Cuando un experimento es conducido, algunas variables son manipuladas por el investigador y otras son inherentes al objeto del estudio. Las primeras son denominadas variables independientes, mientras que las otras son las variables dependientes. Por ejemplo, consideremos un experimento hipotético sobre el efecto de consumir alcohol en el tiempo de reacción de la persona. Los sujetos beben ya sea: agua, 1 cerveza, 3 cervezas o 6 cervezas y entonces se mide su tiempo de reacción a ciertos eventos. En este caso la variable independiente sería el número de cervezas ingeridas (0, 1, 3, 6) y la variable dependiente el tiempo de reacción. 1.6.3 Continuas y Discretas. Algunas variables (tales como el tiempo de reacción) son medidas en una escala continua. Hay un número infinito de posibles valores que las variables puedan tomar. Otras variables únicamente pueden tomar un número limitado de valores. Por ejemplo, si una variable dependiente sólo puede tomar valores de una escala de 5 puntos (1, 2, 3, 4, 5), tales variables son denominadas variables discretas. 1.7 Parámetros. Un parámetro es una cantidad numérica obtenida de algún aspecto de un conjunto de valores. Por ejemplo la media es una medida de tendencia central. Las letras griegas son utilizadas para designar los parámetros son raramente conocidos y son usualmente utilizados por los investigadores. En la siguiente tabla se muestra el símbolo del alfabeto griego junto con el estadístico utilizado para su obtención de una muestra. Medida Media Desviación Estándar Proporción Correlación 1.8 Parámetro Estadístico M p s r Sumatoria. La letra griega (sigma) es utilizada para representar la sumatoria. Por ejemplo, en un experimento se mide el desempeño de 4 sujetos en determinada habilidad, la puntuación del sujeto 1 será representada como I, la del sujeto 2 como 2 y así sucesivamente. Los puntajes son mostrados en la siguiente tabla: Sujeto 1 2 3 4 1 2 3 4 Puntuación 7 6 5 8 4 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología La forma que representaría la sumatoria de la 4 ’s es: 4 X i 1 i Esta notación se lee como sigue: Sumar los valores de , desde 1 hasta 4 . El índice i de la anotación indica los valores de que serán sumados. El índice i toma los valores iniciando con el valor de la derecha del signo “=” (en este caso 1) y continua secuencialmente hasta el valor indicado en la parte superior de sigma (para este ejemplo 4). Por lo tanto i toma los valores de 1, 2, 3, y 4, por lo cual los valores de 1, 2, 3, 4 son sumados (7+6+5+8=26). Para hacer las formulas en forma más general las variables pueden ser utilizadas con la notación de la sumatoria. Por ejemplo: significa que se deben sumar los valores de . Desde 1 hasta N , donde N puede ser cualquier número, aunque N generalmente indica el tamaño de la muestra. Con frecuencia una formula abreviada de la sumatoria es utilizada. Por ejemplo significa que se deben sumar todos los valores de Cuando únicamente un subconjunto de los valores de serán sumados entonces la versión completa es requerida. De tal manera que la suma de todos los elementos de excepto el primero y el último (el N’th) debe ser indicada de la siguiente manera: N 1 X i 2 i La cual debe ser interpretada como la suma de las ’s con i=2 hasta N-1 Algunas formulas requieren que cada número sea elevado al cuadrado antes de ser sumados, como N 1 lo muestra la siguiente formula: X i 2 I desarrollando la formula tenemos 72+62+52+82=174. La versión abreviada es simplemente X2 . Es muy importante hacer notar que existe una gran diferencia entre elevar los números al cuadrado y después sumarlos, que sumarlos y posteriormente elevarlos al cuadrado, en este caso el resultado sería (7+6+5+8)2 =676, resultando muy diferente al 174 del ejemplo anterior. Algunas veces una formula requiere que sea calculada la suma de los productos cruzados. Por ejemplo, si 3 sujetos fueron examinados dos veces, las calificaciones son asignadas a e Y, como lo muestra en la siguiente tabla: Sujeto 1 2 3 2 1 4 Y 3 6 5 La suma de los productos cruzados (2x3)+(1x6)+(4x5)=32 puede ser representada de la siguiente manera 5 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología 1.8.1 Teoremas Básicos. 3 2 4 8 3 1 (x +Y)=Y (x +Y)= 11+5+5=21 x =3+2+4=9 Y =8+3+1=12 x + Y =9+12=21 x a =a x (a es una constante) Si a =2. x a = (2)(3)+(2)(2)+(2)(4)=18 a x(2)(9)=18 (x-M)2 = x2-( x)2/N (N es el número de valores, 3 para este ejemplo, y M es la media aritmética, también igual a 3). (x-M)2 =(3-3)2+(2-3)2+(4-3)2=2 x2=32+22+42=29 ( x)2/N=92/3=27 x2-( x)2/N=29-27=2 1.9 Niveles de Medición. La medición de algún atributo es un conjunto de cosas, es el proceso de asignar números u otros símbolos a las cosas de tal manera que las relaciones de los números o símbolos reflejen las relaciones de los atributos que están siendo medidos. Una forma particular de asignar números o símbolos para medir alguna cosa es denominada escala de medición “Resumiendo la medición es un proceso mediante el cual las cosas se diferencian”. La medición en las ciencias sociales y en la educación por lo general produce números, pero tales números están sin algunas de las propiedades matemáticas para la medición de variables como tiempo, distancia, área, peso y costo. Por ejemplo, la escala de medición para evaluar el CI difiere en forma significativa de la usada para medir la estatura. Esto es importante debido a que la interpretación de un valor influye la escala de medición correspondiente. Generalmente se distinguen cuatro escalas o valores de medición: nominal, ordinal, intervalos y de razón. 6 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología 1.9.1 Nominal. La medición nominal es la forma más rudimentaria de medir. Es el proceso de agrupar unidades (objetos, personas, etc.) en categorías basándose en uno o más atributos o propiedades observados. Con las escalas nominales, los números asignados definen cada grupo distinto y sirven meramente como etiquetas o nombres. La magnitud de los números no reflejan alguna ordenación inherente de las cosas a las que fueron asignados, más bien sirven solo como códigos de identidad. Las observaciones no pueden ser ordenadas de pequeño a grande o de menos a más. La única cuestión comparativa relevante para los datos nominales pertenecen a si dos observaciones son o no de la misma. Ejemplos de la medición nominal son los partidos políticos, etnia, genero, tipo de escuela (privada o pública). 1.9.2 Ordinal. Es cuando las observaciones pueden colocarse en un orden o jerarquía con respecto a la característica que se evalúa. La magnitud de los números no es arbitraria, sino que representa el orden del rango del atributo observado. Se supone un continuo subyacente en los números. Ejemplos de este nivel de medición son la clase social, lugar sen la clase, concursos de belleza, etc. 1.9.3 Intervalo. El nivel de intervalo tiene, además de las propiedades de la escala ordinal, la propiedad de que la distancia entre dos valores es de una magnitud conocida lo cual da a estas escala un mayor grado de perfección. En la escala de intervalo el punto cero y la unidad de medición son arbitrarios. La razón entre dos intervalos es siempre independiente del punto cero y de la unidad que se emplea en la medición. Como ejemplo podemos mencionar: la temperatura, las puntuaciones del IQ y la fecha. 1.9.4 Razón. Este nivel de medición tiene propiedades de las escalas ordinales y de las escalas de intervalos, pero, además el cero representa la ausencia de la característica en cuestión (cero absoluto); en consecuencia, los números pueden compararse como proporciones. Las medidas de longitud para las cuales se utiliza una regla o una cinta métrica ejemplifican una medición de razón. Si Sue mide 1.52 mts. y Carmen 1.27 mts. Entonces Sue es 119% tan alta como Carmen o Sue es 20% más alta que Carmen. Además del ejemplo anterior, las medidas de tiempo, distancia, peso, área y costo por lo general representan escalas de razón. 1.10 Organización de Datos. 1.10.1 Distribuciones de Frecuencia Es el conteo y agrupación de los datos de acuerdo a un sistema de clasificación previamente determinado. Sirven como depositarios de información, con el propósito de efectuar posteriormente el cálculo de medidas estadísticas. Tienen como finalidad ayudar en el análisis formal de las interrelaciones entre las variables. 7 Facultad de Trabajo Social, Sociología y Psicología 1.10.1.1 Estadística Descriptiva Aplicada a la Psicología Distribuciones de Frecuencia No Agrupada Tienen la función de mostrar en forma organizada las características más importantes de un conjunto de valores. La categoría o distribuciones ordinales representan el grado en que está presente una característica en particular. El listado de tales categorías o puntajes en las distribuciones de frecuencia simple deben hacer de modo que refleje ese orden Elementos: Un listado de todos los valores ordenados de mayor a menor, y la frecuencia de cada uno de los valores. Elementos de una Tabla Número de la tabla Titulo Nota en el encabezado Fuente Nota al pie Casillas cabecera Columnas Reglones o hileras Cabeza de cuadro Cuerpo de Cuadro Renglón de totales 8 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología Comparación. Proporción. Compara el número de casos en una categoría dada con el tamaño total de la distribución. P=f /N Porcentaje. Frecuencia de ocurrencia de una categoría por cada 100 casos. %=100*(f /N) Razones. Comparación directa entre el número de casos que caen dentro de una categoría, con el número de casos que caen dentro de otra categoría. Razón=f1 / f2 Tasas. Compara el número de casos reales y el número de casos potenciales Tasa de Nac.=1000*(f C. Reales / f C. Potenciales) Incremento Porcentual. Comparación directa entre el número de casos que caen dentro de una categoría, con el número de casos que caen dentro de otra categoría. I% Promedio del Incremento. PI % P1 P0 *100 P0 P1 P0 2 * *100 P1 P0 n P1 = Valor Actual P0= Valor Anterior N= No. de periodo 9 Facultad de Trabajo Social, Sociología y Psicología 1.10.1.2 Estadística Descriptiva Aplicada a la Psicología Distribuciones de Frecuencia Agrupada Es la condensación de los puntajes separados en un número de categorías o grupos más pequeños, donde cada uno contenga más de un puntaje Procedimiento: Calcular el rango. El rango es la diferencia entre el valor más grande y el valor más pequeño. (Xmax-Xmin) Determinar el número de intervalos de clase. Significa en cuántas categorías o subgrupos vamos a clasificar o agrupar nuestros datos. Para determinar el número óptimo de intervalos de clase, en los cuales nuestros datos quedarán perfectamente distribuidos, aplicamos la Regla de Sturges: No. Intervalos = 1 + ( 3.322*(log n)) En donde “n” representa el número total de datos u observaciones que tenemos recopilados. Evidentemente, el número de intervalos debe ser exacto; es decir, un número entero. Determinar el ancho del intervalo. Dividiendo el rango entre el número deseado de intervalos. (w=rango/No. Intervalos). Especificar los límites del intervalo. Cada intervalo debe comenzar con un múltiplo de w, el cual debe ser menor o igual Xmin. Calcular los límites reales del intervalo. A los límites inferiores se les resta 0.5 y a los límites superiores se les suma 0.5. Determinar el punto medio. X=(limite inferior+limite superior)/2. Conteo de los valores. Determinar la frecuencia de cada uno de los intervalos. Determinar la frecuencia acumulada.Determinar el porcentaje de cada intervalo (%). Determinar el porcentaje acumulado (% acumulado). Construir una distribución de frecuencia acumulada para las siguientes 40 calificaciones de la materia de Estadística I. 61 67 56 64 71 38 61 63 43 50 39 58 52 50 46 51 40 49 56 41 50 53 58 50 54 42 55 51 40 47 51 41 55 42 61 52 42 59 45 56 10 Facultad de Trabajo Social, Sociología y Psicología 1.10.2 Estadística Descriptiva Aplicada a la Psicología Representaciones Gráficas Gran parte de la utilidad que tiene la Estadística Descriptiva es la de proporcionar un medio para informar basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de información dependerá de la presentación de los datos, siendo la forma gráfica uno de los más rápidos y eficientes, aunque también uno de los que más pueden ser manipulados o ser malinterpretados si no se tienen algunas precauciones básicas al realizar las gráficas. Existen también varios tipos de gráficas, o representaciones gráficas, utilizándose cada uno de ellos de acuerdo al tipo de información que se está usando y los objetivos que se persiguen al presentar la información. Entonces, mencionaremos algunas consideraciones que conviene tomar en cuenta al momento de realizar cualquier gráfica a fin de que la información sea transmitida de la manera más eficaz posible y sin distorsiones: 1. El eje que represente a las frecuencias de las observaciones (comúnmente el vertical o de las ordenadas) debe comenzar en cero (0), de otra manera podría dar impresiones erróneas al comparar la altura, longitud o posición de las columnas, barras o líneas que representan las frecuencias. 2. La longitud de los espacios que representan a cada dato o intervalo (clase) en la gráfica deben ser iguales. 3. El tipo de gráfico debe coincidir por sus características con el tipo de información o el objetivo que se persigue al representarla, de otra manera la representación gráfica se convierte en un instrumento ineficaz, que produce más confusión que otra cosa, innecesario o productor de mal interpretaciones. Por ejemplo, si se desea representar la proporción de población masculina en un país conviene más usar una gráfica de pastel o circular que una gráfica de barras al compararla contra la población femenina; por un lado se puede apreciar dicha proporción, por el otro se aprecia cuál de las dos poblaciones es mayor. Hay un punto que conviene remarcar: existe software que permite la construcción rápida y eficiente de gráficas a partir de bases de datos o hojas de cálculos, pero no importa cuán bonita, bien delineada, bien coloreada o bien presentada esté una gráfica, si no se han tomado en cuenta consideraciones de este tipo que tienen que ver más sobre el objetivo de estas herramientas y la Estadística: la transmisión eficiente de la información. 1.10.2.1 Tipos de gráficos Para las distribuciones de frecuencias la representación gráfica más común es el histograma. Un ejemplo es el que se presenta a continuación y que representa el número de "visitas" que ha tenido este hipertexto de acuerdo a la hora de la visita. 11 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología En el eje horizontal (o de las abscisas) se representan los intervalos de los datos, marcándose de manera continua las fronteras entre cada uno de los éstos. De esta manera, el histograma está compuesto rectángulos, cuyo número coincide con la cantidad de intervalos considerados, el ancho de la base de cada uno de esos rectángulos es la misma siempre y coincide con las fronteras de los intervalos, y la altura corresponde a la frecuencia de cada intervalo. Es importante observar que resulta difícil utilizar este tipo de representación cuando existen intervalos abiertos o cuando los intervalos no son iguales entre sí. Otra observación es la amplitud de los intervalos, que se puede establecer utilizando la regla de Sturges, pues al cambiarla la presentación visual de un histograma puede variar. Un tipo de gráfico muy parecido al histograma es la gráfica de columnas. Para este tipo de gráfica, elaboradas con rectángulos también, se pide que sus bases sean del mismo ancho y sus alturas equivalentes con las frecuencias. Para este tipo, a diferencia del histograma, no es necesario tener una escala horizontal continua, por lo que los rectángulos (o barras) no tienen que aparecer juntas entre sí. Otra observación pertinente es que se pueden representar en la misma gráfica, utilizando las mismas escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias observaciones. Esto produce una gráfica con varias series, correspondiendo cada una de ellas a cada observación de la muestra (o población), y teniéndose una gráfica compuesta. Es conveniente que cada serie de datos (u observaciones) sean ilustradas o iluminadas de igual manera entre sí, pero distinta de las demás. El ejemplo que sigue pertenece al comportamiento de las calificaciones parciales de tres alumnos de preparatoria. Las series (cada una de las calificaciones parciales) están coloreadas con diferente 12 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología color para mostrar el comportamiento tanto individual, como de cada uno de los alumnos con respecto a los demás. Es interesante observar que la escala horizontal no es continua (es nominal). Existe la posibilidad, y si los recursos lo permiten, de representar gráficos compuestos de una manera "tridimensional", es decir, con gráficos que posean no sólo dos ejes, sino tres; y en los que los rectángulos son sustituidos por prismas de base rectangular (ocasionalmente el software en el mercado permite utilizar prismas cuya base son polígonos regulares de más de cuatro lados, pirámides o cilindros). Un ejemplo es el siguiente: donde se representa el porcentaje del PIB gastado en docencia e investigación por cinco países en el lapso de 1988 a 1999 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12). Es importante considerar que este tipo de gráficos puede complicarse mucho, haciendo que la información sea menos legible. 13 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología También es posible realizar gráficas de barras horizontales, los cuales se parecen mucho a las gráficas de columnas, con la salvedad importante de que la función de los ejes se intercambian y el eje horizontal queda destinado a las frecuencias y el eje vertical a las clases. Es muy común que este tipo de gráficos se utilicen para ilustrar el tamaño de una población dividida en estratos como, por ejemplo, son sus edades. El ejemplo que se presenta es la población de un país ficticio llamado "Timbuctulandia": A este tipo de gráficos en particular se le llama pirámide de edades por su forma. Incluso, cuando se compara la población masculina y femenina por estratos de edades, se estila utiliza el lado izquierdo para la población de un sexo y el lado derecho para el otro, el resultado es una "pirámide" casi simétrica (dependerá de la población en particular). Cuando los datos se relacionan entre sí, es decir, cuando podemos decir que existe cierta continuidad entre las observaciones (como por ejemplo el crecimiento poblacional, la evolución del peso o estatura de una persona a través del tiempo, el desempeño académico de un estudiante a lo largo de su instrucción escolar, las variaciones presentadas en la medición realizada en algún experimento cada segundo o minuto) se pueden utilizar las gráficas de líneas, que consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con líneas: 14 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo largo de cinco observaciones anuales. Al igual que en el caso de las gráficas de columnas (y de otras más) es posible presentar varias series de observaciones (en este caso cada serie de observaciones son los pesos de un individuo). Otra forma de representación de un uso menos común, y muy parecida a las gráficas de líneas, es el polígono de frecuencias. La diferencia fundamental entre ambas es que en el polígono de frecuencias se añaden dos clases con frecuencias cero: una antes de la primera clase con datos y otra después de la última. El resultado es que se "sujeta" la línea por ambos extremos al eje horizontal y lo que podría ser una línea separada del eje se convierte, junto con éste, en un polígono. El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigación durante el año de 1990 en cinco países (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12): El Excel no crea automáticamente polígonos de frecuencias, sino que produce gráficas de líneas. Sin embargo, es posible arreglárselas para hacerlas. Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen: ojiva mayor que y las ojivas menor que. Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por ésto la aplicación de la técnica es parcial): 1. Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva menor que, con el derecho. 2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor. Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que, utilizando los datos que se usaron para ejemplificar el histograma: 15 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que está sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se diría: después de las 4:00 horas). De forma análoga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el número de observaciones menores que la frontera señalada (en caso de tiempos sería el número de observaciones antes de la hora que señala la frontera). Si se utiliza una distribución porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que según sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que que se acaba de usar, pero con una distribución porcentual: En ocasiones, al comparar dos series de observaciones (o de datos) se utiliza una llamada gráfica de áreas, la cual consiste en rellenas el área que se encuentre debajo de las líneas que resultan de una gráfica de líneas. El ejemplo que se presenta es la comparación del total de las especies de las familias del orden Carnívora y las que están amenazadas, en México, (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):58): 16 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología Cuando lo que se desea es resaltar las proporciones que representan algunos subconjuntos con respecto al total, es decir, cuando se está usando una escala categórica, conviene utilizar una gráfica llamada de pastel o circular. Por ejemplo, para ilustrar la matrícula en licenciatura (en México) por áreas de conocimiento en el año de 1992 se puede usar algo así como sigue (Fuente: ANUIES,1995): De hecho, si se desea resaltar una de las categorías que se presentan, es válido tomar esa "rebanada" de la gráfica y separarla de las demás: 17 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología Para hacer una gráfica de este tipo en papel. Hay que tomar algunas precauciones al utilizar este tipo de gráficos. Por un lado, comparar dos gráficos circulares (por ejemplo, si se quisieran comparar las proporciones de matrículas en licenciatura por áreas de conocimiento en licenciatura para dos años distintos) resulta muy difícil y, por tanto, no es muy aconsejable. Por otro lado, en ocasiones existen categorías con pocas frecuencias (por ejemplo, dos o tres con frecuencias relativas menores al 1% cada una), haciendo que la gráfica resulte "pesada" y las etiquetas se encimen. Una posible solución es juntarlas en una sola categoría (por ejemplo, la típica "otras" o "varias"), pero entonces habría que ponderar si se hace una gráfica extra con dichas observaciones únicamente, haciendo la anotación pertinente, o simplemente se ignoran por no resultar significativas. Actualmente, y mucho en los medios masivos de comunicación, se utilizan gráficos para ilustrar los datos o los resultados de alguna investigación. Regularmente se utilizan dibujos para representar dicha información, y el tamaño o el número de estos dibujos dentro de una gráfica queda determinado por la frecuencia correspondiente. A este tipo de gráfica se le llama pictograma y éstos son dos ejemplos: El de la izquierda representa la población de los Estados Unidos (cada hombrecillo representa a dos millones de habitantes), el de la derecha representa la masa de tres planetas de nuestro sistema solar 18 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología tomando como unidad a la masa de la Tierra (cada representa la masa de nuestro planeta: Venus tiene masa menor y Neptuno tiene más 17 veces más masa que la Tierra). Las versiones del Excel 7.0 y anteriores no tienen opciones para realizar este tipo de gráficas, las posteriores sí. Otros programas contemporáneos (como el Corel Draw o el Harvard Graphics) sí son capaces. Cuando se pretende ilustrar la dispersión de las observaciones realizadas, y así trabajar algunas cosas como correlaciones se puede utilizar una gráfica de dispersión. Por ejemplo, el ejemplo de la izquierda es la dispersión que se presenta al comparar el número de tesis doctorales en ciencias exactas contra el número de total de tesis doctorales (todo en México) en observaciones anuales entre 1984 y 1990 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12): La gráfica de la derecha es resultado de comparar el diámetro (en miles de kilómetros) de los planetas interiores del nuestro sistema solar contra sus densidades (en gramos por centímetro cúbico). Es interesante observar que los puntos parecen "seguir" una línea imaginaria que se asemeja a una recta, con excepción de un caso atípico: Mercurio. Uno de los usos de este tipo de gráficas es precisamente encontrar si las observaciones siguen algún patrón lineal (una línea de tendencia) o si existen valores atípicos. Para el caso del Excel, el programa es capaz de graficar las líneas de tendencias que siguen un conjunto de datos. Un tipo de gráfico similar a las gráficas de dispersión son las gráficas de burbujas, en las cuales se presenta la dispersión de las observaciones de la misma forma que aquéllas, pero se le añade la posibilidad de visualizar otra variable representada en el tamaño del punto, pues éstos se convierten en círculos (burbujas) con radios proporcionales a las magnitudes que representan. 19 Facultad de Trabajo Social, Sociología y Psicología Estadística Descriptiva Aplicada a la Psicología Este ejemplo compara la distancia que existe en cada uno de los planetas interiores de nuestro sistema solar al Sol contra el tiempo que necesitan para recorrer sus órbitas, y el tamaño de las burbujas indica la masa de cada planeta. Además existen otros tipos de gráficos, cada uno con características particulares que les proporcionan cierta intencionalidad para su uso, como son las gráficas de radar y las gráficas polares. 20