Unidad I

Anuncio
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
1 INTRODUCCIÓN.
1.1
Historia de la Estadística.
Desde los comienzos de la civilización han existido formas sencillas de estadísticas, pues ya se
utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de
cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año 3000 A.C. los
babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción
agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos
de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. Los
libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El
primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de
las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año
2000 A.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el año 594
A.C. para cobrar impuestos.
El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la
población, superficie y renta de todos los territorios bajo su control. Durante la edad media sólo se
realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el Breve y
Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y
762 respectivamente.
Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un
censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday
Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y
en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the
London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres).
Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en
1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de
mortalidad. En el siglo XIX, con la generalización del método científico para estudiar todos los
fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir
la información a valores numéricos para evitar la ambigüedad de las descripciones verbales.
En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud
los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve
como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no
consiste ya sólo en reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa
información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las
aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud,
utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para
analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias
estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio
estadístico.
1
Facultad de Trabajo Social, Sociología y Psicología
1.2
Estadística Descriptiva Aplicada a la Psicología
Importancia.
La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende mejor si
tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre...
y la Estadística ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones
con un determinado grado de confianza.
Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa, lo cual es
un concepto profano que se deriva de la ignorancia en este campo y de lo polifacético de los
métodos estadísticos. Sin embargo muchos "investigadores" tendenciosos han cometido abusos con
la estadística, elaborando "investigaciones" de intención, teniendo previamente los resultados que
les interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o
negligencia, abusan de la estadística utilizando modelos inapropiados o razonamientos ilógicos y
erróneos que conducen al rotundo fracaso de sus investigaciones.
Lincoln L. Chao hace referencia a uno de los más estruendosos fracasos, debido a los abusos en la
toma de una muestra:
Se trata del error cometido por la Literary Digest que, en sus pronósticos para las elecciones
presidenciales en EE.UU. para 1936, afirmó que Franklin D. Roosvelt obtendría 161 votos
electorales y Alfred Landon, 370. La realidad mostró a Roosvelt con 523 votos y a Landon con 8
solamente.
El error se debió a que la muestra fue tomada telefónicamente a partir de la lista de suscriptores de la
Digest y, en 1936, las personas que se daban el lujo de tener teléfonos y suscripciones a revistas no
configuraban una muestra representativa de los votantes de EE.UU. y, por ende, no podía hacerse un
pronóstico confiable con tan sesgada información.
1.3
El papel de la Estadística en las Ciencias Sociales.
En las ciencias sociales se utiliza en la psicología (análisis de los resultados de tests de personalidad
o de inteligencia), en las ciencias políticas (medición de la legitimidad del sistema político), en la
sociología (medición de las diferencias entre estratos sociales), en la educación (comparación de
diversos métodos de enseñanza), en la economía (estimación del crecimiento del P.I.B.), en los
negocios (proyección de ventas), en trabajo social (caracterización de grupos marginados), en la
geografías( descripción de varias características
1.4
Definición.
Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las técnicas que
se emplean en los diferentes campos en los que interviene. Sin embargo, diremos, en forma general,
que la estadística es un conjunto de técnicas que, partiendo de la observación de fenómenos,
permiten al investigador obtener conclusiones útiles sobre ellos.
2
Facultad de Trabajo Social, Sociología y Psicología
1.5
Estadística Descriptiva Aplicada a la Psicología
División.
El campo de la estadística esta dividido en 2 áreas generales de estudio. La primera es la Estadística
Descriptiva cuyo propósito es tomar una gran cantidad de datos, organizarlos y presentarlos de tal
forma que revelen información oculta o de interés en la realización de un estudio o investigación.
La segunda área es la Estadística Inferencial, que estudia las propiedades de una pequeña muestra de
datos seleccionada de una porción mucho mayor para inferir (a través de las matemáticas) la
naturaleza de dichas propiedades. Al utilizar la Probabilidad, el investigador puede deducir y
algunas veces controlar el error inevitablemente asociado a dichas inferencias.
El propósito fundamental de la estadística es revelar la verdad acerca de las propiedades de los datos
que están siendo estudiados. Este propósito frecuentemente ignorado de tal manera que no existe
manipulación de la información para beneficiar a alguna de las partes.
EJEMPLOS
No. 1
Estas tratando de determinar el porcentaje de tarjetas de circuitos defectuosas en los lotes que se
están produciendo. Las tarjetas son producidas en lotes de 100. Examinas 15 lotes para determinar el
número de tarjetas defectuosas en cada lote y la naturaleza del defecto.
Suponer que para cada uno de los lotes es generada una forma, en la cual se anotan la naturaleza de
los defectos en cada una de las tarjetas defectuosas que hallan sido encontradas. ¿Qué es lo que
deberías de hacer con estas formas?.
No. 2
En el Departamento de Sociología y Trabajo Social fue aplicada a una encuesta, en la cual a cada
estudiante se le preguntaba su sexo, altura, tiempo promedio de descanso, nivel de agrado hacia la
estadística, número de CD’s que poseía, importancia de la música o el ejercicio como pasatiempos,
No. de veces a la semana que hacía ejercicio. ¿Cómo podemos organizar los datos para poder
entenderlos?
1.6
Variables.
Una variable es cualquier característica o atributo que difiere para diferentes sujetos. Por ejemplo, si
el peso de 30 sujetos fuese medido los pesos varían dependiendo del sujeto, por lo cual el peso es
una variable.
1.6.1 Cuantitativas y Cualitativas.
Las variables pueden ser cuantitativas y cualitativas. Las variables cualitativas son algunas veces
llamadas “variables categóricas”, este tipo de variables son medidas a un nivel de medición nominal.
Por otro lado las variables cuantitativas son medidas a un nivel ordinal, por intervalos o proporción
(también denominado de razón). Por ejemplo, si a un sujeto le preguntasen cual es su color favorito,
entonces la variable sería cualitativa. Si el tiempo que le toma responder fuese medido, entonces la
variable sería cuantitativa.
3
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
1.6.2 Independientes y Dependientes.
Cuando un experimento es conducido, algunas variables son manipuladas por el investigador y otras
son inherentes al objeto del estudio. Las primeras son denominadas variables independientes,
mientras que las otras son las variables dependientes. Por ejemplo, consideremos un experimento
hipotético sobre el efecto de consumir alcohol en el tiempo de reacción de la persona. Los sujetos
beben ya sea: agua, 1 cerveza, 3 cervezas o 6 cervezas y entonces se mide su tiempo de reacción a
ciertos eventos. En este caso la variable independiente sería el número de cervezas ingeridas (0, 1, 3,
6) y la variable dependiente el tiempo de reacción.
1.6.3 Continuas y Discretas.
Algunas variables (tales como el tiempo de reacción) son medidas en una escala continua. Hay un
número infinito de posibles valores que las variables puedan tomar. Otras variables únicamente
pueden tomar un número limitado de valores. Por ejemplo, si una variable dependiente sólo puede
tomar valores de una escala de 5 puntos (1, 2, 3, 4, 5), tales variables son denominadas variables
discretas.
1.7
Parámetros.
Un parámetro es una cantidad numérica obtenida de algún aspecto de un conjunto de valores. Por
ejemplo la media es una medida de tendencia central. Las letras griegas son utilizadas para designar
los parámetros son raramente conocidos y son usualmente utilizados por los investigadores. En la
siguiente tabla se muestra el símbolo del alfabeto griego junto con el estadístico utilizado para su
obtención de una muestra.
Medida
Media
Desviación
Estándar
Proporción
Correlación
1.8
Parámetro
Estadístico


M


p
s
r
Sumatoria.
La letra griega  (sigma) es utilizada para representar la sumatoria. Por ejemplo, en un experimento
se mide el desempeño de 4 sujetos en determinada habilidad, la puntuación del sujeto 1 será
representada como I, la del sujeto 2 como 2 y así sucesivamente. Los puntajes son mostrados en
la siguiente tabla:
Sujeto
1
2
3
4
1
2
3
4
Puntuación
7
6
5
8
4
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
La forma que representaría la sumatoria de la 4 ’s es:
4
X
i 1
i
Esta notación se lee como sigue: Sumar los valores de , desde 1 hasta 4 . El índice i de la
anotación indica los valores de  que serán sumados. El índice i toma los valores iniciando con el
valor de la derecha del signo “=” (en este caso 1) y continua secuencialmente hasta el valor indicado
en la parte superior de sigma (para este ejemplo 4). Por lo tanto i toma los valores de 1, 2, 3, y 4, por
lo cual los valores de 1, 2, 3, 4 son sumados (7+6+5+8=26).
Para hacer las formulas en forma más general las variables pueden ser utilizadas con la notación
de la sumatoria. Por ejemplo:  significa que se deben sumar los valores de . Desde 1 hasta N ,
donde N puede ser cualquier número, aunque N generalmente indica el tamaño de la muestra.
Con frecuencia una formula abreviada de la sumatoria es utilizada. Por ejemplo  significa que se
deben sumar todos los valores de 
Cuando únicamente un subconjunto de los valores de  serán sumados entonces la versión completa
es requerida. De tal manera que la suma de todos los elementos de  excepto el primero y el último
(el N’th) debe ser indicada de la siguiente manera:
N 1
X
i 2
i
La cual debe ser interpretada como la suma de las ’s con i=2 hasta N-1
Algunas formulas requieren que cada número sea elevado al cuadrado antes de ser sumados, como
N 1
lo muestra la siguiente formula:
X
i 2
I
desarrollando la formula tenemos 72+62+52+82=174.
La versión abreviada es simplemente X2 . Es muy importante hacer notar que existe una gran
diferencia entre elevar los números al cuadrado y después sumarlos, que sumarlos y posteriormente
elevarlos al cuadrado, en este caso el resultado sería (7+6+5+8)2 =676, resultando muy diferente al
174 del ejemplo anterior.
Algunas veces una formula requiere que sea calculada la suma de los productos cruzados. Por
ejemplo, si 3 sujetos fueron examinados dos veces, las calificaciones son asignadas a  e Y, como lo
muestra en la siguiente tabla:
Sujeto
1
2
3

2
1
4
Y
3
6
5
La suma de los productos cruzados (2x3)+(1x6)+(4x5)=32 puede ser representada de la siguiente
manera 
5
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
1.8.1 Teoremas Básicos.

3
2
4

8
3
1
 (x +Y)=Y
 (x +Y)= 11+5+5=21
 x =3+2+4=9
 Y =8+3+1=12
 x +  Y =9+12=21
x
a =a x (a es una constante)
Si a =2.
x
a = (2)(3)+(2)(2)+(2)(4)=18
a x(2)(9)=18
 (x-M)2 = x2-( x)2/N (N es el número de valores, 3 para este ejemplo, y M es la media
aritmética, también igual a 3).
 (x-M)2 =(3-3)2+(2-3)2+(4-3)2=2
 x2=32+22+42=29
( x)2/N=92/3=27
 x2-( x)2/N=29-27=2
1.9
Niveles de Medición.
La medición de algún atributo es un conjunto de cosas, es el proceso de asignar números u otros
símbolos a las cosas de tal manera que las relaciones de los números o símbolos reflejen las
relaciones de los atributos que están siendo medidos. Una forma particular de asignar números o
símbolos para medir alguna cosa es denominada escala de medición
“Resumiendo la medición es un proceso mediante el cual las cosas se diferencian”.
La medición en las ciencias sociales y en la educación por lo general produce números, pero tales
números están sin algunas de las propiedades matemáticas para la medición de variables como
tiempo, distancia, área, peso y costo. Por ejemplo, la escala de medición para evaluar el CI difiere en
forma significativa de la usada para medir la estatura. Esto es importante debido a que la
interpretación de un valor influye la escala de medición correspondiente.
Generalmente se distinguen cuatro escalas o valores de medición: nominal, ordinal, intervalos y de
razón.
6
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
1.9.1 Nominal.
La medición nominal es la forma más rudimentaria de medir. Es el proceso de agrupar unidades
(objetos, personas, etc.) en categorías basándose en uno o más atributos o propiedades observados.
Con las escalas nominales, los números asignados definen cada grupo distinto y sirven meramente
como etiquetas o nombres. La magnitud de los números no reflejan alguna ordenación inherente de
las cosas a las que fueron asignados, más bien sirven solo como códigos de identidad. Las
observaciones no pueden ser ordenadas de pequeño a grande o de menos a más. La única cuestión
comparativa relevante para los datos nominales pertenecen a si dos observaciones son o no de la
misma. Ejemplos de la medición nominal son los partidos políticos, etnia, genero, tipo de escuela
(privada o pública).
1.9.2 Ordinal.
Es cuando las observaciones pueden colocarse en un orden o jerarquía con respecto a la
característica que se evalúa. La magnitud de los números no es arbitraria, sino que representa el
orden del rango del atributo observado. Se supone un continuo subyacente en los números. Ejemplos
de este nivel de medición son la clase social, lugar sen la clase, concursos de belleza, etc.
1.9.3 Intervalo.
El nivel de intervalo tiene, además de las propiedades de la escala ordinal, la propiedad de que la
distancia entre dos valores es de una magnitud conocida lo cual da a estas escala un mayor grado de
perfección. En la escala de intervalo el punto cero y la unidad de medición son arbitrarios. La razón
entre dos intervalos es siempre independiente del punto cero y de la unidad que se emplea en la
medición. Como ejemplo podemos mencionar: la temperatura, las puntuaciones del IQ y la fecha.
1.9.4 Razón.
Este nivel de medición tiene propiedades de las escalas ordinales y de las escalas de intervalos, pero,
además el cero representa la ausencia de la característica en cuestión (cero absoluto); en
consecuencia, los números pueden compararse como proporciones. Las medidas de longitud para las
cuales se utiliza una regla o una cinta métrica ejemplifican una medición de razón. Si Sue mide 1.52
mts. y Carmen 1.27 mts. Entonces Sue es 119% tan alta como Carmen o Sue es 20% más alta que
Carmen. Además del ejemplo anterior, las medidas de tiempo, distancia, peso, área y costo por lo
general representan escalas de razón.
1.10 Organización de Datos.
1.10.1
Distribuciones de Frecuencia
 Es el conteo y agrupación de los datos de acuerdo a un sistema de clasificación previamente
determinado.
 Sirven como depositarios de información, con el propósito de efectuar posteriormente el
cálculo de medidas estadísticas.
 Tienen como finalidad ayudar en el análisis formal de las interrelaciones entre las variables.
7
Facultad de Trabajo Social, Sociología y Psicología
1.10.1.1
Estadística Descriptiva Aplicada a la Psicología
Distribuciones de Frecuencia No Agrupada
 Tienen la función de mostrar en forma organizada las características más importantes de un
conjunto de valores.
 La categoría o distribuciones ordinales representan el grado en que está presente una
característica en particular.
 El listado de tales categorías o puntajes en las distribuciones de frecuencia simple deben
hacer de modo que refleje ese orden
 Elementos: Un listado de todos los valores ordenados de mayor a menor, y la frecuencia de
cada uno de los valores.
Elementos de una Tabla
 Número de la tabla
 Titulo
 Nota en el
encabezado
 Fuente
 Nota al pie
 Casillas cabecera
 Columnas
 Reglones o hileras
 Cabeza de cuadro
 Cuerpo de Cuadro
 Renglón de totales
8
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
Comparación.
Proporción. Compara el número de casos en una categoría dada con el tamaño total de la
distribución.
P=f /N
Porcentaje. Frecuencia de ocurrencia de una categoría por cada 100 casos.
%=100*(f /N)
Razones. Comparación directa entre el número de casos que caen dentro de una categoría, con el
número de casos que caen dentro de otra categoría.
Razón=f1 / f2
Tasas. Compara el número de casos reales y el número de casos potenciales
Tasa de Nac.=1000*(f C. Reales / f C. Potenciales)
Incremento Porcentual. Comparación directa entre el número de casos que caen dentro de una
categoría, con el número de casos que caen dentro de otra categoría.
I% 
Promedio del Incremento.
PI % 
P1  P0
*100
P0
P1  P0 2
* *100
P1  P0 n
P1 = Valor Actual
P0= Valor Anterior
N= No. de periodo
9
Facultad de Trabajo Social, Sociología y Psicología
1.10.1.2
Estadística Descriptiva Aplicada a la Psicología
Distribuciones de Frecuencia Agrupada
Es la condensación de los puntajes separados en un número de categorías o grupos más pequeños,
donde cada uno contenga más de un puntaje
Procedimiento:
 Calcular el rango. El rango es la diferencia entre el valor más grande y el valor más
pequeño. (Xmax-Xmin) Determinar el número de intervalos de clase. Significa en cuántas categorías o subgrupos
vamos a clasificar o agrupar nuestros datos. Para determinar el número óptimo de intervalos
de clase, en los cuales nuestros datos quedarán perfectamente distribuidos, aplicamos la
Regla de Sturges:
No. Intervalos = 1 + ( 3.322*(log n))
En donde “n” representa el número total de datos u observaciones que tenemos recopilados.
Evidentemente, el número de intervalos debe ser exacto; es decir, un número entero.
 Determinar el ancho del intervalo. Dividiendo el rango entre el número deseado de
intervalos. (w=rango/No. Intervalos).
 Especificar los límites del intervalo. Cada intervalo debe comenzar con un múltiplo de w, el
cual debe ser menor o igual Xmin.
 Calcular los límites reales del intervalo. A los límites inferiores se les resta 0.5 y a los
límites superiores se les suma 0.5.
 Determinar el punto medio. X=(limite inferior+limite superior)/2.
 Conteo de los valores. Determinar la frecuencia de cada uno de los intervalos.
 Determinar la frecuencia acumulada.Determinar el porcentaje de cada intervalo (%).
 Determinar el porcentaje acumulado (% acumulado).
Construir una distribución de frecuencia acumulada para las siguientes 40 calificaciones de la materia de Estadística I.
61
67
56
64
71
38
61
63
43
50
39
58
52
50
46
51
40
49
56
41
50
53
58
50
54
42
55
51
40
47
51
41
55
42
61
52
42
59
45
56
10
Facultad de Trabajo Social, Sociología y Psicología
1.10.2
Estadística Descriptiva Aplicada a la Psicología
Representaciones Gráficas
Gran parte de la utilidad que tiene la Estadística Descriptiva es la de proporcionar un medio para
informar basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de
información dependerá de la presentación de los datos, siendo la forma gráfica uno de los más
rápidos y eficientes, aunque también uno de los que más pueden ser manipulados o ser
malinterpretados si no se tienen algunas precauciones básicas al realizar las gráficas.
Existen también varios tipos de gráficas, o representaciones gráficas, utilizándose cada uno de
ellos de acuerdo al tipo de información que se está usando y los objetivos que se persiguen al
presentar la información.
Entonces, mencionaremos algunas consideraciones que conviene tomar en cuenta al momento de
realizar cualquier gráfica a fin de que la información sea transmitida de la manera más eficaz posible
y sin distorsiones:
1. El eje que represente a las frecuencias de las observaciones (comúnmente el vertical o de las
ordenadas) debe comenzar en cero (0), de otra manera podría dar impresiones erróneas al
comparar la altura, longitud o posición de las columnas, barras o líneas que representan las
frecuencias.
2. La longitud de los espacios que representan a cada dato o intervalo (clase) en la gráfica
deben ser iguales.
3. El tipo de gráfico debe coincidir por sus características con el tipo de información o el
objetivo que se persigue al representarla, de otra manera la representación gráfica se
convierte en un instrumento ineficaz, que produce más confusión que otra cosa, innecesario
o productor de mal interpretaciones. Por ejemplo, si se desea representar la proporción de
población masculina en un país conviene más usar una gráfica de pastel o circular que una
gráfica de barras al compararla contra la población femenina; por un lado se puede apreciar
dicha proporción, por el otro se aprecia cuál de las dos poblaciones es mayor.
Hay un punto que conviene remarcar: existe software que permite la construcción rápida y eficiente
de gráficas a partir de bases de datos o hojas de cálculos, pero no importa cuán bonita, bien
delineada, bien coloreada o bien presentada esté una gráfica, si no se han tomado en cuenta
consideraciones de este tipo que tienen que ver más sobre el objetivo de estas herramientas y la
Estadística: la transmisión eficiente de la información.
1.10.2.1 Tipos de gráficos
Para las distribuciones de frecuencias la representación gráfica más común es el histograma. Un
ejemplo es el que se presenta a continuación y que representa el número de "visitas" que ha tenido
este hipertexto de acuerdo a la hora de la visita.
11
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
En el eje horizontal (o de las abscisas) se representan los intervalos de los datos, marcándose de
manera continua las fronteras entre cada uno de los éstos. De esta manera, el histograma está
compuesto rectángulos, cuyo número coincide con la cantidad de intervalos considerados, el ancho
de la base de cada uno de esos rectángulos es la misma siempre y coincide con las fronteras de los
intervalos, y la altura corresponde a la frecuencia de cada intervalo.
Es importante observar que resulta difícil utilizar este tipo de representación cuando existen
intervalos abiertos o cuando los intervalos no son iguales entre sí.
Otra observación es la amplitud de los intervalos, que se puede establecer utilizando la regla de
Sturges, pues al cambiarla la presentación visual de un histograma puede variar.
Un tipo de gráfico muy parecido al histograma es la gráfica de columnas. Para este tipo de gráfica,
elaboradas con rectángulos también, se pide que sus bases sean del mismo ancho y sus alturas
equivalentes con las frecuencias. Para este tipo, a diferencia del histograma, no es necesario tener
una escala horizontal continua, por lo que los rectángulos (o barras) no tienen que aparecer juntas
entre sí.
Otra observación pertinente es que se pueden representar en la misma gráfica, utilizando las mismas
escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de
varias observaciones. Esto produce una gráfica con varias series, correspondiendo cada una de ellas
a cada observación de la muestra (o población), y teniéndose una gráfica compuesta. Es conveniente
que cada serie de datos (u observaciones) sean ilustradas o iluminadas de igual manera entre sí, pero
distinta de las demás.
El ejemplo que sigue pertenece al comportamiento de las calificaciones parciales de tres alumnos de
preparatoria. Las series (cada una de las calificaciones parciales) están coloreadas con diferente
12
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
color para mostrar el comportamiento tanto individual, como de cada uno de los alumnos con
respecto a los demás. Es interesante observar que la escala horizontal no es continua (es nominal).
Existe la posibilidad, y si los recursos lo permiten, de representar gráficos compuestos de una
manera "tridimensional", es decir, con gráficos que posean no sólo dos ejes, sino tres; y en los que
los rectángulos son sustituidos por prismas de base rectangular (ocasionalmente el software en el
mercado permite utilizar prismas cuya base son polígonos regulares de más de cuatro lados,
pirámides o cilindros). Un ejemplo es el siguiente:
donde se representa el porcentaje del PIB gastado en docencia e investigación por cinco países en el
lapso de 1988 a 1999 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12). Es importante
considerar que este tipo de gráficos puede complicarse mucho, haciendo que la información sea
menos legible.
13
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
También es posible realizar gráficas de barras horizontales, los cuales se parecen mucho a las
gráficas de columnas, con la salvedad importante de que la función de los ejes se intercambian y el
eje horizontal queda destinado a las frecuencias y el eje vertical a las clases.
Es muy común que este tipo de gráficos se utilicen para ilustrar el tamaño de una población dividida
en estratos como, por ejemplo, son sus edades. El ejemplo que se presenta es la población de un país
ficticio llamado "Timbuctulandia":
A este tipo de gráficos en particular se le llama pirámide de edades por su forma. Incluso, cuando
se compara la población masculina y femenina por estratos de edades, se estila utiliza el lado
izquierdo para la población de un sexo y el lado derecho para el otro, el resultado es una "pirámide"
casi simétrica (dependerá de la población en particular).
Cuando los datos se relacionan entre sí, es decir, cuando podemos decir que existe cierta continuidad
entre las observaciones (como por ejemplo el crecimiento poblacional, la evolución del peso o
estatura de una persona a través del tiempo, el desempeño académico de un estudiante a lo largo de
su instrucción escolar, las variaciones presentadas en la medición realizada en algún experimento
cada segundo o minuto) se pueden utilizar las gráficas de líneas, que consisten en una serie de
puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, uniéndose
consecutivamente con líneas:
14
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo
largo de cinco observaciones anuales. Al igual que en el caso de las gráficas de columnas (y de otras
más) es posible presentar varias series de observaciones (en este caso cada serie de observaciones
son los pesos de un individuo).
Otra forma de representación de un uso menos común, y muy parecida a las gráficas de líneas, es el
polígono de frecuencias. La diferencia fundamental entre ambas es que en el polígono de
frecuencias se añaden dos clases con frecuencias cero: una antes de la primera clase con datos y otra
después de la última. El resultado es que se "sujeta" la línea por ambos extremos al eje horizontal y
lo que podría ser una línea separada del eje se convierte, junto con éste, en un polígono.
El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigación durante
el año de 1990 en cinco países (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):
El Excel no crea automáticamente polígonos de frecuencias, sino que produce gráficas de líneas. Sin
embargo, es posible arreglárselas para hacerlas.
Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar
parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen:
ojiva mayor que y las ojivas menor que.
Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por ésto la
aplicación de la técnica es parcial):
1. Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con
el extremo izquierdo; para la ojiva menor que, con el derecho.
2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase.
Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.
Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que,
utilizando los datos que se usaron para ejemplificar el histograma:
15
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que está sobre
la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas
(en cuestiones temporales se diría: después de las 4:00 horas). De forma análoga, en la ojiva menor
que la frecuencia que se representa en cada frontera de clase son el número de observaciones
menores que la frontera señalada (en caso de tiempos sería el número de observaciones antes de la
hora que señala la frontera).
Si se utiliza una distribución porcentual acumulativa entonces se obtiene una ojiva (mayor que o
menor que según sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente
ejemplo es la misma ojiva menor que que se acaba de usar, pero con una distribución porcentual:
En ocasiones, al comparar dos series de observaciones (o de datos) se utiliza una llamada gráfica de
áreas, la cual consiste en rellenas el área que se encuentre debajo de las líneas que resultan de una
gráfica de líneas.
El ejemplo que se presenta es la comparación del total de las especies de las familias del orden
Carnívora y las que están amenazadas, en México, (fuente: Revista "Ciencia y Desarrollo", 1994,
XIX(114):58):
16
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
Cuando lo que se desea es resaltar las proporciones que representan algunos subconjuntos con
respecto al total, es decir, cuando se está usando una escala categórica, conviene utilizar una gráfica
llamada de pastel o circular.
Por ejemplo, para ilustrar la matrícula en licenciatura (en México) por áreas de conocimiento en el
año de 1992 se puede usar algo así como sigue (Fuente: ANUIES,1995):
De hecho, si se desea resaltar una de las categorías que se presentan, es válido tomar esa "rebanada"
de la gráfica y separarla de las demás:
17
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
Para hacer una gráfica de este tipo en papel.
Hay que tomar algunas precauciones al utilizar este tipo de gráficos. Por un lado, comparar dos
gráficos circulares (por ejemplo, si se quisieran comparar las proporciones de matrículas en
licenciatura por áreas de conocimiento en licenciatura para dos años distintos) resulta muy difícil y,
por tanto, no es muy aconsejable.
Por otro lado, en ocasiones existen categorías con pocas frecuencias (por ejemplo, dos o tres con
frecuencias relativas menores al 1% cada una), haciendo que la gráfica resulte "pesada" y las
etiquetas se encimen. Una posible solución es juntarlas en una sola categoría (por ejemplo, la típica
"otras" o "varias"), pero entonces habría que ponderar si se hace una gráfica extra con dichas
observaciones únicamente, haciendo la anotación pertinente, o simplemente se ignoran por no
resultar significativas.
Actualmente, y mucho en los medios masivos de comunicación, se utilizan gráficos para ilustrar los
datos o los resultados de alguna investigación. Regularmente se utilizan dibujos para representar
dicha información, y el tamaño o el número de estos dibujos dentro de una gráfica queda
determinado por la frecuencia correspondiente. A este tipo de gráfica se le llama pictograma y éstos
son dos ejemplos:
El de la izquierda representa la población de los Estados Unidos (cada hombrecillo representa a dos
millones de habitantes), el de la derecha representa la masa de tres planetas de nuestro sistema solar
18
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
tomando como unidad a la masa de la Tierra (cada representa la masa de nuestro planeta: Venus
tiene masa menor y Neptuno tiene más 17 veces más masa que la Tierra).
Las versiones del Excel 7.0 y anteriores no tienen opciones para realizar este tipo de gráficas, las
posteriores sí. Otros programas contemporáneos (como el Corel Draw o el Harvard Graphics) sí
son capaces.
Cuando se pretende ilustrar la dispersión de las observaciones realizadas, y así trabajar algunas
cosas como correlaciones se puede utilizar una gráfica de dispersión. Por ejemplo, el ejemplo de la
izquierda es la dispersión que se presenta al comparar el número de tesis doctorales en ciencias
exactas contra el número de total de tesis doctorales (todo en México) en observaciones anuales
entre 1984 y 1990 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):
La gráfica de la derecha es resultado de comparar el diámetro (en miles de kilómetros) de los
planetas interiores del nuestro sistema solar contra sus densidades (en gramos por centímetro
cúbico). Es interesante observar que los puntos parecen "seguir" una línea imaginaria que se asemeja
a una recta, con excepción de un caso atípico: Mercurio.
Uno de los usos de este tipo de gráficas es precisamente encontrar si las observaciones siguen algún
patrón lineal (una línea de tendencia) o si existen valores atípicos. Para el caso del Excel, el
programa es capaz de graficar las líneas de tendencias que siguen un conjunto de datos.
Un tipo de gráfico similar a las gráficas de dispersión son las gráficas de burbujas, en las cuales se
presenta la dispersión de las observaciones de la misma forma que aquéllas, pero se le añade la
posibilidad de visualizar otra variable representada en el tamaño del punto, pues éstos se convierten
en círculos (burbujas) con radios proporcionales a las magnitudes que representan.
19
Facultad de Trabajo Social, Sociología y Psicología
Estadística Descriptiva Aplicada a la Psicología
Este ejemplo compara la distancia que existe en cada uno de los planetas interiores de nuestro
sistema solar al Sol contra el tiempo que necesitan para recorrer sus órbitas, y el tamaño de las
burbujas indica la masa de cada planeta.
Además existen otros tipos de gráficos, cada uno con características particulares que les
proporcionan cierta intencionalidad para su uso, como son las gráficas de radar y las gráficas
polares.
20
Descargar