modulo-1

Anuncio
Carrera de Relaciones Laborales
Facultad de Derecho – Universidad de la República
Estadísticas Laborales – Profas. Mariela Quiñones y Mariana Cabrera
INTRODUCCIÓN: CONCEPTOS PREVIOS
Objetivos del módulo 1:
1.
Presentar la disciplina Estadística como ciencia y como ciencia auxiliar, resaltando su
utilidad en los estudios empíricos de las ciencias sociales y en particular en el área de las
relaciones laborales.
2.
Hacer una lectura global de los contenidos del curso, los alcances y límites del mismo,
así como el fundamento de los temas que se van a tratar.
3.
Familiarizarse con algunos conceptos básicos de la estadística y la metodología cuya
comprensión es fundamental para seguir el curso.
4. Complementario: Repasar o incorporar algunos conocimientos matemáticos necesarios
para una mejor comprensión de los contenidos del curso.
Conceptos clave del módulo 1:
Estadística
Estadística descriptiva y Estadística inferencial
Estadístico
Población y muestra
Unidades de análisis
Variables, sistema de categorías
Matriz de datos y estructura tripartita de los datos
Medición
Escalas de medición
Escala nomina,
Escala ordinal
Escala interval
Escala de razón
1.1 INTRODUCCION
Para muchos parece una materia lejana, pero la Estadística y muchas de sus herramientas nos
acompañan diariamente, aunque no nos percatemos de ello. Durante el curso tendremos oportunidad de
ver ejemplos muy familiares y entender algunos términos que escuchamos y manejamos diariamente.
Este primer módulo nos introducirá en el mundo de la estadística, particularmente la estadística
descriptiva, aprendiendo el vocabulario y los conceptos fundamentales para poder abordar los próximos
temas. También repasaremos algunos procedimientos matemáticos que usaremos durante todo el curso..
1.2 LA CIENCIA ESTADISTICA
¿Qué es la ESTADISTICA? Estadística, es algo más que la recolección y publicación (tal cual se ven
en revistas y diarios) de hechos y datos numéricos. Es la aplicación del método científico de análisis de
datos numéricos, con el fin de tomar decisiones racionales.
Estadística será tratada aquí como una Ciencia que trata de la recopilación, presentación, análisis e
interpretación de datos numéricos (estadísticas) con el fin de realizar una toma de decisiones más
efectiva.
Si quieres ver algunas definiciones adicionales, puedes acceder a:
Carrasco Arroyo, S (2005): Aproximación a la Estadística desde las Ciencias
Sociales.Valencia, España.
http://www.uv.es/carrascs/PDF/aproximacion%20estadistica.pdf
Zavrostsky, A: Varias definiciones de la Estadística. Revista de Economía.
Facultad de Ingeniería.Universidad de Los Andes, Venezuela.
http://iies.faces.ula.ve/Revista/Articulos/Revista_02/Pdf/Rev02Zavrotsky.pdf
Su origen en la historia… La estadística científica tal como se entiende actualmente tiene sus
origenes en el SXIX, cada vez más vinculada a la teoría de la probabilidad. Dos puntos de referencia
básicos son los trabajos de F. Galton, fundador de la biometría, y de K. Pearson que sentó las bases de
la estadística moderna.
Sin embargo, los orígenes de las herramientas estadísticas pueden ser rastreados al menos hasta el
antiguo Egipto y más atrás aún. El interés por el registro sistemático sobre la población y los recursos
económicos y la elaboración de instrumentos matemáticos de resumen de la información aparecen desde
la antigüedad vinculados con la administración y la política de los gobiernos.
2
Si te interesa conocer más sobre la historia de la estadística te recomendamos leer:
Ruiz Muñoz, David (2004):Manual de Estadística. Ediciones Eumed·net. Cap. 1. Historia de la
estadística.
http://www.eumed.net/cursecon/libreria/drm/cap1.pdf
El origen de la palabra… La palabra "estadística" procede del latín statisticum collegium ("consejo de
Estado") y de ella deriva el término italiano statista ("hombre de Estado" o "político"). A su vez, el término
alemán Statistik es introducido por Gottfried Achenwall en 1749 al publicar su obra Compendio de la
constitución política de los principales países y pueblos europeos, asociándolo con el análisis de datos
del Estado, es decir, "la ciencia del Estado" . Sin embargo, recién a partir del siglo XIX el término
comienza a ser utilizado en su acepción moderna.
Papel de la Estadística para las ciencias sociales
Para las ciencias sociales la estadística se ha convertido en una ciencia auxiliar fundamental,
permitiendo:
-
Encontrar relaciones y características no previstas en una población, que permiten pensar en
nuevas teorías e hipótesis.
-
Resumir los datos y extraer información relevante, esto es de las mediciones observadas
-
Ayudar en la búsqueda y evaluación de los modelos y pautas que ofrecen los datos, pero que se
encuentran ocultos por la inherente variabilidad de los mismos.
-
Facilitar la comunicación entre los científicos, ya que siempre será más fácil comprender la
referencia a un procedimiento estándar, sin necesidad de mayor detalle.
Estadística Descriptiva y Estadística Inferencial
Para entender el alcance que tiene el presente curso debemos en primer lugar entender los conceptos de
ESTADISTICA DESCRIPTIVA y ESTADISTICA INFERENCIAL o INDUCTIVA.
Estadística Descriptiva: Consiste en un conjunto de instrumentos y temas relacionados con la
descripción de colecciones de observaciones estadísticas, se refiere tanto al total de la población como a
la muestra, y su finalidad es “resumir” un conjunto de datos numéricos.
Estadística Inferencial o Inductiva: Se ocupa de la lógica y el procedimiento para la inferencia y la
inducción de propiedades de una población en bases a resultados obtenidos de una muestra conocida.
¿Porqué es importante esta distinción?
3
Nuestro curso, por la carga horaria y los objetivos que se ha planteado, va a realizar un recorrido básico
por herramientas de estadística descriptiva.
Sin embargo, es necesario considerar que una parte fundamental de la disciplina estadística está
dedicada a la INFERENCIA. En ella, se incorporan los conceptos de variable aleatoria, distribuciones de
probabilidad, estimadores e intervalos de confianza, entre otros, que no utilizaremos en el curso.
“Si el único propósito del investigador es describir los resultados de un experimento
concreto, los métodos descriptivos pueden considerarse suficientes. No obstante, si lo que se
pretende es utilizar la información obtenida para extraer conclusiones generales sobre todos
aquellos objetos del tipo de los que han sido estudiados, entonces estos métodos constituyen
sólo el principio del análisis, y debe recurrirse a métodos de inferencia estadística, los cuales
implican el uso de la teoría de la probabilidad.La probabilidad constituye por sí misma un
concepto básico que refleja su relación con la faceta del mundo exterior que pretende
estudiar: los fenómenos aleatorios, que suponen unas ciertas reglas de comportamiento.
El nexo que une la teoría de la probabilidad y la estadística es la noción de variable aleatoria,
mostrando de esta manera cómo puede emplearse la teoría de la probabilidad para extraer
conclusiones precisas acerca de una población sobre la base de una muestra extraída de ella.
Muchos de los análisis estadísticos son, de hecho, estudio de las propiedades de una o más
variables aleatorias.”
Rodriguez, Mayte: Estadística aplicada a las Ciencias Sociales II.Licenciatura de Sociología. Curso 2001/02.Universidad
autónoma de Madrid
http://www.uam.es/personal_pdi/ciencias/mayter/docencia/sociolog/apuntes.pdf
Con las herramientas estadísticas que vamos a trabajar durante este curso vamos a describir el
comportamiento de conjuntos de individuos, instituciones, países, etc. pero no vamos a utilizarlas para
generalizar los resultados a una población mayor. Esto lo veremos con detenimiento al hablar del
concepto de POBLACION y MUESTRA.
Sin embargo, veremos que estos instrumentos y métodos nos habilitan a realizar análisis sumamente
útiles, a partir de la descripción de nuestra población. Y, por otra parte, como plantea el texto de Mayte
Rodríguez, constituyen el punto de partida para los procedimientos de la Estadística Inferencial.
Por ejemplo:
Cuando queremos conocer el perfil de los trabajadores de una empresa podemos averiguar las
características de todos los empleados, con lo cual no necesitamos “inferir” ninguno de los
resultados. Alcanza con generar formas de resumen de la información para describir el
4
comportamiento de toda la plantilla de trabajadores. Es una aplicación de la estadística
descriptiva.
Pero, si la empresa fuera muy grande, podríamos optar por encuestar o averiguar la información
sólo de un subconjunto de esos trabajadores. En este caso, tendríamos que recurrir a la teoría
de muestreo para tener mecanismos que me “garanticen” una elección al azar de los empleados
entrevistar y a la teoría de la probabilidad para a partir de los resultados obtenidos para ese
grupo, generalizar a toda la plantilla de trabajadores. En este caso, entonces, estaríamos frente
a procedimientos propios de la Estadística Inferencial.
1.3 ¿ CUÁLES INSTRUMENTOS VEREMOS EN EL CURSO?
Por una parte, en lo que queda de este módulo veremos algunos conceptos fundamentales que nos
permiten comenzar a trabajar con las herramientas estadísticas. Entender qué es una población y una
unidad y cómo caracterizo a esas unidades a través de variables, que tienen un sistema de
categorías y una escala de medición. A partir de estos conceptos podemos elaborar la idea de
matriz de datos originales, que contiene toda la información que tengo sobre la población.
En los módulos 1, 2, 3 y 4
aprenderemos cómo describir una población en base a una de sus
características (descripción univariada), sea a través de tablas, gráficos y medidas resumen
(estadísticos).
En el módulo 5, veremos como describir una población en base a dos características simultáneamente.
Los últimos 3 módulos incluyen herramientas más específicas, que pueden ser de mucha utilidad para la
investigación y los análisis en el ámbito de las relaciones laborales:
En el módulo 6, veremos una forma de medir y comparar el grado de concentración de recursos que se
distribuyen en una población (por ejemplo, qué grado de desigualdad hay en la distribución del ingreso
total del país, o la masa salarial de una empresa, entre todos los miembros de esa población).
El módulo 7 está dedicado a la presentación de algunos estadísticos que nos permiten analizar el
comportamiento del mercado de trabajo. Los estadísticos que vamos a estudiar habitualmente se
construyen en base a muestras y constituyen estimaciones de los valores de la población (parámetros),
pero no vamos a profundizar en este aspecto sino que trataremos de entender su construcción y uso.
Finalmente, el módulo 8 presenta dos herramientas que están vinculadas al análisis temporal de datos.
Veremos en primer lugar los números índice nos permiten analizar la evolución de una característica
numérica en el tiempo. Algunos números índice tienen incidencia cotidiana en nuestra vida, como
tendremos oportunidad de ver al llegar a ese módulo final del curso. También nos familiarizaremos con
los conceptos de inflación, precios corrientes y precios constantes, y obtendremos una herramienta que
nos permite comparar precios tomados en distintos momentos del tiempo.
5
1.4 TERMINOS Y CONCEPTOS BASICOS
Es importante que conozcamos algunos términos especializados de la disciplina estadística.
En primer lugar, muchas veces se confunden los términos “Estadística” con “estadísticas” o “estadísticos”.
Cuando hablamos de Estadística, nos estamos refiriendo a la disciplina científica.
Los estadísticos, en cambio, son medidas de resumen calculadas sobre los datos provenientes de una
muestra, que en estadística inferencial se utilizan para estimar los valores correspondientes a nivel de la
población (parámetros). Es decir, son herramientas que asumen determinados valores, construidas en
base a los datos de observaciones. También podemos encontrarlas mencionadas como estadísticas.
En el curso aprenderemos a calcular varios estadísticos. No los veremos, sin embargo, en su “función” de
estimación de los valores poblacionales, ya que no trabajaremos con la inferencia estadística.
Antes de seguir adelante, veamos el concepto de POBLACION Y MUESTRA.
POBLACIÓN o UNIVERSO: Es el conjunto de elementos sobre el que se realiza el estudio. Debe estar
acotada en espacio y tiempo.
Ejemplos de poblaciones en estudios de ciencias sociales:
habitantes de un barrio o un país, alumnos de una escuela, empresas, organizaciones, partidos políticos,
ciudades, países, etc.
Lo fundamental al definir una población es que sea acorde a los objetivos que nos planteamos en el
estudio y que esté delimitada en el tiempo y en el espacio, de modo que sea identificable y podamos
distinguir entre quienes componen la población y quienes no.
MUESTRA: Al recoger datos relativos a las características de una población muchas veces es difícil,
costoso o poco práctico observar todo el grupo, sobre todo cuando se trata de conjuntos grandes.
En ese caso, se relevan los datos sólo para una parte de la población, a la cual se le llama MUESTRA.
Una muestra tomada con determinados criterios de aleatoriedad (para ello nos servimos de la teoría del
muestro) puede considerarse representativa de la población y los estadísticos que construyamos a partir
de ella permiten realizar estimaciones sobre lo que sucede con esas características en toda la población.
Como ya dijimos, estas estimaciones corresponden a la estadística inferencial, que se basa en la teoría
de las probabilidades. Existe un margen de incertidumbre sobre las conclusiones que se sacan para la
población y se trabaja bajo determinados supuestos sobre la pertinencia de generalizar a la población a
6
partir de la información obtenida en al muestra. En estos casos, la estadística descriptiva se encarga de
resumir la información y analizar solamente la muestra, sin inferir conclusiones sobre la población.
CENSO: Es un relevamiento de todos los elementos de la población. Puede considerarse un caso
especial de muestra, cuando el tamaño de la misma coincide con el de la población.
Por ejemplo: para estudiar el mercado de trabajo en Uruguay periódicamente, no se entrevista a todos los
habitantes del país sino que se toma una muestra de hogares e integrantes de los mismos, a los cuales
se les aplica la Encuesta Continua de Hogares.
En cambio, cuando se realiza un Censo de Población, se entrevista a todas las personas que se
encuentran en el país ese día. Dentro de los temas que releva el Censo de Población se incluye el del
mercado de trabajo.
En el caso de la Encuesta de Hogares, obtenemos el número de desocupados de la muestra, el cual sirve
para estimar la desocupación a nivel de toda la población (por lo cual hay una margen de error, una
incertidumbre sobre en qué medida ese valor es el que corresponde a la población). En el caso del
Censo, el número de desocupados nos indica (salvo errores de relevamiento) la desocupación en el país,
sin esa “incertidumbre”.
Durante este curso vamos a trabajar bajo el supuesto que siempre estamos observando a todos los
elementos de la población, es decir, realizando un CENSO.
Extraído de Bueno, Concepción y Escudero, Tomás: Apuntes de Estadística para profesores.Curso 2006/2007.Instituto de
Ciencias de la Educación.Universidad de Zaragoza
La población está compuesta por las UNIDADES DE ANALISIS.
La UNIDAD DE ANALISIS es el elemento mínimo de una población y de una muestra, en tanto se lo
considera como poseedor de ciertas propiedades, atributos o características denominadas variables. Por
7
ejemplo: los estudiantes univesitarios son unidades de análisis si consideramos su año de ingreso, su
centro de estudios o su edad. O, por ejemplo, los centros de estudio universitario son unidades de
análisis si consideramos su número de estudiantes; cantidad de salones; números de docentes por
materia. En nuestros estudios, nos interesará relevar las carácterísticas de la unidades de análisis y sacar
conclusiones sobre la población en base a esta información.
Para obtener los datos de las unidades de análisis debemos relevar la información. Las herramientas
para relevar la información pueden ser entrevistas (encuestas) pero también podemos obtener
información de registros administrativos, documentos, artículos de prensa, observación directa.
La UNIDAD DE RELEVAMIENTO es la Unidad que aporta la información para la construcción del dato
estadístico. Muchas veces coincide con la unidad de análisis, pero en otros casos no. Por ejemplo, si
estamos interesados en estudiar características de los hogares (por ejemplo: los ingresos del hogar, el
número de miembros que trabajan, etc.) nuestro relevamiento lo haremos sobre los miembros del hogar
(les preguntaremos por sus ingresos y su condición laboral). Pero cuando construyamos los datos,
tomaremos esa información y caracterizaremos con ella al hogar. En este caso, la unidad de relevamiento
son los miembros del hogar pero la unidad de análisis (que es la que queremos estudiar) son hogares.
Hemos visto que nos interesa caracterizar a nuestra unidades de análisis. De ahora en adelante
hablaremos de VARIABLES, como los instrumentos que nos permiten hacer esa caracterización. Una
VARIABLE es una propiedad, atributo o característica de una unidad de análisis, susceptible de adoptar
diferentes valores o categorías.
Los valores o categorías que adopta una variable constituyen un SISTEMA DE CATEGORIAS. Este
sistema tiene dos propiedades fundamentales: sus categorías deben ser MUTUAMENTE EXCLUYENTES
y el sistema debe ser EXHAUSTIVO para la población en estudio.
Sigamos con el ejemplo del estudio de los hogares de acuerdo a su nivel de ingresos y al número de
miembros del hogar que trabajan.
Tenemos dos variables.
La primera podemos llamarla INGRESOS DEL HOGAR, y vamos a construir un sistema de categorías
para ella. Supongamos que relevamos los ingresos de todos los miembros de un hogar. Con esta
información podemos obtener el dato que corresponde a ese hogar. Deberemos hacer lo mismo con cada
uno de los hogares que constituyen nuestra población en estudio.
Obtenidos nuestros datos para todos los hogares, queremos expresar el sistema de categorías de esta
variable.
Un sistema de categorías posible podría ser cada uno de los valores obtenidos, por ejemplo: $2000,
$4500, $ 7000, etc.
Para explicitar un sistema de categorías así (que tiene muchos valores posibles), lo mejor es buscar el
valor más bajo y el más alto y expresarlo como:
8
$ 2000, ….., $ 70000.
Otro sistema de categorías posible, si no nos interesa tener tan desagregada la información, podría ser
identificar a los hogares en esta variable en tramos de ingreso.
Por ejemplo: $ 2000 a $10000, $10001 a $40000, $40001 a 70000.
En este caso tendríamos tres categorías en nuestro sistema y los hogares tendrían como valor o
categoría en esta variable su pertenencia a uno de los tres tramos (nos “olvidamos” de sus valores
originales.
Pero nos interesa entender las propiedades del sistema de categorías. Supongamos que tenemos este
segundo sistema.
Si hubiéramos armado los tramos de esta manera: $2000-10000, $10000-40000, $40000-70000,
tendríamos dificultades para saber a qué categoría corresponde un hogar que tiene $10000 como
ingreso. ¿En qué categoría lo coloco? ¿En la primera (2000 a 10000) o en la segunda (10000 a 40000)?
A esto nos referimos con la idea que las categorías deben ser mutuamente excluyentes. Frente al
sistema, no tengo que tener duda de cuál es la categoría que le corresponde a cada unidad.
Supongamos ahora que mi sistema es $ 5000 a $10000, $10001 a $40000, $40001 a 70000. ¿Cuál es la
categoría que le corresponde al hogar que gana $2000? No tengo ninguna categoría que lo incluya. La
idea de exhaustividad implica que mi sistema debe “cubrir” todos los valores posibles de la variable para
mi población.
La exhausitividad de un sistema de categorías está relacionado con la población en estudio: si por
ejemplo estamos estudiando el nivel educativo de un país, nuestro sistema de categorías para esa
variable tendría que tener por ejemplo, las siguientes categorías:
Sin instrucción, Primaria, Secundaria-UTU, Terciaria y posterciaria.
Sin embargo si estoy estudiando el nivel educativo de una población de menores de 16 años, alcanza con
tener el siguiente sistema: Sin instrucción, Primaria, Secundaria-UTU, ya que la educación terciaria no ha
de aparecer como categoría para ninguna de las unidades de análisis de esta población por la edad que
tienen.
La información sobre nuestra población la vamos organizar en una MATRIZ DE DATOS. Una matriz de
datos contiene en sus filas a cada una de las unidades, en sus columnas a las variables que caracterizan
a esas unidades. Y cada celda está compuesta por el valor que asume la variable de esa columan para la
unidad de análisis de esa fila.
Un DATO, en el contexto de nuestra disciplina es el valor que toma una variable en una unidad de
análisis. Por esta razón se dice que su estructura es “tripartita”: refiere simultáneamente a la unidad de
análisis, a la variable y a la categoría o valor.
En la matriz de datos esta estructura tripartita se hace visible, al presentar las unidades en las filas, las
variables en las columnas y el DATO como “cruce” de esos dos “vectores”.
9
Siguiendo nuestro ejemplo de los hogares, una matriz de datos podría ser:
Ingresos
del
Número
hogar
trabajan
Hogar 1
$2000
2
Hogar 2
$70000
4
Hogar 3
$ 4500
0
de
miembros
que
….
Que indica que el hogar uno tiene $ 2000 de ingreso y trabajan 2 de sus miembros, en el hogar 2, el
ingreso es $ 70000 y trabajan 4 miembros, etc.
La matriz de datos tiene tantas filas como el tamaño de la población y tantas columnas como variables.
10
«MEDICIÓN Y ESCALAS DE MEDICIÓN»
¿Qué se mide?
Respecto a este problema encontramos referencias tales como:
«La medición es un método que permite establecer correspondencias entre magnitudes de un mismo
género, y ciertas clases de números (integrales, racionales o reales)» en Russell (1938);
«Medir es asignar numerales a las propiedades de los sistemas materiales según las leyes que presiden
esos atributos» (Campbell, 1938);
«Es la atribución de numerales a los objetos o sucesos conforme con leyes o reglas» (Stevens, 1951).
Lo que destaca de cualquiera de estas definiciones es que si bien la medición se realiza sobre los
elementos u objetos (unidades de estudio) son las variables las que posibilitan la división en clases. Esto
nos abre a la necesidad de conocer la naturaleza de las variables para conocer como medir sus
propiedades.
2.1 Las Escalas y los Niveles de Medición
Comenzaremos con un ejemplo que nos introducirá en la idea de naturaleza distinta de las variables.
Dada una población puede decirse cuáles de los individuos son solteros, casados, divorciados o
cualquiera otra categoría de la variable "estado civil". Pero sobre estos mismos individuos se puede decir
cuáles no tienen hijos y cuales sí. Sobre este segundo atributo de las unidades de registro se puede,
además medir cuales no tienen hijos, cuales tienen un hijo, cuales dos, etc…. Ahora bien, si relevamos
la característica “tener o no tener hijos” es diferente de si relevamos cuantos hijos tiene, a pesar que las
característica de interés es la misma. Lo que difiere son las mediciones en los modos en que se
manifiesta la variable.
En el caso de "tener hijos", el acto queda restringido a clasificar las unidades de registro y/o análisis que
muestran la presencia o ausencia de un atributo; se le puede asignar un número a esta característica,
pero no es cuantificable. Son características cualitativas. En el segundo caso, se puede estimar
objetivamente no sólo la presencia o ausencia de determinado atributo (tener hijos), sino también la
intensidad con que la propiedad se manifiesta, propiedad que se asume en cantidades.
Basándose en esta diferencia entre las formas de clasificar variables por referencia a este criterio de
calidad-cantidad, la Estadística distingue, ya en un grado mayor de complejidad, la medición de acuerdo
al tipo de escala o nivel de medición, en que se encuentran expresados los atributos que queremos
medir.
11
Se trata de operaciones clasificatorias, o sea, ubicación de las unidades de análisis en clases, clases que
tienen ciertas propiedades formales. De estas propiedades se deducen definiciones exactas de las
características de la escala mucho más precisas de lo que pueden darse en términos verbales. Estas
propiedades pueden formularse en forma más abstracta de lo hasta aquí expresado, mediante un
conjunto de axiomas que delinean las operaciones para elaborar las escalas y las relaciones entre los
objetos a que se aplican.
Se distinguen cuatro tipos de escala:
nominal
ordinal
interval
de razón
A. LA ESCALA NOMINAL
Consiste en clasificar objetos o fenómenos, según ciertas características, tipologías o nombres, dándoles
una denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre los
objetos o fenómenos.
En la escala nominal los números sólo sirven para distinguir categorías, estos no poseen propiedades
cuantitativas y sirven solamente para identificar las clases. Por lo tanto, los numerales utilizados en la
clasificación no son cuantitativos. Ni siquiera se puede realizar un orden de las observaciones con
sentido.
La medición se da a nivel elemental en estos casos (se dice que es el nivel más bajo de medición)
En una escala nominal, la operación de escalamiento consiste en partir de una característica dada y
formar un subconjunto de clases que se excluyen mutuamente. La única relación implicada es la de
equivalencia. Esto es, los miembros de cualquier clase deben ser equivalentes en la propiedad medida.
La relación de equivalencia es reflexiva (x = x para todo x), simétrica (x = y luego y = x) y transitiva (x = y
et y = z luego x = z).
Los símbolos que designan a los diferentes grupos en una escala nominal pueden intercambiarse sin
alterar la información esencial de la escala; debido a esto, las estadísticas de tipo descriptivo admisibles
son aquellas que no se alteran por este proceso: el modo, la frecuencia, el conteo, la proporción, etc. Se
pueden desarrollar procesos analíticos acerca de la distribución de las categorías, así como la posible
12
relación entre dos o más características clasificadas mediante este tipo de escala que llamaremos
“variables cualitativas”.
Ejemplo de escala nominal: variable estado civil
Otros ejemplos de escala nominal:
Sexo (1. masculino; 2. femenino)
Tipo de propiedad (1. oficial; 2. privada; 3. mixta; 4. cooperativa)
Departamento de origen (1. Artigas; 2. Canelones; 3. Colonia, etc….)
Conformidad (1. Si; 0. No)
B. LA ESCALA ORDINAL
Para las mismas personas también se pueden medir propiedades donde la clasificación debe seguir un
orden jerárquico. Se trata de la escala ordinal. Con ella se establecen posiciones relativas de los objetos
o fenómenos en estudio respecto a alguna característica de interés, sin que se reflejen distancias entre
ellos.
Suponga que a los clientes en un negocio se les hace unas preguntas para valorar la
calidad del servicio. Los clientes valoran la calidad de acuerdo a las siguientes respuestas:
1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4 (Muy insatisfecho). Estos datos son
ordinales. Note que una valoración de 1 no indica que el servicio es dos veces mejor que
cuando se da una valoración de 2. Sin embargo podemos decir que la valoración de 1 es
preferiblemente mejor que 2, y así en los demás casos.
Puede suceder que los objetos de una categoría de las escala no sean precisamente diferentes a los
objetos de otra categoría de la escala, sino que están relacionados entre sí, guardan una relación de
jerarquía. Los numerales empleados en las escalas ordinales no son cuantitativos, sino que indican
exclusivamente la posición en la serie ordenada y no "cuantifican" la diferencia entre posiciones sucesivas
de la escala.
13
Las relaciones entre los elementos en clasificación, pueden formularse con el signo >, mayor que, o sea
que axiomáticamente la diferencia fundamental entre una escala nominal y una ordinal es que esta última
incorpora no solamente la relación de equivalencia (=) sino también la relación ''mas grande que'' (>).
Esta relación es irreflexiva (no es verdad para ninguna x tal que x > x), asimétrica ( x > y luego x < y ) y
transitiva (x > y et y > z luego x > z ).
Puesto que cualquier transformación tendiente a conservar el orden no altera la información contenida en
una escala ordinal, se dice que la escala es "única hasta una transformación monotónica". Esto es, no
importa que números se den a una pareja de clases o a los miembros de esas clases, siempre que el
número mayor sea dado a los miembros de la clase mayor o mas preferida. Por supuesto, pueden usarse
números menores para grados mas preferidos (3. de primera clase, 2. de segunda clase, 1 de tercera
clase); en tanto se sea consecuente, es indiferente el uso del número mayor o menor para denotar
"mayor" o "mas preferido".
Fundamentalmente, las escalas ordinales se estudian en Estadística, con base en las llamadas
"estadísticas de orden" o "estadísticas de rango": máximos, mínimos, mediana, percentiles, etc…
Ejemplo de escala ordinal: satisfacción con el resultado
1º
Muy Satisfecho
Satisfecho
2º
Insatisfecho
3º
4º
Muy insatisfecho
C. LA ESCALA DE INTERVALO
Representa un nivel de medición más preciso, matemáticamente hablando, que las anteriores. No sólo se
establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide también la
distancia entre los intervalos o las diferentes categorías o clases. En este caso, la medición se ejecuta en
el sentido de una escala de intervalo; esto es, si la asignación de números a varias clases de objetos es
tan precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se
ha obtenido una medida de intervalo. Una escala de intervalo está caracterizada por una unidad de
medida común y constante que asigna un número real a todos los pares de objetos en un conjunto
ordenado. En esta clase de medida, la proporción de dos intervalos cualesquiera es independiente de la
14
unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son
arbitrarios.
Axiomáticamente se puede ver que las operaciones y las relaciones en que se origina la estructura de
una escala de intervalo son tales que las diferencias en la escala son isomórficas a la estructura de la
aritmética. Los números pueden asociarse con las posiciones de los objetos de tal manera que las
operaciones de la aritmética puedan realizarse significativamente con las diferencias entre los números.
La consecuencia de cualquier cambio de los números asociados con los objetos medidos en una escala
de intervalo debe preservar no solamente el orden de los objetos sino también las diferencias relativas
entre ellos. Esto es, la escala de intervalo es "única hasta una transformación lineal". La escala de
intervalo es la primera escala verdaderamente cuantitativa. Las estadísticas paramétricas, son las
aplicables a estudios en estas escalas.
Ejemplo de variable interval: etapas cronológicas
2050
2000
1950
1900
Suponga que se está interesado en algún período histórico específico y se están haciendo proyecciones
demográficas. Se quiere conocer el crecimiento poblacional cada 50 años. Obviamente los datos pueden
ser ordenados (semejante a los datos ordinales) en orden ascendente indicando pasado/s y futuro/s
sucesivamente. Además , las diferencias entre los valores ordenados pueden ser comparadas. Aquí el
intervalo entre los valores de los datos 1900 y 1950 representan un incremento en la historia de 50 años,
y lo mismo en los demás intervalos. Hay que tener encuentra que en esta escala no hay un cero absoluto
o real, el cero es arbitrario; depende del tipo de calendario que estemos usando.
La presente base de datos tiene por objeto presentar información detallada de la población de
los 20 países de América Latina, desglosada por edades simples y años calendario,
correspondiente al período 1950 - 2050. Estas estimaciones se generan a partir de las
proyecciones nacionales utilizando un procedimiento diseñado en el Área de Demografía del
Centro Latinoamericano y Caribeño de Demografía- División de Población
(CEPAL/CELADE). Una parte de esta información (1995 - 2005) se publica en este Boletín
Demográfico (No. 66) y corresponde a las estimaciones y proyecciones vigentes, sustituyendo
así las publicadas en el Boletín Demográfico No. 60 de julio de 1997.
15
año
1950
Población Total América
Latina
160.685.269
2000
507.932.043
2050
800.592.305
D: LA ESCALA DE RAZON
Cuando una escala tiene todas las características de una escala de intervalo y además un punto cero real
en su origen, se llama escala de razón. Además de distinción, orden y distancia, ésta es una escala que
permite establecer en que proporción es mayor una categoría de una escala que otra. El cero absoluto o
natural representa la nulidad de lo que se estudia. Las operaciones y relaciones hechas con los valores
numéricos en una escala de razón son correspondientes a una escala isomórfica de la estructura de la
aritmética. Por consiguiente las operaciones de la aritmética son permisibles en los valores numéricos
asignados a los objetos mismos, así como también en los intervalos entre los números como sucede en
las escalas de intervalo. Implican que las relaciones de equivalencia, relación de mayor a menor,
proporción conocida de dos intervalos y proporción conocida de dos valores de la escala, sean posibles
de obtener operacionalmente. Los números asociados con los valores de la escala de razón son
"verdaderos" números con un verdadero cero; solo la unidad de medida es arbitraria. Así la escala de
razón es "única hasta la multiplicación por una constante positiva". Además de los procesos paramétricos
básicos de las escalas de intervalo, en las de razón pueden utilizarse estadísticas como la media
geométrica, el coeficiente de variación, las que requieren el conocimiento del verdadero valor cero
16
Ejemplo de variable de razón: número de miembros del hogar ocupados
3
2
1
0
Suponga que se quiere medir los ingresos percibidos por las distintas personas empleadas en una
empresa de servicios. Los valores relevados han sido, 2, 1 – 2, 2 – 2,3 …… en miles de pesos. El orden
(ordinal) y la diferencia (intervalo) en el ingreso percibido puede ser comparado, pero también el
incremento de lo percibido de 2.0 a 2.1 es de 100 pesos (o 0,1 miles de pesos), el cual es el mismo que
el que existe entre 2.2 y 2.3 miles de pesos. También, cuando comparamos los pesos de 2.0 a 2.2 miles
de pesos, se encuentra una razón significativa, quien gana 2,2 gana 10 % más que quien gana 2, 0 miles
de pesos.
El Número como Nombre, Orden o Medida (tomado de Bar; 2000)
Para Cohen y Nagel (1979), los números pueden tener por lo menos tres usos distintos, como rótulos o
marcas de identificación; como signos que indican la posición de un grado en una serie de grados; o como
signos que indican las relaciones cuantitativas entre cualidades. De lo dicho se desprende que sólo la última de
las acepciones relaciona el número con la medición.
Esta forma de concebir los números conduce a una clasificación de variables o escalas en función de los
atributos que presenta una serie numérica. Dichos atributos son, el orden, la distancia y el origen.
Las escalas nominales carecen de todas estas propiedades, y en este caso el número sólo puede adoptarse
como nombre o identificación. Las escalas ordinales, como su nombre lo indica, sólo poseen orden, es decir
que organizan sus datos a través de las relaciones de igualdad, mayor o menor. Las escalas interválicas poseen
atributos de orden, y distancia o estimación precisa de las unidades. Pero carecen de origen, o cero natural, o
ausencia de la propiedad. No obstante estas escalas acuden a la utilización del cero convencional. Las escalas
proporcionales o racionales son las únicas que cuentan con las tres propiedades y, por lo tanto, se constituyen
en verdaderas series numéricas. Las dos últimas clases de escalas son las que realmente miden, no obstante, al
carecer las interválicas de cero natural, no pueden establecerse proporciones.
A menudo, datos provenientes de escalas ordinales numéricas son tratados como si fuera información
verdaderamente cuantitativa, lo que constituye una falacia, pues no miden, aunque sí clasifican. En este caso
se encuadran los tests psicométricos, (las evaluaciones de desempeño, las calificaciones de los alumnos en la
facultad1), los cuales únicamente pueden estimar el orden de puntuación, pero nunca la distancia entre dos
valores. Con mucha frecuencia, las puntuaciones de dichos procedimientos reciben tratamiento de variables
interválicas y, consecuentemente, el cálculo de medidas de tendencia central y dispersión, además de otras
operaciones derivadas de ellas. Dichas operaciones no son válidas por cuanto asignan a las escalas un status
que en realidad no tienen.
1
El texto entre paréntesis es agregado del autor
17
EJERCICIOS
1. En este módulo es importante entender algunos conceptos básicos antes de seguir adelante.
Responde las preguntas y realiza las actividades siguientes, que sintetizan los principales aspectos del
módulo.
¿Cuál es la diferencia entre Estadística y Estadísticos?
Piensa ejemplos de Estadísticos que puedan resultar útiles para aplicar en el campo de las
relaciones laborales.
Explica la diferencia entre Estadística Descriptiva y Estadística Inferencial.
Distingue entre población y muestra. Cita ejemplos de estudios para los cuales sea factible trabajar
con toda la población (censo) o con muestras. Fundamenta.
¿Qué relación hay entre las unidades de análisis y la población?
Piensa ejemplos de variables con sus sistemas de categorías. Identifica el nivel de medición.
2. Identifica las escalas de medición de las siguientes variables, de acuerdo al sistema de categorías que
se les ha asignado.
Variable
Nivel educativo
Nivel educativo
Categoría de
ocupación
Categorías
Ninguno
Primaria
Secundaria
Terciaria
0 año aprobado
1 año aprobado
2 años aprobados
……
Escala de medición
Patrón
Empleado público
Empleado privado
Cooperativista
Trabajador por cuenta propia
Trabajador familiar no remunerado
3. Se quiere realizar un estudio para conocer el perfil de la plantilla de trabajadores de una empresa
comercial del área del supermercadismo.
Imagina qué características podrían ser de interés estudiar. Identifica las variables que se corresponden
con esas características y el sistema de categorías que les asignarías. Menciona el nivel de medición de
cada variable.
Construye la estructura de la matriz de datos en la cual se volcaría la información recogida.
18
4.La figura siguiente muestra una de las páginas del formulario de la Encuesta Nacional de Hogares
Ampliada, con preguntas que se relevan de cada integrante del hogar.
Identifica las variables que aparecen, así como sus sistemas de categorías y
niveles de medición.
19
ANEXO: REPASANDO ALGUNOS CONCEPTOS MATEMATICOS
Sumatoria:
Cuando queremos escribir en forma simplificada la suma de un conjunto grande (e incluso
infinito) de sumandos utilizamos una notación especial representada por la letra griega sigma ( Σ )
Si tenemos n sumandos, representamos a cada uno con la letra X.
El primer sumando es X1, el segundo es X2, … el último es Xn.
Entonces, una suma de X1+ X2+…+ Xn la representamos de la forma:
in
X 1  X 2  ...  X n   X i
i 1
Xi es el “i-ésimo” sumando. En la notación de sumatoria estamos expresando que vamos a ir sumando
las X, desde la que tiene subíndice 1 (i=1) hasta la que tiene subíndice n (i=n). La letra “i” representa el
índice de la sumatoria.
Por ejemplo:
Tenemos los siguientes datos y queremos obtener su suma:
3, 8, 17, 5 . La forma “no simplificada” de representar esta suma sería: 3+ 8 + 17 + 5
Pero si identificamos cada dato de la siguiente forma:
X1=3; X2=8; X3=17; X4=5;
i 4
Podemos expresar la suma como una sumatoria:
X
i 1
i , lo cual simplifica la notación y está
representando la misma suma:
i 4
X
i 1
i
 X 1  X 2  X 3  X 4  3  8  17  5
20
Veremos que esta notación es importante para expresar varias de las herramientas estadísticas que
veremos durante el curso.
Algunas propiedades de las sumatorias que utilizaremos en el curso:

La suma de una expresión que es la suma de dos ó más términos es igual a la suma de las
sumas de los términos por separado:
Ejemplo: X1=2, X2=4; Y1=5, Y2=1, Z1=8, Z2=1.
i 2
(X
i 1
i
 Yi  Z i )  (2  5  8)  (4  1  1)  21
i 2
i 2
i 2
i 1
i 1
i 1
 X i  Yi   Z i  (2  4)  (5  1)  (8  1)  21
•
La suma de una constante multiplicada por una variable es igual que la constante multiplicada por la
suma de la variable, esto es
Donde a es una constante, es decir, un número que no está “indexado” en la sumatoria.
Ejemplo:
a=3; X1=5; X2=4; X3=2
i 3
 aX i  3 * 5  3 * 4  3 * 2  33
i 1
i 3
a X i  3 * (5  4  2)  33
i 1
La suma de una constante, es igual a n veces la constante, esto es:
21
Ejemplo:
i 3
 4  4  4  4  3 * 4  12
Sea a=4, y n=3,
i 1
Fracciones, Razones, Proporciones y Porcentajes:
En el curso es importante manejar el concepto de proporcionalidad y algunas herramientas matemáticas
asociadas.
Operando con fracciones
Recordemos algunas propiedades de la operatoria con fracciones:
a c ac
 
b b
b
ejemplo:
2 3 23
 
4 4
4
a*k c*k  a c 
2 *5 3*5  2 3 

    * k ejemplo:

    *5
b
d
3
4
b d 
3 4
Uniendo ambas propiedades:
a*k c*k  a  c 
2 *5 3*5  2  3 




 * k ejemplo:
*5
b
b
3
3
 b 
 3 
Proporcionalidad y regla de tres
Una razón entre dos cantidades es una comparación por cociente, para lo cual nos servimos de las
fracciones:
a
, tanto para expresarla como para calcularla. Sin embargo, muchas veces encontramos
b
esta otra notación: a:b.
En las razones el numerador no es necesariamente un subconjunto del denominador.
22
Por ejemplo:
Decimos que hay una razón de 12 obreros cada 5 administrativos en una determinada empresa. En este
caso los obreros están en un conjunto distinto al de los administrativos. En cambio si decimos hay una
razón de 8 obreros cada 20 empleados de la empresa, estamos comparando un subconjunto (obreros)
con el conjunto total (empleados).
La igualdad entre dos razones se denomina proporción.
La propiedad:
a c
  a * d  b * c , se denomina propiedad fundamental de las proporciones.
b d
La forma de verificar la proporcionalidad es comprobar que los productos cruzados son iguales.
Por ejemplo, el jornal diario de una determinada categoría laboral en una empresa es de $200 por 4 horas
de trabajo. Se paga por hora trabajada, sin que el valor hora se modifique por jornadas con distinta carga
horaria. Entonces, el trabajador que realiza una jornada de 6 horas, va a ganar $300.
En este caso, utilizamos la idea de proporcionalidad:
200 300

4
6
y esto lo podríamos verificar haciendo el producto cruzado, que debe dar el mismo resultado:
200*6=300*4=1200.
La propiedad fundamental de la proporcionalidad permite aplicar la llamada “regla de tres”, para hallar
un valor que es proporcional a otro.
En el ejemplo que utilizamos, si sabemos que por 4 horas de trabajo pagan $200, y que el jornal es
proporcional al número de horas, entonces podemos hallar cuánto gana alguien que trabaja 6 horas
usando la regla de tres:
4 ----- 200
6 ------ x
Que leemos como: “4 es a 200, como 6 es a x”, haciendo referencia a la idea de proporcionalidad.
Como sabemos que los productos cruzados deben ser iguales:
6*200=4*x, lo cual nos permite despejar nuestra incógnita (x): x 
6 * 200
 300
4
23
Es decir:
a ---- b
c ---- x
x
b*c
a
Nos van a interesar en particular dos tipos de razones:
Las proporciones a 1: Estas proporciones son fracciones que comparan un número con 1.
Para hallar la proporción de a en relación a n: P 
a
. Por ejemplo, si queremos saber qué proporción
n
de integrantes de un hogar trabajan, a sería el número de integrantes del hogar y n el total de integrantes
del hogar (dentro de los cuales están incluidos los miembros que trabajan).
Proporción que trabaja = número de integrantes que trabajan/total integrantes del hogar
Los porcentajes: son fracciones que se obtienen al comparar un número con 100.
P% 
a * 100
n
En el ejemplo anterior:
% que trabaja = número de integrantes que trabajan*100/total integrantes del hogar
Cuando se tiene una proporción, alcanza con multiplicar ésta por 100 para obtener el porcentaje.
En el próximo módulo utilizaremos estas dos herramientas para construir las distribuciones de frecuencias
relativas y las frecuencias relativas porcentuales
24
Descargar