nociones 2.docx - Dirección de Estadísticas e Investigaciones

Anuncio
Organización y resumen de datos categóricos
Contenidos
1. Organización y resumen de datos categóricos: tablas de frecuencias.
2. Gráfico de barras. Gráficos de pastel.
3. Tablas de contingencia. Gráficos comparativos.
Distribuciones unidimensionales de frecuencias
Una parte importante del planeamiento de la información administrativa, consiste en resumir y
presentar los datos de modo que se pueda obtener información de manera rápida y sencilla
La información obtenida antes de ser organizada y analizada, se conoce como datos sin procesar.
Ejemplo:
La dirección de Estadísticas e Investigaciones Económicas de la Provincia de Mendoza realiza
desde diciembre del 2002 la “Encuesta de Caracterización del Turista que visita la Provincia”. Los
días 5, 6 y 7 de Marzo de 2009, se realizó la onda número 60 y coincide con la fiesta provincial de la
Vendimia. Metodológicamente, el estudio consiste en la aplicación de un cuestionario estructurado a
través del cual se indagan personas residentes en el país y en el exterior que, al momento de la
investigación, se encuentran visitando la Ciudad de Mendoza. El relevamiento se realizó en cuatro
puntos muestrales del microcentro de la Ciudad de Mendoza.
Los datos siguientes muestran la participación relativa del tipo de alojamiento elegido por los
turistas chilenos que visitaron Mendoza en la onda 60. La codificación respectiva es:
1-Hotel o Petit Hotel
2-Apart Hotel 3-Casas, departamentos o habitaciones de alquiler temporario.
4- Casas de familiares o amigos 5- Otros: Bed & Breakfast, Hostel o Albergue Turístico, Motel
,Hostería o Posada.
Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza.
Mendoza. Marzo 2009 - Sexagésima Onda
1
4
2
1
1
4
1
2
4
4
1
4
2
4
4
4
5
3
4
1
4
4
4
4
4
4
1
3
3
4
3
1
4
1
1
3
2
3
5
4
3
1
4
4
4
3
4
2
5
4
3
2
1
1
4
4
Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista
que visita Mendoza. Mayo 2009
Autores: Liliana Marconi / Adriana D´Amelio
La variable es tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza.
La escala de medición es nominal.
Una primera organización de estos datos sería contar cuántos datos tenemos en cada categoría.
Esto se llama distribución de frecuencias absolutas:
1 : ½½½½ ½½½½ ½½½
13
2 : ½½½½ ½
6
3 : ½½½½ ½½½½
9
4 : ½½½½ ½½½½ ½½½½ ½½½½ ½½½½
25
5 : ½½½½
5
Trabajar con proporciones o porcentajes, en muchas ocasiones nos brinda mayor información, por
lo que la tabla de distribución de frecuencias la vamos a completar con la frecuencia relativa, que se
obtiene dividiendo la frecuencia absoluta por el número total de observaciones, y la frecuencia
porcentual que es la frecuencia relativa multiplicada por 100%.
fi
f
fr = i
n
Frecuencia absoluta: nº de observaciones en cada categoría
Frecuencia relativa:
Frecuencia relativa porcentual
fr% =
fi
.100%
n
Muy importante:
Ahora estamos en condiciones de elaborar una tabla de frecuencias. En estas tablas hay que poner
en el encabezamiento el título (lo que responda a ¿qué?, ¿cuándo?, ¿dónde?) de manera que la
persona que lea el cuadro se ubique sobre el tema. Al final de la tabla de colocan la fuente (quién
obtuvo los datos, en qué fecha, en qué lugar a ser posible) y todas las explicaciones adicionales o
comentarios.
1. Tabla de frecuencias
La tabla formada por las distintas categorías de las variables y por las frecuencias absolutas, relativas
y porcentuales recibe el nombre de distribución de frecuencias .
La tabla, debe constar de:
Autores: Liliana Marconi / Adriana D´Amelio
[Título adecuado: el cual debe ser claro y conciso, que responda a las preguntas: qué
relaciona, cuándo y dónde se hicieron las observaciones.
[El cuerpo: o tabla en sí, donde van las categorías y las frecuencias, generalmente se
utilizan la frecuencia absoluta y el público a quien va dirigido y el diseño artístico del gráfico.
[ Notas al pie: en caso que se haga necesario dar explicaciones adicionales o comentarios.
[ Fuente: donde se indica donde se obtuvieron los datos, quién los obtuvo los datos, en qué
fecha, en qué lugar, a ser posible
En nuestro ejemplo sería:
Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza.
Mendoza. Marzo 2009 - Sexagésima Onda
Alojamiento
1-Hotel o Petit Hotel
2-Apart Hotel
3-Casas, departamentos o habitaciones de alquiler temporario
4-Casas de familiares o amigos
5-Otros
Total
fi
13
6
9
25
3
56
f ri
f ri %
0.23 23%
0.11 11%
0.16 16%
0.45 45%
0.05
5%
1 100%
Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009
Vamos a leer la categoría 4-Casas de familiares o amigos:
"De las 56 personas de origen
chileno entrevistadas, 25 se alojaron en casas de familiares o amigos y corresponde a una proporción
de 0,45 que representa el 45% de las personas entrevistadas"
§
§
Para calcular la f ri se posiciona en la celda se coloca el signo igual se marca la celda 13 / 56
y se dá enter.
Para calcular f ri % se copian las celdas de las f ri y se va a formato-celda-porcentaje y enter
Vemos que la información está expresada de manera más resumida.
· Muchas veces en estas tablas se representan la frecuencia absoluta y los porcentajes
únicamente.
Otra forma de presentar los datos anteriores sería utilizando gráficas
2. Gráficos de barra
v Las barras separadas se diseñan en forma horizontal o vertical
v Todas las barras deben tener el mismo ancho
v Los espacios entre barras van desde la mitad del ancho de una barra hasta el ancho
Autores: Liliana Marconi / Adriana D´Amelio
total
v Se deben incluir escalas y algunas indicaciones que ayuden a la lectura de las gráficas
v Los ejes se deben identificar en forma clara
v Dentro del cuerpo de la gráfica se deben incluir todo tipo de claves
v El título se coloca, preferentemente encima del cuerpo
v Las notas de pie de página y las fuentes se colocan debajo de la gráfica
Tipo de alojamiento elejido por turistas chilenos que visitan Mendoza. Onda 60
3
Tipo de alojamiento
5-Otros
25
4-Casas de familiares o amigos
9
3-Casas, departamentos o habitaciones de alquiler temporario
6
2-Apart Hotel
13
1-Hotel o Petit Hotel
0
5
10
15
20
25
frecuencia absoluta
Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009.
Tipo de alojamiento elegido por turistas chilenos que visitan Mendoza. Onda 60.
30
25
frecuencia absoluta
25
20
15
13
9
10
6
5
3
0
1-Hotel o Petit Hotel
2-Apart Hotel
3-Casas, departamentos 4-Casas de familiares o
o habitaciones de alquiler
amigos
temporario
5-Otros
Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009.
Autores: Liliana Marconi / Adriana D´Amelio
30
§
Se marca las celdas de las categorías y las de frecuencias, en el menú se hace clic en
Asistente para gráficos. Bajo Tipo de gráficos se selecciona columnas, y bajo Subtipo de
gráficos seleccione en la esquina superior izquierda el tipo de barras que quiere se
representen.
§
Luego marque siguiente en título coloque el título correspondiente a la variable en estudio
teniendo en cuenta que esté territoriada y la fecha. En eje de categorías (X) escriba “Tipo de
alojamiento” y en eje (Y) escriba el tipo de frecuencia que representó puede ser cualesquiera
de las tres.
§
Pase a la parte superior a la pestaña Leyenda, y quite si no quiere ver la leyenda la palomita
que dice Mostrar leyenda. Si quiere rotular los datos se va a la pestaña Rótulos de datos y
elige en el contenido del rótulo lo que quiere mostrar ( valores, porcentajes, etc.). Si quiere
que muestre la tabla, se va a la pestaña Tabla de datos y le pone la palomita a mostrar tabla
de datos . Luego marca finalizar.
§
Si quiere cambiar los colores del gráfico cómo así las tramas, las fuentes, etc. se debe
posicionar en el gráfico y ahí le van apareciendo las opciones.
Gráfica de pastel
v Se dibuja un círculo y se divide en sectores.
v Para calcular los grados de ángulo que le corresponde a cada sector se multiplica la
frecuencia relativa f r por 360º.
v Son válidas todas las sugerencias sobre escalas, títulos, fuentes e información que se
coloca en el cuerpo del gráfico
Tipo de alojamiento elegido por turistas chilenos que visitan
Mendoza. Onda 60
5-Otros
5%
4-Casas de
fam iliares o amigos
45%
1-Hotel o Petit Hotel
23%
2-Apart Hotel
11%
3-Cas as ,
departam entos o
habitaciones de
alquiler tem porario
16%
Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009.
Autores: Liliana Marconi / Adriana D´Amelio
Tipo de alojamiento elegido por turistas chilenos que visitan
Mendoza. Onda 60
5%
23%
45%
11%
16%
1-Hotel o Petit Hotel
2-Apart Hotel
3-Casas, departamentos o habitaciones de alquiler temporario
4-Casas de familiares o amigos
5-Otros
Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009.
El programa R es de distribución gratuita. Tiene una amplia gama de paquetes estadísticos que hacen
que cada vez más a nivel mundial se utilice y recomiende el mismo.
En http://www.r-project.org se baja el programa en la forma Windows, y en CRAN se elige el país
desde el que se quiere bajar. Además se pueden obtener manuales en varios idiomas, incluyendo
castellano. Una introducción al uso de R en castellano (version power-point) se puede ver en:
http://www.etsu.edu/math/seier/R.htm
Manuales en castellano en http://www.R-project.org
•
R Para Principiantes traducida por Jorge A. Ahumada (PDF).
•
“Introducción a R” por Andrés González y Silvia González (PDF )
•
“Gráficos Estadísticos con R” por Juan Carlos Correa y Nelfi González (PDF).
•
“Cartas sobre Estadística de la Revista Argentina de Bioingeniería” Marcelo R. Risk
(PDF).
•
“Introducción al uso y programación del sistema estadístico R” por Ramón Díaz-Uriarte.
Realizamos el gráfico de pastel
> pie(x,alojamiento)
Poniendo título
>pie(x,alojamiento,main="Tipo de alojamiento elegido por los turistas chilenos que visitan
Mendoza.Onda 60. Marzo 2009")
Autores: Liliana Marconi / Adriana D´Amelio
Tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza.Onda 60. Marzo 2009
Apart Hotel
Hotel o Petit Hotel
Casas,departamentos o habitaciones de alquiler temporario
Otros
Casas de familias o amigos
Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009.
2. Tablas estadísticas de doble entrada o tablas de contingencia
Consideramos una población de n individuos, donde cada uno de ellos presenta dos caracteres que
representamos mediante las variables X e Y, La variable X presenta k categorías, y la variable Y p
categorías ,
Por ejemplo:
Una empresa automotriz inició un estudio acerca del tipo de automóvil utilizado por los empleados
administrativos de una organización pública, Los datos obtenidos se muestran en la siguiente tabla de
contingencia:
Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza, marzo 2009.
Tipo de Alojamiento
Onda 47-2008 Onda 60 - 2009
13
45
1-Hotel o Petit Hotel
6
20
2-Apart Hotel
9
9
3-Casas, departamentos o habitaciones de alquiler temporario
25
13
4-Casas de familiares o amigos
3
13
5-Otros
Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009,
Autores: Liliana Marconi / Adriana D´Amelio
§
Se marca las celdas de las categorías y las de frecuencias, en el menú se hace clic en
Asistente para gráficos, Bajo Tipo de gráficos se selecciona columnas, y bajo Subtipo de
gráficos seleccione en la esquina superior izquierda el tipo de barras que quiere se
representen,
§
Luego marque siguiente en título coloque el título correspondiente a la variable en estudio
teniendo en cuenta que esté territoriada y la fecha, En eje de categorías (X) escriba “Tipo de
alojamiento” y en eje (Y) escriba el tipo de frecuencia que representó puede ser cualesquiera
de las tres,
§
Pase a la parte superior a la pestaña Leyenda, y quite si no quiere ver la leyenda la palomita
que dice Mostrar leyenda, Si quiere rotular los datos se va a la pestaña Rótulos de datos y
elige en el contenido del rótulo lo que quiere mostrar ( valores, porcentajes, etc,), Si quiere
que muestre la tabla, se va a la pestaña Tabla de datos y le pone la palomita a mostrar tabla
de datos , Luego marca finalizar,
§
Si quiere cambiar los colores del gráfico cómo así las tramas, las fuentes, etc, se debe
posicionar en el gráfico y ahí le van apareciendo las opciones,
Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009,
X es tipo alojamiento elegido por turistas chilenos en 2008 (onda 47) e Y es la variable es tipo
alojamiento elegido por turistas chilenos en 2009 (onda 60)
También se puede utilizar un gráfico de barras apiladas
Autores: Liliana Marconi / Adriana D´Amelio
Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009,
Con la intención de reunir en una sola estructura toda la información disponible, creamos una tabla
de contingencia formada por k x p casillas, en nuestro ejemplo 5 x 2 organizadas de forma que se
tengan k (en nuestro caso 5) filas y p (en nuestro caso 2) columnas, La casilla denotada de forma
general mediante el subíndice ij hará referencia a los elementos de la muestra que presentan
simultáneamente las modalidades xi e yj. Cada celda de la tabla representa la frecuencia bivariante
de las características correspondientes a su fila y columna
Por ejemplo, (xi=2 , yj=1) representa a turistas que seleccionaaron Apart Hotel en 2008
Con estas tablas se puede obtener una descripción cuantitativa de las distintas cualidades bivariantes
de la muestra, en forma de frecuencias y porcentajes, Estos últimos pueden ser relativos al total de la
muestra, al total de una fila o al total de una columna,,
Llamamos:
Ø frecuencia bivariante total al número de datos n,
Ø frecuencia absoluta conjunta fij al número de datos que presentan
simultáneamente las características xi de la primera variable e yj de la segunda variable ,
La suma de los datos de todas las casillas nos da el total de datos n
f ij
Ø frecuencia relativa conjunta es el cociente f rij =
n
,
La suma de los datos de todas las casillas nos da 1
Ø frecuencia relativa porcentual es el cociente
frij% =
f ij
n
,100%,
La suma de los datos de todas las casillas nos da 100%
a) Utilizando la frecuencia absoluta conjunta:
Autores: Liliana Marconi / Adriana D´Amelio
Participación relativa del tipo de alojamiento elegido por los turistas chilenos que
visitan Mendoza, marzo 2009.
Tipo de Alojamiento
Onda 47-2008 Onda 60 - 2009
13
45
1-Hotel o Petit Hotel
20
6
2-Apart Hotel
3-Casas, departamentos o habitaciones de alquiler temporario
9
9
13
25
4-Casas de familiares o amigos
5-Otros
3
13
Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009,
o Observamos que respondieron que elegían casas de familiares o amigos 25 turistas chilenos en 2008 y 13
en 2009
b) Utilizando la frecuencia absoluta porcentual
Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan
Mendoza, marzo 2009.
Tipo de Alojamiento
1-Hotel o Petit Hotel
2-Apart Hotel
3-Casas, departamentos o habitaciones de alquiler temporario
4-Casas de familiares o amigos
5-Otros
Total
Onda 47-2008
8%
4%
6%
16%
2%
36%
Onda 60 - 2009 Total
29%
37%
13%
17%
6%
12%
8%
24%
8%
10%
64%
100%
Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009,
o Observamos que respondieron que elegían casas de familiares o amigos el 16% de los turistas chilenos
en 2008 y el 8% en 2009
a) Usando los porcentajes por fila
Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan
Mendoza, marzo 2009.
Tipo de Alojamiento
1-Hotel o Petit Hotel
2-Apart Hotel
3-Casas, departamentos o habitaciones de alquiler temporario
4-Casas de familiares o amigos
5-Otros
Onda 47-2008
Onda 60 - 2009 Total
22%
78%
100%
23%
77%
100%
50%
50%
100%
66%
34%
100%
19%
81%
100%
Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo
2009,
o Dentro del grupo que eligió Hotel o Petit hotel, observamos que el 22% lo eligió en 2008 y el 78%
en 2009
Autores: Liliana Marconi / Adriana D´Amelio
Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo2009
b) Usando los totales por columna
Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan
Mendoza, marzo 2009.
Tipo de Alojamiento
1-Hotel o Petit Hotel
2-Apart Hotel
3-Casas, departamentos o habitaciones de alquiler temporario
4-Casas de familiares o amigos
5-Otros
Total
Onda 47-2008
Onda 60 - 2009
23%
45%
11%
20%
16%
9%
45%
13%
13%
5%
100%
100%
Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo2009,
o Observamos que entre los turistas chilenos que nos visitaron en el 2008, el 23%se alojó en Hoteles o
Petit Hotel, el 11% en apart Hotel, el 16% en casa, departamentos o habitaciones de alquiler
temporario, el 45% en casas de familiares o amigos el 5% restante en otros establecimientos.
Participación relativa del tipo de alojamiento elegido por los turistas
chilenos que visitan Mendoza, marzo 2009.
100%
Total
90%
80%
5-Otros
70%
60%
50%
4-Casas de familiares o
amigos
40%
30%
3-Casas, departamentos o
habitaciones de alquiler
temporario
2-Apart Hotel
20%
10%
0%
Onda 47-2008
Onda 60 - 2009
Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo2009
Autores: Liliana Marconi / Adriana D´Amelio
Descargar