CAPÍTULO 4: ESTADÍSTICA DESCRIPTIVA.

Anuncio
EJERCICIOS PROPUESTOS
CAPÍTULO 4: ESTADÍSTICA DESCRIPTIVA.
1.
a.
b.
c.
d.
e.
f.
g.
h.
i.
j.
Determine qué tipo son las siguientes variables. Si son variables cualitativas indique
si es nominal u ordinal; si son cuantitativas si son discretas o continuas.
Nivel de instrucción (básico, medio, técnico, universitario).
Número de piezas en la vivienda.
Sexo (1=Hombre, 2=Mujer).
Temperatura (en grados Celsius).
Estado Civil (soltero, casado, anulado, viudo).
El número en tarjetas de crédito.
El tiempo que tardó en llegar a la Universidad hoy.
El número de personas en una muestra de 50 que prefieren una marca determinada
de cerveza.
La cantidad de gas que se usa al mes para calentar un hospital.
El número de diarios que vende “El Centro” cada mes.
2.
En el certificado de nacimiento el nivel educacional de la madre se codifica con un
número. 1 = Nivel Superior, 2 = Medio, 3 = Básico, 4 = Ninguno. ¿Qué tipo de
variable es?
3.
Una alumna del curso de Estadística de Agronomía del segundo semestre de 1999
nos dio información sobre el origen de 450 especies de maleza en Chile. De estas
270 provienen de Europa, 70 de Sudamérica, 28 de Chile, 25 de Norteamérica, y
57 de otros lugares. Presente esta información usando una tabla de distribución de
frecuencias y una gráfica adecuada.
4.
En una Universidad que ofrece un programa de postgrado especializado en manejo
de desechos peligrosos. Para planificar futuros cambios, se hizo una encuesta para
determinar los antecedentes y objetivos de los 223 estudiantes que actualmente
están inscritos en el programa (Fuente: Journal of Professional Issues in
Engineering, abril de 1990). La gráfica circular muestra un desglose de las
licenciaturas que cursaron los 223 estudiantes. Interprete la gráfica.
Biología
15%
Otros
28%
Química
13%
Geología
7%
Ingeniería
Química
23%
Ingeniería
Civil
14%
Transforme este gráfico en un gráfico de barras donde se muestren las frecuencias
absolutas.
CAPÍTULO CUATRO
PÁGINA 1 DE 11
EJERCICIOS PROPUESTOS
5.
a.
b.
i.
ii.
iii.
iv.
v.
vi.
c.
6.
Se hace un estudio para evaluar una nueva marca de marcapasos. El estudio se
hizo en 20 pacientes que recibieron el nuevo marcapasos. Se registra el tiempo, en
meses, al primer problema eléctrico del marcapasos.
22 14
6
21 24 12 18 16 28 18
16 24 26 28 13 16 23 20
3
22
Haga un gráfico de tallo y hoja a estos datos.
¿Cuál de las siguientes descripciones se ajusta a la distribución del tiempo?
Seleccione todas las posibles:
Simétrica.
Unimodal.
Bimodal.
Sesgada a la derecha.
Sesgada a la izquierda.
Uniforme.
¿A qué proporción de sujetos le falla el marcapasos antes de 5 meses?
El siguiente diagrama de tallo y hoja representa el tiempo, en segundos, que
necesitan 30 personas para embalar una caja de frutas.
0|3334
0|66677788999
1|0012234
1|55689
2|1
2|5
3|0
Nota: 1 | 5 representa 150 segundos
a.
b.
c.
Describa la forma de la distribución. ¿Es aproximadamente simétrica ó sesgada? Si
es sesgada, ¿Qué tipo de sesgo?
Construya un diagrama de caja para describir estos datos.
¿Cuánto se demora el 25% más rápido para embalar?
7.
Los diagramas de talla y hoja a continuación muestran el tiempo de duración (en
horas) de dos tipos de ampolletas A y B:
Ampolleta A
Ampolleta B
71
72 5
6 3 1 0 73 1
9 9 8 7 6 2 74 6
9 7 3 0 75 2
76 0 2 2 5 7
77 1 1 3 4 6 8
1 78
Nota: 72 | 5 representan 725 horas.
a.
b.
c.
d.
¿Cuánto duró la ampolleta que duró más?
¿Cuál ampolleta dura típicamente más la A ó B? Explique.
Dé alguna razón para preferir A.
Dé alguna razón para preferir B.
CAPÍTULO CUATRO
PÁGINA 2 DE 11
EJERCICIOS PROPUESTOS
8.
La siguiente tabla muestra el promedio de años de escolaridad en personas de 15
años y más, por sexo para Chile. Fuente: INE Censo 2002. Construya un gráfico de
tallo y hoja comparativo, apropiado para describir estos datos.
Región
Hombres Mujeres
I de Tarapacá
10,7
10,2
II de Antofagasta
10,9
10,3
III de Atacama
9,8
9,4
IV de Coquimbo
9,3
9,2
V de Valparaíso
10,2
9,9
XIII Metropolitana de Santiago
10,6
10,1
VI del Libertador
8,8
8,8
VII del Maule
8,2
8,5
VIII del Bío-Bío
9,3
9,1
IX de la Araucanía
8,6
8,5
X de los Lagos
8,6
8,3
XI de Aisén
8,9
8,6
XII de Magallanes
10,2
9,8
Total Chile
9,8
9,5
9.
La siguiente tabla muestra las tasas de suicidios para hombres y mujeres en 15
países por 100000 personas. Suponga que estos datos provienen de una muestra
aleatoria de países. Construya un gráfico de tallo y hoja comparativo, apropiado
para describir estos datos.
País
Hombres Mujeres
Australia
16
6
Austria
40
15
Canadá
22
7
Dinamarca
39
21
Francia
25
10
Irlanda
6
4
Israel
8
4
Japón
22
13
Holanda
12
8
Noruega
19
7
Polonia
22
4
Suecia
28
11
Suiza
37
15
Reino Unido
11
7
Estado Unidos
19
6
10.
¿Qué forma tiene las distribuciones descritas por las siguientes medidas de
tendencia central?:
Media = 46, Mediana = 42, Moda = 39.
Media = 3,1, Mediana = 3,1, Moda = 3,1.
Media = 105, Mediana = 110, Moda = 115.
a.
b.
c.
11.
a.
Determine si las siguientes aseveraciones son verdaderas ó falsas. Una aseveración
verdadera tiene que ser siempre verdadera.
El rango entre cuartiles es la mitad del rango.
CAPÍTULO CUATRO
PÁGINA 3 DE 11
EJERCICIOS PROPUESTOS
b.
c.
d.
e.
12.
a.
b.
c.
13.
a.
b.
c.
14.
a.
b.
c.
15.
El promedio está siempre entre el primer y tercer cuartil.
La mediana está siempre entre el primer y tercer cuartil.
La desviación estándar de una distribución simétrica es siempre igual al rango entre
cuartiles.
El promedio de una distribución simétrica es siempre igual a la mediana.
Un Profesor le entrega las notas en el primer control y les dice que el promedio fue
de 5,7. Si usted obtuvo un 6,2:
¿Puede su nota ser la máxima?
¿Puede ser que el 50% de los estudiantes tuvieron mejor nota que usted?
Si además el Profesor da la desviación estándar, ¿Con cuál se sentiría mejor: con
una desviación estándar de 0,6 ó con una de 1,1? Explique.
Un estudio encontró que los estudiantes hombres de una Universidad pesaban en
promedio 66 kilos con una desviación estándar de 9 kilos. Las mujeres pesaban en
promedio 55 kilos, con una desviación estándar de 9 kilos.
Puede decir si el estudiante de más peso es ¿Un hombre ó una mujer? Explique.
Encuentre el promedio y la desviación estándar en libras (1 kg = 2,2 libras).
Si juntamos los hombres y las mujeres, la desviación estándar será: ¿Menor que,
mayor que ó igual a 9?
Se estudia el resultado de un test de aptitud y las medidas de resumen se
presentan en la tabla:
Mínimo
Cuartil 1
Mediana
Cuartil 3
Máximo
340
460
580
780
950
Dibuje un diagrama de caja simple.
Suponga que Usted obtuvo 770 puntos en el test, ¿Qué puede decir acerca del
porcentaje de los alumnos que obtuvieron menos puntos que Usted?
Si el 25% con mayor puntaje se sacó un siete, ¿Cuál fue el puntaje mínimo para
sacarse un siete?
Se conduce un estudio de los efectos de fumar sobre los patrones de sueño. La
medición que se observa es el tiempo, en minutos, que toma quedar dormido. Los
datos se grafican en el siguiente diagrama de cajas:
80
70
60
50
40
Minutos
30
20
10
N=
12
Fumadores
14
No fumadores
Grupo
CAPÍTULO CUATRO
PÁGINA 4 DE 11
EJERCICIOS PROPUESTOS
a.
b.
c.
d.
En base al gráfico, comente qué clase de impacto parece tener el fumar sobre el
tiempo que se requiere para quedar dormido (use medidas de tendencia central y
de dispersión).
¿Aproximadamente cuánto se demoró en quedar dormido al que más le costo
quedarse dormido?
¿Aproximadamente qué porcentaje de los fumadores se demoró menos de media
hora en quedarse dormidos?
Comente si los datos que se presentan parecen ser simétricos. Justifique su
respuesta.
16.
La Corporación Nacional de Consumidores y Usuarios de Chile (www.odecu.cl) hizo
un estudio que mide el contenido de sodio (en miligramos) en 63 tipos de galletas
dulces en venta en el comercio.
a.
b.
c.
¿Cuál es el valor aproximado de la mediana?
¿Qué medidas de dispersión puede calcular del gráfico de caja? Calcúlelas.
¿Aproximadamente cuántos productos contenían más de 250 miligramos de sodio?
Justifique.
¿Se puede decir que la distribución del contenido de sodio es simétrica? Justifique.
d.
17.
Encuentre el promedio, mediana y moda de estos dos conjuntos de datos:
Datos I
2
3
4
6
6
6
7
7
-9
9
Datos II
6
8
4
8
9
6
42
¿Para cuál de los dos conjuntos de datos I ó II el promedio es una mala medida de
tendencia central? ¿Por qué?
CAPÍTULO CUATRO
PÁGINA 5 DE 11
EJERCICIOS PROPUESTOS
18.
Se tienen datos de la cantidad mensual de lluvia caída en 3 estaciones de una
ciudad para los 12 meses de 1999.
a.
¿Cuál de las 3 estaciones tiene el mayor rango de lluvia caída en los 12 meses?
Justifique.
En general, ¿Qué medidas de dispersión puede calcular en un gráfico de caja?
¿Cuál es el valor aproximado de las medidas de dispersión en la estación 2?
¿Aproximadamente cuántos meses llovió menos de 8 mm en la estación 1.
Justifique.
En vista de que la caja de la estación 1 es simétrica, ¿Podemos decir que la
distribución de los valores de lluvia caída en la estación 1 será simétrica? Justifique
su respuesta.
Estos son los datos de la lluvia caída en la estación 4:
3
5
9
9
9
10 11 11 11 11 12 15
Calcule las medidas de tendencia central y de dispersión a estos datos.
En el gráfico dibuje la caja correspondiente a la estación 4.
b.i.
b.ii.
c.
d.
e.
e.i.
e.ii.
19.
a.
b.
c.
Entre el 14% y 20% de los menores de 19 años, a nivel nacional, sufre algún tipo
de trastorno emocional, cuyas causas son múltiples. En la región del Maule, se
consideró una muestra de 20 de estos jóvenes que padecen de este tipo de
trastornos, resumiéndose la información recopilada en la siguiente tabla:
Causas del trastorno emocional
Frecuencia absoluta
%
Deficiencia en habilidades sociales
4
20
Hechos negativos
5
25
Alteraciones endocrinas
3
15
Herencia familiar
8
40
Según el contexto del planteamiento, ¿Qué representa la frecuencia absoluta?
Determine e interprete alguna medida de resumen de estos datos.
Construya un gráfico adecuado para resumir la información anterior.
CAPÍTULO CUATRO
PÁGINA 6 DE 11
EJERCICIOS PROPUESTOS
20.
Una Nutricionista quiere estudiar el efecto de la edad en la masa muscular de las
mujeres (en mg por ml). Suponga que el gráfico de caja muestra las medidas de la
masa muscular en la población de mujeres, dividida en cuatro grupos de edad.
a.
b.
¿Cuáles son la variable respuesta y la variable explicatoria en este estudio?
¿Cómo están medidas las variables respuesta y la explicatoria? ¿Cualitativa
(nominal u ordinal) ó Cuantitativa (discreta ó continua)?
Basado en el gráfico, ¿Cuál de los siguientes esquemas de muestreo parece como el
mejor diseño muestral para esta población? Muestreo aleatorio simple ó muestreo
aleatorio estratificado. Explique su respuesta.
¿Qué porcentaje de mujeres en el grupo de mayor edad tiene masa muscular
menor que 80 mg por ml?
¿Qué tipo de distribución tiene el grupo de 40-49 años de edad? ¿Simétrica ó
sesgada (Positiva ó Negativa)? Fundamente su respuesta.
c.
d.
e.
21.
a.
b.
c.
22.
Se ha recopilado la siguiente información proporcionada por un Odontólogo, que
describe la cantidad de piezas dentales que fueron extraídas en los últimos 20
meses:
19
23
32
19
32
17
25
18
27
30
22
47
23
35
23
27
29
28
25
20
Calcule todas las medidas de tendencia central.
Calcule todas las medidas de dispersión.
Dibuje un diagrama de tallo y hoja.
Dos Profesores (A y B) están interesados en estudiar los hábitos de sueño de los
estudiantes en sus clases. Ambos profesores registran el tiempo (en minutos) que
demoran en quedarse dormidos sus alumnos desde que empieza la clase. El gráfico
siguiente muestra los tiempos que demoran en quedarse dormidos los alumnos del
profesor A.
CAPÍTULO CUATRO
PÁGINA 7 DE 11
EJERCICIOS PROPUESTOS
22
21
20
19
18
17
16
15
Tiempo en minutos
14
13
12
11
10
9
8
N=
19
Profesor A
a.
b.
c.
23.
a.
b.
c.
24.
¿Cuál es el valor aproximado de las medidas de dispersión del tiempo del Profesor
A?
¿Qué porcentaje de alumnos se queda dormido antes de los 14 minutos con el
Profesor A? Justifique.
Los datos del Profesor B son los siguientes:
10,5 11,3 11,9 12,0 12,3 12,3 12,5 12,7 13,4 13,7
13,8 14,2 14,8 15,1 15,3 16,7 16,8 18,8 20,8
Construya un diagrama de caja (junto al diagrama de caja del profesor A)
correspondiente a los tiempos en que se quedan dormidos los alumnos en la clase
del Profesor B y compare ambos grupos respecto de la variable en estudio.
En Toconey, un pueblo ubicado junto a la rivera norte del Río Maule, un alumno de
Odontología de la Universidad de Talca, atiende gratuitamente a los pobladores,
insistiendo en ellos que deben tener un buen hábito de higiene bucal. Para controlar
lo anterior, el día 21 de Septiembre del 2006, consultó a sus pacientes por la
cantidad de cepillados que se habían realizado el día anterior, recopilándose la
siguiente información:
3
3
0
2
4
5
3
2
1
1
0
1
2
3
4
3
2
0
1
2
3
4
5
0
2
2
1
3
3
3
Resuma la información anterior en una tabla de distribución de frecuencias.
Grafique la información recopilada.
Calcule e interprete todas las medidas de tendencia central.
Grado de Depresión de las personas.
Un Psicólogo elaboró una prueba llamada “Lápiz y Papel” que tiene como finalidad
medir el grado de depresión de las personas. Para comparar los resultados de esa
prueba con las calificaciones asignadas por expertos, varios individuos “con
perturbaciones emocionales” fueron sometidos a ella. Los mismos individuos fueron
calificados por dos Psiquiatras A y B, de manera independiente, según el grado de
depresión observado por cada uno de ellos en el transcurso de entrevistas
detalladas con esos individuos.
Los puntajes más altos corresponden a un grado mayor de depresión.
CAPÍTULO CUATRO
PÁGINA 8 DE 11
EJERCICIOS PROPUESTOS
Diagrama de caja de los resultados de la prueba “Lápiz y Papel” del Psiquiatra A.
a.
b.
c.
d.
e.
25.
a.
b.
c.
¿Cuál es el valor aproximado de las medidas de dispersión del grado de depresión
determinada por el Psiquiatra A?
¿Qué medida de dispersión usaría para describir mejor la variabilidad de los datos
del Psiquiatra A? Justifique.
¿Qué porcentaje de los individuos tienen un grado de depresión mayor a 8 puntos
según el Psiquiatra A?
Calcule las medidas de tendencia central y de dispersión del grado de depresión de
los individuos calificados por el Psiquiatra B. Use los siguiente datos:
Resultados Psiquiatra B
7 28 3 4 8 18 1 1 9 35 9 6 10 15 2 2 11 42 6 10 12 22 5 3
Dibuje un diagrama de tallo y hoja para los resultados del Psiquiatra B. Comente el
resultado acerca de la distribución.
Un Tecnólogo Médico resume la información recopilada durante el mes de Enero del
año 2008, de los exámenes que miden el nivel de triglicéridos de las personas
atendidas en el consultorio de la zona norte de la ciudad de Curicó:
Niveles de triglicéridos
Frecuencia Absoluta
Normal
90
Límite Alto
270
Alto
140
Muy Alto
100
Según el planteamiento, ¿Qué representa la frecuencia absoluta?
¿Cuál es el nivel de triglicérido que se observa con mayor frecuencia?
Determine la Mediana e interprete su resultado.
CAPÍTULO CUATRO
PÁGINA 9 DE 11
EJERCICIOS PROPUESTOS
26.
a.
b.
c.
d.
e.
27.
a.
b.
c.
Los estudiantes de Psicología siempre manifiestan que tienen mayor dificultad en
los cursos que involucre el tratamiento de cálculos matemáticos, es por ello que se
realizó una medición de la memoria en estudiantes de primer año de la carrera. La
experiencia consistió en exponer 10 palabras y 10 números ante los estudiantes
durante 10 segundos. Después de cuatro días de clases, se pidió a los alumnos que
recordaran las palabras y números que se habían mostrados previamente,
registrándose los siguientes resultados:
Cantidad de palabras
Número de
Cantidad de números
Número de
que recuerda
alumnos
que recuerda
alumnos
0
2
0
4
1
5
1
8
2
2
8
15
3
12
3
24
4
15
4
26
5
5
22
23
6
25
6
14
7
27
7
10
8
21
8
9
9
17
9
4
10
11
10
1
En término medio, ¿Qué cantidad de palabras y números recuerdan los estudiantes?
¿Cuál es la cantidad de palabras y de números que recuerdan con mayor
frecuencia?
Determine la mediana de ambos casos. Interprete sus resultados.
¿En cuál de los dos grupos se recopiló una información más homogénea?
Determine en qué grupo existe una menor desviación cuartil.
La Dependencia no es sinónimo de vejez.
La Dependencia se define como “la necesidad de ayuda o asistencia para las
actividades de la vida cotidiana”, o también, de manera más concreta, como “un
estado en el que se encuentran las personas que por razones ligadas a la falta o
pérdida de autonomía física, psíquica o intelectual, tienen necesidad de asistencia a
fin de realizar los actos corrientes de la vida diaria y, de modo particular, los
referentes al cuidado personal”.
En un estudio en el Hospicio de Talca se recoge una muestra, donde se constata
que existen personas con diferentes tipos de dependencia, como se describe a
continuación:
Económica
Física
Social
Social
Económica
Económica
Mental
Mental
Física
Económica
Mental
Social
Mental
Económica
Social
Física
Física
Económica
Mental
Social
Mental
Económica
Mental
Mental
Física
Física
Social
Física
Económica
Mental
Resuma la información anterior en una tabla de distribución de frecuencias.
Construya un gráfico adecuado para resumir la información anterior.
Calcule e interprete alguna medida de resumen de estos datos.
CAPÍTULO CUATRO
PÁGINA 10 DE 11
EJERCICIOS PROPUESTOS
28.
Se realiza un estudio de un geriátrico de Santiago durante el mes de Mayo del
2006. El objetivo es determinar el tipo de pacientes a los que se atiende
observándose su diagnóstico:
Retraso
Mental
Retraso
Mental
Enfermo
Mental
Físicamente
Enfermo
Enfermo
Mental
a.
b.
29.
a.
b.
c.
30.
a.
b.
Enfermo
Mental
Retraso
Mental
Físicamente
Enfermo
Retraso
Mental
Retraso
Mental
Físicamente
Enfermo
Enfermo
Mental
Retraso
Mental
Físicamente
Enfermo
Enfermo
Mental
Físicamente
Enfermo
Retraso
Mental
Enfermo
Mental
Retraso
Mental
Retraso
Mental
Retraso
Mental
Enfermo
Mental
Retraso
Mental
Retraso
Mental
Físicamente
Enfermo
Construya la tabla de distribución de frecuencias adecuada para la información
recopilada.
Determine todos los parámetros posibles de obtener. Interprete sus resultados.
Se recopilan datos de las menciones obtenidas por Tecnólogos Médicos titulados en
la Universidad de Talca entre los años 2001 y 2005:
Bioanálisis Clínico, Morfofisiopatología, Imagenología, Oftalmología, Oftalmología,
Bioanálisis
Clínico,
Morfofisiopatología,
Bioanálisis
Clínico,
Oftalmología,
Imagenología, Oftalmología, Imagenología, Oftalmología, Morfofisiopatología,
Bioanálisis
Clínico,
Bioanálisis
Clínico,
Oftalmología,
Morfofisiopatología,
Imagenología, Bioanálisis Clínico, Oftalmología, Oftalmología, Morfofisiopatología,
Oftalmología,
Imagenología,
Bioanálisis
Clínico,
Bioanálisis
Clínico,
Morfofisiopatología, Bioanálisis Clínico, Imagenología, Imagenología, Oftalmología,
Oftalmología, Oftalmología, Imagenología.
Represente la información anterior en una tabla de distribución de frecuencias.
Represente gráficamente la información anterior.
Calcule e interprete los parámetros de la información recopilada.
En un estudio sobre la amnesia postraumática tras una lesión craneal, se estudia la
variable del tiempo de hospitalización en días. En la figura se muestra el diagrama
de tallo y hojas para los datos.
Stem-and-Leaf Display for Amnesia: unit = 1.0 1|2 represents 12.0
0|8
1|2
2|7
3|0256
4|00001257
5|02
6|1
7|
8|9
9|
10|8
Calcule las medidas de tendencia central y de dispersión más adecuadas para estos
datos, indicando a qué tipo de medida pertenece.
Dibuje un diagrama de caja. Comente el resultado acerca de la distribución.
Muestre sus cálculos.
CAPÍTULO CUATRO
PÁGINA 11 DE 11
Descargar