Ejercicio 1.. Clasificar las siguientes variables: • Preferencias

Anuncio
Ejercicio 1.. Clasificar las siguientes variables:
• Preferencias políticas (izquierda, derecha o centro).
• Marcas de cerveza.
• Velocidad en Km/h.
• El peso en Kg.
• Signo del zodiaco.
• Nivel educativo (primario secundario, superior).
• Años de estudios completados.
• Tipo de enseñanza (privada o pública).
• Número de empleados de una empresa.
• La temperatura de un enfermo en grados Celsius.
• La clase social (baja, media o alta).
•
La presión de un neumático en Nw/cm2
Ejercicio 2. Clasifique las variables que aparecen en el siguiente cuestionario.
1. ¿Cuál es su edad?
2. Estado civil:
a) Soltero
b) Casado
c) Separado
d) Divorciado
e) Viudo
3. ¿Cuanto tiempo emplea para desplazarse a su trabajo?
4. Tamaño de su municipio de residencia:
a) Municipio pequeño (menos de 2.000 habitantes)
b) Municipio mediano (de 2.000 a 10.000 hab.)
c) Municipio grande (de 10.000 a 50.000 hab.)
d) Ciudad pequeña (de 50.000 a 100.000 hab.)
e) Ciudad grande (más de 100.000 hab.)
5. ¿Está afiliado a la seguridad social?
Ejercicio 3. En el siguiente conjunto de números, se proporcionan los
pesos (redondeados a la libra más próxima) de los bebés nacidos durante
un cierto intervalo de tiempo en un hospital:
4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7,
6, 8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.
1.
2.
3.
4.
5.
6.
Construir una distribución de frecuencias de estos pesos.
Encontrar las frecuencias relativas.
Encontrar las frecuencias acumuladas.
Encontrar las frecuencias relativas acumuladas.
Dibujar un histograma con los datos de la parte a.
¿Por qué se ha utilizado un histograma para representar estos datos, en lugar
de una gráfica de barras?
7. Calcular las medidas de tendencia central.
8. Calcular las medidas de dispersión.
9. Calcular las medidas de forma.
10. ¿Es esta una distribución sesgada? De ser así, ¿en qué dirección?
11. Encontrar el percentil 24.
Ejercicio 4. A continuación se dan los resultados obtenidos con una muestra de 50
universitarios. la característica es el tiempo de reacción ante un estímulo auditivo:
0,110 0,110 0,126 0,112 0,117 0,113 0,135 0,107 0,122
0,113 0,098 0,122 0,105 0,103 0,119 0,100 0,117 0,113
0,124 0,118 0,132 0,108 0,115 0,120 0,107 0,123 0,109
0,117 0,111 0,112 0,101 0,112 0,111 0,119 0,103 0,100
0,108 0,120 0,099 0,102 0,129 0,115 0,121 0,130 0,134
0,118 0,106 0,128 0,094 0,1114
1. ¿Cuál es la amplitud total de la distribución de los datos?
2. Obtenga la distribución de frecuencias absolutas y relativas.
3. Obtenga la distribución de frecuencias acumuladas, absolutas y relativas, con
los intervalos anteriores.
4. Calcular la media y la varianza con los intervalos del apartado b y después
calculense las mismas magnitudes sin ordenar los datos en una tabla
estadística.¿Con qué método se obtiene mayor precisión?
5. Dibuje el polígono de frecuencias relativas.
6. Dibuje el polígono de frecuencias relativas acumuladas.
Ejercicio 5. Con el fin de observar la relación entre la inteligencia y el nivel
socioeconómico (medido por el salario mensual familiar) se tomaron dos grupos, uno
formado con sujetos de cociente intelectual inferior a 95 y otro formado por los demás;
De cada sujeto se anotó el salario mensual familiar. Teniendo en cuenta los resultados
que se indican en la tabla:
Nivel socioeconómico
Intervalos
10 o menos _(4,10]
10 – 16
16 – 22
22 – 28
28 – 34
más de 34 _(34,40]
Sujetos con CI < 95
Frecuencia
75
35
20
30
25
15
Sujetos con CI _ 95
Frecuencia
19
26
25
30
54
46
1. Dibuje un gráfico que permita comparar ambos grupos.
2. Calcule las medidas de tendencia central para aquellos sujetos con CI < 95.
3. Calcular las medidas de dispersión para aquellos sujetos con CI _ 95.
Ejercicio 6. Un estudio consistió en anotar el número de palabras leídas en 15
segundos por un grupo de 120 sujetos disléxicos y 120 individuos normales. Teniendo
en cuenta los resultados de la tabla
N_ de palabras leídas
Disléxicos nD
Normales nN
25 o menos _25
56
1
26
24
9
27
16
21
28
12
29
29
10
28
30 o más _30
2
32
calcule:
1. Las medias aritméticas de ambos grupos.
2. Las medianas de ambos grupos.
3. El porcentaje de sujetos disléxicos que superaron la mediana de los normales.
4. Compare la variabilidad relativa de ambos grupos.
Ejercicio 7. La tabla siguiente muestra la composición por edad, sexo y trabajo de un
grupo de personas con tuberculosis pulmonar en la provincia de Vizcaya en el año
1979:
Edad
Trabajadores
Varón Mujer Total
2
1
3
10
4
14
32
10
42
47
12
59
38
8
46
22
4
26
14–19
19–24
24–29
29–34
34–39
39–44
No trabajadores
Varón Mujer Total
25
40
65
20
36
56
15
50
65
13
34
47
10
25
35
7
18
25
Totales
Varón
Mujer
27
41
30
40
47
60
60
46
48
33
29
22
Total
68
70
107
106
81
51
1. Representar gráficamente la distribución de frecuencias de aquellas personas
trabajadoras que padecen tuberculosis.
2. Representar gráficamente la distribución de frecuencias de los varones no
trabajadores que padecen tuberculosis.
3. Representar gráficamente la distribución de frecuencias del número total de
mujeres que padecen tuberculosis.
4. ¿Cuál es la edad en la que se observa con mayor frecuencia que no trabajan
los varones? ¿Y las mujeres? Determinar asímismo la edad más frecuente (sin
distinción de sexos ni ocupación).
5. ¿Por debajo de qué edad está el 50% de los varones?
6. ¿Por encima de qué edad se encuentra el 80% de las mujeres?
7. Obtener la media, mediana y desviación típica de la distribución de las edades
de la muestra total.
8. Estudiar la asimetría de las tres distribuciones.
Ejercicio 8. En una epidemia de escarlatina, se ha recogido el número de muertos en
40 ciudades de un país, obteniéndose la siguiente tabla:
N_ de muertos
Ciudades
1.
2.
3.
4.
5.
6.
7.
0
7
1
11
2
10
3
7
4
1
5
2
6
1
7
1
Representar gráficamente estos datos.
Obtener la distribución acumulada y representarla.
Calcular media, mediana y moda.
Calcular la varianza y la desviación típica.
Porcentaje de ciudades con al menos 2 muertos.
Porcentaje de ciudades con más de 3 muertos.
Porcentaje de ciudades con a lo sumo 5 muertos.
Ejercicio 9. Se realiza un estudio para establecer una ecuación mediante la cual se
pueda utilizar la concentración de estrona en saliva(X) para predecir la concentración
del esteroide en plasma libre (Y ). Se extrajeron los siguientes datos de 14 varones
sanos:
X
Y
1,4
30
7,5
25
8,5
9
9
11
31,5 27,5 39,5 38
13
43
14
49
14,5 16
17
55
48,5 51
18
20
64,5 63
23
68
1. Estúdiese la posible relación lineal entre ambas variables.
2. Obtener la ecuación que se menciona en el enunciado del problema.
3. Determinar la variación de la concentración de estrona en plasma por unidad
de estrona en saliva.
Ejercicio 10. Los investigadores están estudiando la correlación entre obesidad y la
respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal
(X). La respuesta al dolor se mide utilizando el umbral de reflejo de flexión nociceptiva
(Y ), que es una medida de sensación de punzada. Se obtienen los siguientes datos:
X
Y
89
2
90
3
75
4
30
4,5
51
5,5
75
7
62
9
45
13
90
15
20
14
1. ¿Qué porcentaje de la varianza del peso es explicada mediante un modelo de
regresión lineal por la variación del umbral de reflejo?
2. Estúdiese la posible relación lineal entre ambas variables, obteniendo su grado
de ajuste.
3. ¿Qué porcentaje de sobrepeso podemos esperar para un umbral de reflejo de
10?
Ejercicio 11. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la
capacidad corporal para absorber hierro y plomo. Participan en el estudio 10 sujetos. A
cada uno se le da una dosis oral idéntica de hierro y plomo. Después de 12 días se
mide la cantidad de cada componente retenida en el sistema corporal y, a partir de
ésta, se determina el porcentaje absorbido por el cuerpo. Se obtuvieron los siguientes
datos:
Porcentaje de hierro _ X 17 22 35 43 80 85 91 92 96 100
Porcentaje de plomo _ Y 8
17 18 25 58 59 41 30 43 58
1. Comprobar la idoneidad del modelo lineal de regresión.
2. Obtener la recta de regresión, si el modelo lineal es adecuado.
3. Predecir el porcentaje de hierro absorbido por un individuo cuyo sistema
corporal absorbe el 15% del plomo ingerido.
Ejercicio 12. Para estudiar el efecto de las aguas residuales de las alcantarillas que
afluyen a un lago, se toman medidas de la concentración de nitrato en el agua. Para
monitorizar la variable se ha utilizado un antiguo método manual. Se idea un nuevo
método automático. Si se pone de manifiesto una alta correlación positiva entre las
medidas tomadas empleando los dos métodos, entonces se hará uso habitual del
método automático. Los datos obtenidos son los siguientes:
Manual _ X
25 40 120 75 150 300 270 400 450 575
Automático _ Y 30 80 150 80 200 350 240 320 470 583
1. Hallar el coeficiente de determinación para ambas variables.
2. Comprobar la idoneidad del modelo lineal de regresión. Si el modelo es
apropiado, hallar la recta de regresión de Y sobre X y utilizarla para predecir la
lectura que se obtendría empleando la técnica automática con una muestra de
agua cuya lectura manual es de 100.
3. Para cada una de las observaciones, halle las predicciones que ofrece el
modelo lineal de regresión para X en función de Y , e Y en función de X, es
decir, X̂ e Ŷ .
4. Calcule los errores para cada una de dichas predicciones, es decir, las
variables X − X̂ e Y − Ŷ .
5. ¿Que relación hay entre las medias de X y X̂ ? ¿Y entre las de Y e Ŷ ?
6. Calcule las medias de X − X̂ e Y − Ŷ . ¿Era de esperar el valor obtenido?
7. Calcule las varianzas de X, X̂ , Y , Ŷ , X − X̂ e Y − Ŷ .
Ejercicio 13. Se ha medido el aclaramiento de creatinina en pacientes tratados con
Captopril tras la suspensión del tratamiento con diálisis, resultando la siguiente tabla:
Días tras la diálisis _ X
Creatinina (mg/dl) _ Y
1
5,7
5
5,2
10
4,8
15
4,5
20
4,2
25
4
35
3,8
1. Hállese la expresión de la ecuación lineal que mejor exprese la variación de la
creatinina, en función de los dias transcurridos tras la diálisis, así como el
grado de bondad de ajuste y la varianza residual.
2. ¿En qué porcentaje la variación de la creatinina es explicada por el tiempo
transcurrido desde la diálisis?
3. Si un individuo presenta 401 mg/dl de creatinina, ¿cuánto tiempo es de esperar
que haya transcurrido desde la suspensión de la diálisis?
Ejercicio 14. En un ensayo clínico realizado tras el posible efecto hipotensor de un
fármaco, se evalúa la tensión arterial diastólica (TAD) en condiciones basales (X), y
tras 4 semanas de tratamiento (Y ), en un total de 14 pacientes hipertensos. Se
obtienen los siguiente valores de TAD:
X
95 100 102 104 100 95 95 98 102 96 100 96 110 99
Y
85 94
84
88
85
80 80 92 90
76 90
87 102 89
1. ¿Existe relación lineal entre la TAD basal y la que se observa tras el
tratamiento?
2. ¿Cuál es el valor de TAD esperado tras el tratamiento, en un paciente que
presentó una TAD basal de 95 mm de Hg?
Ejercicio 15. Se han realizado 9 tomas de presión intracraneal en animales de
laboratorio, por un método estándar directo y por una nueva técnica experimental
indirecta, obteniéndose los resultados siguientes en mm de Hg:
Método estándar _ X
9 12 28 72 30 38 76 26 52
Método experimental _ Y 6 10 27 67 25 35 75 27 53
1. Hallar la ecuación lineal que exprese la relación existente entre las presiones
intracraneales, determinadas por los dos métodos.
2. ¿Qué tanto por ciento de la variabilidad de Y es explicada por la regresión?
Hállese el grado de dependencia entre las dos variables y la varianza residual
del mismo.
Descargar