Subido por Lara Bermúdez Pillado

20-21 NHD Problemas traballo ANOVA (tema 5)

Anuncio
1
BIOESTATÍSTICA 2020-2021
Grao en Nutrición Humana e Dietética. Facultade de Ciencias. Lugo
==================================================================================
Boletín de problemas de ANOVA PARA O TRABALLO
Tema 5
==================================================================================
A.1 Se desea comparar el porcentaje de carbonato de calcio (CaCO3) en tres localizaciones L1,
L2 y L3. Un examen de seis muestras en cada lugar (llevado a cabo en las mismas condiciones y de
forma independiente para cada muestra) dio los siguientes resultados, para los que se acompaña un
análisis estadístico preliminar.
DATOS Y MEDIDAS DE RESUMEN
L1 19,2 18,7 21,3 16,5 17,3 22,4
L2 12,5 14,3 8,7 11,4 9,5 16,5
L3 19,9 24,3 17,6 20,2 18,4 19,1
L1
L2
L3
media
19,23
12,15
19,92
desviación típica
2,2713
2,9379
2,3507
Davis JC (2002) Statistics and data analysis in
Geology. Wiley
TABLA ANOVA
Variabilidad
Entre localizaciones
Residual
Total
Suma de Grados de
cuadrados libertad
Cuadrado
medio
110,9617
Valor
de F
96,5767
COMPARACIÓN POR PARES
comparación
L1 con L2
diferencia de medias µ1 − µ 2
límite inferior
límite superior
L1 con L3
µ1 − µ3
L2 con L3
µ 2 − µ3
-3,8059
2,4392
a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez
del análisis estadístico asociado a la tabla ANOVA?
b) Examinar si se puede considerar que el contenido medio de carbonato de calcio es el mismo
en los tres lugares, indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test para un nivel de significación del 5%.
c) Obtener los intervalos de confianza del 95% para las diferencias de medias µi − µ j (basados
en el método de la mínima diferencia significativa) pendientes de calcular en la tabla de “comparación
por pares”. En base a dichos intervalos decidir, si es posible, cuáles son los lugares de mayor y de
menor contenido medio de carbonato de calcio.
A.2. Se realizó un estudio para comparar los porcentajes de carbohidratos en 4 marcas de pan.
Se realizaron 18 determinaciones: 5 en la primera marca (M1), 3 en la segunda (M2), 4 en la tercera
(M3) y 6 en la cuarta (M4). A continuación se presentan los resultados obtenidos, varias medidas
muestrales de resumen, y parte de la tabla de análisis de la varianza.
DATOS Y MEDIDAS DE RESUMEN
Porcentaje
M1
65
68
71
70
69
M2
60
65
61
M3
59
66
58
59
M4
70
69
62
71
70
66
Fuente: Infante Gil, S y Zárate de Lara, G. (2012). Métodos
estadísticos, un enfoque interdisciplinario. Mundi-Prensa
Q1
Q3
68,0 70,0
60,5 63,0
58,5 62,5
66,0 70,0
Marca
M1
M2
M3
M4
media
68,6
62
60,5
68
desviación
típica
2,3022
2,6458
3,6968
3,4059
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
2
TABLA ANOVA
Variabilidad
Entre marcas
Residual
Total
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
74,10
9,5857
Valor
de F
COMPARACIÓN POR PARES
Intervalos de confianza del 95%
Comparación
1 con 3 2 con 3
límite inferior
3,65
-3,57
límite superior
12,55
6,57
3 con 4
a) Para la marca M4, obtener e interpretar la medida de tendencia central y la medida de dispersión
representadas en el gráfico de cajas. En base al gráfico de cajas, ¿qué tipo de asimetría se aprecia?
b) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del
análisis estadístico asociado a la tabla ANOVA?
c) Examinar, en base al p-valor, si se puede considerar que, en términos medios, el porcentaje de
carbohidratos es el mismo en cualquiera de las cuatro marcas, indicando:
c.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
c.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
c.3) Cuál es el resultado del test.
d) Obtener el intervalo de confianza del 95% para la diferencia de medias µ3 − µ4 basado en el método
de la mínima diferencia significativa, indicando:
d.1) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados.
d.2) Cuál es la expresión matemática del intervalo de confianza.
d.3) Cuál es el intervalo de confianza obtenido.
d.4) Interpretar los tres intervalos de confianza de la tabla de “comparación por pares”. En base a ellos, ¿se
puede considerar que la marca M3 es la que tiene un menor porcentaje de carbohidratos?
A.3. Se llevó a cabo un experimento en el que se determinó el valor nutritivo de un total de 20
piezas de cierto fruto comestible. Se consideraron piezas de 4 variedades diferentes del fruto para
comparar sus valores nutritivos medios. Los resultados y la tabla ANOVA son los que siguen a
continuación.
V
V1
V2
V3
V4
valor nutritivo
109
124
108
110
110
121
109
108
110
118
111
114
media
112
120
109
112
114
119
119
117
total
111,0
120,4
111,2
112,2
113,7
Fuente de
variación
Variedad
Error exp.
Total
Suma de
cuadrados
303,4
Grados de
libertad
Cuadrado
medio
Valor
de F
470,2
a) Escribir las hipóteses nula y alternativa del problema e indicar qué supuestos sobre las muestras
se asumen en el análisis estatístico asociado a la tabla ANOVA.
b) Completar la tabla y examinar si se puede considerar que el valor nutritivo de las cuatro
variedades es la misma.
c) En el caso de que en el apartado anterior se observen diferencias significativas, calcular un
intervalo de confianza de un nivel de confianza del 95% para la diferencia de medias del valor
nutritivo entre cada par de variedades, µi − µ j . En base a la información de estos intervalos, ¿existe
alguna variedad que podamos afirmar que tiene un valor nutritivo superior a las demás?. ¿Por qué?
A.4. En un estudio sobre polución realizado con algas, se seleccionaron aleatoriamente cinco
ejemplares de cada una de las cuatro especies objetivo del estudio. En el laboratorio se determinó el
nivel de cadmio presente, en μg por g. de peso seco. Los resultados y la tabla ANOVA son los que
siguen a continuación.
Especie:
Cadmio
μg/g peso seco
Media
desv. Típica
Pelvetia
Fucus vesiculous
2,04
2,01 2,17
2,07
1,97
1,95 2,25
2,14
2,06
2,11
2,006
2,148
0,04615
0,06797
Ascophyllum
Laminaria
1,93
2,05 1,94
1,85
2,08
2,13 2,02
1,97
2,03
1,93
2,044
1,942
0,07403
0,06221
Muestra
media
2,035
total
desv. típica
0,09627
Fuente: Gardiner, W. P. y Gettinby, G. (1998). Experimental Design Techniques in Statistical Practice. Horwood Publishing
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
3
Fuente de
Variación
Especie
Error experimental
Total
Suma de Grados de Cuadrado
cuadrados libertad
medio
0,1117
0,0644
Valor
de F
a) Completar la tabla e indicar:
a.1) cuál es el modelo de análisis de la varianza asociado a la muestra, identificando cada uno de sus
términos;
a.2) qué hipótesis sobre el error experimental se asumen en el análisis estadístico asociado a la tabla
ANOVA.
b) ¿Se puede considerar que no existen diferencias significativas entre los contenidos medios
de cadmio de las cuatro especies?
b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la
distribución de referencia del test correspondiente?.
b.2) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su
valor.
b.3) ¿Cuál es el resultado del test?
c) Contrastar, utilizando el método de la mínima diferencia significativa, con un nivel de
significación del 5%, si se puede asumir que el contenido medio de cadmio es el mismo en las
especies Fucus vesiculosus y Ascophyllum.
d) Calcular:
d.1) los residuos correspondientes a la especie Laminaria,
d.2) la estimación insesgada de la varianza del error experimental. ¿Cuál es su expresión en términos
de los residuos?
A.5. En una plantación de árboles frutales hay tres variedades de melocotoneros, A, B y C. Se
quiere determinar si las variedades de frutal son diferentes respecto al diámetro del tronco medido a 75
cm. del suelo. Los siguientes datos son las determinaciones de dicho diámetro en once árboles de cada
variedad seleccionados al azar.
media
Variedad A
Variedad B
Variedad C
29,69 29,39 29,10 28,22 27,94 27,65 28,81 27,93 28,52 28,22 27,36
30,90 29,98 29,66 28,78 29,67 29,38 28,80 29,37 29,08 29,96 29,97
29,39 27,38 29,10 27,37 27,95 29,1 28,5 27,65 28,81 27,10 26,55
total
varianza
28,4391
29,5955
0,5441
0,3793
28,7055
1,0003
Fuente: Ruiz Macías, P. (2000). Métodos estadísticos para investigación agraria y biológica. Junta de Extremadura
En el análisis de la varianza se obtuvieron los siguientes resultados:
Variabilidad
Entre variedades
Residual
Total
Suma de Grados de Cuadrado
cuadrados libertad
medio
6,8858
18,2379
Valor
de F
Puntos críticos
5%
10%
3,3158
2,4887
a) Calcular las medidas de resumen (media y varianza muestrales) de la variedad C indicando
su expresión.
b) Completar la tabla ANOVA e indicar:
b.1) Cuál es el modelo de análisis de la varianza asociado a la muestra, identificando cada uno de sus
términos.
b.2) Qué hipótesis sobre el error experimental se asumen en el análisis estadístico asociado a la tabla
ANOVA.
b.3) Cuál es la estimación insesgada de cada uno de los parámetros del modelo ANOVA y calcular sus
valores.
c) ¿Se puede considerar que no existen diferencias significativas entre el diámetro (a 75 cm.
del suelo) de las tres variedades de melocotonero?
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
4
c.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la
distribución de referencia del test correspondiente?
c.2) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su
valor. ¿Cuál es el resultado del test?
d) Obtener para cada par de variedades, un intervalo de confianza del 95% para la diferencia
en término medio de sus diámetros, µi − µ j . A partir de dichos intervalos:
d.1) deducir qué diferencias son significativas en base al método de la mínima diferencia significativa;
d.2) examinar cuáles son las variedades con el menor diámetro y con el mayor diámetro.
A.6.- Los datos que aparecen en la tabla siguiente provienen de un experimento realizado en la
estación experimental de Rothamsted. El objetivo era medir la eficacia de tres insecticidas, el
clorodinitrobenceno (CN), el carbón disulfido (CD) y un preparado propio denominado cymag (CM).
Cada insecticida se aplicó a dosis normal (1) y doble (2). Por último se contó con un grupo control al
que no se aplicó ningún insecticida. Los pesticidas se aplicaron antes de la siembra del trigo, y los
datos recogidos muestran el incremento del número de gusanos encontrados en cada parcela después
de la recolección del trigo.
Insecticida
Control
466
421
561
433
Incremento en el número de gusanos
1CN
1CD
1CM
2CN
222
194
306
92
219
221
176
114
332
308
215
80
298
256
199
128
2CD
166
172
111
80
2CM
28
179
165
82
a) Completar la tabla siguiente resultado de efectuar un análisis de la varianza para comparar la
eficacia de los insecticidas:
Fuente de
variación
Tratamientos
Residual
Total
Grados de
libertad
Suma de
cuadrados
Cuadrados
medios
65407.79
F
453567.71
b) Para un nivel de significación α=0.05, ¿cuál sería la conclusión en cuanto a la eficacia media de los
insecticidas?
c) Efectuar comparaciones entre las medias de los insecticidas a dosis normal con el mismo insecticida
en dosis doble. ¿Qué conclusiones se obtienen?
A.7.- Un químico del departamento de desarrollo de un laboratorio farmacéutico desea
conocer cómo influye el tipo de aglutinante utilizado en tabletas de ampicilina de 500 mg. en el
porcentaje de friabilidad; para lo cual eligió tres tipos de aglutinantes realizando cinco pruebas con
cada uno de ellos. A continuación se muestra una parte de la tabla del análisis de la varianza obtenida
en el experimento:
Fuente de la Suma de
Grados de Cuadrados F
Variación
cuadrados libertad
medios
Tratamientos
Residual
0,398
Total
0,873
a) Completar la tabla del ANOVA.
b) Considerando un nivel de significación α = 0.05 ¿Se podría aceptar que el aglutinante no afecta al
porcentaje de friabilidad?
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
5
c) En el experimento se obtuvieron las siguientes medias por aglutinante: y1. = 0.235 , y2. = 0.638 ,
y3. = 0.293 . En caso de que se hayan detectado diferencias significativas entre las medias de los tres
aglutinantes, realizar los cálculos necesarios para comparar los distintos aglutinantes y averiguar
porqué se ha producido el rechazo de la igualdad de medias.
A.8. Se realizó un estudio de control de calidad en los cuatro hospitales de una zona
metropolitana. Se pidió a las enfermeras del departamento de urgencias que evaluasen en una escala de
0 a 20 la calidad de la atención que se da en sus instalaciones con respecto a una cuestión determinada.
A continuación se presentan los resultados obtenidos, varias medidas muestrales de resumen, y parte
de la tabla de análisis de la varianza. Únicamente el hospital H3 es del Servicio Público de Salud.
DATOS Y MEDIDAS DE RESUMEN
Valoraciones
H1
10
12
16
9
H2
18
15
14
17
13
H3
14
16
16
15
17
H4
9
8
10
11
6
Hospital
H1
H2
H3
H4
18
Fuente: Blair, R.C. & Taylor, R.A. (2008) Bioestadística. Pearson
TABLA ANOVA
Variabilidad
Entre hospitales
Residual
Total
Suma de
cuadrados
Grados de
libertad
Cuadrado
Medio
58,8167
4,4219
Valor
de F
media
11,75
15,4
16
desviación típica
3,0957
2,0736
1,4142
COMPARACIÓN POR PARES
Intervalos de confianza del 95% para µ i − µ j
Comparación
límite inferior
límite superior
1 con 3
-7,13
-1,37
2 con 3
3 con 4
4,50
9,90
a) Para el hospital H4, obtener la media y desviación típica muestrales, indicando su expresión
matemática. Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la
validez del análisis estadístico asociado a la tabla ANOVA?
b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, la valoración
del servicio es la misma en cualquiera de los cuatro hospitales, indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuáles son el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test.
c) Obtener el intervalo de confianza del 95% para la diferencia de medias µ2 − µ3 basado en el
método de la mínima diferencia significativa, indicando:
c.1) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados.
c.2) Cuál es la expresión matemática del intervalo de confianza.
c.3) Cuál es el intervalo de confianza obtenido.
c.4) Interpretar los tres intervalos de confianza de la tabla, en la que se compara el hospital público
(H3), con los hospitales privados (H1, H2 y H4). En base a ellos, ¿se puede considerar que el hospital
H3 es el que tiene una mejor valoración en términos medios?
d) Escribir la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA
identificando cada uno de sus términos.
Obtener el intervalo de confianza del 99% para la diferencia de medias µ1 − µ3 basado en el
método de la mínima diferencia significativa.
A.9.- Se ha estudiado el contenido en plata (tanto por ciento de plata) de monedas de Bizancio
de cuatro épocas diferentes. Se analizaron cinco monedas de cada una de las épocas, obteniéndose los
siguientes resultados:
Época I
Época II Época III Época IV
5,9
5,9
5,9
5,3
5,8
6,0
5,5
5,6
6,4
6,6
5,6
5,5
6,0
5,1
5,5
5,1
6,6
6,3
5,6
6,2
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
6
a) Para un nivel de significación α=0.10, ¿se podría admitir que no existen diferencias significativas
entre los contenidos medios de plata de las cuatro épocas? En caso contrario, realizar las
comparaciones por pares mediante el método de la mínima diferencia significativa (un nivel de
significación α=0.10).
b) Señalar cuáles son los supuestos teóricos necesarios para la correcta realización del apartado
anterior.
A.10.- Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión
arterial, comparándola con la de una dieta sin sal. Para ello, se seleccionan al azar 25 hipertensos y se
distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le suministra ningún tratamiento, al
segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el fármaco a una
dosis determinada y al quinto el mismo fármaco a otra dosis. Las presiones arteriales sistólicas de los
25 sujetos al finalizar los tratamientos son:
1
180
173
175
182
181
2
172
158
167
160
175
Grupo
3
163
170
158
162
170
4
158
146
160
171
155
5
147
152
143
155
160
a) Completar la tabla siguiente resultado de efectuar un análisis de la varianza para comparar la
eficacia de los tratamientos:
Fuente de
variación
Tratamientos
Residual
Total
Grados de
libertad
Suma de
cuadrados
Cuadrados
medios
F
44,72
2905,04
b) Para un nivel de significación α=0.05, ¿cuál sería la conclusión en cuanto a la eficacia media de los
tratamientos?
c) Efectuar comparaciones entre las medias de los tratamientos de los grupos 2, 3, 4 y 5 con respecto
al grupo de control (grupo 1). ¿Qué conclusiones se obtienen?
A.11.- En una fábrica de automóviles se desea analizar el rendimiento de tres marcas de
gasolina G1, G2 y G3. Para ello, se controlan los kilómetros recorridos por 18 motores de similares
características que se encuentran regulados para funcionar a una velocidad constante. De los 18
motores a 6 se les proporciona la gasolina G1, a otros 6 G2 y a los 6 restantes G3. A cada motor se le
suministra 40 litros de gasolina y funciona sin parar hasta quedar sin combustible. La tabla siguiente
es la tabla incompleta del análisis de la varianza realizado para comparar los kilómetros medios
recorridos por cada una de las tres marcas de gasolina:
Origen de la
variación
Tratamiento
Residual
Total
Grados de
libertad
Suma de
cuadrados
12636
Cuadrados
medios
F
24362
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
7
a) Escribir las hipótesis nula y alternativa y los supuestos teóricos necesarios para la resolución del
problema.
b) Completar la tabla anterior.
c) ¿Puede concluirse, a un nivel de significación α = 0.05, que los rendimientos medios de las tres
marcas de gasolina son iguales?
d) Si no se acepta la igualdad de los rendimientos y sabiendo que las medias de los kilómetros
recorridos por cada una de las tres marcas fueron: x1. = 533 Km. (para los 6 motores que emplearon
la marca G1), x 2. = 596 Km. (para la marca G2) y x 3. = 551 Km. (para G3). Analizar si alguna
marca pudo producir dicho rechazo.
A.12. Una muestra de 19 pacientes que fueron sometidos a cirugía de bypass cardíaco se asignaron al
azar a tres grupos, cada uno de los cuales recibió un tratamiento de ventilación mecánica distinto. Tras 24 horas
se determinó el nivel de folato de glóbulos rojos (ng/ml) para cada paciente. A continuación se presentan los
resultados obtenidos y un análisis preliminar incompleto.
Datos
T1 243 251 275 291 347 354 380
T2 206 210 226 249 255 273 285
T3 241 258 270 293 328
Fuente:Vidakovic B (2017), Engineering Biostatistics, an introduction using MATLAB and
WinBUGS
T1
T2
T3
Q1
263
218
258
Medidas de localización y de dispersión
Q2
Q3
Media
desviación típica
291
350,5
305,86
54,22
249
264
243,43
30,52
293
Tabla ANOVA
Variabilidad
Entre tratamientos
Residual
Total
Suma de
cuadrados
Grados de
libertad
16
Cuadrado
medio
6841,0827
1736,7857
COMPARACIÓN POR PARES: método i con método j
Valor Intervalos de confianza del 95% para la diferencia de medias
1 con 2
1 con 3
2 con 3
de F Límites
Inferior
─23,87
─86,30
Superior
79,59
17,16
a) Se pide:
a.1) Para el tratamiento T3, obtén las medidas de localización y de dispersión que faltan en la tabla
correspondiente. Para el tratamiento T1 interpreta los cuartiles. ¿Qué tipo de asimetría se aprecia en la
distribución muestral en base al gráfico de cajas para los tratamientos T1 y T2?
a.2) Completa la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis
estadístico asociado a la tabla ANOVA?
b) Para examinar si se puede considerar que en términos medios con los tres tratamientos el nivel de
folato de glóbulos rojos es el mismo, se pide:
b.1) Indica cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Indica cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Representa gráficamente el p-valor e indica cuál es el resultado del test.
c) Utilizando el método de la mínima diferencia significativa, obtén un intervalo de confianza del 95%
para la diferencia de medias del folato de glóbulos rojos con los tratamientos 1 y 2, indicando:
c.1) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados.
c.2) Cuál es la expresión matemática del intervalo de confianza.
c.3) Cuál es el intervalo de confianza obtenido. Interpreta el intervalo obtenido, así como los demás intervalos de
confianza de la tabla de “comparación por pares”.
d) Responde a las siguientes cuestiones adicionales:
d.1) Escribe la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada
uno de sus términos.
d.2) En el contraste del apartado b) para examinar si se puede considerar que en términos medios con los tres
tratamientos el nivel de folato de glóbulos rojos es el mismo, ¿cuáles son las regiones de aceptación y de rechazo
para un nivel de significación del 1%? ¿Cuál es el resultado del test para dicho nivel de significación?
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
8
A.13. En un estudio para comparar 6 dietas para engorde de cerdos se registraron los
siguientes aumentos de peso durante el período en que tuvo lugar el experimento (García (2004), cap.
7). El experimento se llevó a cabo con cerdos de similares características, que fueron criados
separadamente, y las dietas fueron asignadas a los animales al azar.
1
2
3
4
5
6
Dieta
Maíz
Maíz y trigo
Maíz y cebada
Mijo
Mijo y trigo
Mijo y cebada
11,3
13,8
15,4
8,0
12,6
13,2
11,8
12,7
15,2
10,6
8,8
13,0
11,9
12,2
17,2
11,3
10,2
12,3
13,7
10,5
13,9
10,6
12,6
11,4
García, R.M. (2004). Inferencia Estadística y diseño de experimentos.
Eudeba
13,3
10,9
13,9
Global
Media
12,175
12,500
15,425
10,280
11,050
12,760
12,3074
Desviación típica
1,05000
1,27083
1,35739
1,30652
1,87883
0,95026
1,99382
La tabla de análisis de la varianza es la siguiente.
Suma de
Grados de Cuadrado
Valor de
Variabilidad
cuadrados
libertad
medio
F
Dietas
67,03351852
13,40670370 7,75060641
Residual
21
Total
Ptos. críticos (tablas F)
10%
5%
1%
2,1423 2,6848 4,0421
a) Se pide:
a.1) Completar la tabla.
a.2) Indicar brevemente cuál es el modelo de análisis de la varianza que describe los datos.
b) ¿Existen diferencias significativas entre las dietas?
b.1) Formular el problema como un contraste de hipótesis e indicar cuál es el estadístico de contraste.
b.2) Interpretar el resultado del test correspondiente en la gráfica de la distribución que corresponda.
Considerar un nivel de significación del 1%
c) Determinar:
c.1) El valor del estadístico de contraste del test de la mínima diferencia significativa para contrastar
las hipótesis H 0 siguientes (frente a las hipótesis alternativas contrarias correspondientes).
H 0 : µi = µ j
H 0 : µ1 = µ3
yi  − y j 
-3,25
0,92999
Error típico
Estadístico de contraste
H 0 : µ 2 = µ3
H 0 : µ3 = µ 4
H 0 : µ3 = µ5
H 0 : µ3 = µ 6
5,145
0,88227
4,375
0,92999
2,665
0,88227
-2.925
0,88227
c.2) ¿Qué tests indican la existencia de diferencias significativas al 5% entre las medias comparadas?.
A.14. Para comparar cuatro variedades de maíz (A, B, C y D), se llevó a cabo el siguiente experimento.
Se seleccionaron 20 parcelas similares y se eligieron para el cultivo de cada variedad 5 de ellas al azar. La
asignación resultante así como las cosechas obtenidas (en kg/parcela) son las siguientes.
A
22.2
C
18.4
A
21.2
A
25.2
D
23.9
D
24.8
B
30.3
B
26.4
B
24.1
D
28.2
C
23.2
A
16.1
D
21.7
A
17.3
C
21.9
C
22.6
C
25.9
D
26.4
B
27.4
B
34.8
Media
Varianza
A
20.4
13.755
B
28.6
16.965
C
22.4
7.295
D
25.0
6.085
Media global 24.10
Varianza global 19.1895
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
9
La tabla de análisis de la varianza y los resultados de los tests de la mínima diferencia significativa para
contrastar las hipótesis nulas que se indican (frente a las hipótesis alternativas contrarias correspondientes), son:
H 0 : µi = µ j
H 0 : µ1 = µ 2 H 0 : µ1 = µ3 H 0 : µ1 = µ 4
Fuente
Suma de Grados de Cuadrado Valor
yi • − y j •
de variación cuadrados libertad
medio
de F
-8.2
-2
-4.6
Variedad
188.2
62.7333
5.69
Error típico
2.1
2.1
2.1
Error
Estadístico t
-3.9048
-0.9524
-2.1905
Total
p-valor
0.001261
0.355071
0.043645
a) Completar la tabla. ¿Qué diseño se utilizó para obtener la muestra?
b) ¿Se puede considerar que no existen diferencias significativas entre las cuatro variedades?
b.1) Formular el problema como un contraste de hipótesis.
b.2) ¿Cuál es el estadístico de contraste del test correspondiente?. Interpretar el resultado del test en la gráfica de
la distribución apropiada. Considerar un nivel de significación del 5%.
c) ¿Se puede considerar que la variedad A es peor que la B? ¿Y peor que la C? ¿Y peor que la D?
Indicar el valor del nivel de significación crítico de los tests correspondientes a cada una de las cuestiones
anteriores.
A.15. Se realizó un experimento para comparar cuatro productos químicos en fase de prueba para
combatir la roya en las plantaciones de trigo. (La roya es un hongo que parasita en su interior extrayéndole las
substancias alimenticias. Aparece en primavera como manchas amarilloanaranjadas en hojas y cañas).
Se consideró un diseño completamente aleatorizado en parcelas homogéneas de 50 m2. Las cosechas de
grano en kilogramos obtenidas en cada parcela, se muestran en la siguiente tabla.
Cosecha
Producto
X52
B29
Z15
PP5
19.00 23.60 21.90 24.20
21.00 21.80 24.90 22.30
Datos
23.00 18.80 23.40 25.80
20.00 23.90 18.90 26.90
17.00 22.25 22.80 22.30
Global
Media
20.00 22.07 22.38 24.30
22.1875
Varianza
5.000 4.122 4.977 4.255
6.3110
Saville, D.J. y Wood, G.R. (1997). Statistical methods: the geometric approach. Springer
La tabla de análisis de la varianza es la siguiente.
Fuente de
Suma de
Grados de
Cuadrado
Variación
cuadrados
Libertad
medio
Producto
15.4978
Error
4.5885
Total
19
Valor de
F
3.3775
Ptos. críticos (tablas F)
10%
5%
1%
2.4618 3.2389 5.2922
a) Completar la tabla. ¿Cómo se calcula el cuadrado medio residual a partir de las varianzas muestrales de los
tratamientos?.
b) ¿Existen diferencias significativas entre los productos químicos?
b.1) Formular el problema como un contraste de hipótesis.
b.2) Indicar el criterio de rechazo al nivel de significación del 5% del test correspondiente.
b.3) Interpretar el resultado del test en la gráfica de la distribución del estadístico de contraste.
c) Calcular un intervalo de confianza de un nivel de confianza del 95% para la diferencia de medias de las
cosechas correspondientes a los productos B29 y PP5 ( µ 2 − µ 4 ).
d) Indicar brevemente:
d.1) Cuál es el modelo de análisis de la varianza correspondiente al diseño experimental empleado.
d.2) Qué hipótesis sobre el error experimental dan validez al análisis estadístico realizado.
A.16. Se desea comparar el contenido de hierro de tres contenedores de ceniza de carbón en polvo. De
cada contenedor se extraen aleatoriamente cinco muestras para determinar su contenido de hierro en porcentaje.
Los resultados obtenidos y un análisis estadístico preliminar se presentan a continuación.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
10
DATOS Y MEDIDAS DE RESUMEN
A
B
C
TABLA ANOVA
1,81 1,8 1,79 1,83 1,82
1,84 1,8 1,83 1,79 1,82
1,76 1,79 1,74 1,73 1,78
A
B
C
media
1,810
1,816
1,760
desviación típica
0,01581
0,02074
0,02550
Suma de Grados de
Variabilidad
cuadrados libertad
Entre contenedores
2
Residual
12
Total
14
Cuadrado
medio
0,004727
0,000443
Valor
de F
COMPARACIÓN POR PARES
comparación
A con B
difer. media
límite inferior
límite superior
Fuente: Alfassi, Z.B. et al (2005). Statistical
treatment of analytical data. CRC Press
µ1 − µ2
A con C
µ1 − µ3
B con C
µ 2 − µ3
-0,035015
0,023015
a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del
análisis estadístico asociado a la tabla ANOVA?
b) Examinar si se puede considerar que el contenido medio de hierro es el mismo en los tres
contenedores, indicando:
a.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
a.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
a.3) Cuál es el resultado del test para un nivel de significación del 5%.
c) Obtener los intervalos de confianza del 95% para las diferencias de medias µi − µ j (basados en el
método de la mínima diferencia significativa) pendientes de calcular en la tabla de “comparación por pares”. En
base a dichos intervalos decidir, si es posible, cuáles son los contenedores de mayor y de menor contenido de
hierro.
A.17. Uno de los factores que determina el grado de riesgo que un pesticida plantea a la salud humana
es la tasa con la que lo absorbe la piel después del contacto. Una pregunta importante es si la cantidad en la piel
aumenta con la duración del contacto, o si sólo aumenta durante un tiempo corto antes de estabilizarse. Para
investigar esto último se aplicó una cantidad determinada fija de pesticida a 20 muestras similares de piel de rata.
Se analizaron cuatro muestras de piel en cada uno de los intervalos de duración del contacto: de 1, 2, 4 10 y 24
horas. Las cantidades de compuestos químicos (en µg) asociados al pesticida que estaban en la piel vienen dadas
en la tabla siguiente.
Duración (h)
1
2
4
10
24
1,7
1,8
1,9
2,3
2,1
cantidad
1,5
1,6
1,7
1,9
2,2
absorbida
1,2
1,8
2,1
1,7
2,5
1,5
1,9
2,0
1,5
2,3
Global
Media
1,475
1,775
1,925
1,85
2,275
1,86
Desviación típica
0,2062
0,1258
0,1708
0,3416
0,1708
0,3267
La tabla de análisis de la varianza es la siguiente.
Suma de
Grados de Cuadrado
Valor de
Ptos. críticos (tablas F)
Variabilidad
cuadrados
libertad
medio
5%
1%
0.1%
F
Entre duraciones
1,3280
0,3320
7,1143
3,06
4,89
8,25
Residual
Total
a) Se pide:
a.1) Indicar cuál es el modelo de análisis de la varianza que describe los datos.
a.2) Completar la tabla. ¿Cuál sería una estimación insesgada de la varianza del error experimental?
b) ¿Se puede considerar que la duración del contacto no influye sobre la cantidad absorbida?
b.1) Formular el problema como un contraste de hipótesis e indicar cuál es el estadístico de contraste.
b.2) Interpretar el resultado del test en la gráfica de la distribución que corresponda.
c) Determinar:
c.1) El valor del estadístico de contraste del test de la mínima diferencia significativa para contrastar las hipótesis
nulas siguientes (frente a las hipótesis alternativas contrarias correspondientes).
H 0 : µi = µ j
H 0 : µ1 = µ 2
H 0 : µ2 = µ4
H 0 : µ 4 = µ10
H 0 : µ10 = µ 24
H 0 : µ 4 = µ 24
yi • − y j •
Error típico
Estadístico de contraste
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
11
c.2) ¿Qué tests indican la existencia de diferencias significativas al 5% entre las medias comparadas?.
c.3) El intervalo de confianza del 95% para la diferencia de medias correspondientes a las duraciones de
4 h. y 24 h..
A.18. En un estudio sobre contaminación de las aguas fluviales se pretende contrastar si la
cantidad media de fosfatos varía en tres lugares diferentes en el curso de un río. Para ello se tomaron
diez observaciones independientes de una determinada cantidad de agua en cada uno de los tres
lugares y se determinó la cantidad de fosfatos en mg/l. Los resultados obtenidos son los siguientes.
Lugar:
Fosfatos
(mg/l)
L1
96
84 116
96
102 107
104
Media
107,9
Desviación típica
14,2005
Media de la muestra total: 112,0333
125
124
125
L2
L3
76
107 120
77
99
114
88
139 110
116
130
111
147
109
105
118,4
109,8
23,32952
14,5968
Desviación típica de la muestra total: 17,86633
123
140
134
112
125
Fuente: González Manteiga, M. T. y Pérez de Vargas Luque, A. (2009). Estadística aplicada. Una visión instrumental. Díaz de Santos
La tabla de análisis de la varianza es:
Fuente de
Variación
Lugar
Error experimental
Total
Suma de Grados de Cuadrado
cuadrados libertad
medio
626,0667
319,6630
Valor
de F
Punto crítico
del 5%
3,354
a) Completar la tabla.
b) ¿Se puede concluir que la concentración de fosfatos no es la misma en los tres lugares
examinados?
b.1) Formular el problema como un contraste de hipótesis.
b.2) Interpretar el resultado del test en la distribución de referencia en base al nivel de significación
del 5%.
b.3) Representar gráficamente el p-valor del test.
c) ¿Qué hipótesis sobre las muestras son necesarias para la validez del test anterior? Asumiendo
que son válidas, ¿cuál es el valor de la estimación insesgada de la varianza del error experimental?
A.19. Se desea comparar el desarrollo bacterial promedio con cuatro métodos diferentes de
almacenamiento de carne. Se seleccionaron 12 piezas del mismo tamaño (75 gr.) y características
similares y se asignaron al azar tres a cada método. Después de 9 días de almacenamiento a 4º C en la
misma instalación, se midió el número de bacterias sicotrópicas en cada una de las piezas de carne.
Estas bacterias se encuentran en la superficie de la carne y se asocian al deterioro de la carne. Como
variable respuesta final se consideró el logaritmo del número de bacterias por cm2.
Método de almacenamiento
A
B
C
D
7,66
5,26
3,51
7,41
6,98
5,44
2,91
7,33
7,80
5,80
3,66
7,04
Global
Media
7,48
5,50
3,36
7,26
5,90
Desviación típica
0,43863
0,27495
0,39686
0,19468
1,75291
Fuente: Kuehl, R. (2001). Diseño de experimentos. Principios estadísticos para el diseño y análisis de investigaciones. Thomson
A =envase de plástico con aire del ambiente., B = envasado al vacío, C = atmósfera 100% monóxido de carbono
(CO), D = atmósfera mezcla de gases: 1% de CO, 40% de O2 y 59% de N.
La tabla de análisis de la varianza correspondiente es la siguiente.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
12
Variabilidad
Entre grupos
Residual
Total
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
10,9576
0,1159
Valor de
F
Ptos. críticos (tablas F)
10%
5%
1%
2,9238 4,0662 7,5910
33,8
a) Se pide:
a.1) Indicar cuál es el modelo de análisis de la varianza que describe los datos.
a.2) Completar la tabla. ¿Cuál sería una estimación insesgada de la varianza del error experimental?
a.3) Calcular los residuos correspondientes al método B.
b) ¿Se puede considerar que el método de envasado no influye de forma significativa en el
desarrollo de las bacterias?
b.1) Formular el problema como un contraste de hipótesis e indicar cuál es el estadístico de contraste.
b.2) Interpretar el resultado del test en la gráfica de la distribución que corresponda. Considerar un
nivel de significación del 1%.
c) Determinar el intervalo de confianza del 95% para la diferencia de medias correspondientes
a cada par del cuadro siguiente:
µ1 − µ3
Diferencia
µ3 − µ 4
µ 2 − µ3
yi • − y j •
Error típico
Límite inferior
Límite superior
0,2780
A.20. Se llevó a cabo un experimento para investigar cómo afecta la densidad de aves por m2
en la producción de huevos de gallinas de cierta estirpe. Se eligieron tres mil gallinas similares que se
repartieron al azar en diez grupos de trescientas gallinas cada uno, los cuales se asignaron al azar a
corrales de dimensiones adecuadas para las densidades A, B, C y D (densidades crecientes de la A – la
más baja –, a la D –la más alta). Tras un período de adaptación, se midió el peso (g.) del huevo por
gallina en la semana número 21. A continuación se presentan el diseño y los datos obtenidos junto con
las medidas de resumen y la tabla ANOVA correspondientes.
D
45,5
A
45,89
A
46,59
D
47,10
B
46,44
B
48,78
C
46,24
C
45,66
D
47,71
A
49,48
Media
Desviación típica
A
47,32
1,9031
B
47,61
1,6546
Media global
Desviación típica global
46,9390
1,3389
C
45,95
0,4101
D
46,77
1,1414
Fuente: Collins, C. y Seeney, F. (1999). Statistical Experimental Design and interpretation. An introduction with agricultural examples. Wiley
Fuente
de variación
Densidad
Error
Total
Suma de
cuadrados
12,7548
Grados de
libertad
Cuadrado
medio
1,1260
2,1258
Valor
de F
a) Completar la tabla e indicar cómo se denomina el diseño empleado y cuál es el modelo de
análisis de la varianza asociado a la muestra. ¿Qué hipótesis sobre el error experimental se asumen en
el análisis estadístico asociado a la tabla ANOVA?
b) ¿Se puede considerar que no existen diferencias significativas entre las cuatro densidades?
b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste del test
correspondiente?
b.2) Representar gráficamente el nivel de signifcación crítico del test correspondiente.
b.3) ¿Cuál es el resultado del test con un nivel de significación del 5%?.
c) Contrastar la hipótesis de igualdad de varianzas de los pesos de los huevos que resultan de
considerar las densidades A y D, indicando:
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
13
c.1) cuál es el estadístico de contraste y su distribución;
c.2) cuál es la región de aceptación del test de un nivel de significación del 5% y cuál es el resultado
del test.
A.21. Se realizó un estudio para evaluar un método de detección de plaguicidas en los cultivos de
verduras. Se aplicó dieldrin (un pesticida de uso común) marcado con Carbono 14 (radiactivo) a rábanos en
crecimiento. Catorce días después se aplicó el proceso de extracción y análisis del contenido de dicho pesticida
en los rábanos. El plaguicida era la única fuente de Carbono 14, por lo que se consideró la proporción de
Carbono 14 en la pulpa de las verduras como indicador de la proporción del pesticida en ellas. En la tabla
siguiente se muestran los datos obtenidos al utilizar distintas concentraciones del solvente acetonitrilo en el
proceso de extracción.
Concetración de acetonitrilo:
baja
moderada
alta
Porcentaje de
23,37 25,13 23,78 27,74 20,39 20,87 20,78 20,19 18,87 19,69 19,29 18,10
Carbono 14 en la
25,30 25,21 22,12 20,96 20,01 20,23 20,73 19,53 18,42 19,33 17,26 18,09
pulpa de las verduras 23,11 22,57 24,59 23,70 18,87 18,17 23,34 22,45 18,69 18,82 18,72 18,75
Media
23,9650
20,4633
18,6692
Varianza
3,1728
1,9607
0,4222
La tabla de análisis de la varianza es:
Fuente de
Variación
Concentración del solvente
Error experimental
Total
Suma de Grados de Cuadrado
cuadrados libertad
medio
235,2187
33
35
Valor
de F
Punto crítico
del 5%
3,2849
1,8519
a) Completar la tabla.
b)¿Se puede concluir que la concentración de acetonitrilo que se utiliza en el proceso de extracción influye
en el porcentaje de Carbono 14 que se detecta en la pulpa de las verduras?
b.1) Formular el problema como un contraste de hipótesis.
b.2) Interpretar el resultado del test en la distribución de referencia en base al nivel de significación del 5%.
b.3) Representar gráficamente el p-valor del test.
Si procede, realizar comparaciones por pares utilizando el método de la mínima diferencia significativa.
c) ¿Qué hipótesis sobre las muestras son necesarias para la validez del test anterior? Asumiendo que son
válidas, ¿cuál es el valor de la estimación insesgada de la varianza del error experimental?
A.22. Se sabe que el dióxido de carbono tiene un efecto crítico en el crecimiento microbiológico.
Cantidades pequeñas de CO2 estimulan el crecimiento de muchos microorganismos, mientras que altas
concentraciones inhiben el crecimiento de la mayor parte de ellos. Esto último se utiliza comercialmente cuando
se almacenan productos alimenticios perecederos. En un estudio para investigar el efecto del CO2 sobre la tasa
de crecimiento de Pseudomonas fragi, un corruptor de alimentos, se administraron tres presiones atmosféricas
diferentes en seis cultivos con cada nivel de presión. Los datos obtenidos, el cambio porcentual en la masa
celular después de un tiempo de crecimiento de una hora, son los siguientes.
media desviación típica
45,5 41,1 38,3 40,2 38,5 29,8 38,9000
0,29
5,1657
29,5 22,8 19,2 20,6 29,2 24,1 24,2333
0,5
4,3131
24,9 17,2 22,6 17,8 22,1 10,5 19,1833
0,86
5,1790
En el análisis de la varianza se obtuvieron los siguientes resultados:
Variabilidad
Entre presiones
Residual
Total
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
629,3606
Valor
de F
15
1619,2628
a)¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado a la tabla ANOVA?
Completar la tabla.
b) Para examinar si se puede admitir que no existen diferencias en la respuesta media con las tres
presiones de CO2, se pide:
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
14
b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
b.2) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su valor. ¿Cuál es
el resultado del test?
c) ¿Existen diferencias significativas entre las medias de las dos presiones más altas?. ¿Y entre las
medias de la presión más baja y la presión más alta? Razonar la respuesta en base al método de la mínima
diferencia significativa considerando un nivel de significación del 5%.
A.23. Se investigó la pérdida de peso en porcentaje del peso inicial de la carne de res tipo milanesa, tras
cinco días desde la fecha de envasado. En el estudio se consideraron 20 muestras de carne similares y se
asignaron cinco de ellas, elegidas al azar, a cada uno de los cuatro tipos de envolturas. Los resultados obtenidos
fueron los siguientes:
media desviación típica
5,33 4,95 5,10 7,14 7,84 6,0720
1. Icopor
1,32483
6,95
7,90
4,48
7,32
6,41
2. Biopak
6,6120
1,30964
3. Cry-0-Vac 4,95 4,44 3,48 3,92 8,62 5,0820
2,05327
2,41 2,83 2,93 2,38 2,11 2,5320
4. Shopak
0,34032
total 5,0745
2,05612
Fuente: Melo Martínez, O.O. y otros (2007). Diseño de experimentos, métodos y aplicaciones. Universidad Nacional de Colombia
En el análisis de la varianza se obtuvieron los siguientes resultados:
Suma de Grados de Cuadrado
Variabilidad
cuadrados libertad
medio
Entre envolturas
49,1164
Residual
31,2083
Total
Valor
de F
a)¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado a la tabla ANOVA?
Completar la tabla.
b) Para examinar si se puede considerar que la envoltura no afecta a la pérdida media de peso, se pide:
b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
b.2) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su valor. ¿Cuál es
el resultado del test?
c) Obtener un intervalo de confianza del 95% para la diferencia en término medio de la pérdida de peso
de las envolturas Icopor y Biopak. A la vista del intervalo obtenido, ¿se puede concluir que existen diferencias
significativas entre ambas envolturas en base al método de la mínima diferencia significativa?
A.24. Se sabe que cierto compuesto químico tiene influencia sobre el crecimiento de una especie de
planta a lo largo del tiempo. Se utilizaron tres concentraciones del compuesto (1, 2 y 3) con objeto de comparar
su efecto sobre el crecimiento medio de la planta. Se utilizaron cuatro plantas de características análogas para
cada una de las tres concentraciones del compuesto y se obtuvieron los siguientes resultados de crecimiento en
cm. al cabo de un mes.
Concent.
crecimiento
medias
Tabla ANOVA
1
2
3
7,6
7,5
4,7
8,1
7,3
5,7
8,3
7,0
6,3
7,5
6,9
6,1
7,875
7,175
5,70
Fuente de
variación
Concentración
Error exper.
Total
Suma de
cuadrados
Grados de
libertad
Cuadrado
Medio
4,930833
Valor
de F
9
12,056667
a) Para examinar si se puede considerar que en términos medios las distintas concentraciones tienen el
mismo efecto sobre el crecimiento de la planta, se pide:
a.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
a.2) ¿Cuál es el resultado del test para un nivel de significación del 5%?
a.3) Completar la tabla ANOVA. ¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado
a ella?
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
15
b) Examinar cuál o cuáles son las concentraciones mejores (para el crecimiento de la planta) en base al
método de la mínima diferencia significativa. Razonar la respuesta a partir de los intervalos de confianza del
95% para las diferencias de medias de cada par, completando los cálculos que faltan.
µ1 − µ2
Diferencia
µ 2 − µ3
µ1 − µ3
1,3850424
2,9649576
Límite inferior
Límite superior
c) Contrastar si se puede admitir que la varianza del crecimiento de la planta es la misma con
concentración 1 que con la concentración 2. Considerar un nivel de significación del 5%.
A.25. Se desea determinar si la cantidad de carbón empleado en la fabricación de acero tiene algún
efecto en la resistencia a la tensión de este. Se investigaron cuatro porcentajes de carbón de interés: 0,2%; 0,3%;
0,4% y 0,5%. Para cada porcentaje de carbón se seleccionaron, en forma aleatoria del mismo lote, cinco
muestras de acero y se midieron las resistencias a la tensión (en kg por cm2), que se muestran a continuación.
Concentr.
0,2%
0,3%
0,4%
0,5%
resistencia
1240
1430
1480
1600
1350
1510
1460
1690
1390
1410
1530
1640
medias
1280
1530
1560
1710
1320
1460
1510
1630
total
Tabla ANOVA
1316
1468
1508
1654
1486,5
Fuente de
variación
Concentración
Error exper.
Total
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
96551,6667
16
328255
a) Para examinar si se puede considerar que en términos medios la resistencia es la misma con
cualquiera de las cuatro concentraciones, se pide:
a.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
a.2) ¿Cuál es el resultado del test para un nivel de significación del 5%?
a.3) Completar la tabla ANOVA. ¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado
a ella?
b) Examinar si existe una concentración óptima (que produce la máxima resistencia a la tensión) en
base al método de la mínima diferencia significativa. Razonar la respuesta a partir de los intervalos de confianza
del 95% para las diferencias de medias de cada par, completando los cálculos que faltan.
Diferencia
Límite inferior
Límite superior
µ0,2 − µ0,3
µ0,2 − µ0,4
µ0,2 − µ0,5
-217,85
-86,15
-257,85
-126,15
-403,85
-272,15
µ0,3 − µ0,4
µ0,3 − µ0,5
µ0,4 − µ0,5
-251,85
-120,15
A.26. Se realizó un estudio para examinar la pérdida de peso de probetas de resina a altas
temperaturas. Se seleccionaron 15 probetas de igual tamaño, 5 de cada uno de los tres tipos de resina
empleados. Tras exponer las probetas a una temperatura de 371 ºC durante 400 horas, se determinó la
pérdida de peso en tanto por ciento de cada una. Los resultados fueron los siguientes.
Resina
pérdida de peso
media
desviación típica
R1
R2
25,2 25,4 24,6 25,6 25,0 27,5 29,1 28,9 28,6 27,8
25,16
28,38
0,3847
0,6979
R3
28,4 28,9 28,2 27,8 27,3
28,12
0,6058
La tabla de análisis de la varianza para los datos anteriores es:
Fuente de
Variación
Resina
Error experimental
Total
Suma de Grados de Cuadrado
cuadrados libertad
medio
31,9960
Valor
de F
36,0040
Asumiendo que son tres muestras independientes de variables normales con la misma
varianza, se pide:
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
Valor
de F
16
a) Examinar si se puede admitir que la pérdida media de peso es la misma para las tres resinas.
a.1) Formular el problema como un contraste de hipótesis.
a.2) Interpretar el resultado del test en la distribución de referencia para un nivel de significación del
5%.
b) Comparar los diferentes pares de resinas mediante el método de la mínima diferencia
significativa a partir de intervalos de confianza del 95%. ¿Se puede concluir que alguna resina sea la
mejor (por conllevar una menor pérdida de peso)?
A.27 Cuando se inyecta un antibiótico en la sangre, una parte de él se une a la proteína sérica,
lo que reduce el efecto medicinal. Se midió la tasa (en porcentaje) de antibiótico que se unió a la
proteína sérica en un estudio realizado en 12 vacas similares con cierta enfermedad a las que se
administró uno de los tres tipos de antibióticos disponibles elegido al azar. Los datos obtenidos y un
análisis preliminar se muestran a continuación.
Media Desviación típica
A1
(Chloramphenicol)
A2
(Erythromycin)
A3
(Tetracycline)
Variabilidad
Entre antibióticos
Residual
Total
Suma de
cuadrados
29,2 32,8 25,0 24,2
27,8
3,99
21,6 17,4 18,3 19,0 19,075
1,8062
27,3 32,6 30,8 34,8 31,375
3,1711
Grados de Cuadrado Valor
libertad
medio
de F
160,1308
9,7461
Comparación por pares. Intervalos de confianza del 95%
Comparación:
A1 con A2
A1 con A3
A2 con A3
µi − µ j
µ1 − µ3
µ 2 − µ3
µ1 − µ2
yi • − y j •
lím. inferior
lím. superior
8,725
3,7313
13,7187
-3,5750
-8,5687
1,4187
a) Para examinar si se puede considerar que en términos medios la tasa de antibiótico que se
une a la proteína sérica es la misma con los tres antibióticos, se pide:
a.1) Completar la tabla ANOVA.
a.2) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la
distribución de referencia del test correspondiente?
a.3) Representar en la gráfica de la distribución adecuada el nivel de significación crítico. ¿Cuál es el
resultado del test?
a.4) Indicar qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior.
b) Obtener, mediante el método de la mínima diferencia significativa, el intervalo de
confianza del 95% para la diferencia de medias µ2 − µ3 que completa la tabla de comparación por
pares, indicando:
b.1) Cuál es el estadístico pivote y su distribución, qué valores se utilizan de dicha distribución, y cuál
es la expresión matemática del intervalo.
b.2) En base a los tres intervalos de confianza, ¿con qué antibiótico será menor en términos medios el
porcentaje del mismo que se une a la proteína sérica?
A.28. Se desea comparar la eficacia de tres fertilizantes químicos para el maíz. A tal fin se
consideraron 15 plantas similares cultivadas en idénticas condiciones de temperatura, humedad, suelo,
etc. Las plantas se asignaron al azar a tres grupos, y se aplicó un fertilizante en cada grupo (la misma
cantidad a todas las plantas). El crecimiento de las plantas de maíz al cabo de un mes se recoge en la
tabla que sigue a continuación.
Fertilizante
1
2
3
crecimiento
23
16
18
21
23
22
al cabo
24
20
25
de un mes
17
21
21
19
18
20
Global
Media
20,8
19,6
21,2
20,5333333
Desviación típica
2,86356421
2,70185122
2,58843582
2,39017597
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
17
La tabla de análisis de la varianza correspondiente es la siguiente.
Variabilidad
Entre grupos
Residual
Total
Suma de
Grados de
cuadrados
libertad
6,93333333
2
88,8
Cuadrado
medio
3,46666667
Valor de
F
Ptos. críticos (tablas F)
10%
5%
1%
2,8067 3,8853 6,9266
a) Se pide:
a.1) Indicar cuál es el modelo de análisis de la varianza que describe los datos.
a.2) Completar la tabla. ¿Cuál sería una estimación insesgada de la varianza del error experimental?
b) ¿Se puede considerar que el fertilizante no influye de forma significativa sobre el
crecimiento del maíz?
b.1) Formular el problema como un contraste de hipótesis e indicar cuál es el estadístico de contraste.
b.2) Interpretar el resultado del test en la gráfica de la distribución que corresponda. Considerar un
nivel de significación del 1%.
Realizar, si procede, las comparaciones de medias por pares mediante el método de la mínima
diferencia significativa.
A.29. Se realizó un experimento con cinco variedades de maíz con un diseño completamente
aleatorizado en el cual se midió la cosecha de grano por planta en gms. Los datos obtenidos y la tabla
ANOVA que se deriva de ellos siguen a continuación.
Variedad: V1
V2
cosecha (g.) 62
62
60
de grano
57
58
59
por planta 60
61
57
Media
60
desv.
2,0976
Típica
Media global: 58,95
62
61
60
60
61
61
60,1111
1,4530
V3
60
57
58
59
53
56
57
60
55
57,2222
2,3333
V4
56
57
58
62
61
60
58
60
59
2,0702
V5
61
57
58
62
55
59
57
61
58,75
2,4349
Desviación típica global: 2,2640
Fuente: Agarwal, B.L. y Agarwal, S.P. (2007). Statistical Analysis of Quantitative Genetics. New Age International Publishers
Fuente de
variación
Variedad
Error experimental
Total
Suma de Grados de Cuadrado
Cuadrado
libertad
medio
s
45,9556
Valor
de F
Punto crítico del
5%
10%
2,6415
2,1128
199,90
a) Completar la tabla e indicar cuál es el modelo de análisis de la varianza asociado a la
muestra. ¿Qué hipótesis sobre el error experimental se asumen en el análisis estadístico asociado a la
tabla ANOVA?
b) ¿Se puede considerar que no existen diferencias significativas entre las cosechas medias de
las cinco variedades?
b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste del test
correspondiente?.
b.2) ¿Cuál es el resultado del test con un nivel de significación del 5%?. ¿Y al nivel de significación
del 10%?
b.3) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su
valor.
Realizar, si procede, las comparaciones de medias por pares mediante el método de la mínima
diferencia significativa.
c) Contrastar la hipótesis de igualdad de varianzas de las cosechas de grano por planta de las
variedades V1 y V4, indicando:
c.1) cuál es el estadístico de contraste y su distribución;
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
18
c.2) cuál es la región de aceptación del test de un nivel de significación del 5% y cuál es el resultado
del test.
A.30. En un estudio comparativo de tres variedades de patata, se midió el número por cada
mm2 de pelos glandulares repelentes de insectos en 10 plantas de cada variedad. Los datos resultantes
fueron los siguientes.
Variedad
A
B
C
3,7
4,9
6,4
4,8
9,4
15,2
1,6
2,9
10,5
nº/ mm2
3,1
5,1
5,4
3,8
11,2 8,4
5,2
6,1
6,5
7,5
5,9
7,4
6,5
5,4
14,6
6,7
6,8
7,8
6,9
5,9
11,1
Fuente: Van Emden (2008). Statistics for terrified biologists. Blackwell Publishing
La tabla de análisis de la varianza es:
Fuente
de variación
Variedad
Error
Total
Suma de
cuadrados
Grados de
libertad
149,6030
Cuadrado
medio
Valor
de F
Punto crítico
1%
10%
5,4881 2,5106
5,54085
29
a) Completa la tabla e indicar cuál es la ecuación del modelo de análisis de la varianza
asociado a la muestra. ¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado
a la tabla ANOVA?
b) ¿Se puede considerar que no existen diferencias significativas entre las tres variedades?
b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste del test
correspondiente?.
b.2) Representar gráficamente el nivel de significación crítico del test.
b.3) ¿Cuál es el resultado del test con un nivel de significación del 1%?. ¿Y con un nivel de
significación del 10%?
c) Contrastar la hipótesis de igualdad de varianzas del número (por cada mm2) de pelos
glandulares repelentes de insectos en las variedades A y B, indicando:
c.1) cuáles son las hipótesis a contrastar;
c.2) cuál es el estadístico de contraste y su distribución;
c.3) cuál es la región de aceptación del test de un nivel de significación del 5% y cuál es el resultado
del test.
A.31. En un estudio para comprobar el efecto que tienen las concentraciones de cobre en el
agua sobre el tiempo de vida de los animales acuáticos se seleccionaron unos micro crustáceos
denominados Daphnia magna (conocido como pulga de agua dulce) dado que estos animales tienen un
corto período de vida. Se disponía de 15 daphnia para el estudio y de 3 contenedores, con las
siguientes concentraciones de cobre: sin cobre, 20 µg/l, y 40 µg/l. Los tratamientos (niveles de cobre)
se asignaron al azar a las unidades experimentales (los daphnia) con la única restricción de que a cada
contenedor se le asignaba el mismo número de daphnias. Desafortunadamente un daphnia que había
sido asignado al contenedor sin cobre murió antes de ser introducido en el contenedor por un descuido
del investigador, por lo que sólo se dispone de cuatro observaciones del primer tratamiento. Los
resultados del experimento (Weber y Skilling (2000, Cap. 7)) y la tabla ANOVA asociada se muestran
a continuación.
Tiempos de vida en días para distintas concentraciones de cobre
Sin cobre
60
90
74
82
20 µg/l
58
74
50
65
68
40 µg/l
40
58
25
30
42
Tabla de análisis de la varianza
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
19
Fuente de
variación
Tratamiento
Error experim.
Total
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
Valor de
F
1%
5%
10%
1483.0000
4780.8571
Puntos críticos
F
Dunnett
7.21
3.45
3.98
2.53
2.86
a) Completar la tabla anterior e identificar qué entrada se corresponde con cada uno de los términos de
la siguiente expresión de la descomposición de la varianza:
p
2
••
i
i•
=i 1 =i 1
2
(n − 1) S=
p
∑ n (Y
− Y ) + ∑ (ni − 1) Si2 .
b) Indicar:
b.1) Cuál es el modelo de análisis de la varianza que describe cómo se generan los datos.
b.2) ¿Qué hipótesis dan validez al F test que se deriva del análisis de la varianza?
c) ¿Existen diferencias significativas entre los tratamientos con un nivel de significación α = 0.05 ?
d) Resolver el mismo problema que en el apartado anterior en base al nivel crítico del contraste.
e) Comparar los tiempos medios de vida de las dos concentraciones de cobre con el tiempo medio de
vida "sin cobre", utilizando el método de la mínima diferencia significativa.
A.32. Un granjero, tras cruzar cuatro linajes de gallinas, A, B, C y D, quiere comparar los
huevos de los cuatro cruces siguientes: AB, AC, BC y BD. Los pesos de los huevos en gramos
obtenidos en cuatro muestras, son los que se muestran a continuación (Kaps y Lamberson (2004))
Cruce
AB
AC
BC
BD
58
59
56
59
51
62
57
55
56
64
56
50
52
60
55
64
54
62
57
58
60
57
53
57
53
Kaps, M. y Lamberson, W. (2004). Biostatistics for Animal Science.
CABI Publishing
Media
Desviación típica
55.75
3.15096357
61.40
1.94935887
56.00
0.81649658
56 55
55.90
3.81371793
Global 56.8888889
3.63035634
La tabla de análisis de la varianza es la siguiente.
Fuente de
variación
Cruce
Error
Total
Suma de
cuadrados
Grados de
libertad
23
Cuadrado
Valor de
medio
F
41.68888889 4.40645425
9.46086957
Ptos. críticos (tablas F)
10%
5%
1%
2.3387 3.0280 4.7648
a) Completar la tabla.
b) ¿Existen diferencias significativas entre los cruces?
b.1) Formular el problema como un contraste de hipótesis.
b.2) Indicar el criterio de rechazo, al nivel de significación del 5%, del test correspondiente.
b.3) Interpretar el resultado del test en la gráfica de la distribución del estadístico de contraste.
c) Calcular un intervalo de confianza de un nivel de confianza del 95% para la diferencia media de
peso entre los huevos del cruce AB y el cruce BD ( µ1 − µ 4 ).
d) Indicar brevemente cuál es el modelo de análisis de la varianza que describe cómo se generan los
datos. ¿Qué hipótesis sobre las muestras dan validez al análisis estadístico realizado?
A.33. Se realizó un estudio sobre tratamiento de aguas de desecho para comparar tres métodos
de tratamiento para la extracción de carbono orgánico. Se utilizó un diseño completamente
aleatorizado y los siguientes métodos de tratamiento: flotación de aire, separación con espuma y
coagulación con cloruro férrico. Las mediciones de carbono orgánico de los tres tratamientos llevaron
a los siguientes datos.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
20
Mediciones de carbono orgánico
Método
Datos
Flotación
34.6 36.1 37.2
35.1 36.5 37.4
35.3 36.8 37.7
35.8
Separación
38.8 41.0 46.9
39.0 43.2 51.6
40.1 44.9 53.6
40.9
Coagulación
26.7 27.5 28.1
27.0 28.1 30.7
27.1 28.7 31.2
26.7
Global
36.25
1.04695
44
5.22430
28.18
1.60402
36.1433
7.26397
Media
desviación típica
La tabla ANOVA es la siguiente.
Fuente de
Variación
Tratamientos
Error
Total
Suma de
cuadrados
1251.533
Grados de
libertad
1530.194
29
Cuadrado
medio
625.766
Valor de
F
Puntos críticos distrib. F
10%
1%
2.51
5.49
a) ¿Cuál es el modelo de análisis de la varianza (y sus hipótesis) que corresponde al diseño
experimental anterior?
b) ¿Existen diferencias significativas entre los métodos con un nivel de significación α = 0.01 ?
c) Acotar el nivel de significación crítico del contraste del apartado anterior. ¿Se puede concluir que
existen diferencias significativas entre los tratamientos en base al nivel de significación crítico?
d) Calcular un intervalo de confianza con un nivel de confianza del 95% para la diferencia de medias
de las mediciones de carbono orgánico de los métodos "separación con espuma" y "coagulación con
cloruro férrico", µ 2 − µ3 .
A.34. Una empresa desea estudiar la productividad media por hora en el montaje de un
mecanismo electrónico en las tres fábricas que tiene, A, B y C. Para ello se midió el número de
unidades que se montaron por hora en varios días seleccionados al azar en cada empresa, resultando
los siguientes datos.
Número de unidades por hora
Fábrica
4.5
4.3
4.3
4.9
3.8
4.6
4.2
Datos
Media
Varianza
A
4.4
4.7
4.8
3.8
4.3
4.9
4.2
4.7
4.5
4.43
0.1143
4.8
4.4
4.4
4.5
4.9
4.7
4.6
B
5.1
4.9
5.2
4.7
3.8
5.1
3.6
4.56
0.1794
4.6
4.6
4.2
4.1
4.2
4.8
C
3.7
4.2
4.3
4.2
4.5
4.1
4.2
4.1
4.6
4.6
4.3
4.0
4.0
3.9
4.25
0.0732
4.3
4.6
4.7
4.2
Global
4.419
0.1374
La tabla ANOVA es la siguiente.
Fuente
De
Variación
Tratamientos
Error
Total
Suma
de
cuadrados
0.9141
Grados
de
libertad
7.2814
53
Cuadrado
medio
0.4570
Valor de
F
Puntos críticos
(tablas de la F )
5%
1%
3.1788
5.0472
a) Completar la tabla.
b) ¿Existen diferencias significativas entre los tratamientos con un nivel de significación α = 0.05 ? ¿Y
con α = 0.01 ?
c) Acotar el nivel de significación crítico del contraste del apartado anterior. ¿Se puede concluir que
existen diferencias significativas entre los tratamientos en base al nivel de significación crítico?
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
21
d) Calcular un intervalo de confianza con un nivel de confianza del 95% para la diferencia de medias
de productividad entre cada par de empresas, µi − µ j .
A.35. Tres granjeros utilizan métodos diferentes para engordar a sus cerdos hasta que alcanzan
el peso óptimo para beicon. Para llevar a cabo una comparación de sus métodos, se seleccionaron
cerdos similares y se contabilizaron el número de días de ceba desde que el cerdo deja de mamar hasta
que alcanza el peso óptimo para beicon. Los datos obtenidos son los siguientes.
A
B
C
105
104
107
101
100
115
112
107
108
103
107
98
99
104
105
113
110
97
112
108
103
105
Media
Varianza
A
104
29,6
B
106
12
C
106,375
36,55357143
Media global 105,59090909
Varianza global 24,25324675
Fuente: Mead, R.; Curnow, R.N. y Hasted, A.M. (1998). Statistical methods in agriculture and experimental biology. Chapman & Hall
La tabla de análisis de la varianza y los resultados de los tests de la mínima diferencia
significativa para contrastar las hipótesis nulas que se indican (frente a las hipótesis alternativas
contrarias correspondientes), son:
Punto
Fuente de Suma de Grados de Cuadrado Valor
Variación cuadrados libertad
Medio
de F crítico 10%
Método
21,4432
10,7216
2,6056
Error
25,6776
Total
H 0 : µi = µ j
yi • − y j •
Error típico
Estadístico t
H 0 : µ1 = µ 2
H 0 : µ1 = µ3
H 0 : µ 2 = µ3
-2,0000
2,7367
-2,3750
2,7367
-0,3750
2,5337
a) Se pide:
a.1) Completar la tabla.
a.2) ¿Qué diseño se utilizó para obtener la muestra?
b) ¿Se puede considerar que no existen diferencias significativas entre los tres métodos?
b.1) Formular el problema como un contraste de hipótesis.
b.2) ¿Cuál es el estadístico de contraste del test correspondiente?. Interpretar el resultado del test en la
gráfica de la distribución apropiada. Considerar un nivel de significación del 5%.
c) Obtener un intervalo de confianza del 95% para cada una de las diferencias de medias
poblacionales posibles.
A.36. En un estudio para comparar cuatro variedades de melón, se cultivó cada una de las variedades
en seis parcelas. Todas las parcelas eran similares. Las variedades se asignaron a las parcelas al azar,
obteniéndose los datos y la tabla ANOVA que siguen a continuación.
Cosecha
Variedad
A
B
C
D
25.12 40.25 18.30 28.55
17.25 35.25 22.60 28.05
26.42 31.98 25.90 33.20
Datos
16.08 36.52 15.05 31.68
22.15 43.32 11.42 30.32
15.92 37.10 23.68 27.58
Global
Media
20.49 37.40 19.49 29.90
26.82
Varianza
22.04 15.61 30.91
4.97
Fuente: Mead, R.; Curnow, R.N. y Hasted, A.M. (1998). Statistical Methods
in agriculture and experimental biology. Chapman & Hall
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
22
Tabla ANOVA
Fuente de
Variación
Variedades
Error
Total
Suma de
cuadrados
1291.477
Grados de
libertad
Cuadrado
medio
430.492
Valor de
F
Puntos críticos (tablas de la F )
5%
1%
3.0984
4.9382
1659.130
a) Completar la tabla indicando las relaciones entre las diferentes cantidades de la misma.
b) ¿Existen diferencias significativas entre las variedades de melón con un nivel de significación α = 0.05 ?. ¿Y
con α = 0.01 ?. ¿Cuál es la conclusión en base al nivel de significación crítico?.
c) Calcular un intervalo de confianza de un nivel de confianza del 95% para la diferencia de medias de las
cosechas entre las variedades A y D ( µ1 − µ 4 ).
A.37. En una fábrica de galletas se desea saber si las harinas de sus cuatro proveedores producen la
misma viscosidad en la masa. Para ello, produce durante un día 20 masas, 5 de cada tipo de harina y mide su
viscosidad. Los resultados obtenidos se muestran en la siguiente tabla, junto con varias medidas de resumen, los
gráficos de cajas asociados y parte de la tabla de análisis de la varianza.
DATOS Y MEDIDAS DE RESUMEN
viscosidad de la masa
A
B
C
D
97
97
99
96
91
91
96
92
96
95
97
95
95
96
100
98
92
93
98
94
media
94,2
94,4
98
95
Q1
92
93
97
94
Q2
95
95
98
95
Q3
96
96
99
96
Fuente: Garcia Leal, J. y otros (2007). Técnicas estadísticas aplicadas a la Biología..
Proyecto Sur Ediciones
TABLA ANOVA
Suma de Grados de Cuadrado Valor
Variabilidad
cuadrados libertad
medio
de F
Entre proveedores
15,6
Residual
16
Total
126,8
a) Para la muestra del proveedor 1:
a.1) Explicar cómo se obtiene la caja correspondiente.
a.2) ¿Cuáles son los valores de las medidas de tendencia central y de dispersión que se reflejan en la caja?
b) Para examinar si se puede considerar que en términos medios la viscosidad de la masa es la misma
con la harina de los cuatro proveedores, se pide:
b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
b.2) Representar en la gráfica de la distribución adecuada la región crítica del test de un nivel de significación
del 10%. ¿Cuál es el resultado del test?
b.3) Qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior.
c) Comparar mediante el método de la mínima diferencia significativa la viscosidad de la masa con las
harinas de los proveedores 3 y 4. ¿Cuál es el resultado del test con un nivel de significación del 10%? ¿Y con un
nivel de significación del 5%?
A.38 Se llevó a cabo una evaluación metalúrgica de la resistencia de materiales fabricados con cuatro
aleaciones de acero diferentes, A, B, C y D. Se fabricaron cinco barras del mismo tamaño y forma con cada una
de las aleaciones y se sometieron a una fuerte tensión hasta alcanzar una deformación permanente. Los datos que
siguen a continuación representan los máximos niveles de tensión (psi) logrados con cada barra y un análisis
estadístico preliminar.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
23
TABLA ANOVA
DATOS Y MEDIDAS DE RESUMEN
A
B
C
D
13,55
13,44
16,43
17,13
A
B
C
D
Total
14,24
13,75
15,88
17,77
11,97
12,88
16,93
16,55
media
13,108
13,302
16,384
17,142
14,984
12,56
14,11
17,33
16,23
13,22
12,33
15,35
18,03
desviación típica
Fuente
Aleaciones
Error exper.
Total
Suma de Grados de
Cuadrado
cuadrados libertad
medio
64,827320
21,609106,67
9,963760
0,622735
74,791080
Valor
de F
COMPARACIÓN POR PARES
Comparación:
µi − µ j
A con B
µ1 − µ2
B con C
µ 2 − µ3
C con D
µ3 − µ 4
yi • − y j •
Fuente: Probability and Statistics for modern
Engineering. PWS-Kent
Límite inferior
Límite superior
Asumiendo que los datos son cuatro muestras independientes de variables normales con la misma
varianza, se pide:
a) Examinar si se puede considerar que en términos medios la resistencia de una barra es la misma para
cualquiera de las cuatro aleaciones de acero, indicando:
a.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
a.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
a.3) Cuál es el resultado del test para un nivel de significación del 5%. Interpretarlo en la gráfica de la
distribución de referencia.
b) Si procede, comparar los pares de medias señalados en la tabla de “comparación por pares”. Obtener
para ello, mediante el método de la mínima diferencia significativa, los intervalos de confianza del 95%
correspondientes a cada diferencia de medias e interpretarlos.
A.39 Se quiere averiguar si el porcentaje medio de proteínas en la leche se ve afectado por el tipo de
pienso, se seleccionaron 15 vacas similares las cuales fueron asignadas al azar a tres grupos, cada uno de cinco
vacas. En los dos primeros grupos, se incluyó en la dieta un pienso elaborado con productos transgénicos: en un
grupo se usó pienso elaborado con soja A5403, y en el otro pienso elaborado con maíz T25. En el tercer grupo
se incluyó un pienso convencional. Los resultados obtenidos fueron los siguientes.
pienso:
soja A5403
maíz T25
tradicional
porcentaje
82,1 82,3 86,5 83,2 90,3 86,5
de proteínas 84,6 84,1 83,2 83,3 91,5 90,2
en la leche
83,1
84,2
89,3
media
83,24
84,08
89,56
varianza
1,198
2,007
3,538
Media global: 85,6267
Varianza global: 10,3407
Fuente: García Alonso, A. (2008). Ejercicios de estadística aplicada. UNED
Fuente de
Variación
Pienso
Error experimental
Total
Suma de
Grados de Cuadrado
cuadrados
libertad
Medio
117,7973
26,9720
144,76933
Valor
de F
H 0 : µi = µ j
H 0 : µ1 = µ3
H 0 : µ 2 = µ3
yi • − y j •
Error típico
t
a) Completar la tabla e indicar cuál es el modelo de análisis de la varianza asociado a la muestra. ¿Qué
hipótesis sobre las muestras se asumen en el análisis estadístico asociado a la tabla ANOVA?
b) ¿Se puede considerar que en términos medios el pienso no influye en el porcentaje de proteína de la
leche de las vacas?
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
24
b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste del test
correspondiente?.
b.2) ¿Cuál es el resultado del test con un nivel de significación del 5%?
b.3) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su valor.
c) Comparar mediante el método de la mínima diferencia significativa cada una de las dietas con
piensos transgénicos con la dieta de pienso convencional. Considerar un nivel de significación del 5%.
A.40 Se llevó a cabo un estudio en un grupo determinado de población (sujetos del mismo sexo, de la
misma edad, semejante peso inicial y antecedentes hereditarios similares) para comparar cuatro medicamentos
antihiperlipidémicos diferentes. Los sujetos con hiperlipidemia presentan bajos niveles de HDL-C. En el grupo
poblacional indicado, se seleccionó una muestra aleatoria de 64 sujetos con hiperlipidemia los cuales fueron
asignados al azar a cuatro tratamientos con los medicamentos A, B, C y D. Después de seis meses con dichos
tratamientos, se tomaron las muestras de sangre correspondientes y se midieron los niveles de HDL-C. Los
resultados obtenidos y un análisis preliminar son los siguientes.
DATOS Y MEDIDAS DE RESUMEN
A
B
C
D
21
26
28
33,7
37,6
41,6
37,5
41,4
20
26
29,5
32,1
39,7
39
39,8
39
A
B
C
D
22,8
24,3
30,6
32,1
37,8
43,9
37,7
43,8
23,9
24,2
31,7
33,2
41,9
43
41,4
43
media
24,2250
32,0313
39,8250
39,7750
23,4
25,8
30,9
31,4
39,5
39,6
39,2
39,4
TABLA ANOVA
24
24,1
31,4
34
35
36,7
35
36,6
23,5
26,3
32,6
34,1
40,5
40,7
40,8
40,8
25,4
26,9
32,1
35,1
38,2
42,5
38,3
42,7
Suma de Grados de
Fuente
cuadrados libertad
Medicamento 2667,2430
Error exper.
278,5044
Total
2945,7473
Cuadrado
medio
889,0810
4,6417
Valor
de F
Punto crítico
del 5%
2,7581
COMPARACIÓN POR PARES
desviación típica
1,8849
1,8066
2,4236
2,4242
Comparación:
diferencia media
yi  − y j 
Error típico
Límite inferior
Límite superior
A con B
µ1 − µ2
B con C
µ 2 − µ3
C con D
µ3 − µ 4
0,7617
Fuente: Díaz Narváez, V. P. (2009). Metodología de la investigación científica y bioestadística
para profesionales y estudiantes de ciencias de la salud. Universidad Finis Terrae
Asumiendo que los datos son cuatro muestras independientes de variables normales con la misma
varianza, se pide:
a) Examinar si se puede considerar que en términos medios los niveles de HDL-C son iguales con los
cuatro medicamentos, indicando:
a.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
a.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
a.3) Cuál es el resultado del test para un nivel de significación del 5%. Interpretarlo en la gráfica de la
distribución de referencia.
b) Si procede, comparar los niveles medios de HDL-C señalados en la tabla de “comparación por pares”
en base a los intervalos de confianza del 95% obtenidos mediante el método de la mínima diferencia
significativa.
A.41 Se desea comparar la capacidad de cuatro laboratorios (A, B, C y D) para determinar la pureza en
muestras de 1-bromopropano. Se tomaron 20 muestras homogéneas que fueron asignadas al azar a los
laboratorios para su análisis. A continuación se presentan los resultados, varias medidas muestrales de resumen,
y parte de la tabla de análisis de la varianza.
Pureza 1-bromopropano
A 73 75 73 75 73
B 74 74 75 74 74
C 68 69 69 70 69
D 71 72 72 71 73
media desviación típica
A
73,8
1,095445
B
74,2
0,447214
C
69
0,707107
D
71,8
0,83666
TABLA ANOVA
Fuente de
variación
Laboratorio
Error experimental
Total
Suma de Grados de
cuadrados libertad
Cuadrado
medio
28,2667
0,6500
Valor
de F
COMPARACIÓN POR PARES. Intervalos de confianza del 95%
Comparación
A con B A con C A con D B con C B con D C con D
límite inferior
3,72
0,92
4,12
1,32
-3,88
límite superior
5,88
3,08
6,28
3,48
-1,72
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
25
a) Completar la tabla. ¿Qué requisitos deben de verificar las muestras para la validez del análisis
estadístico asociado a la tabla ANOVA?
b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, la determinación de la
pureza es la misma en cualquiera de los cuatro laboratorios, indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test.
c) Obtener el intervalo de confianza del 95% para la comparación A con B basada en el método de la
mínima diferencia significativa. Explicar el cálculo de dicho intervalo indicando:
c.1) Cuáles son el estadístico y la distribución de referencia y los puntos críticos utilizados.
c.2) Cuál es la expresión matemática del intervalo de confianza.
c.3) Cuál es el intervalo de confianza obtenido para la diferencia de medias µ A − µ B . ¿Qué conclusiones se
pueden extraer de cada uno de los seis intervalos de confianza de la tabla de “comparación por pares”?
d) Escribir la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando
cada uno de sus términos.
Cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1% en el test del
apartado b). ¿Cuál es el resultado del test para dicho nivel de significación?.
A.42 Para comparar los métodos que siguen tres laboratorios (A, B y C) para la determinación del
lasalócido de sodio en un producto alimenticio para aves de corral, se proporcionaron muestras homogéneas de
dicho alimento a los laboratorios. El laboratorio A es el laboratorio de referencia en la actualidad por lo que
realizó nueve determinaciones independientes del lasalócido de sodio, mientras que los otros dos realizaron cada
uno cinco determinaciones independientes. A continuación se presentan los resultados de cada laboratorio, varias
medidas muestrales de resumen, y parte de la tabla de análisis de la varianza.
DATOS Y MEDIDAS DE RESUMEN
Lasalócido
de sodio
A
B
C
Lasalócido
de sodio
A
B
C
87
86
88
85
84
84
89
84
media
85,56
87
83,8
85
88
85
83
87
86
87
86
83
86
81
desviación típica
1,666667
1,581139
1,923538
TABLA ANOVA
Fuente de
Suma de Grados de
variación
cuadrados libertad
Laboratorio
Error experim.
Total
Cuadrado
medio
12,8573
2,9389
Valor
de F
COMPARACIÓN POR PARES. Intervalos de confianza
del 90%
Comparación
A con B
A con C
B con C
límite inferior
1,3071
límite superior
5,0929
a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del
análisis estadístico asociado a la tabla ANOVA? Escribir la expresión del modelo de análisis de la varianza
identificando cada uno de sus términos.
b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, la determinación del
lasalócido de sodio es la misma en cualquiera de los tres laboratorios, indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test.
c) Obtener los intervalos de confianza del 90% para las diferencias de medias µ A − µ B y µ A − µC
basados en el método de la mínima diferencia significativa. ¿A qué conclusiones se llega en base a los tres
intervalos de confianza de la tabla de “comparación por pares”? Contestad indicando además:
c.1) Cuáles son el estadístico y la distribución de referencia y los puntos críticos utilizados.
c.2) Cuál son las expresiones matemáticas de los intervalos de confianza.
c.3) Cuáles son los intervalos de confianza obtenidos.
d) En la comparación de A con C, ¿se llegaría a la misma conclusión si se considerase un intervalo de
confianza de un nivel de confianza del 95%?
A.43. La anfetamina es una sustancia que suprime el apetito. En un estudio, una farmacóloga asignó
aleatoriamente 24 ratas similares a tres grupos. Las ratas de cada grupo recibieron una inyección: las del primer
grupo, de una solución salina (dosis 0 mg/kg de anfetamina), las del segundo grupo con una dosis de 2,5 mg/kg
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
26
de anfetamina, y las del tercer grupo con una dosis de 5 mg/kg de anfetamina. A las tres horas siguientes a la
administración de la inyección se midió la cantidad de alimento consumido por cada animal (g de alimento
consumido por kg de peso corporal). Los datos obtenidos y un análisis preliminar se muestran a continuación.
dosis anfetamina
D1: 0 mg/kg
D2: 2,5 mg/kg
D3: 5 mg/kg
consumo de alimento (g/kg) media
112,6 102,1 90,2 81,5 105,6
93 106,6 108,3 99,9875
73,3 84,8 67,3 55,3 80,7
90 75,5 77,1
75,5
38,5 81,3 57,1 62,3 51,5 48,3 42,7 57,9
54,95
desviación típica
10,6521
10,7335
13,3012
Suma de Grados de Cuadrado
Comparación por pares. Intervalos de confianza del 95%
Variabilidad cuadrados libertad
medio
F
p-valor Comparación: D1 con D2
D1 con D3
D2 con D3
µi − µ j
Entre dosis 8134,1775
0,000001
µ1 − µ2
µ1 − µ3
µ 2 − µ3
Residual
21
yi • − y j •
24,4875
45,0375
Total
10973,366
lím. inferior
12,397
32,947
lím. Superior
36,578
57,128
a) Para examinar si se puede considerar que en términos medios la cantidad de alimento consumida por
animal es la misma con cualquiera de las tres dosis, se pide:
a.1) Completar la tabla ANOVA.
a.2) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
a.3) Representar en la gráfica de la distribución adecuada el nivel de significación crítico. ¿Cuál es el resultado
del test?
b) Indicar qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior.
c) Obtener, mediante el método de la mínima diferencia significativa, el intervalo de confianza del 95%
para la diferencia de medias µ2 − µ3 que completa la tabla de comparación por pares, indicando:
c.1) Cuál es el estadístico pivote y su distribución, qué valores se utilizan de dicha distribución, y cuál es la
expresión matemática del intervalo.
c.2) ¿Qué conclusiones se obtienen a partir de los intervalos de confianza de la tabla de comparación por pares?
d) Indicar cuál es el modelo de análisis de la varianza en el que se basa el análisis estadístico del
apartado a). ¿Cuál es la expresión matemática del cuadrado medio residual, cuál es su valor, y qué estima?
A.44 Los televisores de un fabricante tienen una pieza que puede ser suministrada por tres proveedores,
A, B y C. Se desea comparar los tiempos de vida en horas de las piezas de dichos proveedores. Se tomaron al
azar 3 piezas de A, 5 de B y 4 de C y se examinó su tiempo de vida (h), con los que se llevó a cabo el siguiente
análisis estadístico de datos, que está incompleto.
DATOS Y MEDIDAS DE RESUMEN
Tiempo de vida
A 407 411 409
B 404 406 408 405 402
C 410 408 406 408
Media desviación típica
A
409
2
B
405
2,2361
C
TABLA ANOVA
Fuente de
variación
Proveedor
Error experimental
Total
Suma de Grados de
cuadrados libertad
Cuadrado
medio
Valor
de F
4,5
4
11
COMPARACIÓN POR PARES. Intervalos de confianza del 95%
Comparación
A con B A con C B con C
límite inferior
-2,456
-6,035
límite superior
4,456
0,035
Fuente: Spiegel, M.R. et al (2009) Probabilidad y Estadística. McGraw-Hill
a) Para el proveedor C, obtener la media y desviación típica muestrales, indicando su expresión
matemática. Completar la tabla. ¿Qué requisitos deben de verificar las muestras para la validez del análisis
estadístico asociado a la tabla ANOVA?
b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, el tiempo de vida es el
mismo para cualquiera de los tres proveedores, indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
27
c) Obtener el intervalo de confianza del 95% para la comparación A con B basada en el método de la
mínima diferencia significativa. Explicar el cálculo de dicho intervalo indicando:
c.1) Cuáles son el estadístico y la distribución de referencia y los puntos críticos utilizados.
c.2) Cuál es la expresión matemática del intervalo de confianza.
c.3) Cuál es el intervalo de confianza obtenido para la diferencia de medias µ A − µ B . ¿Qué conclusiones se
pueden extraer de cada uno de los tres intervalos de confianza de la tabla de “comparación por pares”?
A.45. Se midió la concentración de S-colesterol en 4 grupos de 5 participantes en diferentes dietas. Los
participantes eran todas personas de características similares, y fueron asignadas al azar a las dietas. Los datos
obtenidos y un análisis preliminar se muestran a continuación.
DATOS Y MEDIDAS DE RESUMEN
Dieta 1
Dieta 2
Dieta 3
Dieta 4
5,2
6,6
4,2
5,9
5,6
6,2
4,9
4,7
6,8
7,9
5,6
5,8
6,3
8,2
3,7
4,9
5,9
5,7
4,5
5,6
Media
5,96
6,92
4,58
5,38
desv.
típica
0,61887
1,08490
0,71903
0,54498
Q1
5,6
6,2
4,2
4,9
Q2
5,9
6,6
4,5
5,6
Q3
6,3
7,9
4,9
5,8
Daniel, W (2004). Bioestadística. Ed. Limusa
TABLA ANOVA:
Variabilidad
Entre dietas
Residual
Total
Comparación:
µi − µ j
Suma de
cuadrados
D1 con D2
µ1 − µ2
Grados de Cuadrado Valor
libertad
medio
de F
4,8540
0,5935
Intervalos de confianza del 95%:
D1 con D3
D1 con D4
D2 con D3
µ1 − µ3
µ1 − µ4
µ 2 − µ3
D2 con D4
µ2 − µ4
D3 con D4
µ3 − µ 4
yi • − y j •
-0,80
-0,96
lím. inferior
-1,9929
-1,8329
lím. superior
0,07290
0,23290
a) Identificar los cuartiles en el gráfico de cajas y comentar el tipo de asimetría de las distribuciones
muestrales.
b) Calcular las medidas de dispersión representadas en el gráfico de cajas correspondientes a las dietas
1 y 2 y compararlas.
c) Para examinar si se puede considerar que en términos medios la concentración de S-colesterol es la
misma con las cuatro dietas, se pide:
c.1) Completar la tabla ANOVA.
c.2) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
c.3) Representar en la gráfica de la distribución adecuada el nivel de significación crítico. ¿Cuál es el resultado
del test?
c.4) Indicar qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior.
d) Obtener, mediante el método de la mínima diferencia significativa, un intervalo de confianza del
95% para cada par de diferencia de medias µi − µ j . En base a los intervalos, ¿con qué dieta/s cabe esperar el
nivel de colesterol más bajo?
A.46. Un laboratorio desea comparar tres métodos para la determinación de los niveles de glucosa en
bebidas refrescantes: el método A, que utiliza un ensayo espectroscópico; el B, que utiliza un electrodo
enzimático, y el C, que utiliza HPLC y es el método oficial (indicado por la AOAC, Asscociation of Official
Analytical Chemists). Se realizó un experimento con 18 muestras homogéneas de refresco, que se repartieron al
azar en tres grupos de seis. En cada grupo se determinó el nivel de glucosa (en mM) con una técnica. Los
resultados obtenidos y algunas medidas de resumen se muestran a continuación.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
28
TABLA ANOVA
DATOS Y MEDIDAS DE RESUMEN
A
B
C
1,9 1,82 1,7 1,94 1,85 1,9
1,35 1,65 1,76 1,41 1,80 1,33
1,92 1,82 1,85 1,79 1,89 1,95
Fuente: Hibbert D.B. y Gooding, J.J. (2006). Data
analysis for chemestry. Oxford University Press
A
B
C
media
desviación típica
1,851667
0,085422
1,55
0,211943
1,87
0,060992
Suma de Grados de
cuadrados Libertad
0,387478
0,279683
0,667161
Variabilidad
Entre métodos
Residual
Total
Comparación:
H 0 : µi = µ j
A con B
H 0 : µ1 = µ2
Cuadrado
medio
Valor
de F
0,018646
A con C
H 0 : µ1 = µ3
B con C
H 0 : µ 2 = µ3
yi • − y j •
Error típico
Estadístico t
a) Para examinar si se puede considerar que en términos medios los resultados de los tres métodos son
iguales, se pide:
a.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
a.2) Representar gráficamente el nivel de significación crítico del test correspondiente. ¿Cuál es el resultado del
test?
a.3) Qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior.
b) Si procede, comparar mediante el método de la mínima diferencia significativa las medias de cada
par de dietas. Considerar un nivel de significación del 5%.
A.47. En una ciudad se determinó la cantidad de fluoruro en el suministro de agua local mediante cuatro
métodos colorimétricos, A, B, C y D. Con el fin de garantizar muestras de agua homogéneas, se tomaron todas
de un único barril de 40 litros de agua. A continuación se presentan los datos obtenidos (en ppm) y un análisis
estadístico preliminar incompleto.
A
B
C
D
2
5
1
3
A
B
C
D
fluoruro
3
6
4
4
3
2
1
1
TABLA ANOVA
5
2
4
2
media
varianza
3,6
2,8
1,6
1,3
1,7
0,8
4
3
4
1
Variabilidad
Entre métodos
Residual
Total
Suma de Grados de
cuadrados libertad
Cuadrado
medio
5,6
1,575
Valor
de F
COMPARACIÓN POR PARES. Intervalos de confianza del 95%
Comparación
A con B A con C A con D B con C B con D C con D
límite inferior
─1,28
─0,48
─0,88
0,32
─0,48
límite superior
2,08
2,88
2,48
3,68
2,88
Fuente:Lazic Z.R. (2005); Design of Experiments in Chemical Engineering, A Practical Guide. Wiley
Se asume que las determinaciones del fluoruro (en ppm) por cualquiera de los cuatro métodos sigue una
distribución normal, con varianza constante σ2.
a) Para completar el análisis preliminar se pide:
a.1) Calcular la media y la varianza muestrales de las determinaciones del método A, ¿qué parámetros se estiman
con dichos valores? ¿Son la media y la varianza muestrales estimadores insesgados de los correspondientes
parámetros? ¿Qué interpretación tiene dicha propiedad?
a.2) Completar la tabla ANOVA e indicar el valor del estimador insesgado de la varianza del error experimental
σ2 así como su expresión matemática.
b) ¿Se puede admitir que el método colorimétrico empleado no influye en la determinación del fluoruro
(esto es, en términos medios los cuatro métodos dan igual)? Contestar respondiendo a los siguientes apartados.
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y cuál es la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test en base al p-valor.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
29
c) La tabla de “comparación por pares” contiene intervalos de confianza del 95% para varias diferencias
de medias µi − µ j , obtenidos por el método de la mínima diferencia significativa. Si procede comparar las
medias por pares, indicar:
c.1) A qué conclusión se llega con cada uno de los cinco intervalos de confianza ya facilitados.
c.2) Cuál es el intervalo de confianza correspondiente a la comparación A con D ( µ1 − µ 4 ). Especificar:
i) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados.
ii) Cuál es la expresión matemática del intervalo de confianza, el intervalo obtenido y la conclusión.
d) Indicar:
d.1) la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada uno de sus
términos.
d.2) en el test del apartado b), cuáles son las regiones de aceptación y de rechazo para un nivel de significación
del 1%; ¿cuál es el resultado del test para dicho nivel de significación?
A.48 Se desea comparar la capacidad de cuatro laboratorios (A, B, C y D) para determinar la pureza en
muestras de 1-bromopropano. Se tomaron 20 muestras homogéneas que fueron asignadas al azar a los
laboratorios para su análisis. A continuación se presentan los resultados, varias medidas muestrales de resumen,
y parte de la tabla de análisis de la varianza.
DATOS Y MEDIDAS DE RESUMEN
Pureza 1-bromopropano
73 75 73 75 73
74 74 75 74 74
68 69 69 70 69
71 72 72 71 73
media desviación típica
A
73,8
1,095445
B
74,2
0,447214
C
69
0,707107
D
71,8
0,83666
A
B
C
D
TABLA ANOVA
Fuente de
variación
Laboratorio
Error experimental
Total
Suma de Grados de
cuadrados libertad
Cuadrado
medio
28,2667
0,6500
Valor
de F
COMPARACIÓN POR PARES. Intervalos de confianza del 95%
Comparación
A con B A con C A con D B con C B con D C con D
límite inferior
3,72
0,92
4,12
1,32
-3,88
límite superior
5,88
3,08
6,28
3,48
-1,72
a) Completar la tabla. ¿Qué requisitos deben de verificar las muestras para la validez del análisis
estadístico asociado a la tabla ANOVA?
b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, la determinación de la
pureza es la misma en cualquiera de los cuatro laboratorios, indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test.
c) Obtener el intervalo de confianza del 95% para la comparación A con B basada en el método de la
mínima diferencia significativa. Explicar el cálculo de dicho intervalo indicando:
c.1) Cuáles son el estadístico y la distribución de referencia y los puntos críticos utilizados.
c.2) Cuál es la expresión matemática del intervalo de confianza.
c.3) Cuál es el intervalo de confianza obtenido para la diferencia de medias µ A − µ B . ¿Qué conclusiones se
pueden extraer de cada uno de los seis intervalos de confianza de la tabla de “comparación por pares”?
d) Escribir la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando
cada uno de sus términos.
Cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1% en el test del
apartado b). ¿Cuál es el resultado del test para dicho nivel de significación?.
A.49 Un fabricante de neumáticos realizó unas pruebas en laboratorio para comparar sus neumáticos
(marca A=M1) con los de dos marcas competidoras (B=M2 y C=M3). Mediante un estudio de simulación se
determinó el recorrido en miles de millas (en iguales condiciones de conducción para las tres marcas) hasta que
el desgaste alcanzó un valor determinado. A continuación se presentan los datos obtenidos (miles de millas) y un
análisis estadístico preliminar incompleto.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
30
DATOS
Marca
M1
M2
M3
65
61
65
61
62
67
62
63
68
64
60
66
63
64
65
59
64
62
MEDIDAS ESTADÍSTICAS DE RESUMEN
desviación
Marca
media
típica
Q1
Q2
M1
63
1,58114
62
63
M2
61,75 1,66905
60,5 62
M3
65,83 1,47196
65 65,5
63
Q3
64
63
67
Fuente: Quirk, T.J. (2016) Excel 2016 for Engineering Statistics. Springer
TABLA ANOVA
Variabilidad
Entre marcas
Residual
Total
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
16
2,5208
Valor
de F
11,52
COMPARACIÓNES POR PARES. Intervalos
de confianza del 95% para la diferencia de medias
Comparación límite inferior límite superior
M1-M2
─0,67
3,17
M1-M3
M2-M3
─5,90
─2,27
Se asume que el desgaste de los neumáticos de cualquiera de las tres marcas sigue una distribución
normal, con varianza constante σ2.
a) Para completar el análisis preliminar se pide:
a.1) Calcular la medida de dispersión representada en el gráfico de cajas de cada marca, ¿qué interpretación tiene
dicha medida? Indicar el tipo de asimetría de las correspondientes distribuciones muestrales, en base al gráfico
de cajas, y en base a las medidas de tendencia central disponibles para cada marca en la tabla de “medidas
estadísticas de resumen”.
a.2) Completar la tabla ANOVA e identificar el valor del estimador insesgado de la varianza del error
experimental así como su expresión matemática. ¿Qué significa que el estimador sea insesgado?
b) Examinar, en base al p-valor, si se puede considerar que el recorrido medio hasta llegar al desgaste
prefijado se puede considerar el mismo para las tres marcas, indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test.
c) Obtener el intervalo de confianza del 95% para la diferencia de medias µ1 − µ3 utilizando el método
de la mínima diferencia significativa. Indicar:
c.1) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados.
c.2) Cuál es la expresión matemática del intervalo de confianza.
c.3) ¿Cuál es el intervalo de confianza obtenido para µ1 − µ3 ? Interpretar los tres intervalos de confianza de la
tabla de “comparación por pares”. ¿A qué conclusiones se llega?
d) Escribir la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando
cada uno de sus términos.
Cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1% en el test del
apartado b). ¿Cuál es el resultado del test para dicho nivel de significación?
A.50 En un estudio de laboratorio se consideraron n=18 muestras homogéneas de un mismo compuesto
orgánico para determinar su porcentaje de cloro. Para llevar a cabo las determinaciones se prepararon otras tantas
soluciones de nitrato de plata (AgNO3), n1=5 con nitrato de plata del fabricante, A, n2=6 con nitrato de plata del
fabricante B, y n1=7 con nitrato de plata del fabricante C. La asignación de las muestras del compuesto orgánico
a las soluciones de nitrato de plata de los diferentes fabricantes se hizo al azar. Los porcentajes de cloro
obtenidos, algunas medidas de resumen y parte de la tabla de análisis de la varianza se muestran a continuación.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
31
Fabricante
c
l
o
r
o
Medidas
resumen
media
varianza
A
5,2
4,4
5,45
5,8
5,6
5,29
0,2955
B
5,5
5,1
5,5
5,98
5,6
5,56
C
4,45
5,45
4,65
4,4
4,9
4,95
5,4
5,54
0,0789
TABLA ANOVA
Variabilidad
Fabricante
Residual
Total
Suma de Grados de
cuadrados libertad
1,4209
2,6450
17
Cuadrado
medio
0,1763
COMPARACIÓN POR PARES. Intervalos de confianza
del 95%
Comparación
A con B A con C B con C
límite inferior
─0,7920 ─0,1198
límite superior
0,2920
0,9284
a) Obtener el valor, e indicar la expresión matemática, de la media y de la varianza de las
determinaciones de cloro llevadas a cabo con nitrato de plata del fabricante C. ¿Cuál es el valor de la medida de
tendencia central y de la medida de dispersión representadas en el gráfico de cajas correspondiente a la muestra
C?. ¿Cuál es la interpretación de dichas medidas? ¿Qué otra información se puede extraer de dicho gráfico?
Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis
estadístico asociado a la tabla ANOVA?
b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, el porcentaje de cloro
(en el compuesto orgánico considerado) es el mismo cualquiera que sea el fabricante del nitrato de plata
utilizado. Responder contestando a las siguientes cuestiones:
b.1) Cuáles son la hipótesis nula y la hipótesis alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test.
c) Obtener el intervalo de confianza del 95% para para la diferencia de medias µ B − µC basada en el
método de la mínima diferencia significativa. Explicar el cálculo de dicho intervalo indicando:
c.1) Cuáles son el estadístico y la distribución de referencia y los puntos críticos utilizados.
c.2) Cuál es la expresión matemática del intervalo de confianza.
c.3) Cuál es el intervalo de confianza obtenido para la diferencia de medias µ B − µC .
c.4) ¿Qué conclusiones se pueden extraer de cada uno de los tres intervalos de confianza de la tabla de
“comparación por pares”?
d) Escribir la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando
cada uno de sus términos.
Cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1% en el test del
apartado b). ¿Cuál es el resultado del test para dicho nivel de significación?
A.51. Un laboratorio desea comparar tres métodos para la determinación de los niveles de glucosa en
bebidas refrescantes: el método A, que utiliza un ensayo espectroscópico; el B, que utiliza un electrodo
enzimático, y el C, que utiliza HPLC y es el método oficial (indicado por la AOAC, Asscociation of Official
Analytical Chemists). Se realizó un experimento con 18 muestras homogéneas de refresco, que se repartieron al
azar en tres grupos de seis. En cada grupo se determinó el nivel de glucosa (en mM) con una técnica. Los
resultados obtenidos y algunas medidas de resumen se muestran a continuación.
DATOS Y MEDIDAS DE RESUMEN
A
B
C
1,9 1,82 1,7 1,94 1,85 1,9
1,35 1,65 1,76 1,41 1,80 1,33
1,92 1,82 1,85 1,79 1,89 1,95
Fuente: Hibbert D.B. y Gooding, J.J. (2006). Data
analysis for chemestry. Oxford University Press
A
B
C
media
desviación típica
1,851667
0,085422
1,55
0,211943
1,87
0,060992
Valor
de F
TABLA ANOVA
Variabilidad
Entre métodos
Residual
Total
Comparación:
H 0 : µi = µ j
Suma de Grados de
cuadrados Libertad
0,387478
0,279683
0,667161
A con B
H 0 : µ1 = µ2
Cuadrado
medio
Valor
de F
0,018646
A con C
H 0 : µ1 = µ3
B con C
H 0 : µ 2 = µ3
yi • − y j •
Error típico
Estadístico t
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
32
a) Para examinar si se puede considerar que en términos medios los resultados de los tres métodos son
iguales, se pide:
a.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
a.2) Representar gráficamente el nivel de significación crítico del test correspondiente. ¿Cuál es el resultado del
test?
a.3) Qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior.
b) Si procede, comparar mediante el método de la mínima diferencia significativa las medias de cada
par de dietas. Considerar un nivel de significación del 5%.
A.52. Para comparar los métodos que siguen tres laboratorios (L1, L2 y L3) para la determinación de la
concentración de albúmina en suero sanguíneo, se proporcionó a cada laboratorio una muestra de un mismo
suero estándar. Cada laboratorio realizó seis determinaciones independientes de la concentración de albúmina. A
continuación se presentan los resultados de cada laboratorio, varias medidas de resumen muestrales, los gráficos
de cajas asociados y parte de la tabla de análisis de la varianza.
DATOS Y MEDIDAS DE RESUMEN
concentración (g/l)
media Q1
Q2
Q3
L1 41,3 42,3 42,1 41,2 42,9 41,7
41,3 41,9 42,3
L2 42,7 40,5 40,2 41,8 43,1 42,2 41,75 40,5
42 42,7
L3 43,7 43,4 42,9 43,1 44,3 42,1 43,25 42,9 43,25 43,7
Fuente: Sánchez, J. y Villalobos, M. (2010). Tratamiento de los resultados analíticos.
Cano Pina – Ediciones Ceysa
TABLA ANOVA
Variabilidad
Entre laboratorios
Residual
Total
Suma de Grados de Cuadrado
cuadrados libertad
medio
4,0556
15
0,7852
17
Valor
de F
a) Para la muestra correspondiente al laboratorio 1:
a.1) Calcular la media y la desviación típica.
a.2) Indicar los valores de las medidas de tendencia central y de dispersión que se reflejan en el gráfico de cajas.
b) Para examinar si se puede considerar que en términos medios los resultados de los tres laboratorios
son iguales, se pide:
b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
b.2) Representar gráficamente el nivel de significación crítico del test correspondiente. ¿Cuál es el resultado del
test?
b.3) Qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior.
c) Comparar mediante el método de la mínima diferencia significativa las determinaciones de los laboratorios 1
y 3. Considerar un nivel de significación del 5%.
A.53. En un estudio sobre el proceso de blanqueado del papel, se determinó el brillo de la pulpa (el
GEB –General electric brightness- expresado como porcentaje de un GEB máximo) en muestras de pulpa
homogéneas tratadas con tres blanqueantes químicos diferentes.
DATOS
BQ1
BQ2
BQ3
TABLA ANOVA
77,20 74,47 72,75 76,21 72,88
80,52 79,31 81,91 80,35 77,39
79,42 78,02 81,60 80,80 80,63
media
BQ1
BQ2
BQ3
desv. típica
74,702 1,9810
79,896 1,6789
80,094 1,3973
Fuente: Ugarte, MD y otros (2008) Probability and
statistics with R.. CRC Press
Variabilidad
Entre blanqueantes
Residual
Total
Comparación:
estimación\parámetro
yi • − y j •
límite inferior
límite superior
Suma de Grados de
cuadrados libertad
93,4842
Cuadrado
medio
Valor
de F
2,8985
BQ1 con BQ2
µ1 − µ2
BQ1 con BQ3
µ1 − µ3
BQ2 con BQ3
µ 2 − µ3
-7,540064
-2,847936
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
33
a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del
análisis estadístico asociado a la tabla ANOVA?
b) Examinar si se puede considerar que el brillo de la pulpa es el mismo con los tres blanqueantes,
indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test para un nivel de significación del 5%.
c) Si procede, comparar mediante el método de la mínima diferencia significativa las medias del brillo
de cada par de blanqueantes, en base a intervalos de confianza del 95%.
A.54. Se llevó a cabo un experimento para examinar el efecto de la velocidad de flujo del C2F6 sobre la
uniformidad del grabado químico de una oblea de silicio usada en la fabricación de circuitos integrados. Se
probaron tres velocidades de flujo, cada una en seis unidades de prueba. La uniformidad resultante (en
porcentaje) y un análisis estadístico preliminar son los siguientes.
DATOS Y MEDIDAS DE RESUMEN
Q1 Q3
flujo de C2F6
(SCCM)
2,7 3,8 125
4,2 4,9 160
3,4 4,6 200
2,6 2,7 3 3,2 3,8 4,6
3,6 4,2 4,2 4,6 4,9 5
2,9 3,4 3,5 4,1 4,6 5,1
Fuente: Montgomery (2003) Diseño y análisis de
experimentos. Limusa-Wiley
flujo de C2F6
(SCCM)
125
160
200
media
desviación típica
4,4167
3,9333
0,523132
0,821381
TABLA ANOVA
Variabilidad
Entre flujos
Residual
Total
Suma de Grados de
cuadrados libertad
Cuadrado
Medio
1,8239
0,5087
Valor
de F
COMPARACIÓN POR PARES. Intervalos de confianza del 90%
comparación
límite inferior
límite superior
125con 160
125 con 200
160 con 200
-0,3781
a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del
análisis estadístico asociado a la tabla ANOVA? Calcular la media y la desviación típica de la uniformidad
correspondientes a un flujo de 125 SCCM de C2F6.
b) Examinar, considerando un nivel de significación del 10%, si se puede considerar que, en términos
medios, la velocidad del flujo afecta a la uniformidad del grabado químico, indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test.
c) Obtener, si procede, los intervalos de confianza del 90% para las diferencias de medias µi − µ j
basados en el método de la mínima diferencia significativa. ¿A qué conclusiones se llega?
A.55. Para evitar la corrosión por picadura de unas chapas metálicas expuestas en el exterior se emplean
tres tratamientos, A, B y C. En un estudio se tomaron 15 chapas homogéneas, que se asignaron al azar a tres
grupos, aplicándose un tratamiento distinto a cada grupo. Tras un período determinado se midió la profundidad
de las picaduras (en mm) en cada chapa Los datos obtenidos y un análisis preliminar se muestran a continuación.
DATOS Y MEDIDAS DE RESUMEN
Profundidad de
las picaduras
A
1 1,5 1,3 1,4 1,3
B
1,1 1,6 1,5 1,5 1,4
C
1,7 1,7 1,6 1,7 1,8
Profundidad
de picaduras
media desviación típica
A
1,3
0,187083
B
1,42
0,192354
C
1,7
0,070711
TABLA ANOVA
Suma de Grados de
Variabilidad
cuadrados libertad
Tratamiento
Residual
Total
Cuadrado
medio
0,2107
0,0257
Valor
de F
Comparaciones por pares. Intervalos de confianza del 95%
comparación
A con B
A con C
B con C
límite inferior
-0,3408
límite superior
0,1008
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
34
a) Para examinar si se puede considerar que en términos medios la profundidad de las picaduras es la
misma con cualquiera de los tres tratamientos, se pide:
a.1) Completar la tabla ANOVA.
a.2) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la
distribución de referencia del test correspondiente?
a.3) Representar en la gráfica de la distribución adecuada el nivel de significación crítico. ¿Cuál es el
resultado del test?
b) Indicar qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior.
c) Obtener, mediante el método de la mínima diferencia significativa, un intervalo de confianza del 95%
para la diferencia de medias µ1 − µ3 y otro para µ2 − µ3 , indicando:
c.1) Cuál es el estadístico pivote y su distribución, qué valores se utilizan de dicha distribución, y cuál
es la expresión matemática del intervalo.
c.2) ¿Qué conclusiones se obtienen a partir de los intervalos de confianza de la tabla de comparación
por pares?
d) Indicar cuál es el modelo de análisis de la varianza en el que se basa el análisis estadístico del
apartado a). ¿Cuál es la expresión matemática del cuadrado medio residual, cuál es su valor, y qué estima?
A.56. En un estudio sobre el principio activo de determinados comprimidos participaron tres
laboratorios (A, B y C). Se seleccionaron al azar 18 comprimidos y se asignaron aleatoriamente 6 a cada
laboratorio. Cada laboratorio determinó la cantidad en mg de ingrediente activo por comprimido. A continuación
se presentan los resultados obtenidos, varias medidas muestrales de resumen, y parte de la tabla de análisis de la
varianza.
DATOS Y MEDIDAS DE RESUMEN
Contenido
(mg)
A
6,67 6,79 6,84 6,58 6,89 6,43
B
6,46 6,30 6 6,76 5,96 6,28
C
5,79 6,09 5,96 6,32 6,66 5,81
Q1
6,58
6
5,81
Ingrediente
Q3
activo (mg)
6,84
A
6,46
B
6,32
C
media
6,700
6,293
6,105
desviación
típica
0,174356
0,297635
0,335187
Fuente: Ellinson, SL et al (2009) Practical Statistics for the Analytical Scientist, A Bench Guide.
RSC Publishing
TABLA ANOVA
Variabilidad
Entre laboratorios
Residual
Total
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
0,5549
0,0771
Valor
de F
COMPARACIÓN POR PARES.
Intervalos de confianza del 95%
Comparación
A con B A con C
límite inferior
0,0649
límite superior
0,7484
a) Para el laboratorio A, obtener e interpretar la medida de tendencia central y la medida de dispersión
representadas en el gráfico de cajas.
Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis
estadístico asociado a la tabla ANOVA?
b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, la cantidad de
principio activo obtenida por comprimido es la misma en cualquiera de los tres laboratorios, indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test.
c) Obtener los intervalos de confianza del 95% para las diferencias de medias µ A − µC y µ B − µC
basados en el método de la mínima diferencia significativa, indicando:
c.1) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados.
c.2) Cuáles son las expresiones matemáticas de los intervalos de confianza.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
B con C
35
c.3) Cuáles son los intervalos de confianza obtenidos.
c.4) ¿A qué conclusiones se llega en base a los tres intervalos de confianza de la tabla de “comparación por
pares”?
d) En la comparación de A con B, ¿se llegaría a la misma conclusión si se considerase un intervalo de
confianza de un nivel de confianza del 99%?
A.57 Un laboratorio farmacéutico está probando un nuevo antibiótico (N) para tratar una enfermedad
infecciosa, y lanzarlo al mercado. Para ello se hizo un estudio con el fin de comparar su efecto con el de otros
dos antibióticos ya existentes en el mercado para la misma enfermedad, A y B. La variable respuesta, Y, indica
el grado de mejoría del paciente, según cierto parámetro fisiológico, después de serle administrado el
tratamiento. Los resultados del ensayo clínico son:
Antibiótico
A
B
N
0,4
3,1
2,3
grado
1,1
2,7
3,5
de mejoría
0,7
0,3
3,8
3,0
2,8
3,2
0,9
2,9
2,9
2,7
3,6
3,4
2,8
2,7
Global
Media
0,68
3,1
2,99
2,44
Varianza
0,1120
0,1750
0,1743
1,232
La tabla de análisis de la varianza es la siguiente.
Suma de
cuadrados
20,691
Variabilidad
Entre grupos
Residual
Total
Grados de
libertad
Cuadrado
medio
10,3455
Valor de
F
Ptos. críticos (tablas F)
5%
1%
0.1%
23,408
a) Para examinar si se puede concluir que los antibióticos no tienen en términos medios el mismo grado
de efectividad, se pide:
a.1) ¿Cuál es el estadístico de contraste del test correspondiente?.
a.2) Interpretar el resultado del test en la gráfica de la distribución apropiada. Considerar un nivel de
significación del 5%.
b) Comparar, si procede, el nuevo medicamento con cada uno de los ya existentes mediante el método
de la mínima diferencia significativa.
A.58 El agua puede contener radón disuelto en altas cantidades cuando proviene de acuíferos
subterráneos. Cuando el agua se expone al aire, se libera el radón que contiene. Se realizó un experimento con
agua enriquecida en radón para comparar cuatro diámetros (D1: 0.51, D2: 1.02, D3: 1.40 y D4: 1.99) de los
orificios de las duchas domésticas. A continuación se presentan los datos obtenidos (radón liberado, %) y un
análisis estadístico preliminar incompleto.
D1
D2
D 3:
D4
D1
D2
D3
D4
Radón liberado (%)
75 75 79 79
67 72 74 74
62 62 67 69
60 61 64 66
media
77
varianza
2,3094
65
62,75
3,5590
2,7538
TABLA ANOVA
Fuente de variación
Diámetro
Error experimental
Total
Suma de Grados de
cuadrados libertad
109,5000
615,7500
12
15
Cuadrado
medio
Valor
de F
9,1250
Fuente: Montgomery, D.C. & Runger, G. C. (2003).
Applied statistics and probability for engineers. Wiley
COMPARACIÓN POR PARES. Intervalos de confianza del 95% (MDS):
Límite
D1 con D2 D1 con D3 D1 con D4 D2 con D3 D2 con D4 D3 con D4
inferior
0,60
7,35
9,60
2,10
4,35
superior
9,90
16,65
18,90
11,40
13,65
Se asume que el radón liberado (%) por cualquiera de los cuatro métodos sigue una distribución normal,
con varianza constante σ2.
a) Para completar el análisis preliminar se pide:
a.1) Calcular la media y la varianza muestrales del radón liberado con orificios de diámetro D2, ¿qué parámetros
se estiman con dichos valores? ¿Son la media y la varianza muestrales estimadores insesgados de los
correspondientes parámetros? ¿Qué interpretación tiene dicha propiedad?
a.2) Completar la tabla ANOVA e indicar el valor del estimador insesgado de σ2, la varianza del error
experimental, incluido en la tabla.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
36
b) ¿Se puede admitir que el diámetro de los orificios de la ducha no influye en el radón liberado (esto
es, en términos medios, el radón liberado es el mismo con cualquiera de los cuatro diámetros)? Contestar
respondiendo a los siguientes apartados.
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y cuál es la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test en base al p-valor.
c) La tabla de “comparación por pares” contiene intervalos de confianza del 95% para varias diferencias
de medias µi − µ j , obtenidos por el método de la mínima diferencia significativa. Si procede comparar las
medias por pares, indicar:
c.1) A qué conclusión se llega con cada uno de los cinco intervalos de confianza ya facilitados.
c.2) Cuál es el intervalo de confianza correspondiente a la comparación D3 con D4 ( µ3 − µ 4 ). Especificar:
i) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados.
ii) Cuál es la expresión matemática del intervalo de confianza, el intervalo obtenido y la conclusión.
d) Indicar:
d.1) la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada uno de sus
términos.
d.2) en el test del apartado b), cuáles son las regiones de aceptación y de rechazo para un nivel de significación
del 1%; ¿cuál es el resultado del test para dicho nivel de significación?
A.59 Se llevó a cabo un estudio en cierto tipo de animales para comparar el efecto de tres
dietas, D1, D2 y D3, sobre el tiempo de coagulación de la sangre. Se eligió una muestra de animales de
las mismas características y a cada animal se le asignó una de las tres dietas elegida al azar. Pasado un
período prefijado, se determinó el tiempo de coagulación de la sangre. A continuación, se muestran los
datos obtenidos (que también figuran en el fichero Excel con tu nombre, en la hoja P4), así como un
análisis preliminar incompleto. Se asume que son tres muestras independientes de variables con
distribución normal y de igual varianza.
D1
62
60
63
59
t
i
e
m
p
o
D2
63
67
71
64
65
66
68
Media
desviación típica
D3:
56
62
60
61
63
64
63
58
Medidas de resumen
D1
D2
61,0000
66,2857
1,8257
2,6904
Tabla ANOVA
Variabilidad
Entre dietas
Residual
Total
Suma de
cuadrados
Grados de
libertad
106,3036
16
Cuadrado
medio
63,7430
6,6440
D3:
60,8750
2,7484
Fuente: Vidakovic (2011); Statistics For
Bioengineering Science; Springer
Comparaciones de medias por pares, método MDS
Valor Intervalos de confianza del 95% para la diferencia de medias
Comparación
Límite inferior Límite superior
de F
D1 con D2
-8,7106
-1,8608
D2 con D3
2,5827
8,2387
a) Se pide:
a.1) En base al gráfico de cajas, ¿qué tipo de asimetría se aprecia en la distribución muestral del
tiempo de coagulación de la sangre con la dieta D3?
a.2) Completa la tabla ANOVA.
b) Para analizar si se puede considerar que en términos medios el tiempo de coagulación de la
sangre es igual con las tres dietas, responde a las siguientes preguntas:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Utilizando la distribución de referencia, expresa matemáticamente el p-valor del test como una
probabilidad e indica cuál es el resultado del test.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
37
c) Considera el método de la mínima diferencia significativa (MDS) para la comparación de
medias por pares mediante intervalos de confianza del 95%. Indica:
c.1) ¿A qué conclusión se llega en las comparaciones de medias correspondientes a los intervalos de
confianza incluidos en la tabla “Comparaciones de medias por pares, método MDS”?
c.2) Para la diferencia de medias del tiempo de coagulación de la sangre con las dietas D1 y D3, indica
cuál es la expresión matemática del intervalo de confianza del 95% y cuál es el valor de cada uno de
sus términos. Comenta el intervalo obtenido.
A.60. Se pretende estudiar el efecto de la temperatura de conservación de los zumos naturales, sobre la
valoración que los consumidores hacen de los mismos. Tras recoger la opinión dada por una muestra de 20
personas, se obtuvieron los siguientes resultados.
Temperatura
valoraciones
media
varianza
0º
5º
9,0 7,8 8,5 8,1 8,7 8 8,5 8,4 7,9 8
8,42
8,16
0,227
0,073
10º
7,5 6 7 6,5 6,8
6,76
0,313
15º
6 7 6,5 5,7 5,9
6,22
0,277
La tabla de análisis de la varianza es:
Fuente de
Suma de Grados de Cuadrado Valor
Variación
cuadrados libertad
medio
de F
Temperatura
Error experimental
16
0,2225
Total
20,658
19
a) Completar la tabla.
b) ¿Se puede concluir que la temperatura de conservación influye en la valoración de los consumidores?
b.1) Formular el problema como un contraste de hipótesis.
b.2) Interpretar el resultado del test en la distribución de referencia en base al p-valor.
c) Determinar:
c.1) El valor del estadístico de contraste del test de la mínima diferencia significativa para contrastar las hipótesis
nulas siguientes (frente a las hipótesis alternativas contrarias correspondientes).
H 0 : µi = µ j
H 0 : µ 0 = µ5
H 0 : µ5 = µ10
H 0 : µ10 = µ15
yi • − y j •
Error típico
Estadístico de contraste
c.2) ¿Qué tests indican la existencia de diferencias significativas al 5% entre las medias comparadas?
c.3) El intervalo de confianza del 95% para la diferencia de medias correspondientes a las temperaturas de 0º C y
15º C.
d) ¿Qué hipótesis sobre las muestras son necesarias para la validez de los análisis estadísticos de los
apartados b) y c)?
A.61 Se está llevando a cabo un estudio para comprobar el efecto de tres dietas diferentes (A, B y C)
en el nivel de colesterol de pacientes hipercolesterolémicos. Para ello se han establecido 3 grupos de pacientes
similares (elegidos al azar), de tamaños 12, 8 y 10. Los niveles de colesterol, medidos después de dos semanas
de dieta, se presentan a continuación.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
38
TABLA ANOVA
DATOS Y MEDIDAS DE RESUMEN
A
B
C
A
B
C
2,9
3,25
3,15
2,8
3
2,35
3,35 3,25 3
3,3
3,25 3,1 3,05 3,25
2,95 2,8 3,1 2,75
3,05
2,6 2,65 2,2 2,55
2,6 2,35 2,6
media
3,15
2,90
2,52
3,1
3
2,6
2,3
Suma de Grados de
Variabilidad Cuadrados libertad
Entre dietas
2,1727
2
Residual
0,9610
27
Total
3,1337
29
Comparación:
H 0 : µi = µ j
desviación típica
0,14302
0,19272
0,22998
yi • − y j •
Error típico
Estadístico t
Cuadrado
Valor
p-valor
medio
de F
1,0863 30,5213 0,00000012
0,0356
A con B
H 0 : µ1 = µ2
A con C
H 0 : µ1 = µ3
0,25
0,08611
0,08078
B con C
H 0 : µ 2 = µ3
Fuente: Carrasco, J.L. et al. (1994). Ejercicios y problemas de estadística médica. CIBEST
a) Para examinar si se puede considerar que en términos medios los resultados de las tres dietas son
iguales, se pide:
a.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución
de referencia del test correspondiente?
a.2) Representar gráficamente el nivel de significación crítico del test correspondiente. ¿Cuál es el resultado del
test?
a.3) Qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior.
b) Si procede, comparar los niveles medios de colesterol de cada par de dietas mediante el método de la
mínima diferencia significativa. Considerar un nivel de significación del 5%.
A62. Se llevó a cabo un experimento para comparar la resistencia a la tensión de barras fabricadas con
aleaciones de fundición a tres altas temperaturas A, B y C. Se seleccionaron 6 barras al azar de cada fundición,
obteniéndose los siguientes resultados, que se acompañan con algunos análisis estadísticos.
DATOS Y MEDIDAS DE RESUMEN
Resistencia
Q1 Q3
a la tensión
88 92,9 A
86
90 B
92,5 96,2 C
88
89
88
86 94,8 92,9
86
90
91 85,9 88,6 89,6
92 94,2 96,5 96,2 95,6 92,5
Fuente: Kenett RS & Zacks S (2014) Modern industrial statistics, Wiley
Resistencia a
la tensión
A
B
C
media
89,783
88,517
desviación típica
3,351666
2,132057
TABLA ANOVA
Suma de Grados de
Fuente
cuadrados libertad
Fundiciones
119,3033
Error exp.
15
Total
Cuadrado
medio
Valor
de F
6,4891
COMPARACIÓN POR PARES. Intervalos de confianza
del 95%
comparación
A con B
A con C
B con C
límite inferior
-1,8681
límite superior
4,4014
a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del
análisis estadístico asociado a la tabla ANOVA? Calcular la media y la desviación típica de resistencia a la
tensión correspondientes a la fundición C.
b) Examinar, considerando un nivel de significación del 5%, si se puede considerar que, en términos
medios, la resistencia a la tensión es la misma con cualquiera de las tres fundiciones, indicando:
b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente.
b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente.
b.3) Cuál es el resultado del test.
c) Obtener, si procede, los intervalos de confianza del 95% para las diferencias de medias µi − µ j
basados en el método de la mínima diferencia significativa. ¿A qué conclusiones se llega?
d) Dibujar el gráfico de cajas de la tercera muestra. Identificar una medida de tendencia central y otra de
dispersión en el gráfico. Utilizar dicho gráfico para examinar el tipo de asimetría de la distribución muestral.
__________________________________________________________________________________________
Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo
Curso 2020-2021
Descargar