Subido por LEYNER YESID QUERALES ZARACHE

Diseño Unifactorial aleatorizado

Anuncio
TRABAJO
DISEÑO UNIFACTORIAL ALEATORIZADO
EVANDIS MANUEL ALGARIN BUZÓN
LEYNER YESID QUERALES ZARACHE
NOVIEMBRE DE 2020
UNIVERSIDAD DEL ATLANTICO
DISEÑO DE EXPERIMENTOS
GRUPO 1
INTRODUCCIÓN
En el siguiente trabajo se realizará un experimento para estudiar la
confiabilidad de una cierta cantidad de tableros electrónicos para
carros, donde cada uno de estos es sometido a un envejecimiento
acelerado durante 100 horas a una determinada temperatura, donde
nuestra variable de interés es aquella que mide la intensidad de
corriente que circulan entre dos puntos.
En este experimento estaremos aplicando el análisis de varianza
(ANOVA) que nos arroja el saber la existencia o no de diferencia
significativa entre las medias de cada temperatura, para más tarde
aplicar los supuestos de modelo, como el de normalidad, que se realiza
de manera gráfica y por la prueba de Shapiro-Wilks.
Por otra parte se analizará si hay datos atípicos. Después de tener en
cuenta los resultados de la tabla de ANOVA por medio de gráficos, la
prueba de Bartlett y la de Levene se analiza el supuesto de
Homocedasticidad es decir ver si habría o no diferencia significativa
entre las varianzas de los tratamientos.
Al final teniendo en cuenta los resultados de la tabla ANOVA y por
medio de la prueba de los Rangos Múltiples de Duncan y la LSD
analizaremos entre que pares de medias existe o no una diferencia
significativa.
OBJETIVOS
 Estudiar si hay diferencias significativas entre las medias de las
temperaturas.
 Realizar el análisis de varianza.
 Verificar la existencia o no de diferencia significativa entre las
medias.
 Determinar un intervalo de confianza para la media de cualquier
tratamiento y una para la diferencia de ellos.
 Verificar el cumplimiento del supuesto de normalidad.
 Verificar si existen datos atípicos.
 Verificar el cumplimiento del supuesto de homocedasticidad.
 Hacer las comparaciones de pares de medias.
 Verificar en que pares de medias existe significancia o no.
Inicialmente establecemos las hipótesis que queremos contrastar
Nuestra hipótesis nula nos indica que no existe diferencia significativa
entre las medias de las temperaturas por lo cual no afectan la
intensidad de corriente. Mientras la alternativa nos dice que si existe
diferencia entre algunas de las medias por lo cual la temperatura sí
afecta la intensidad de corriente.
El modelo estadístico que se va a utilizar es el unifactorial aleatorizado.
Ahora calculamos los valores necesarios para construir nuestra tabla
ANOVA.
Temperatura
Intensidad de Corriente
15
18
13
12
17
21
11
16
23
19
25
22
28
32
34
31
45
51
57
48
̅
14,5
16,25
22,25
31,25
50,25
58
65
89
125
201
̅
Totales
[(
∑∑
)
(
)
(
) ]
(
)
Tratamientos
[(
∑
(
Errores
)
)
(
) ]
(
)
Tabla ANOVA
Fuente de
Variación
Temperaturas
Error
Total
Suma de
Cuadrados
3599,8
Debemos calcular
con nuestro
Grados de
Libertad
4
15
19
Cuadrado
Medio
852,95
12,53
68,06
con un 95% de confiabilidad y contrastar
Entonces nos queda
Por lo tanto, se rechaza
y concluimos que existe diferencia entre
algunas de las medias, por lo cual la temperatura sí afecta la intensidad
de corriente.
A continuación vamos a estimar:
 Intervalo de confianza de 95% para la media 1
 Intervalo de confianza de 95% para la diferencia de medias de los
tratamientos 1 y 2
Intervalo de confianza para
√
̅
√
̅
√
(
√
)√
(
)√
Intervalo de confianza para
̅
√
̅
̅
√
̅
√
(
)√
√
(
)√
Normalidad
Veamos los residuos del ejercicio sobre la intensidad de corriente de
acuerdo a determinada temperatura.
15
17
23
28
45
18
21
19
32
51
0,5
0,75
0,75
3,25
3,5
4,75
13
11
25
34
57
̅
14,5
16,25
22,25
31,25
50,25
12
16
22
31
48
2,75
2,75
6,75
0,75
0,75
Determinamos los rangos para cada
y sus respectivos porcentaje de
probabilidad de acuerdo a la posición.
Rango
1
2
3
4
5
6
7
8
9
10
%
0,025
0,075
0,125
0,175
0,225
0,275
0,325
0,375
0,425
0,475
2,5%
7,5%
12,5%
17,5%
22,5%
27,5%
32,5%
37,5%
42,5%
47,5%
Rango
11
12
13
14
15
16
17
18
19
20
%
0,5
0,75
0,75
0,75
0,75
2,75
2,75
3,5
4,75
6,75
0,525
0,575
0,625
0,675
0,725
0,775
0,825
0,875
0,925
0,975
52,5%
57,5%
62,5%
67,5%
72,5%
77,5%
82,5%
87,5%
92,5%
97,5%
Realizamos la gráfica de los
probabilidad.
vs sus respectivos porcentajes de
Al observarse una tendencia lineal de los puntos en la gráfica podemos
afirmar que los residuos se distribuyen normalmente, cumpliendo así
el supuesto de normalidad.
Prueba Shapiro-Wilks para normalidad.
Tenemos estas hipótesis
Tomando el ejercicio tenemos:
Rango
Rango
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
La varianza de los residuales es:
Los coeficientes serian:
0,5
0,75
0,75
0,75
0,75
2,75
2,75
3,5
4,75
6,75
(
1
2
3
4
5
6
7
8
9
10
[
)
(
(
0,4734
0,3211
0,2565
0,2085
0,1686
0,1334
0,1013
0,0711
0,0422
0,0140
(
)
)
)
(
(
(
(
(
(
(
)
)
)
)
)
)
)
TOTAL
Luego
(
(
)
)(
[∑
)
(
(
[
]
)
(
)
)]
(
)
5,681
3,211
1,731
1,251
0,885
0,4
0,228
0,071
0,042
0,01
13,51
]
Teniendo en cuenta un nivel de confianza del 95% se tiene que:
Por lo tanto no se rechaza , es decir, se cumple el supuesto de
normalidad para los residuales.
Datos Atípicos.
Si analizamos los residuales del ejercicio sobre la intensidad de
corriente de acuerdo a determinada temperatura, observamos que
son respectivamente el menor y mayor de los residuales.
0,5
0,75
0,75
3,25
3,5
4,75
0,75
0,75
2,75
2,75
6,75
√
√
√
Teniendo en cuenta los residuos estandarizados podemos afirmar que
no hay datos atípicos en las observaciones.
Igualdad de Varianzas (Homocedasticidad)
Método gráfico.
Tomando nuestro ejercicio tenemos que:
0,5
0,75
0,75
3,25
̅
14,5
16,25
22,25
31,25
50,25
3,5
4,75
2,75
2,75
6,75
0,75
0,75
8
6
4
2
0
0
-2
-4
-6
10
20
30
40
50
60
Si observamos la gráfica
de los valores predichos
vs los residuales podría
decirse que no se está
cumpliendo
el
supuesto, sin embargo
al ser una pequeña
cantidad
de
datos,
necesitamos hacer la
prueba analítica.
Método analítico.
Prueba de Bartlett
Usamos esta prueba para contrastar las siguientes hipótesis:
En el ejercicio tenemos que:
Temperatura
∑
Intensidad de Corriente
15
18
13
12
17
21
11
16
23
19
25
22
28
32
34
32
45
51
57
48
(
)
(
)
(
)
(
)
[
( )
(
(
7
16,92
6,25
6,33
26,25
)
[
]
(
)
)
(
(
)]
)
( )
[
(
]
)
Observamos que
por ende no se rechaza
la hipótesis nula, es decir, se valida la igualdad de las varianzas de cada
tratamiento.
Prueba de Levene
Inicialmente establecemos las hipótesis que queremos contrastar
Nuestra hipótesis nula nos indica que no existe diferencia significativa
entre las medias. Mientras la alternativa nos dice que si existe
diferencia significativa en al menos una de ellas.
Tomando la tabla original del ejercicio
Temperatura
Intensidad de Corriente
15
18
13
12
17
21
11
16
23
19
25
22
28
32
34
31
45
51
57
48
̃
14
16,5
22,5
31,5
49,5
Tomando la desviación absoluta de las observaciones de cada
tratamiento con la mediana de los tratamientos, denotada de la forma:
|
̃|
Tenemos
̅
1
0,5
0,5
3,5
4,5
4
4,5
3,5
0,5
1,5
1
5,5
2,5
2,5
7,5
2
0,5
0,5
0,5
1,5
8
11
7
7
15
2
2,75
1,75
1,75
3,75
̅
Totales
[( )
∑∑
( )
(
) ]
(
)
Tratamientos
[( )
∑
(
Errores
)
(
) ]
(
)
Tabla ANOVA
Fuente de
Variación
Temperaturas
Error
Total
Suma de
Cuadrados
Debemos calcular
con nuestro
76,8
Grados de
Libertad
4
15
19
Cuadrado
Medio
2,95
4,33
0,68
con un 95% de confiabilidad y contrastar
Entonces nos queda
Por lo tanto, se acepta
y que las deviaciones medias son iguales, por
lo cual las varianzas de las observaciones de los tratamientos también
lo serán.
Comparaciones de pares de medias.
Método de rangos múltiples de Duncan.
Arreglando los promedios de los tratamientos en orden ascendente
tenemos:
̅
̅
̅
̅
̅
El error estándar de cada promedio es
̅
√
√
En el conjunto de rangos significativos de la siguiente tabla para 15
grados de libertad y
, se obtiene
(
)
(
)
(
)
(
)
Por lo tanto, los rangos de significación mínima son
(
)
̅
(
)(
)
(
)
̅
(
)(
)
(
)
̅
(
)(
)
(
)
̅
(
)(
)
Los resultados de las comparaciones serían
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
Por el análisis se observa que hay diferencias significativas entre todos
los pares de medias con excepción de la 1 y 2.
Método por prueba LSD.
Tomando nuestro ejercicio sobre la intensidad de corriente de acuerdo
a determinada temperatura, comparemos con la prueba LSD los pares
de medias.
√
√
(
)
|̅
̅ |
|
|
|̅
̅ |
|
|
( )
|̅
̅ |
|
|
( )
|̅
̅ |
|
|
( )
|̅
̅ |
|
|
( )
(
)(
)
|̅
̅ |
|
|
( )
|̅
̅ |
|
|
( )
|̅
̅ |
|
|
( )
|̅
̅ |
|
|
( )
|̅
̅ |
|
|
( )
Como las diferencias de medias de medias cuyos valores absolutos
superen el estadístico de prueba se consideran estadísticamente
diferentes, podemos decir que todos los pares, excepto
, tienen
diferencias significativas.
CONCLUSIÓN
Concluimos que realizando el método de análisis de varianza (ANOVA),
vimos que existe diferencia significativa entre las medias de
temperaturas.
Realizando después el supuesto de normalidad de manera gráfica y con
la prueba de Shapiro-Wilks, concluimos que los datos tienen una
distribución normal.
Más tarde, gracias a al método gráfico y a las pruebas de Bartlett y
Levene, observamos que cumple el supuesto de homocedasticidad, es
decir, que no existe diferencia significativa entre las varianzas de las
temperaturas.
Por último, aplicando el método de Duncan y la prueba LSD, llegamos a
concluir que existe diferencia significativa entre todos los pares de
medias a excepción de la 1 la 2.
Descargar