Análisis de la varianza

Anuncio
República de Venezuela
Universidad Rafael Belloso Chacin
Cátedra: Estadística II
ANÁLISIS DE VARIANZA
Maracaibo, 25 de Octubre de 2.002
Esquema
1.− Análisis de Varianza.
2.− Tipos de Diseño Experimental
2.1.− Modelo Balanceado.
2.2.− Modelo no Balanceado.
2.3.− Diseño de bloques completos aleatorizados.
2.4.− Diseño de Cuadrado Latino.
1) Análisis de Varianza: Es una técnica que se usa para comprobar si existen diferencias significativas entre
los promedios de los tratamientos.
2) Tipos de Diseño Experimental
2.1) Diseños completamente Aleatorios: Supondremos que el experimentador cuenta con los resultados de k
muestras aleatorias independientes, cada una de tamaño n, de k diferentes poblaciones; y le interesa probar la
hipótesis que las medias de esas k poblaciones son toas iguales. Si denotamos j−esima observación en la
i−esima muestra por Yij, el esquema general para un criterio de clasificación es como sigue:
Medias
Muestra 1: Y11, Y12,...., Y1j, ....... Y1
Muestra 2: Y21, Y22,...., Y2j, ....... Y2
1
...
...
...
Muestra i: Yk1, Yi2,...., Yij, ........ Yi
..
..
..
Muestra a: Yk1, Yk2,...., Ykj, ....... Yk / Y
Modelo Estadístico Lineal (Balanceado):
Yij = + Ti + Eij
Yij = Valor de la pésima observación ubicada en el pésimo tratamiento.
= Promedio General
Ti = Efecto del iésimo tratamiento
Bj = Efecto de jésimo tratamiento
Eij = Variación de las observaciones ubicada en el pésimo bloque, utilizando el iésimo tratamiento.
Hipotesis:
Ho: = =..... = k
H1: No todas 'is son iguales
Nivel de significación:
= 0.05 ó 0.01
Estadístico de Prueba:
F = S1²/S²
Regla de Decisión:
Si f>f [(k−1), (k (n−1) ) ] se rechaza Ho
Tomar una muestra y llegar a una decisión.
Suma de Cuadrados
2
STC = Suma total de cuadrado
STC = " " Yij² − Y²..
n.k
SCT = Suma de cuadrados de los tratamientos
SCT = " Yi² − Y²..
nn.k
SCE =Suma de cuadrado del error
SCE = STC−SCT
Cuadrados Medios
S1²= Cuadrado medio de los tratamientos
S1²= SCT
k−1
S² = Cuadrado medio del error
S² = SCE
K(n−1)
Fuente de variación
Tratamiento
Error
Total
Suma de
cuadrados
Grados de
libertad
SCT
SCE
STC
K−1
K(n−1)
n(K−1)
Valor de
Cuadros Medios
F
S1²
S²
F=S1²/S²
2.2) Modelo no Balanceado:
Hipotesis:
Ho: = =..... = k
H1: No todas 'is son iguales
Nivel de significación:
= 0.05 ó 0.01
Estadístico de Prueba:
F = S1²/ S²
3
Regla de Decisión:
Si f>f [(k−1), (k (n−1) ) ] se rechaza Ho
Tomar una muestra y llegar a una decisión.
Suma de Cuadrados
STC = Suma total de cuadrado
STC = " " Yij² − Y²..
N
N = Numero total de observaciones
SCT = Suma de cuadrados de los tratamientos
SCT = " Yi² − Y²..
ni N
SCE = Suma de cuadrado del error
SCE = STC−SCT
Cuadrados Medios
S1²= Cuadrado medio de los tratamientos
S1²= SCT
k−1
S² = Cuadrado medio del error
S² = SCE
N−K
Fuente de variación
Tratamiento
Error
Total
Suma de
cuadrados
Grados de
libertad
SCT
SCE
STC
K−1
N−k
n−1
Valor de
Cuadros Medios
F
S1²
S²
F=S1²/S²
2.3) Diseño de Bloques Aleatorios: La estimación de variable aleatoria a menudo puede reducirse, esto es ,
liberarse de la variabilidad debida a causas extrañas, dividiendo las observaciones de cada clasificación en
bloques. Conviniendo en que Yij denote la observación relativa al i−esimo bloque Yi. la media de las b
observaciones para el i−esimo tratamiento, Y.j la media de las a observaciones en el j−esimo bloque y Y.. la
gran media de las ab observaciones, empleamos el siguiente esquema en esta clase de clasificación con dos
4
criterios:
Bloques
B1 B2 .......Bj ....Bh Medias
Tratamiento 1: Y11, Y12,...., Y1j, .......Y1h Y1.
Tratamiento 2: Y21, Y22,...., Y2j, .......Y2h Y2.
...
...
...
Tratamiento i: Yk1, Yi2,...., Yij, ........Yih Yi.
..
..
..
Tratamiento a: Ya1, Ya2,...., Yaj, ....... Yah Ya.
Medias Y.1 Y.2 Y.j ....... Y.h Y..
Este tipo de esquema se denomina también diseño en bloques aleatorios, siempre que los tratamientos sean
asignados el azar dentro de cada bloque. Nótese que cuando un punto se usa en lugar de un subíndice, esto
significa que la moda se obtiene sumando sobre èl. En el análisis de clasificación con dos criterios cada
tratamiento es representado una vez dentro de cada bloque, el bloque principal consiste en probar la
significancia de las diferencias entre las Yi., o sea probar la hipótesis nula = = ..... = a = 0
Mas aun , quizá convenga probar si la división en bloques ha sido eficaz, esto es, si la hipótesis nula =
= ..... = b = 0 puede rechazarse. En cualquier caso, la hipótesis alterna establece que al menos uno de los
efectos no es cero.
Yij= + Ti + Eij
Yij = Valor de la i−ésima observación ubicada en el i−ésimo tratamiento.
= Promedio General
Ti = Efecto del i−ésimo tratamiento
Bj = Efecto de j−ésimo tratamiento
Eij = Variación de las observaciones ubicada en el pésimo bloque, utilizando el i−ésimo tratamiento.
B = Cantidad de bloques
5
Y.. = Suma de todas las observaciones
Yi. = Suma de todas las observaciones por tratamiento
Y.j = Suma de todas las observaciones por bloques.
Análisis de Varianza
Hipótesis:
Ho: = =..... = k
H1: no todas 'ks son iguales
Ho: = =..... = j
H1: no todas 'js son iguales
Nivel de significación:
= 0.05 ó 0.01
Estadístico de Prueba:
F1= S1²/S² ; F2= S2²/S²
Regla de Decisión:
Si f>f [(k−1), (k (n−1) (b−1)) ] se rechaza Ho
Tomar una muestra y llegar a una decisión.
Suma de Cuadrados
STC = Suma total de cuadrado
STC = " " Yij² − Y²..
n.b
SCT = Suma de cuadrados de los tratamientos
SCT = " Yi² − Y²..
b b.k
SCB = Suma de cuadrados de los bloques
SCB = " Y.j² − Y²..
k b. k
6
SCE = Suma de cuadrado del error
SCE = STC− SCT− SCB
Cuadrados Medios
S1²= Cuadrado medio de los tratamientos
S1²=SCT S2²= SCB
k−1 b−1
S² = Cuadrado medio del error
S² = SCE____
(K−1)(b−1)
Fuente de variación
Tratamiento
Error
Bloques
Total
Suma de
cuadrados
Grados de libertad
SCT
SCB
STE
STC
K−1
b−1
(k−1)(b−1)
B k−1
Cuadros
Medios
S1²
S²
Valor de
F
F = S1²/S²
F2=S2²/S²
2.4) Diseño a Cuadros Latinos: El diseño en bloques aleatorios es adecuado cuando una fuente de
variabilidad extraña se elimina comparando un conjunto de medias muestrales. Una Característica importante
de este tipo de diseño es su balance, que se logra asignando el mismo numero de observaciones a cada
tratamiento de cada bloque. La misma clase de balance puede lograrse en otros tipos de diseño mas
complicados, en los cuales es conveniente eliminar el efecto de varias fuentes extrañas de variabilidad. Con el
fin de comparar tres tratamientos, A, B, C, en presencia de otras fuentes de variabilidad. Por ejemplo, los tres
tratamientos pueden ser métodos de soldadura para conductores eléctricos, y las dos fuentes extrañas de
variabilidad pueden ser diferentes operadores aplicando la soldadura y la utilización de diversos fundentes
para soldar. Si tres operadores y tres fundentes para soldar. Si tres operadores y tres fundentes son
considerados, el experimento podría disponerse según el patrón siguiente:
Fund.1 Fund. 2 Fund. 3
A
C
B
B
A
C
C
B
A
Operador1
Operador2
Operador3
Aquí cada método de soldadura se aplica una sola vez por cada operador junto con cada fundente, y si
existiesen efectos sistemáticos debido a diferencias entre los operadores o entre los fundentes, dichos efectos
7
estarían presentes de igual manera en cada tratamiento, esto es, en cada método de soldadura.
5x5
A
B
C
D
E
B
A
D
E
C
C
E
A
B
D
D
C
E
A
B
E
D
B
C
A
4x4
A
B
C
D
B
C
D
A
C
D
A
B
D
E
B
C
Un arreglo experimental como el que se describió se denomina cuadrado latino. Un cuadrado latino n x n es
un arreglo cuadrado de n distintas, las cuales aparecen solo una vez en cada renglón y en cada columna.
Un experimento de cuadrado latino sin repetición da solo (n−1) (n−2) grados de libertad para estimar el error
experimental. Así, tales experimentos son efectuados en contadas ocasiones sin repetición cuando n es
pequeña, esto es, sin repetir el patrón completo de cuadrado varias veces.
Modelo Estadístico Lineal
Yij = + Ti + Bj + rk + Eijk
Yijk = valor de la i−ésima observación ubicada en la k−ésima columna con la j−esima fila usando el i−esimo
tratamiento.
= Promedio General
Ti = Efecto del iésimo tratamiento
Bj = Efecto de la j−ésima columna
Rk = efecto de la k−esima fila
Eijk = Variación de las observaciones ubicada en la k−ésima columna, con la j−esima fila, usando el i−esimo
tratamiento.
Análisis de Varianza
Hipótesis:
Ho: = =..... = i
H1: no todas 'is son iguales
Ho: = =..... = j
8
H1: no todas 'js son iguales
Ho: = =..... = k
H1: no todas 'ks son iguales
Nivel de significación:
= 0.05 ó 0.01
Estadístico de Prueba:
F1= S1²/S² ; F2= S2²/S² ; F3= S3²/S²
Regla de Decisión:
Si f>f [(r−1) ; (r−2) (r−1)] se rechaza Ho
Tomar una muestra y llegar a una decisión.
Suma de Cuadrados
STC = Suma total de cuadrado
STC = """ Yijk² − Y²..
r²
SCT = Suma de cuadrados de los tratamientos
SCT = " Yi..² − Y²..
r r²
SCF = Suma de cuadrados de las filas
SCF = " Y.j² − Y...²
r r²
SCC = Suma de cuadrados de las columnas
SCC = " Y...k² − Y...²
r r²
SCE = Suma de cuadrado del error
SCE = STC− SCT− SCE − SCC
Cuadrados Medios
9
S1²= Cuadrado medio de los tratamientos
S1²= SCT S2²= SCF S3²= SCC
r−1 r−1 r−1
S² = Cuadrado medio del error
S² = SCE____
(r−2)(r−1)
Suma de
Fuente de variación
cuadrados
Cuadros
Grados de libertad
Medios
Tratamiento
Filas
Bloques
Error
Total
r−1
r−1
r−1
(r−2)(r−1)
r²−1
SCT
SCF
SCC
STE
STC
S1²
S2²
S3²
Valor de
F
F1=S1²/S²
F2=S2²/S²
F3=S3²/S²
10
Descargar