i_Capitulo 5_Superficies de Respuesta

Anuncio
Capitulo 5. Superficies de Respuesta
Sobre el capitulo 5, se puede encontrar los tratamientos estadísticos más completos en los
libros de Cornell (1990), Myers y Montgomery (1995) y en artículos de G.E.P. Box y sus
colaboradores (Box & Wilson, 1951; Box, 1954; Box & Youle, 1955 entre otros).
La metodología de superficie de respuesta (o RSM, de Response Surface Methodology)
es una técnica de optimización basada en planeamientos factoriales que fue introducida por
G.E.P. Box en los años cincuenta, y que desde entonces ha sido usada con gran suceso en el
moldeamiento de diversos procesos industriales. En los textos tradicionales sobre RMS, éstos son
dirigidos a un público con poco conocimiento de estadística y de entendimiento a veces
complicado y hasta otras veces redundante, lo que necesitamos es el aprovechamiento de los
conceptos introducidos de dichos autores para poder presentar los principios básicos de la RMS.
5.1 Metodología de Superficies de Respuesta
La metodología de superficies de respuesta tiene dos etapas distintas, modelamiento y
desplazamiento, que son repetidas tantas veces cuantas fueran necesarias, con el objetivo de
alcanzar una región optima de la superficie investigada. El modelamiento, generalmente es hecho
ajustándose a modelos simples (en general, lineares o cuadráticos) una respuesta obtenidas con
planeamientos factoriales o con planeamientos factoriales ampliados. El desplazamiento se da
siempre a lo largo del camino de máxima inclinación de un determinado modelo que es una
trayectoria en la cual la respuesta varía de forma más pronunciada.
Por ejemplo, se está investigando el efecto de dos factores, concentración de un reactivo y
la velocidad de agitación, en el rendimiento de una determinada reacción. En trabajos previos se
tiene conocimiento que el proceso viene funcionando hace algún tiempo con los valores de esos
factores fijados en 50% y 100rpm, respectivamente, y que los rendimientos medios obtenidos han
sido valorizados en torno de 68%. Ahora se necesita saber si no sería posible mejorar el
rendimiento, seleccionado otros niveles para los factores.
40
5.2 Modelamiento Inicial
5.2.1 Caso 1: Modelamiento lineal. El primer paso para atacar el problema, es investigar
la superficie de respuesta en torno de las condiciones habituales de funcionamiento del proceso,
usando el planeamiento factorial mostrado en la Fig. 5.1, note que el planeamiento contiene un
punto central, y por eso se da tres niveles de cada factor y no apenas dos. Esto nos permitirá
verificar si hay o no falta de ajuste para un modelo linear lo que sería imposible si hubiésemos
usado apenas dos niveles. En la Tabla 5.1, se muestra la matriz de planeamiento y los
rendimientos observados experimentalmente en cada combinación de niveles. En general fueron
realizadas siete pruebas, siendo tres de ellos repeticiones del punto central.
120
V(rpm)
110
100
90
80
40
45
50
55
60
C(%)
Figura 5.1 Planeamiento factorial de dos niveles con punto central
2
Tabla 5.1. Resultados de un planeamiento 2 con punto central
Ensayo
C (%)
V(rpm)
Y (%)
1
45
90
-1
-1
69
2
55
90
1
-1
59
3
45
110
-1
1
78
4
55
110
1
1
67
5
50
100
0
0
68
6
50
100
0
0
66
7
50
100
0
0
69
Fuente: Cornell (1990)
y
representan los valores de los dos factores codificados por las ecuaciones:
41
y
(5.1)
En el análisis vamos admitir que la superficie de respuesta en la región investigada es una función
lineal de los factores y que por lo tanto la respuesta puede ser estimada por la ecuación:
(5.2)
Donde
son los estimadores de los parámetros del modelo y
factores codificados, es de suponer que los valores
representan los
pueden ser obtenidos por el método
de los mínimos cuadrados.
Usando el software de STATISTICA release 7 (http://www.statsoft.com/support/freestatistica-9-trial/), se presenta en la Fig. 5.2, la ventana de presentación para la ejecución de
tareas previas a la obtención de la superficie de respuesta. Se deben estudiar, la interacción de los
principales efectos sobre la variable de respuesta, para el análisis de varianza, el término de error
utilizado para todas las pruebas será de Error Puro, se obtendrá la tabla del ANOVA y finalmente
se obtendrá la superficie de respuesta.
Figura 5.2. Ventana de análisis de superficie de respuesta
42
En la Fig. 5.2, se presentan los efectos involucrados en el proceso de optimización, se
puede observar que las variables de concentración y velocidad de agitación son estadísticamente
significativas (p<0,05) lo mismo se puede observar en el análisis de regresión presentado en la
Fig. 5.3, donde se observa un valor del coeficiente de determinación de 0,97, considerado ser un
valor alto para la predicción de la variable de respuesta.
Figura 5.2 Ventana de Análisis de efectos estimados en el proceso de Optimización
Tabla 5.3. Ventana de Análisis de la Regresión
En la Fig. 5.4, se presenta la tabla del análisis de varianza.
Figura 5.4 Ventana de Análisis de Varianza
En la Fig. 5.5, se presenta la predicción del rendimiento a partir de la ecuación obtenida del
análisis de regresión y comparada con los valores reales o experimentales:
(5.3)
43
Figura 5.5 Rendimiento estimado vs rendimiento real
En la Fig. 5.6, se presenta la superficie de respuesta obtenida, se puede observar que
para bajas concentraciones de reactivo y a altas velocidades de agitación, se obtienen más altos
valores de rendimiento, pudiendo ser las variables de 45% de concentración y de 110RPM de
agitación como los parámetros optimizados para los niveles estudiados.
Superficie ajustada; Variable: Rendimiento (%)
2 factors, 1 Blocks, 7 Runs; MS Pure Error=2,33
58,673
60,745
62,818
64,891
66,964
69,036
71,109
73,182
75,255
77,327
above
Figura 5.6 Superficie de respuesta de la concentración de reactivo vs velocidad de agitación
44
5.2.2 Caso 2: Modelamiento no lineal. Determinar los valores de tiempo(X) y temperatura (Y)
que produce un rendimiento químico máximo en una investigación de laboratorio. Una experiencia
previa, indicó que un tiempo de 75min y temperatura de 130ºC resultó en un buen rendimiento,
también el error estándar del rendimiento fue estimado en 1,5.
En las experiencias iniciales, el investigador vario de 80 para 90minutos y la temperatura de 127,5
2
hasta 32,5ºC. Para una simplificación factorial de 2 con tres ensayos en el punto central fueron
usados. La información de los ensayos en el punto central fue usado para:
1. Estimar el error de la medida
2. Estimar la curvatura de la superficie
2
Un planeamiento factorial de 2 con punto central es apropiado para determinar el modelo lineal
(modelo de 1er orden):
(5.4)
Donde:
:
Rendimiento
:
Tiempo
:
Temperatura
2
El factorial 2 por triplicado en el punto central permite:
1. Determinar el modelo lineal de una manera eficaz
2. Verificar si el modelo planar es adecuado para representar los datos
3. Estimar el error experimental
Primero los niveles de las variables son transformadas en unidades más convenientes:
,
y
45
Tabla 5.2 Planeamiento experimental
Fuente: Statistica release 7(2011)
Un modelo de primer orden es satisfactorio si la superficie tiene poca curvatura en la
región investigada, entonces, los gradientes son los términos del modelo más importante. Esto
normalmente es verdadero si se está investigando una región alejada del máximo. Del mismo
modo, si se está investigando una región donde existe curvatura apreciable, siempre se puede
verificar la precisión del modelo lineal. Si fuera necesario usar un modelo más satisfactorio,
2
nuevos ensayos pueden ser adicionados a aquellos del factorial 2 para su determinación.
Estimativa de los coeficientes:
,
y
:
Verificación de la validación del modelo planar:
La interacción entre el tiempo y temperatura es despreciable.
Verificación de la curvatura:
46
Media de las 4 respuestas del factorial
Media de las respuestas del punto central
, donde,
son coeficientes de
e
de un modelo
cuadrático.
En resumen:
El modelo planar es satisfactorio en esta región de la superficie.
La nueva estimativa del error en el rendimiento usando las respuestas del punto central:
Entonces:
Cuyo valor es próximo a la estimativa inicial de 1,5.
La ecuación para los diagramas de las líneas de contorno para la superficie de respuesta
es:
(5.4)
Luego, la ecuación para la línea de contorno con valor de rendimiento igual a Z es dado
por:
(5.5)
47
Esta ecuación puede ser resuelta para obtener los valores de tiempo y temperatura que
resultaría en un valor de Z previsto por un modelo, juntando todos estos pares de valores de X e Y
resulta la línea de contorno con rendimiento previsto de Z.
Determinación de la validez del modelo lineal usando el test T
Intervalos de confianza de 95% para
El valor de
es significativo en el nivel de confianza de 95%.
Intervalos de confianza de 95% para
Para
: no es estadísticamente significante en el nivel de confianza de 95% (en el nivel de confianza de
80% el valor de
es estadísticamente significante).
Para
: es estadísticamente significante en el nivel de confianza de 95%.
Para
: es estadísticamente significante en el nivel de confianza de 95%.
Calculo del error de la suma:
El intervalo de confianza de 95% para el valor de la suma:
El valor de
no es estadísticamente significativa, al nivel de confianza de 95%.
48
Prueba F
Determinar si una varianza significativa de los datos experimentales es explicada por el modelo:
(5.6)
Suma de los cuadrados de los desvíos experimentales de la media Z:
libertad
; número de medidas
; grados de
.
Varianza total en los datos
(5.7)
Suma de los cuadrados de los desvíos de la media que son previstos por el modelo:
grados de libertad =
;
.
Suma de los cuadrados de las diferencias entre los valores experimentales y aquellos previstos
por el modelo:
; grados de libertad =
La prueba F, envuelve una comparación entre los tres valores de las sumas de los cuadrados,
todas corregidas por sus números de grados de libertad.
(5.8)
(5.9)
(5.10)
En la tabla 5.3, se presenta los valores de la prueba F.
Tabla 5.3 Prueba F
Fuente de
Suma de
G.L.
MSS
F
variación
cuadrados
Regresión
103,09
2
51,54
20,4
Desvíos
10,12
4
2,53
--
Total
113,12
6
--
--
Fuente: elaboración propia (2011)
49
En la tabla para
; resulta que:
, por lo que la regresión es
significante.
El camino de ascendencia máxima (Steepest Ascent Path) es perpendicular a las líneas de
contorno. Podemos representar este camino gráficamente trazando una recta con punto inicial en
2
el punto central del factorial 2 y con inclinación:
; tres ensayos fueron hechas en esta
recta:
Ensayo Nº 8: Mejor respuesta que el factorial.
Ensayo Nº 9: Se extrapola demasiado.
Ensayo Nº 10: máximo rendimiento.
Fue realizado un segundo factorial en el punto central, cerca del punto para el ensayo Nº 10. Los
parámetros para un modelo lineal fueron calculados.
Ensayos Nº 11 hasta 16; nuevo escalamiento para este factorial (tabla Nº 5.4):
Tabla 5.4 Planeamiento experimental-nuevo escalonamiento
Fuente: Statistica release 7(2011)
50
Prueba de validación del modelo lineal:
;
;
Regresion no es significante
;
Como los valores para
,
y
son grandes en relación a sus errores, un modelo
lineal no es adecuado para describir esta región de la superficie (tal vez se encuentre en la región
de un máximo).
Estimativa del error de los ensayos de los puntos centrales
Nueva estimativa del error de la medida = 2,02
Determinación del modelo cuadrático:
(5.11)
Para determinar los valores de los seis coeficientes de una manera eficaz, fueron hechos los
ensayos 17-22 ó planeamiento tipo estrella (Star Design).
Los ensayos 11-22 juntos forman un diseño de compuesto central (“Central Composite Design”).
Para facilitar el cálculo, un programa computacional de regresión lineal múltiple puede ser
usado (Statgraf ó Statistica release 7).
Variable dependiente:
Variable independiente:
Siendo el resultado:
51
Las líneas de contorno:
La superficie es un “Oblique Rising Ridge” el rendimiento aumenta cuando aumentamos la
temperatura y simultáneamente reducimos el tiempo de la reacción, tal como se presenta en la
Fig.5.7.
Verificación de la validez del modelo cuadrático:
Para nuestro conjunto de datos:
El modelo cuadrático es ligeramente inadecuado.
Fitted Surface; Variable: Rend
2 factors, 1 Blocks, 22 Runs; MS Pure Error=3,1535
DV: Rend
Histogram of Raw Residuals
2 factors, 1 Blocks, 22 Runs; MS Pure Error=3,1535
DV: Rend
7
90
90
80
70
60
50
40
6
5
Frecuencia
>
<
<
<
<
<
<
4
3
2
1
0
-12
-10
-8
-6
-4
-2
0
Figura 5.7 Superficie de Respuesta e Histograma de los residuos
Estimativa del error:
52
2
4
6
8
Calidad de la superficie ajustada con los datos:
: Números de parámetros del modelo
: Numero de ensayos
Intervalo de valores para
Tabla 5.5 Prueba F
Fuente de
Suma de los
G.L.
Media
F
variación
cuadrados
Regresión
188,17
5
37,36
9,37
Desvios
24,11
6
4,02
--
Total
212,28
11
--
--
cuadrática
Fuente: elaboración propia (2011)
La regresión es significativa.
53
Descargar