Método de las Superficies de Respuesta

Anuncio
7
Método de las Superficies de
Respuesta
En este capítulo se analizará en qué consiste la Metodología de Superficies de Respuesta,
su representación gráfica, el procedimiento a seguir hasta encontrar un óptimo y los diseños
experimentales que pueden utilizar.
7.1 Definición.
La Metodología de Superficies de Respuesta (RSM) es un conjunto de técnicas
matemáticas utilizadas en el tratamiento de problemas en los que una respuesta de interés está
influida por varios factores de carácter cuantitativo. El propósito inicial de estas técnicas es
diseñar un experimento que proporcione valores razonables de la variable respuesta y, a
continuación, determinar el modelo matemático que mejor se ajusta a los datos obtenidos. El
objetivo final es establecer los valores de los factores que optimizan el valor de la variable
respuesta.
Cuando decimos que el valor real esperado, η, que toma la variable de interés
considerada está influido por los niveles de k factores cuantitativos, X1, X2, ..., Xk, esto significa
que existe alguna función de X1, X2, ..., Xk (que se supone continua en Xi, i = 1, ..., k) que
proporciona el correspondiente valor de para alguna combinación dada de niveles:
,
,…,
(7.1)
de tal forma que la variable respuesta puede expresarse como:
,
,…,
(7.2)
donde ε es el error observado en la respuesta.
, ,…,
existente entre η y los niveles de los k factores puede
La relación
representarse a través de una hipersuperficie (subconjunto de un espacio euclídeo (k+1)dimensional) a la que llamaremos superficie de respuesta.
7.2 Terminología.
Factores. Son las condiciones del proceso que influencian la variable de respuesta.
Estos pueden ser cuantitativos o cualitativos. En el presente trabajo los factores se corresponden
con el ángulo de la lámina correspondiente, por tanto tendremos tantos factores como número
de láminas.
Respuesta. Es una cantidad medible cuyo valor se ve afectado al cambiar los niveles
de los factores. El interés principal es optimizar dicho valor. En el presente trabajo la Respuesta
no es más que el resultado de la aplicación del Criterio de Tsai-Wu.
88 89
Método de las Superficies de Respuesta Función de respuesta. Al decir que un valor de respuesta Y depende de los niveles
x1, x2, ... xk de k factores, ξ1, ξ2,... ξk, estamos diciendo que existe una función matemática de x1,
x2, ... xk cuyo valor para una combinación dada de los niveles de los factores corresponde a Y,
esto es Y=f(x1, x2, ... xk).
Función de respuesta predicha. La función de respuesta se puede representar con
una ecuación polinomial. El éxito en una investigación de una superficie de respuesta depende de
que la respuesta se pueda ajustar a un polinomio de primer o segundo grado.
Supongamos que la función de respuesta para los niveles de dos factores se puede
expresar utilizando un polinomio de primer grado:
(7.3)
son los coeficientes de regresión a estimar, x1 y x2 representan los niveles de
donde , ,
x1 y x2 respectivamente. Suponiendo que se dispone de N 3 valores de respuesta (Y), con los
estimadores b0, b1 y b2 se obtienen , y
respectivamente. Al remplazar los coeficientes de
regresión por sus estimadores obtenemos:
(7.4)
donde
denota el valor estimado de Y dado por x1 y x2.
Superficie de respuesta. La relación Y=f(x1, x2,... xk) entre Y y los niveles de los k
factores x1, x2,... xk representa una superficie. Con k factores la superficie está en k+1
dimensiones. Por ejemplo cuando se tiene Y=f(x1) la superficie esta en dos dimensiones,
mientras que si tenemos Y=f(x1, x2.) la superficie está en tres dimensiones.
Y
x1 x2
Figura 7.1 Superficie de respuesta tridimensional.
Gráfica de contornos.
Una técnica utilizada para ayudar a visualizar la forma que puede tener una superficie
de respuesta tridimensional consiste en representar la gráfica de contornos de la superficie, en la
que se trazan las denominadas líneas de contorno, que son curvas correspondientes a valores
constantes de la respuesta sobre el plano X1X2 (plano cuyos ejes coordenados vienen dados por
los niveles X1 y X2 de los factores). Geométricamente, cada línea de contorno es una proyección
sobre el plano X1X2 de una sección de la superficie de respuesta al intersectar con un plano
paralelo al X1X2. La gráfica de contornos resulta útil para estudiar los niveles de los factores en
los que se da un cambio en la forma o altura de la superficie de respuesta. La existencia de
gráficas de contorno no está limitada a 3 dimensiones a pesar de que en el caso en que haya más
de 3 factores de influencia no es posible la representación geométrica. No obstante, el hecho de
poder representar gráficas de contorno para problemas en que haya 2 o 3 factores permite
visualizar más fácilmente la situación general.
90
Método de las Superficies de Respuesta Para generar la gráfica de contornos correspondiente se secciona la superficie de
respuesta usando planos paralelos al X1X2 en ciertos valores de respuesta considerados, por
ejemplo:
Figura 7.2 Gráfica de contornos.
7.3 Polinomio de primer orden.
Generalmente se desconoce la relación entre la respuesta y las variables independientes,
por ello requerimos un modelo que aproxime la relación funcional entre Y y las variables
independientes. Si la respuesta se describe adecuadamente por una función lineal de las variables
independientes se utiliza el modelo de primer orden:
(7.5)
Los parámetros del modelo se estiman mediante el método de mínimos cuadrados. Una
vez que se tienen los estimadores se sustituyen en la ecuación y obtenemos el modelo ajustado:
(7.6)
donde la matriz X puede escribirse alternativamente como X = [ 1 : D ], con D la matriz de
combinaciones de niveles de los factores, denominada matriz de diseño.
Si la matriz X es de rango completo, entonces el estimador de β obtenido por el método
(que es, de hecho, el mejor estimador lineal de β) y la
de mínimos cuadrados es
.
matriz de varianzas-covarianzas de b viene dada por
Este modelo se utiliza cuando queremos estudiar el comportamiento de la variable de
respuesta únicamente en la región y cuando no conocemos la forma de la superficie.
La forma de la función f que determina la relación entre los factores y la variable
respuesta es, en general, desconocida, por lo que el primer objetivo de la RSM consiste en
establecer experimentalmente una aproximación apropiada de la función f. Para ello, se propone
un modelo de ecuación, generalmente polinómico, en los k factores X1, X2, ..., Xk y se selecciona
un conjunto de tratamientos sobre los que realizar las observaciones experimentales, que se
utilizarán tanto para obtener estimaciones de los coeficientes en el modelo propuesto (por
ejemplo, a través del método de mínimos cuadrados) como para obtener una estimación de la
variación del error experimental (para lo que es necesario tener al menos 2 observaciones por
cada tratamiento). Se realizan, entonces, contrastes sobre las estimaciones de los parámetros y
sobre el ajuste del modelo y si el modelo se considera adecuado, puede utilizarse como función
91
Método de las Superficies de Respuesta de aproximación. En tal caso, el estudio de la superficie de respuesta se hace en términos de la
superficie ajustada, pues su análisis será aproximadamente equivalente al del sistema real.
Los polinomios usados más frecuentemente como funciones de aproximación son los de
órdenes uno y dos:
Modelo de primer orden:
(7.7)
7.4 Análisis del error en el modelo ajustado.
Para estimar los coeficientes se requieren N k+1 valores de respuesta (Y). El análisis de
los datos se suele representar en una tabla de análisis de varianza. La tabla presenta las
diferentes fuentes de variación que contribuyen a la variación total de los datos. La variación
total recibe el nombre de suma de cuadrados total SST, y se calcula de la siguiente manera:
(7.8)
donde Yi es el valor observado en la i-ésima muestra.
La suma de cuadrados se compone por la suma de cuadrados debido a la regresión. La
fórmula de la suma de cuadrados debido a la regresión es:
(7.9)
La suma de cuadrados residual, se calcula de la siguiente forma:
(7.10)
Se puede hacer un análisis del ajuste del modelo con la R2, que es la proporción total de
la variación de las Yi con respecto a la media que se puede explicar con la ecuación de regresión
ajustada.
(7.11)
92
Método de las Superficies de Respuesta 7.5 Método de máxima pendiente en ascenso.
El método de máxima pendiente en ascenso consiste en ejecutar una secuencia de
experimentos a lo largo de la línea de máximo incremento de la respuesta. Si el modelo ajustado
de primer orden es adecuado, la información que éste proporciona se utiliza para determinar una
dirección en la cual se espere observar mayores valores de la variable respuesta. A medida que se
avanza sobre la superficie ajustada en la dirección en que se incrementan los valores de la
respuesta y se va llegando a una región en la que haya curvatura en la superficie real, el
incremento en la respuesta se estabilizará en el punto más alto de la superficie ajustada. Si se
continúa en esta dirección y la altura de la superficie disminuye, se lleva a cabo un nuevo
conjunto de experimentos y se ajusta de nuevo el modelo de primer orden. Se determina una
nueva dirección hacia valores crecientes de la respuesta y se ejecuta otra secuencia de
experimentos en la dirección determinada. Este proceso continúa hasta que se hace evidente que
a partir del método no se puede obtener un incremento en la respuesta o éste es muy pequeño.
Si los tests de ajuste detectan que puede haber curvatura en la superficie, se aumenta un
grado al modelo añadiéndole los términos del producto cruzado y/o los términos cuadráticos
puros y se completa el diseño de primer orden añadiéndole los puntos necesarios para ajustar el
nuevo modelo de segundo orden. Si el modelo de segundo orden se ajusta adecuadamente, se
utiliza para describir la forma de la superficie a través de la gráfica de contornos en la región
experimental. Se utiliza entonces el modelo ajustado de segundo orden para localizar, en el lugar
en el que la pendiente de la superficie ajustada es cero, las coordenadas del punto estacionario,
que es el punto que proporciona el valor óptimo de la variable respuesta y, si se detecta que éste
se encuentra dentro de los límites de la región experimental, se pasa a determinar su naturaleza
(si es máximo, mínimo o punto de silla). Si, por el contrario, el punto estacionario no se halla
dentro de la región experimental, hemos de realizar una nueva experimentación en la dirección
en la que éste se encuentra. Una vez que se ha localizado el punto que proporciona valores
óptimos de la variable respuesta, se describe la superficie en un entorno próximo a éste.
Frecuentemente la estimación inicial de las condiciones de operación óptimas está
alejada del óptimo real, en este caso se desea moverse rápidamente a la vecindad del óptimo. El
método de máxima pendiente en ascenso es un procedimiento para recorrer secuencialmente la
trayectoria de la máxima pendiente, que nos lleva en dirección del máximo aumento de la
respuesta. Cuando se desea la minimización se habla de mínima pendiente en descenso. La
dirección de ascenso máximo es en la que aumenta más rápido, ésta es paralela a la normal de
la superficie de respuesta ajustada. Los incrementos a lo largo de la trayectoria son
proporcionales a los coeficientes de regresión β0, β1, β2,...
Los experimentos se llevan a cabo hasta que deje de observarse un incremento en la
respuesta, entonces se ajusta un nuevo modelo de primer orden con el que se determina una
nueva trayectoria y se continua con el procedimiento. Finalmente, se consigue llegar a la
cercanía del óptimo, esto ocurre cuando existe falta de ajuste del modelo de primer orden.
7.5.1 Algoritmo para determinar las coordenadas de
un punto en la trayectoria de máxima pendiente en
ascenso.
Un algoritmo utilizado es el siguiente:
Supóngase que el punto x1= x2 = ... = xk =0.
1.
Se elige un tamaño de incremento o “escalón” en una de las variables del proceso,
digamos Δxj, usualmente se elige la variable de la que más se sabe, o la que tiene el
.
mayor coeficiente de regresión absoluto
93
Método de las Superficies de Respuesta 2.
El tamaño de incremento en las otras variables es
Δ
(7.12)
donde i= 1, 2, ..., k i
j.
Se convierte Δxi de variables codificadas a variables naturales.
3.
7.6 Diseños experimentales para ajustar superficies
de respuesta.
El ajuste y análisis de una superficie de respuesta se facilita con la elección apropiada
de un diseño experimental.
Un diseño es el conjunto específico de combinaciones de los niveles de las k variables que
se utilizará al llevar a cabo el experimento.
La elección de un diseño adecuado del experimento a realizar es fundamental para
modelar y explorar la superficie de respuesta usada para ajustar un modelo polinómico al
conjunto de datos recogidos en los puntos del diseño. Así pues, sería deseable que el diseño
tuviera, de las características que se enumeran a continuación, y dado que algunas de ellas
resultan conflictivas entre sí, las que más sirvan al interés del experimento:
1.
2.
3.
4.
5.
6.
7.
Generar una distribución razonable de puntos y, por tanto, de información, en toda la
región de interés, pero utilizando el menor número posible de puntos experimentales.
Asegurar que, para cada punto x, el valor ajustado, Ŷ(x), está tan cerca como sea
posible del valor real, Y(x).
Permitir la detección de falta de ajuste en el modelo.
Permitir la ejecución de los experimentos en bloques.
Permitir la construcción secuencial de diseños de orden creciente.
Proporcionar una estimación interna de la varianza del error.
Asegurar simplicidad en los cálculos de las estimaciones de los parámetros del modelo.
Además de las propiedades mencionadas, sería muy conveniente que el diseño elegido
fuera ortogonal y/o invariante por rotación.
Un diseño ortogonal es aquel en el que los términos del modelo ajustado son sin
correlación y, por tanto, también las estimaciones de los parámetros lo son, en cuyo caso, la
varianza de la respuesta esperada en cualquier punto de la región experimental se puede
expresar como la suma ponderada de las varianzas de los parámetros estimados del modelo.
Por otro lado, en un diseño invariante por rotación, la varianza de Ŷ(x), que depende de la
situación del punto x, es función únicamente de la distancia del punto al centro del diseño, lo
que significa que es la misma en todos los puntos equidistantes del centro del diseño. Teniendo
en cuenta que el objetivo de la RSM es la optimización de la respuesta y que se desconoce la
localización del óptimo antes de ejecutar el experimento, esta propiedad resulta muy interesante,
puesto que garantiza que el diseño proporciona estimaciones igualmente precisas en todas las
direcciones.
94
Método de las Superficies de Respuesta 7.6.1 Diseños para ajustar modelos de primer orden.
Si el modelo es una representación adecuada de la respuesta real esperada, entonces el
diseño elegido para estimar los parámetros debe proporcionar valores razonables de la respuesta
sobre la región de interés. Los diseños considerados con el propósito de recoger datos para
ajustar un modelo de primer orden se conocen como diseños de primer orden.
Un criterio razonable para la elección de un diseño de primer orden adecuado es la
minimización de Var(Ŷ), lo que se logra minimizando la varianza de los estimadores de los
parámetros βi, i = 1, ..., k. Hay una única clase de diseños que lo consiguen, los ortogonales, que
en los modelos de primer orden son aquellos para los que se verifica que los elementos de fuera
son cero, lo que nos permite determinar de manera
de la diagonal principal de la matriz
independiente los efectos de los k factores (medidos a través de los valores de bi, i = 1, ..., k).
Además, se verifica que todo diseño ortogonal de primer orden es invariante por rotación.
Una clase única de diseños que minimizan la varianza de los coeficientes de regresión
(βi) son los diseños ortogonales de primer orden. Por ortogonal se entiende que los elementos
son iguales a cero, lo cual implica que los productos
fuera de la diagonal de la matriz
cruzados de las columnas de la matriz es igual a cero. En esta clase de diseños ortogonales de
primer orden se incluyen:
1. Diseños factoriales 2k.
2. Fracciones de la serie 2k.
3. Diseños simplex.
7.6.2 Diseños factoriales 2k.
En un diseño factorial 2k, para cada factor se consideran dos niveles, que pueden
codificarse en los valores +1 (para el más alto) y –1 (para el más bajo). Considerando todas las
posibles combinaciones de los niveles de los k factores, se obtiene una matriz de diseño de 2k
filas, cada una de las cuales representa un tratamiento.
Los diseños factoriales 2k presentan el inconveniente de que, salvo que se repitan algunas
observaciones, no permiten la estimación del error experimental. Una técnica habitual para
incluir repeticiones consiste en aumentar el diseño con algunas observaciones en el centro, pues
esto no influye sobre las estimaciones de los parámetros y no altera la ortogonalidad del diseño,
aunque como resultado, la estimación de β0 es la media de todas las observaciones.
7.6.3 Fracciones de la serie 2k.
Estamos considerando los diseños factoriales 2k para ajustar los modelos de primer
orden, pero si se recogen datos en todos los puntos es posible, en realidad, estimar todos los
coeficientes de un modelo de la forma:
…
…
(7.13)
en el que los términos adicionales de mayor orden están asociados con las interacciones entre los
factores. De esta manera, el número de puntos del diseño, y por tanto, el número de
observaciones, junto con el número de posibles términos del modelo con parámetros estimables,
se incrementan rápidamente a medida que aumenta el número k de factores.
95
Método de las Superficies de Respuesta Así pues, hay que valorar, en función del coste del experimento, si para ajustar un
modelo de primer orden es necesario llevar a cabo las 2k combinaciones, o si es más conveniente
omitir algunas utilizando únicamente un subconjunto de los puntos de un diseño factorial 2k. Se
puede considerar en este último caso una fracción 2-m de un diseño 2k que consiste en 2k-m
tratamientos (k ≥ m), siempre y cuando el diseño resultante tenga, al menos, k+1 puntos, que es
el número de parámetros que han de estimarse y mantenga las mismas propiedades que las del
factorial completo, en particular, sea ortogonal.
7.6.4 Diseño simplex.
En este diseño los puntos se localizan en los vértices de una figura regular, ésta tiene
k+1 vértices y está en k dimensiones. Para k=2 la figura geométrica es un triángulo equilátero y
para k=3 es un tetraedro. Como el número de puntos es igual al número de coeficientes del
modelo se recomienda adicionar réplicas en el punto central para que sea posible obtener la
varianza del error y/o llevar a cabo la prueba de falta de ajuste.
7.7 Aplicación del RSM a Laminados en Materiales
compuestos.
El Método de las Superficies de Respuestas consiste en el análisis y planteamiento de
experimentos empleados en el modelado matemático de respuestas. En este sentido el método
procura identificar la relación entre las variables independientes de un sistema, que son los
factores controlables, y las variables dependientes del sistema, que son las respuestas.
El Método de las Superficies de Respuestas obtiene una curva o superficie a través de los
puntos que resultan de la respuesta del problema estudiado y de la utilización de una función de
regresión, también llamada función base. La función base generalmente es un polinomio de
primer orden o segundo orden o está compuesta por términos que son funciones trigonométricas.
Los coeficientes de la función base pueden ser estimados con una regresión matemática,
utilizando el método de los mínimos cuadrados. El modelo empírico resultante es llamado
Superficie de Respuesta.
En muchas de las aplicaciones donde se hace uso de las Superficies de Respuesta, la
forma de relacionar las variables dependientes e independientes es desconocida. De esta forma es
necesario aplicar el método SR de forma secuencial, o sea, realizar una primera aproximación
para esta relación, utilizando una regresión de bajo grado polinómico e incrementándolo si fuera
necesario.
Una relación entre las variables dependientes e independientes viene dada de la
formulación de la mecánica clásica de laminados, de esta manera la aplicación secuencial de las
SR no es necesaria.
Se sabe que la formulación de los problemas de compuestos laminados presentan
soluciones donde aparecen funciones trigonométricas de seno y coseno, por eso una regresión con
una función base compuesta por funciones trigonométricas es una excelente elección para la
construcción de un SR [Lee & Lin, 2003].
Como describen [Lee & Lin, 2003], se puede describir la respuesta de la variable de
salida, vector y, como:
(7.14) donde,
96
Método de las Superficies de Respuesta 1
1
;
(7.15)
1
; donde ε es el vector error, β representa el vector de coeficientes desconocidos y X es la matriz de
funciones base (los multiplicadores de β) evaluados en k experimentos diferentes.
El objetivo será, dado un conjunto de valores de y conocidos, obtener los valores de β
donde el error ε sea mínimo. La función de error cuadrático es una manera de medir un valor en
función de la variación en torno a un valor ideal, y viene dada por:
(7.16) Para obtener un valor con mínimo error cuadrático, será necesario satisfacer la
condición:
2
(7.17) A partir de la (Eq. 7.17) se obtiene el vector
que paso a denominarlo b, y que
representa el vector de coeficientes β que minimiza el error cuadrático L:
(7.18) La ecuación de regresión estimada por el modelo SR nos proporciona los valores:
(7.19) Lee & Lin (2003) también describen un test para un compuesto laminado con el objetivo
de verificar el método de las superficies de respuesta. Este test utiliza cinco tipos de funciones
base diferentes, con el objetivo de comparar la respuesta utilizando funciones trigonométricas y
funciones polinómicas. Debido a la direccionalidad y periodicidad de las fibras de las láminas, las
funciones trigonométricas presentan un mejor comportamiento.
Para realizar los test se utilizaron cuatro funciones base de las presentadas por [Lee &
Lin, 2003]. Estos tipos son:
Tipo 1:
(7.20) 97
Método de las Superficies de Respuesta Tipo 2:
2
2
(7.21) Tipo 3:
2
2
(7.22) Tipo 4:
2
2
2
2
2
2
(7.23) Donde y es la respuesta de la estructura, x son las variables independientes, n es el
número de variables de C,D,E,F,G,H,I y J los coeficientes desconocidos de las funciones base.
El número de experimentos, o sea, el número de puntos utilizados para la
construcción de la superficie de respuesta, es un factor clave para garantizar una buena
respuesta.
De acuerdo a [Akira & Ishikawa, 2003], se recomienda utilizar dos veces el número de
coeficientes de la función base.
Descargar