7 Método de las Superficies de Respuesta En este capítulo se analizará en qué consiste la Metodología de Superficies de Respuesta, su representación gráfica, el procedimiento a seguir hasta encontrar un óptimo y los diseños experimentales que pueden utilizar. 7.1 Definición. La Metodología de Superficies de Respuesta (RSM) es un conjunto de técnicas matemáticas utilizadas en el tratamiento de problemas en los que una respuesta de interés está influida por varios factores de carácter cuantitativo. El propósito inicial de estas técnicas es diseñar un experimento que proporcione valores razonables de la variable respuesta y, a continuación, determinar el modelo matemático que mejor se ajusta a los datos obtenidos. El objetivo final es establecer los valores de los factores que optimizan el valor de la variable respuesta. Cuando decimos que el valor real esperado, η, que toma la variable de interés considerada está influido por los niveles de k factores cuantitativos, X1, X2, ..., Xk, esto significa que existe alguna función de X1, X2, ..., Xk (que se supone continua en Xi, i = 1, ..., k) que proporciona el correspondiente valor de para alguna combinación dada de niveles: , ,…, (7.1) de tal forma que la variable respuesta puede expresarse como: , ,…, (7.2) donde ε es el error observado en la respuesta. , ,…, existente entre η y los niveles de los k factores puede La relación representarse a través de una hipersuperficie (subconjunto de un espacio euclídeo (k+1)dimensional) a la que llamaremos superficie de respuesta. 7.2 Terminología. Factores. Son las condiciones del proceso que influencian la variable de respuesta. Estos pueden ser cuantitativos o cualitativos. En el presente trabajo los factores se corresponden con el ángulo de la lámina correspondiente, por tanto tendremos tantos factores como número de láminas. Respuesta. Es una cantidad medible cuyo valor se ve afectado al cambiar los niveles de los factores. El interés principal es optimizar dicho valor. En el presente trabajo la Respuesta no es más que el resultado de la aplicación del Criterio de Tsai-Wu. 88 89 Método de las Superficies de Respuesta Función de respuesta. Al decir que un valor de respuesta Y depende de los niveles x1, x2, ... xk de k factores, ξ1, ξ2,... ξk, estamos diciendo que existe una función matemática de x1, x2, ... xk cuyo valor para una combinación dada de los niveles de los factores corresponde a Y, esto es Y=f(x1, x2, ... xk). Función de respuesta predicha. La función de respuesta se puede representar con una ecuación polinomial. El éxito en una investigación de una superficie de respuesta depende de que la respuesta se pueda ajustar a un polinomio de primer o segundo grado. Supongamos que la función de respuesta para los niveles de dos factores se puede expresar utilizando un polinomio de primer grado: (7.3) son los coeficientes de regresión a estimar, x1 y x2 representan los niveles de donde , , x1 y x2 respectivamente. Suponiendo que se dispone de N 3 valores de respuesta (Y), con los estimadores b0, b1 y b2 se obtienen , y respectivamente. Al remplazar los coeficientes de regresión por sus estimadores obtenemos: (7.4) donde denota el valor estimado de Y dado por x1 y x2. Superficie de respuesta. La relación Y=f(x1, x2,... xk) entre Y y los niveles de los k factores x1, x2,... xk representa una superficie. Con k factores la superficie está en k+1 dimensiones. Por ejemplo cuando se tiene Y=f(x1) la superficie esta en dos dimensiones, mientras que si tenemos Y=f(x1, x2.) la superficie está en tres dimensiones. Y x1 x2 Figura 7.1 Superficie de respuesta tridimensional. Gráfica de contornos. Una técnica utilizada para ayudar a visualizar la forma que puede tener una superficie de respuesta tridimensional consiste en representar la gráfica de contornos de la superficie, en la que se trazan las denominadas líneas de contorno, que son curvas correspondientes a valores constantes de la respuesta sobre el plano X1X2 (plano cuyos ejes coordenados vienen dados por los niveles X1 y X2 de los factores). Geométricamente, cada línea de contorno es una proyección sobre el plano X1X2 de una sección de la superficie de respuesta al intersectar con un plano paralelo al X1X2. La gráfica de contornos resulta útil para estudiar los niveles de los factores en los que se da un cambio en la forma o altura de la superficie de respuesta. La existencia de gráficas de contorno no está limitada a 3 dimensiones a pesar de que en el caso en que haya más de 3 factores de influencia no es posible la representación geométrica. No obstante, el hecho de poder representar gráficas de contorno para problemas en que haya 2 o 3 factores permite visualizar más fácilmente la situación general. 90 Método de las Superficies de Respuesta Para generar la gráfica de contornos correspondiente se secciona la superficie de respuesta usando planos paralelos al X1X2 en ciertos valores de respuesta considerados, por ejemplo: Figura 7.2 Gráfica de contornos. 7.3 Polinomio de primer orden. Generalmente se desconoce la relación entre la respuesta y las variables independientes, por ello requerimos un modelo que aproxime la relación funcional entre Y y las variables independientes. Si la respuesta se describe adecuadamente por una función lineal de las variables independientes se utiliza el modelo de primer orden: (7.5) Los parámetros del modelo se estiman mediante el método de mínimos cuadrados. Una vez que se tienen los estimadores se sustituyen en la ecuación y obtenemos el modelo ajustado: (7.6) donde la matriz X puede escribirse alternativamente como X = [ 1 : D ], con D la matriz de combinaciones de niveles de los factores, denominada matriz de diseño. Si la matriz X es de rango completo, entonces el estimador de β obtenido por el método (que es, de hecho, el mejor estimador lineal de β) y la de mínimos cuadrados es . matriz de varianzas-covarianzas de b viene dada por Este modelo se utiliza cuando queremos estudiar el comportamiento de la variable de respuesta únicamente en la región y cuando no conocemos la forma de la superficie. La forma de la función f que determina la relación entre los factores y la variable respuesta es, en general, desconocida, por lo que el primer objetivo de la RSM consiste en establecer experimentalmente una aproximación apropiada de la función f. Para ello, se propone un modelo de ecuación, generalmente polinómico, en los k factores X1, X2, ..., Xk y se selecciona un conjunto de tratamientos sobre los que realizar las observaciones experimentales, que se utilizarán tanto para obtener estimaciones de los coeficientes en el modelo propuesto (por ejemplo, a través del método de mínimos cuadrados) como para obtener una estimación de la variación del error experimental (para lo que es necesario tener al menos 2 observaciones por cada tratamiento). Se realizan, entonces, contrastes sobre las estimaciones de los parámetros y sobre el ajuste del modelo y si el modelo se considera adecuado, puede utilizarse como función 91 Método de las Superficies de Respuesta de aproximación. En tal caso, el estudio de la superficie de respuesta se hace en términos de la superficie ajustada, pues su análisis será aproximadamente equivalente al del sistema real. Los polinomios usados más frecuentemente como funciones de aproximación son los de órdenes uno y dos: Modelo de primer orden: (7.7) 7.4 Análisis del error en el modelo ajustado. Para estimar los coeficientes se requieren N k+1 valores de respuesta (Y). El análisis de los datos se suele representar en una tabla de análisis de varianza. La tabla presenta las diferentes fuentes de variación que contribuyen a la variación total de los datos. La variación total recibe el nombre de suma de cuadrados total SST, y se calcula de la siguiente manera: (7.8) donde Yi es el valor observado en la i-ésima muestra. La suma de cuadrados se compone por la suma de cuadrados debido a la regresión. La fórmula de la suma de cuadrados debido a la regresión es: (7.9) La suma de cuadrados residual, se calcula de la siguiente forma: (7.10) Se puede hacer un análisis del ajuste del modelo con la R2, que es la proporción total de la variación de las Yi con respecto a la media que se puede explicar con la ecuación de regresión ajustada. (7.11) 92 Método de las Superficies de Respuesta 7.5 Método de máxima pendiente en ascenso. El método de máxima pendiente en ascenso consiste en ejecutar una secuencia de experimentos a lo largo de la línea de máximo incremento de la respuesta. Si el modelo ajustado de primer orden es adecuado, la información que éste proporciona se utiliza para determinar una dirección en la cual se espere observar mayores valores de la variable respuesta. A medida que se avanza sobre la superficie ajustada en la dirección en que se incrementan los valores de la respuesta y se va llegando a una región en la que haya curvatura en la superficie real, el incremento en la respuesta se estabilizará en el punto más alto de la superficie ajustada. Si se continúa en esta dirección y la altura de la superficie disminuye, se lleva a cabo un nuevo conjunto de experimentos y se ajusta de nuevo el modelo de primer orden. Se determina una nueva dirección hacia valores crecientes de la respuesta y se ejecuta otra secuencia de experimentos en la dirección determinada. Este proceso continúa hasta que se hace evidente que a partir del método no se puede obtener un incremento en la respuesta o éste es muy pequeño. Si los tests de ajuste detectan que puede haber curvatura en la superficie, se aumenta un grado al modelo añadiéndole los términos del producto cruzado y/o los términos cuadráticos puros y se completa el diseño de primer orden añadiéndole los puntos necesarios para ajustar el nuevo modelo de segundo orden. Si el modelo de segundo orden se ajusta adecuadamente, se utiliza para describir la forma de la superficie a través de la gráfica de contornos en la región experimental. Se utiliza entonces el modelo ajustado de segundo orden para localizar, en el lugar en el que la pendiente de la superficie ajustada es cero, las coordenadas del punto estacionario, que es el punto que proporciona el valor óptimo de la variable respuesta y, si se detecta que éste se encuentra dentro de los límites de la región experimental, se pasa a determinar su naturaleza (si es máximo, mínimo o punto de silla). Si, por el contrario, el punto estacionario no se halla dentro de la región experimental, hemos de realizar una nueva experimentación en la dirección en la que éste se encuentra. Una vez que se ha localizado el punto que proporciona valores óptimos de la variable respuesta, se describe la superficie en un entorno próximo a éste. Frecuentemente la estimación inicial de las condiciones de operación óptimas está alejada del óptimo real, en este caso se desea moverse rápidamente a la vecindad del óptimo. El método de máxima pendiente en ascenso es un procedimiento para recorrer secuencialmente la trayectoria de la máxima pendiente, que nos lleva en dirección del máximo aumento de la respuesta. Cuando se desea la minimización se habla de mínima pendiente en descenso. La dirección de ascenso máximo es en la que aumenta más rápido, ésta es paralela a la normal de la superficie de respuesta ajustada. Los incrementos a lo largo de la trayectoria son proporcionales a los coeficientes de regresión β0, β1, β2,... Los experimentos se llevan a cabo hasta que deje de observarse un incremento en la respuesta, entonces se ajusta un nuevo modelo de primer orden con el que se determina una nueva trayectoria y se continua con el procedimiento. Finalmente, se consigue llegar a la cercanía del óptimo, esto ocurre cuando existe falta de ajuste del modelo de primer orden. 7.5.1 Algoritmo para determinar las coordenadas de un punto en la trayectoria de máxima pendiente en ascenso. Un algoritmo utilizado es el siguiente: Supóngase que el punto x1= x2 = ... = xk =0. 1. Se elige un tamaño de incremento o “escalón” en una de las variables del proceso, digamos Δxj, usualmente se elige la variable de la que más se sabe, o la que tiene el . mayor coeficiente de regresión absoluto 93 Método de las Superficies de Respuesta 2. El tamaño de incremento en las otras variables es Δ (7.12) donde i= 1, 2, ..., k i j. Se convierte Δxi de variables codificadas a variables naturales. 3. 7.6 Diseños experimentales para ajustar superficies de respuesta. El ajuste y análisis de una superficie de respuesta se facilita con la elección apropiada de un diseño experimental. Un diseño es el conjunto específico de combinaciones de los niveles de las k variables que se utilizará al llevar a cabo el experimento. La elección de un diseño adecuado del experimento a realizar es fundamental para modelar y explorar la superficie de respuesta usada para ajustar un modelo polinómico al conjunto de datos recogidos en los puntos del diseño. Así pues, sería deseable que el diseño tuviera, de las características que se enumeran a continuación, y dado que algunas de ellas resultan conflictivas entre sí, las que más sirvan al interés del experimento: 1. 2. 3. 4. 5. 6. 7. Generar una distribución razonable de puntos y, por tanto, de información, en toda la región de interés, pero utilizando el menor número posible de puntos experimentales. Asegurar que, para cada punto x, el valor ajustado, Ŷ(x), está tan cerca como sea posible del valor real, Y(x). Permitir la detección de falta de ajuste en el modelo. Permitir la ejecución de los experimentos en bloques. Permitir la construcción secuencial de diseños de orden creciente. Proporcionar una estimación interna de la varianza del error. Asegurar simplicidad en los cálculos de las estimaciones de los parámetros del modelo. Además de las propiedades mencionadas, sería muy conveniente que el diseño elegido fuera ortogonal y/o invariante por rotación. Un diseño ortogonal es aquel en el que los términos del modelo ajustado son sin correlación y, por tanto, también las estimaciones de los parámetros lo son, en cuyo caso, la varianza de la respuesta esperada en cualquier punto de la región experimental se puede expresar como la suma ponderada de las varianzas de los parámetros estimados del modelo. Por otro lado, en un diseño invariante por rotación, la varianza de Ŷ(x), que depende de la situación del punto x, es función únicamente de la distancia del punto al centro del diseño, lo que significa que es la misma en todos los puntos equidistantes del centro del diseño. Teniendo en cuenta que el objetivo de la RSM es la optimización de la respuesta y que se desconoce la localización del óptimo antes de ejecutar el experimento, esta propiedad resulta muy interesante, puesto que garantiza que el diseño proporciona estimaciones igualmente precisas en todas las direcciones. 94 Método de las Superficies de Respuesta 7.6.1 Diseños para ajustar modelos de primer orden. Si el modelo es una representación adecuada de la respuesta real esperada, entonces el diseño elegido para estimar los parámetros debe proporcionar valores razonables de la respuesta sobre la región de interés. Los diseños considerados con el propósito de recoger datos para ajustar un modelo de primer orden se conocen como diseños de primer orden. Un criterio razonable para la elección de un diseño de primer orden adecuado es la minimización de Var(Ŷ), lo que se logra minimizando la varianza de los estimadores de los parámetros βi, i = 1, ..., k. Hay una única clase de diseños que lo consiguen, los ortogonales, que en los modelos de primer orden son aquellos para los que se verifica que los elementos de fuera son cero, lo que nos permite determinar de manera de la diagonal principal de la matriz independiente los efectos de los k factores (medidos a través de los valores de bi, i = 1, ..., k). Además, se verifica que todo diseño ortogonal de primer orden es invariante por rotación. Una clase única de diseños que minimizan la varianza de los coeficientes de regresión (βi) son los diseños ortogonales de primer orden. Por ortogonal se entiende que los elementos son iguales a cero, lo cual implica que los productos fuera de la diagonal de la matriz cruzados de las columnas de la matriz es igual a cero. En esta clase de diseños ortogonales de primer orden se incluyen: 1. Diseños factoriales 2k. 2. Fracciones de la serie 2k. 3. Diseños simplex. 7.6.2 Diseños factoriales 2k. En un diseño factorial 2k, para cada factor se consideran dos niveles, que pueden codificarse en los valores +1 (para el más alto) y –1 (para el más bajo). Considerando todas las posibles combinaciones de los niveles de los k factores, se obtiene una matriz de diseño de 2k filas, cada una de las cuales representa un tratamiento. Los diseños factoriales 2k presentan el inconveniente de que, salvo que se repitan algunas observaciones, no permiten la estimación del error experimental. Una técnica habitual para incluir repeticiones consiste en aumentar el diseño con algunas observaciones en el centro, pues esto no influye sobre las estimaciones de los parámetros y no altera la ortogonalidad del diseño, aunque como resultado, la estimación de β0 es la media de todas las observaciones. 7.6.3 Fracciones de la serie 2k. Estamos considerando los diseños factoriales 2k para ajustar los modelos de primer orden, pero si se recogen datos en todos los puntos es posible, en realidad, estimar todos los coeficientes de un modelo de la forma: … … (7.13) en el que los términos adicionales de mayor orden están asociados con las interacciones entre los factores. De esta manera, el número de puntos del diseño, y por tanto, el número de observaciones, junto con el número de posibles términos del modelo con parámetros estimables, se incrementan rápidamente a medida que aumenta el número k de factores. 95 Método de las Superficies de Respuesta Así pues, hay que valorar, en función del coste del experimento, si para ajustar un modelo de primer orden es necesario llevar a cabo las 2k combinaciones, o si es más conveniente omitir algunas utilizando únicamente un subconjunto de los puntos de un diseño factorial 2k. Se puede considerar en este último caso una fracción 2-m de un diseño 2k que consiste en 2k-m tratamientos (k ≥ m), siempre y cuando el diseño resultante tenga, al menos, k+1 puntos, que es el número de parámetros que han de estimarse y mantenga las mismas propiedades que las del factorial completo, en particular, sea ortogonal. 7.6.4 Diseño simplex. En este diseño los puntos se localizan en los vértices de una figura regular, ésta tiene k+1 vértices y está en k dimensiones. Para k=2 la figura geométrica es un triángulo equilátero y para k=3 es un tetraedro. Como el número de puntos es igual al número de coeficientes del modelo se recomienda adicionar réplicas en el punto central para que sea posible obtener la varianza del error y/o llevar a cabo la prueba de falta de ajuste. 7.7 Aplicación del RSM a Laminados en Materiales compuestos. El Método de las Superficies de Respuestas consiste en el análisis y planteamiento de experimentos empleados en el modelado matemático de respuestas. En este sentido el método procura identificar la relación entre las variables independientes de un sistema, que son los factores controlables, y las variables dependientes del sistema, que son las respuestas. El Método de las Superficies de Respuestas obtiene una curva o superficie a través de los puntos que resultan de la respuesta del problema estudiado y de la utilización de una función de regresión, también llamada función base. La función base generalmente es un polinomio de primer orden o segundo orden o está compuesta por términos que son funciones trigonométricas. Los coeficientes de la función base pueden ser estimados con una regresión matemática, utilizando el método de los mínimos cuadrados. El modelo empírico resultante es llamado Superficie de Respuesta. En muchas de las aplicaciones donde se hace uso de las Superficies de Respuesta, la forma de relacionar las variables dependientes e independientes es desconocida. De esta forma es necesario aplicar el método SR de forma secuencial, o sea, realizar una primera aproximación para esta relación, utilizando una regresión de bajo grado polinómico e incrementándolo si fuera necesario. Una relación entre las variables dependientes e independientes viene dada de la formulación de la mecánica clásica de laminados, de esta manera la aplicación secuencial de las SR no es necesaria. Se sabe que la formulación de los problemas de compuestos laminados presentan soluciones donde aparecen funciones trigonométricas de seno y coseno, por eso una regresión con una función base compuesta por funciones trigonométricas es una excelente elección para la construcción de un SR [Lee & Lin, 2003]. Como describen [Lee & Lin, 2003], se puede describir la respuesta de la variable de salida, vector y, como: (7.14) donde, 96 Método de las Superficies de Respuesta 1 1 ; (7.15) 1 ; donde ε es el vector error, β representa el vector de coeficientes desconocidos y X es la matriz de funciones base (los multiplicadores de β) evaluados en k experimentos diferentes. El objetivo será, dado un conjunto de valores de y conocidos, obtener los valores de β donde el error ε sea mínimo. La función de error cuadrático es una manera de medir un valor en función de la variación en torno a un valor ideal, y viene dada por: (7.16) Para obtener un valor con mínimo error cuadrático, será necesario satisfacer la condición: 2 (7.17) A partir de la (Eq. 7.17) se obtiene el vector que paso a denominarlo b, y que representa el vector de coeficientes β que minimiza el error cuadrático L: (7.18) La ecuación de regresión estimada por el modelo SR nos proporciona los valores: (7.19) Lee & Lin (2003) también describen un test para un compuesto laminado con el objetivo de verificar el método de las superficies de respuesta. Este test utiliza cinco tipos de funciones base diferentes, con el objetivo de comparar la respuesta utilizando funciones trigonométricas y funciones polinómicas. Debido a la direccionalidad y periodicidad de las fibras de las láminas, las funciones trigonométricas presentan un mejor comportamiento. Para realizar los test se utilizaron cuatro funciones base de las presentadas por [Lee & Lin, 2003]. Estos tipos son: Tipo 1: (7.20) 97 Método de las Superficies de Respuesta Tipo 2: 2 2 (7.21) Tipo 3: 2 2 (7.22) Tipo 4: 2 2 2 2 2 2 (7.23) Donde y es la respuesta de la estructura, x son las variables independientes, n es el número de variables de C,D,E,F,G,H,I y J los coeficientes desconocidos de las funciones base. El número de experimentos, o sea, el número de puntos utilizados para la construcción de la superficie de respuesta, es un factor clave para garantizar una buena respuesta. De acuerdo a [Akira & Ishikawa, 2003], se recomienda utilizar dos veces el número de coeficientes de la función base.