METODOS NUMERICOS UNIDAD Introducción Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo es calcular los valores de la función en un numero discreto de valores en el intervalo de interés. Después se obtiene una función más simple para ajustar dichos valores. Estas dos aplicaciones se conocen como ajuste de curvas. Existen dos métodos para el ajuste de curvas que se distinguen entre si al considerar la cantidad de error asociado con los datos. Primero, si los datos exhiben un grado significativo de error o ruido, la estrategia será obtener una sola curva que represente la tendencia general de los datos. Se construye una curva que siga la tendencia de los puntos tomados como un grupo. Un procedimiento de este tipo se llama REGRESION POR MINIMOS CUADRADOS. Segundo, si se sabe que los datos son muy precisos, el procedimiento básico será colocar una curva o una serie de curvas que pasen por cada uno de los puntos en forma directa. La estimación de valores entre puntos discretos bien conocidos se llama INTERPOLACION. ANTECEDENTE MATEMATICOS La regresión por mínimos cuadrados requiere además de la información en el campo de la estadística. Si usted conoce los conceptos de la media, desviación estándar, suma residual de los cuadrados, distribución normal e intervalos de confianza. Se repasara el estudio del siguiente material como introducción. ING. ADA PAULINA MORA GONZALEZ Página 1 METODOS NUMERICOS UNIDAD ESTADISTICA SIMPLE Supóngase que la tabla 1 contiene 24 lecturas del coeficiente de expansión térmica del acero. Tomados así, los datos ofrecen una información limitada (tienen un mínimo y un máximo). Se obtiene una mayor comprensión al analizar los datos mediante uno o más estadísticos, bien seleccionados, que den tanta información como sea posible acerca de las características especificas del conjunto de datos. TABLA 1. MEDICIONES DEL COEFIC. DE EXPANSION TERMICA DEL ACERDO. (IN °F) 6.495 6.595 6.615 6.635 6.485 6.555 3.665 6.505 6.435 6.625 6.715 6.655 6.755 6.625 6.715 6.575 6.655 6.605 6.565 6.515 6.555 6.395 6.775 6.685 Esos estadísticos descriptivos se seleccionan para presentar: 1. La posición del centro de la distribución de los datos. 2. El grado de dispersión de los datos. El estadístico de posición más común es la media aritmética. Donde define como la suma de los datos (yi) dividida entre el número de datos (n). yi y n ING. ADA PAULINA MORA GONZALEZ Página 2 METODOS NUMERICOS UNIDAD La medida de dispersión más común para una muestra es la desviación estándar (sy) respecto a la media; St Sy n 1 Donde St es la suma total de los cuadrados de las diferencias entre los datos y la media, o St ( yi y ) 2 Así, si las mediciones se encuentran muy dispersas alrededor de la media, St, será grande. Si están agrupadas cerca de ella, la desviación estándar será pequeña. La dispersión también se puede representar por el cuadrado de la desviación estándar, llamada varianza. St S n 1 2 y Un estadístico final que tiene utilidad para cuantificar la dispersión de los datos es el coeficiente de variación (c.v.). Es el cociente de la desviación estándar entre la media. De esta manera, proporciona una medición normalizada de la dispersión. c.v. ING. ADA PAULINA MORA GONZALEZ Sy y 100% Página 3 METODOS NUMERICOS UNIDAD Esta es la razón de una medición de error (sy) respecto a un estimado para los datos del valor verdadero ( y ). Otra característica útil en el presente análisis es la distribución de datos. Un histograma proporciona una representación visual simple de la distribución. Si se tiene un conjunto de datos muy grande, el histograma se puede aproximar mediante una curva suave. La curva simétrica en forma de campana que se sobrepone llamada “distribución normal”. ING. ADA PAULINA MORA GONZALEZ Página 4 METODOS NUMERICOS UNIDAD De la tabla 1. Calcular la media, la varianza, la desviación estándar y el coeficiente de variación para lo sdatos de la tabla. i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Sumatoria yi 6.395 6.435 6.485 6.495 6.505 6.515 6.555 6.555 6.565 6.575 6.595 6.605 6.615 6.625 6.625 6.635 6.655 6.655 6.665 6.685 6.715 6.715 6.755 6.775 158.4 ING. ADA PAULINA MORA GONZALEZ ( yi y )2 0.042025 0.027225 0.013225 0.011025 0.009025 0.007225 0.002025 0.002025 0.001225 0.000625 0.000025 0.000025 0.000225 0.000625 0.000625 0.001225 0.003025 0.003025 0.004225 0.007225 0.013225 0.013225 0.024025 0.30625 0.217000 Página 5 METODOS NUMERICOS UNIDAD Media yi y n = 158.4 6.6 24 Desviación estándar. Sy St n 1 0.217000 0.097133 24 1 La varianza. S y2 = 0.009435 Y el coeficiente de variación. 0.097133 100% 1.47% c.v.= 6.6 ING. ADA PAULINA MORA GONZALEZ Página 6 METODOS NUMERICOS y yi n x UNIDAD FORMULARIO xi n Suma total de los cuadrados Desviación Estándar Varianza St n 1 S y2 St ( yi y )2 Sy S y/ x St n 1 Sr n (m 1) Coeficiente Variación Sy C.V . y *100% Regresión lineal Ecuaciones normales a1 línea recta n xiyi xi yi a0 y a1 x n xi 2 ( xi ) 2 Suma de los cuadrados(respecto a línea recta) Sr ( yi a0 a1xi) Error estándar estimado 2 Coeficiente de determinación r2 y a0 a1 x St Sr St S y/ x Sr n2 Coeficiente de correlación r St Sr St Regresión Polinomial 2 grado Ecuaciones Normales y a0 a1 x a2 x2 Suma de los cuadrados Sr ( yi a0 a1xi a2 xi 2 )2 na0 ( xi)a1 ( xi 2 )a2 yi ( xi)a0 ( xi 2 )a1 ( xi 3 )a2 xiyi ( xi 2 )a0 ( xi 3 )a1 ( xi 4 )a2 xi 2 yi Error estándar estimado S y/ x Sr n (m 1) Coeficiente de determinación r2 St Sr St ING. ADA PAULINA MORA GONZALEZ Coeficiente de correlación r St Sr St Página 7 METODOS NUMERICOS UNIDAD EJEMPLO DE UNA REGRESION LINEAL DANDO VALORES A “x” Y “y”, checar el formulario para ver qué datos se necesitaron y hacer los cálculos para rectificar resultados. Esta es la ecuación de la Recta para cualquier valor de “x” que le queramos asignar y con ello formar la recta para mostrar la tendencia de los datos. ING. ADA PAULINA MORA GONZALEZ Página 8