El ajuste de m¶³nimos cuadrados a partir del concepto de valores medios o \c¶omo ajustar por m¶³nimos cuadrados sin minimizar ni elevar al cuadrado" Or la n d o Gu z m ¶a n a y D o lo r e s A ya la b a D e p a r t a m e n t o d e In g e n ie r ¶ ³a Qu ¶ ³m ic a , U n ive r s id a d d e W is c o n s in -Ma d is o n o r la n d o @c h e .wis c .e d u b D e p a r t a m e n t o d e F¶ ³s ic a , U n ive r s id a d A u t ¶o n o m a Me t r o p o lit a n a -Iz t a p a la p a d a v@xa n u m .u a m .m x Recibido: 2 de Mayo de 2002. Aceptado: 7 de Agosto de 2002. Introducci¶ on Los profesores de M¶etodo Experimental de la Divisi¶ on de Ciencias B¶ asicas e Ingenier¶³a de la Unidad Iztapalapa, con mucha frecuencia nos enfrentamos a la di¯cultad que tienen los estudiantes de entender y aplicar el m¶etodo de m¶³nimos cuadrados para el ajuste de rectas en relaciones funcionales lineales. En este trabajo nos proponemos presentarles una forma alternativa de conducir a los estudiantes a la obtenci¶ on de los par¶ ametros de la recta, que no requiere minimizar las funci¶ on del cuadrado de las desviaciones de los puntos a la recta buscada. Resumen Se presenta una forma alternativa de determinar los par¶ ametros del ajuste por m¶³nimos cuadrados de una relaci¶ on lineal, con un procedimiento usado en econometr¶³a que esperamos facilite la comprensi¶ on a los alumnos a los que se les di¯culta el procedimiento est¶ andar. \. . . por ejemplo, la educaci¶on. Un tipo llega y observa la manera en que se ense~ nan las matem¶aticas. Y dice: |Tengo una mejor idea, voy a hacer una computadora de juguete y ense~ nar con ella{ As¶³ que lo intenta con un grupo. . . y le gusta lo que hace, se emociona. . . Los ni~ nos saben que es algo nuevo, as¶³ que tambi¶en se emocionan y aprenden muy, muy bien. . . Pero lo que realmente usted quiere saber es, si le da este m¶etodo descrito en un libro a un maestro promedio (y tiene que haber maestros promedio, hay maestros en todo el mundo y tiene que haber alguno que sea promedio), qui¶en recibe este libro y trata de ense~ nar con el m¶etodo descrito, >ser¶ a mejor o no?" Esperamos que este planteamiento alternativo sea de utilidad did¶ actica y que ayude a los alumnos a visualizar el problema y la obtenci¶ on de los par¶ametros de ajuste. Dejamos el tratamiento en su expresi¶on m¶ as usual y elemental, de manera que podamos dar una alternativa a la comprensi¶ on del planteamiento de m¶³nimos cuadrados, en su forma m¶ as com¶ un y general. El m¶etodo de m¶³nimos cuadrados es un procedimiento muy popular para obtener par¶ ametros para un modelo lineal a partir de datos emp¶³ricos[1] Para este ¯n se construye y resuelve un sistema de ecuaciones simult¶ aneas (llamadas ecuaciones normales) que deber¶ an satisfacer los par¶ ametros. {Richard Feynman. The Pleasure of Finding Things Out En su forma elemental, para un modelo de la forma y(x) = mx + b se procede de la manera siguiente: Se considera un conjunto de N pares ordenados (xi ; yi ) de datos emp¶³ricos y se de¯ne una funci¶ on Q(m; b) 51 52 ContactoS 45, 51{61 (2002) como la suma de los cuadrados de las desviaciones: di = yi ¡ mxi ¡ b, Q(m; b) = N X i= 1 d21 = N X (yi ¡ mxi ¡ b)2 i= 1 A medida que m y b se alejan de los valores correctos, las desviaciones di se vuelven m¶as y m¶as grandes. Por lo tanto, para encontrar los valores ¶optimos de m y b, hay que encontrar el m¶³nimo de Q. La manera habitual es aplicar el c¶alculo diferencial y requerir que las derivadas parciales de Q con respecto a m y b se anulen: 0 = 0 = N X @Q = ¡2 (yi ¡ mxi ¡ b) @b i= 1 N X @Q = ¡2 xi (yi ¡ mxi ¡ b) @m i= 1 Estas dos ecuaciones son las ecuaciones normales que se deben resolver para hallar m y b, pero el procedimiento y la l¶ ogica de su obtenci¶on son poco accesibles para algunos estudiantes. En este art¶³culo presentamos una forma alternativa de arribar a las ecuaciones normales. Consideramos que es conveniente tener m¶as de una forma de ense~ nar temas dif¶³ciles, de manera que los estudiantes que no comprenden un procedimiento en particular, puedan acceder a otras formulaciones que les sean m¶ as accesibles. Esta formulaci¶ on alternativa es bien conocida en econometr¶³a [2] y se basa en aplicaciones sucesivas del concepto de valor medio de una variable aleatoria. Nos parece conveniente incluir en este trabajo una introducci¶ on gradual a este concepto, para que los estudiantes menos familiarizados con ¶el, puedan entender despu¶es c¶omo se aplica a la obtenci¶on de las ecuaciones normales. Por esta raz¶ on, las secciones 1 a 3 son introducciones informales a los conceptos de probabilidad, valor medio y varianza de una variable aleatoria [3]. La secci¶ on 4 generaliza estos conceptos para el caso de dos variables e introduce la covarianza. Finalmente, en la secci¶on 5 se analizan las desviaciones respecto al modelo que tendr¶an los datos experimentales a medida que dicho modelo se aproxima o se aleja del \modelo correcto". Esta pr¶ actica puede estimular que los estudiantes analicen sus resultados en t¶erminos de gr¶ a¯cos de desviaciones y emitan juicios cr¶³ticos sobre si un modelo es \razonable o no" para representar un conjunto determinado de datos, en vez de usar mec¶ anicamente las ecuaciones normales o peor a¶ un, una calculadora, para obtener \la m y la b" que caracterizan la mejor recta. 1. La probabilidad y sus reglas En la naturaleza observamos muchos ejemplos de procesos aleatorios, es decir, situaciones cuyos resultados no podemos predecir con absoluta certeza. Algunos ejemplos cl¶ asicos son el lanzamiento de un dado o de una moneda, un partido de f¶ utbol y una loter¶³a. Con frecuencia, tambi¶en podemos ver que la medici¶ on de una magnitud f¶³sica es un proceso aleatorio. Por ejemplo, el voltaje entre los polos de una bater¶³a AA no ser¶ a siempre 1.5 V. Aunque no se pueda predecir el resultado de un proceso aleatorio A, al menos podemos identi¯car el conjunto de todos los posibles resultados que cabe esperar de dicho proceso: UA = fa1; a2; a3; : : :g. M¶ as a¶ un, en muchas ocasiones es posible cuanti¯car nuestras expectativas de que se obtenga un resultado dado. Por poner un ejemplo, supongamos que el proceso A es un partido de f¶ utbol entre M¶exico (MX) y Brasil. En este caso, el universo de resultados de A consta tan s¶ olo de tres elementos: UA =a1 = MX pierde, a2 = MX empata, a3 = MX gana. Para acercarnos m¶ as al caso en que se miden magnitudes f¶³sicas, digamos que los resultados de A son los puntos que gana la selecci¶ on mexicana tras el partido. En este caso, los elementos de UA son n¶ umeros: UA = f0; 1; 2g: Ahora pasamos al asunto de especi¯car nuestras expectativas de que se produzca cada uno de los posibles resultados. Como aceptamos desde el principio, no podemos predecir con certeza el resultado de ning¶ un partido, en particular, entre M¶exico y Brasil, pero en general esperamos que M¶exico gane una fracci¶ on relativamente peque~ na de los encuentros, que empate en una fracci¶ on un poco mayor y el resto de los encuentros los pierda. Para formalizar esta idea imaginaremos que asistimos a una serie de N partidos entre M¶exico y Brasil, y contamos el n¶ umero de veces n(a) que se obtiene cada resultado particular a. Como el m¶ aximo El ajuste de m¶³nimos cuadrados . . . F. Orlando Guzm¶ an y Dolores Ayala. a 0 1 2 53 P (a) 0.50 0.30 0.20 T a bla 1 . D istribuc i¶o n de pro ba bilida de s de q ue M ¶e x ic o o bte ng a a punto s e n un pa rtido c o ntra Bra sil. X P (a) = 1; a es decir, estamos seguros que el resultado del proceso aleatorio ser¶ a uno entre todos los elementos de UA . F ig . 1 . Gr¶a ¯c a de la distribuc i¶o n de pro ba bilida de s P (a) de la T a bla 1 . de n(a) es el total N , la fracci¶on de veces que se obtiene el resultado a esta acotada ente cero y uno: Tambi¶en podemos calcular la probabilidad de resultados \m¶ as complejos", por ejemplo, >cu¶ al es la probabilidad del resultado \M¶exico no pierde"? Para esto notemos que el evento \no pierde" equivale a \gana o empata". Como un resultado no puede ser al mismo tiempo ganar y empatar, la probabilidad buscada es: P (no pierde) = P (gana) + P (empata) 0· n(a) · 1: N Ahora completamos la formalizaci¶on de nuestra cuanti¯caci¶ on de las expectativas de obtener un resultado dado, de¯niendo su probabilidad como P (a) = lim N! 1 µ ¶ n(a) : N (1) Para continuar con nuestro ejemplo, digamos que la distribuci¶ on de probabilidades para los puntos ganados por la selecci¶on mexicana est¶a dada en la tabla 1. Podemos representar gr¶a¯camente la distribuci¶ on de probabilidades P (a) como una gr¶a¯ca de barras, tal como se ve en la ¯gura 1. N¶ otese que la suma de las probabilidades sobre todos los posibles resultados es 1, Por supuesto, es muy dif¶³cil obtener la distribuci¶on P (a) a partir de su de¯nici¶ on, por lo que, en general se recurre a este tipo de axiomas y teoremas para calcular la probabilidad de resultados complicados, a partir de las probabilidades de otros resultados m¶as elementales. Dichas reglas son explicadas en diversos textos sobre probabilidad [1,3] y no las abordaremos aqu¶³ con m¶ as detalle. 2. El valor medio como valor representativo La distribuci¶ on de probabilidades P (a) resume convenientemente todas las probabilidades para cada resultado de un proceso aleatorio. Sin embargo, como no siempre tendremos acceso a esta distribuci¶ on de probabilidades, podemos conformarnos con dar un valor representativo de los posibles resultados. Se nos podr¶³a ocurrir usar el promedio de los valores de a, y para hacerlo con cuidado volvamos a nuestro ejemplo de la serie de partidos de f¶ utbol. Diga- 54 ContactoS 45, 51{61 (2002) mos que para el partido n¶ umero i anotamos el resultado obtenido, ai . Obtendr¶³amos una lista de valores (a1 a2 ; a3 ; a4 ; : : : ; aN ). Lo que entendemos por el promedio de los n¶ umeros de esta lista es simplemente el sumar todos los valores de a y dividir por el n¶ umero total de estos resultados: haiN = N 1 X ai : N i= 1 En ocasiones, se usa tambi¶en la siguiente notaci¶ on para el promedio ¹a = haiN , que tiene la desventaja de no especi¯car el n¶ umero N de datos sobre los que se promedia. Ahora, como cuando de¯nimos la probabilidad P (a), volvemos a agrupar todos los elementos ai que corresponden a un tipo de resultado a, en vez de sumar los resultados en el orden que se dieron en la serie de partidos, los sumamos seg¶ un el tipo de resultado obtenido, llevando la cuenta n(a) de cuantos hubo de cada uno, de manera que: X n(a) 1 X : an(a) = a N a N a haiN = Esta u ¶ltima ecuaci¶on nos proporciona la conexi¶ on que necesitamos, porque vamos a de¯nir el valor esperado de la distribuci¶on P(a) como el l¶³mite del valor promedio a medida que N crece (va a in¯nito): E(a) = = lim N! X 1 X n(a) X n(a) = lim a N! 1 N N a a aP (a) a Comparando con nuestra de¯nici¶on de la probabilidad P (a), vemos que E(a) = X Para nuestro ejemplo de f¶ utbol, X a aP (a) = 0 £ 0:5 + 1 £ 0:3 + 2 £ 0:2 = 0:7 Otros nombres para el valor esperado E(a) son valor medio o media de a, por lo que vamos a usar tambi¶en la notaci¶ on: (2) 3. La varianza como media de desviaciones cuadr¶ aticas Acept¶emoslo, al describir a P (a) dando un u ¶nico n¶ umero que consideramos representativo, se nos escapan muchos detalles de la forma de la distribuci¶ on. Una vez que usamos a E(a) como valor representativo, nos gustar¶³a mejorar nuestra descripci¶ on diciendo que tan lejos de ¶el esperamos que se encuentre un resultado en un partido determinado. La primera idea que pasa por nuestra cabeza es decir: calculemos la distancia entre cada resultado ai de la serie de partidos y el valor esperado, llamemos a esta distancia la desviaci¶ on del resultado i: di = ai ¡ ¹a aP (a) a E(a) = ¹a = E(a): Proponemos usar el valor esperado de las desviaciones, E(d) como medida de qu¶e tan lejos cabe esperar que \aterrice" un resultado respecto del valor medio. Desafortunadamente, para toda distribuci¶ on P (a), E(d) = 0. En efecto, E(d) = E(a ¡ ¹a ) = E(a) ¡ E(¹a ) = ¹a ¡ ¹a = 0 El ajuste de m¶³nimos cuadrados . . . F. Orlando Guzm¶ an y Dolores Ayala. 55 Lo importante de la de¯nici¶ on es que para abarcar todos los posibles resultados, debemos hacer una doble suma: para cada resultado de a hay que sumar sobre todos los resultados de b si queremos incluir todas las posibles parejas (a; b). Ahora podemos usar esta ecuaci¶ on para algunos casos especiales: 4.1. El valor esperado de a; E(a) Para este caso, hacemos que f (a; b) = a. Por lo tanto, E(a) = XX a Al investigar las causas de este fracaso, nos damos cuenta que el \problema" es que las desviaciones respecto al promedio pueden ser tanto positivas como negativas y que vienen en la misma cantidad a ambos lados del valor esperado. £ ¤ Var(a) = E(d ) = E (a ¡ ¹a )2 : Llamaremos a Var(a) la varianza de a. Hay que hacer notar que las unidades de V ar(a) son el cuadrado de las unidades de a. Para tener una medida de la variabilidad de a que tenga sus mismas unidades, de¯nimos la desviaci¶ on est¶ andar de a como la ra¶³z cuadrada de la varianza: ¾a = p Var(a): 4. Valor medio en el caso de dos variables Lo primero que tenemos que hacer cuando nos encontramos con un proceso aleatorio con dos variables (digamos, A y B) es que hay que trabajar con distribuciones de probabilidad del tipo P (a; b). Esto es, ahora tenemos que considerar el resultado en ambas variables. Vamos a generalizar nuestra idea de valor esperado para funciones que dependan de ambas variables. Supongamos que tenemos una funci¶on f que depende de a y b, es decir, f = f (a; b). De¯nimos el valor esperado de f con la siguiente ecuaci¶on E(f ) = XX a b f (a; b)P (a; b): a a b à X ! P (a; b) b Ahora bien, el t¶ermino entre par¶entesis es la suma de probabilidades de todas las posibles maneras en que se obtiene el resultado a, independientemente de cu¶ al fue el resultado de b. Reconocemos a este t¶ermino como Pa (a) y por tanto Una manera de darle la vuelta al problema es calcular el valor esperado del cuadrado de las desviaciones, es decir, de¯nir nuestra medida de la variabilidad de los resultados como 2 aP (a; b) = X E(a) = X aPa (a) = ¹a : a En otras palabras, para calcular el valor medio de a, no prestamos atenci¶ on a cu¶ al fue el resultado b y hacemos nuestros c¶ alculos como de costumbre para una sola variable. Por supuesto, podemos hacer el mismo an¶ alisis para b, encontrando que: Pb (b) = X a P (a; b) y E(b) = X bPb (b) = ¹b : b 4.2. La varianza y desviaci¶ on est¶ andar, Var(a) y ¾a Para calcular Var(a) hacemos f (a; b) = (a ¡ ¹a )2 . Como en el caso del valor esperado de a, el resultado es: £ ¤ E (a ¡ ¹a )2 = Var(a) = ¾a2 ; y para b se obtienen resultados an¶ alogos. 4.3. La covarianza Cov(a; b) Ahora llegamos a la parte nueva en cuanto a la descripci¶ on de la distribuci¶ on P (a; b). La idea es la siguiente: queremos describir la tendencia de que la variable a est¶e por encima de su valor medio al mismo tiempo que la variable b est¶ a por encima del suyo. O para el caso, que cuando una est¶e por arriba de su media, la otra est¶e por debajo. 56 ContactoS 45, 51{61 (2002) Para esto de¯nimos la covarianza de a y b, Cov(a; b) Cov(a; b) = E[(a ¡ ¹a )(b ¡ ¹b )]: El calculo de la covarianza se puede simpli¯car desarrollando el producto de las desviaciones respecto a cada promedio y a ¯n de cuentas se obtiene que: Cov(a; b) = E(ab) ¡ ¹a ¹b : En la ¯gura 2 mostramos ejemplos de las tres posibilidades: (i) Cov(a; b) < 0; (ii) Cov(a; b) = 0; (iii) Cov(a; b) > 0: Observamos que una covarianza negativa se mani¯esta porque las desviaciones de a casi siempre tienen signo opuesto a las desviaciones de b. La covarianza es positiva, cuando las desviaciones de ambas variables tienen el mismo signo. En cambio, cuando para cada desviaci¶on de a hay el mismo n¶ umero de desviaciones de b con uno y otro signo, la covarianza de a y b vale cero. En la secci¶ on siguiente, aplicaremos estos conceptos a la obtenci¶ on de un modelo para una serie de datos experimentales. x=ux 0 1 2 3 4 5 0.74 3.23 5.36 6.70 8.85 11.00 y=uy 0.56 0.76 2.59 2.63 5.40 5.35 7.07 7.50 9.01 8.90 10.58 11.19 0.58 3.20 5.04 6.82 8.89 11.48 5. Ajustando una recta a los datos experimentales En lo que sigue estamos interesados en el an¶ alisis de un conjunto de mediciones experimentales, M = f(x1 ; y1 ); (x2 ; y2 ); (x3 ; y3 ); : : : ; (xN ; yN )g. Para dar un ejemplo, emplearemos los datos de la Tabla 2 a lo largo de esta secci¶on. T a bla 2 . U n c o njunto de c ua tro me dic io ne s de y c o n unida de s uy pa ra c a da uno de se is v a lo re s de x c o n unida de s ux. Antes de ajustar una recta a unos datos es necesario gra¯carlos, tal como hemos hecho con los datos de la Tabla 2 en la Figura 3. Al trazar la gr¶ a¯ca podemos juzgar si es o no razonable proponer el modelo siguiente para el valor representativo de y: S¶ olo cuando nos hayamos cerciorado que no es descabellado representar los datos con un modelo lineal podemos plantearnos las preguntas >cu¶al es la recta que se ajusta m¶as a los datos? y >qu¶e tan signi¯cativo es dicho ajuste? En este art¶³culo s¶olo nos ocuparemos de la primera pregunta, dejando para posterior ocasi¶ on la discusi¶on de la segunda. Como se hace comunmente, vamos a suponer que la variable x se puede medir con muy poca incertidumbre, mientras que los valores de y di¯eren de su valor representativo por una desviaci¶on aleatoria di : yi = y^(xi ) + di y^(x) = mx + b; En casos como este, en que el modelo es razonable, el problema consiste en averiguar los valores optimos de la pendiente m y la ordenada al ori¶ gen b a partir del conjunto de mediciones M . Como tenemos dos inc¶ ognitas, vamos a necesitar un sistema de dos ecuaciones para determinar ambas variables. La cuesti¶ on es >de d¶ onde obtendremos dichas ecuaciones? El ajuste de m¶³nimos cuadrados . . . F. Orlando Guzm¶ an y Dolores Ayala. 57 F ig . 2 . Eje mplo s de g r¶a ¯c a s de la re la c i¶o n e ntre a y b c ua ndo :(i) C ov(a; b) < 0 , (ii) C ov(a; b) = 0 y (iii) C ov(a; b) > 0 . 58 ContactoS 45, 51{61 (2002) Conviene concentrarse en las desviaciones di = yi ¡ (mxi ¡ b). Si nuestro modelo fuera muy bueno, de seguro las desviaciones positivas deber¶³an cancelarse con las negativas, en otras palabras, esperar¶³amos que fuese cero: 0 = E(d) = E(y) ¡ mE(x) ¡ b 0 = E[x(y ¡ mx ¡ b)] = E(xy) ¡ mE(x2 ) ¡ bE(x) Nuevamente, aproximamos los diversos valores esperados por los promedios sobre los datos experimentales, para obtener que es nuestra primera ecuaci¶on y que podemos escribir de manera equivalente como: mhx2 i + b = hxyi b = E(y) ¡ mE(x) Al sistema de ecuaciones I y II se le llama sistema de Ecuaciones Normales para el ajuste por m¶³nimos cuadrados. Si aproximamos los valores medios por los promedios sobre los datos experimentales, obtenemos mhxi + b = hyi mhx2 i + b = hxyi mhxi + b = hyi (3) Esta ecuaci¶ on dice simplemente que la mejor recta pasa por el punto cuyas coordenadas son los promedios de x y y, al cual llamaremos \centro" de los datos. En nuestro ejemplo, este punto es (2.500, 5.975). Necesitamos una segunda ecuaci¶on, as¶³ que ahora nos preguntamos >qu¶e otra propiedad de las desviaciones podemos esperar si suponemos que nuestro modelo va a ser muy bueno? Pong¶amoslo de otro modo: Supongamos que el modelo \correcto" es una recta que pasa por el centro de los datos con cierta pendiente mc , pero que nosotros proponemos en cambio un modelo con la pendiente equivocada me . >C¶ omo se ver¶an las desviaciones di a medida que x se aleja de hxi? La Figura 4 ilustra la situaci¶on. Observamos que, a medida que nos alejamos del centro de los datos, las desviaciones tienden sistem¶aticamente a tener un solo signo y a crecer m¶as y m¶as. Si la pendiente equivocada me se aproxima a la correcta, como en la Figura 5, las desviaciones se concentran cerca del eje x, sin presentar ninguna tendencia sistem¶ atica. En el caso extremo en que me se vuelve mc ,, las desviaciones no desaparecen (despu¶es de todo, son aleatorias) pero al menos se mantienen dentro de una banda alrededor del eje de las x. >C¶omo podemos formalizar estas observaciones en una ecuaci¶on? La clave est¶ a en comparar las ¯guras 4 y 5 con la ¯gura 2. Lo que tenemos que pedir a las desviaciones di es que su covarianza con x sea cero: 0 = Cov(x; d) = E(xd) ¡ E(x)E(d) Gracias a la ecuaci¶on I, podemos simpli¯car la ecuaci¶ on anterior para obtener nuestra ecuaci¶on II: (4) La soluci¶ on se puede encontrar por muchos m¶etodos y es m= b= hxyi ¡ hxihyi hx2 i ¡ hxi2 hx2 ihyi ¡ hxihxyi hx2 i ¡ hxi2 Para nuestro ejemplo, obtenemos m = 2:05(uy =ux) y b = 0:85uy . Comp¶ arese con los valores verdaderos con los que se generaron los datos, que fueron una pendiente de 2:00(uy =ux ) y una ordenada al origen de 1.00 uy . Una vez obtenidas las ecuaciones normales podemos continuar con su an¶ alisis, en especial sobre la incertidumbre que se debe asociar a m y b, siguiendo cualquier libro elemental de estad¶³stica o de introducci¶ on a la experimentaci¶ on [4]. Conclusi¶ on Existen varias rutas para llegar a un ajuste por m¶³nimos cuadrados. Una de ellas es la del c¶ alculo diferencial y la suma de desviaciones cuadr¶ aticas. Para algunas personas, ¶esta es una ruta elegante y satisfactoria. Afortunadamente, no todo el mundo comparte esta opini¶ on, de manera que tenemos formulaciones alternativas. La formulaci¶ on que presentamos tiene su origen en las di¯cultades t¶ecnicas de los econometristas para sustentar la imagen de que sus datos emp¶³ricos provienen de un experimento. En vez de tirar por la borda los instrumentos matem¶ aticos propios de los m¶³nimos cuadrados, nuestros colegas econometristas decidieron fundamentarlos en un an¶ alisis de las desviaciones respecto del modelo. Esto es muy afortunado, ya que ahora nosotros (los cient¶³¯cos con datos experimentales) podemos alternar entre ambos puntos de vista, esto El ajuste de m¶³nimos cuadrados . . . F. Orlando Guzm¶ an y Dolores Ayala. F ig . 3 . Gr¶a ¯c a de lo s da to s e x pe rime nta le s de la T a bla 2 . F ig . 4 . D e sv ia c io ne s d de un mo de lo q ue pa sa po r e l c e ntro de lo s da to s c o n una pe ndie nte de ma sia do g ra nde . 59 60 ContactoS 45, 51{61 (2002) F ig . 5 . D e sv ia c io ne s d de un mo de lo q ue pa sa po r e l c e ntro de lo s da to s c o n una pe ndie nte q ue a pro x ima bie n a lo s da to s. El ajuste de m¶³nimos cuadrados . . . F. Orlando Guzm¶ an y Dolores Ayala. nos permite analizar las desviaciones en una gr¶ a¯ca, d¶ andole un sentido a las ecuaciones normales, porque ayudan a ver la conveniencia de trazar la recta por el centro de los puntos y de que las desviaciones est¶en descorrelacionadas con las abscisas. Adem¶ as, la incorporaci¶ on de las incertidumbres, an¶alisis tambi¶en llamado \m¶³nimos cuadrados ponderados", puede hacerse sin ninguna modi¯caci¶on al procedimiento est¶ andar, que por lo general, se omite en el caso introductorio. 61 2. Woolridge, Je®rey. Introductory Econometrics: A Modern Approach. South-Western College Pub. (2000) 3. Cowan, Glen. Statistical Data Analysis. Oxford UP, Oxford (1998) 4. Baird, D. C. Experimentaci¶ on, Una introducci¶ on a la teor¶³a de mediciones y al dise~ no de experimentos, Prentice Hall Hispanoamericana, M¶exico (1991) pp. 172-177. Ser¶³a interesante modi¯car el m¶etodo para incorporar el an¶ alisis de funciones polinomiales con m¶ as coe¯cientes y el efecto de que una o ambas variable tenga una incertidumbre que pueda variar de punto a punto. Bibliograf¶³a 1. Denny, Mark y Gaines, Steven. Chance in Biology. Using Probability to Explore Nature. Princeton UP, Princeton (2000) cs