Universidade de Vigo La no normalidad de las perturbaciones Normalidad Curva normal Area Universidade de Vigo Curva normal Cola de probabilidad Nivel de significación Area Valor crítico Valor muestral del estadístico Introducción Concepto, efectos del fallo y propiedades Universidade de Vigo Normalidad Universidade de Vigo Nos dice si los datos con los que trabajamos siguen leyes de distribución normales o no. Su comprobación es necesaria, para realizar los test de hipótesis exactos y los intervalos de confianza en el MRLC. El comportamiento normal se denomina así porque tiende a ponderar más los valores centrales y menos los extremos, además de ser simétrica. Caracterizada por media y varianza Comportamiento normal Universidade de Vigo Simetría Curva normal Mucha ponderación en valores centrales Varianza Area Poca ponderación en valores externos Media Efectos de la no normalidad Universidade de Vigo Si no se verifica la normalidad del modelo, entonces los estimadores MCO dejan de ser MV y por tanto pierden la eficiencia dentro de los estimadores insesgados, sin embargo siguen siendo ELIO. Mantienen la consistencia y la normalidad asintótica, pero también pierden la eficiencia asintótica. Los estimadores MV en general, verificarán mejores propiedades. Causas de la no Normalidad 1. Existencia de valores atípicos 2. Distribuciones no normales Formas no simétricas, no están centradas en la media: Fallo de la simetría Mayor masa probabilística en el centro que la normal Mayor masa en los extremos que la normal Fallo de la curtósis Universidade de Vigo Identificación de la Normalidad Universidade de Vigo - Gráficos - Histogramas - Residuos - Gráfico de probabilidad - Test de hipótesis Pretenden comprobar la distribución normal de las perturbaciones a partir de alguna regla de decisión estadística. Bondad de ajuste, compara la distribución teórica con la empírica, pero se aplica a intervalos. Jarque-Bera, que estudia la simetría y curtósis de la densidad empírica. Histograma Gráfico de residuos Gráfico de probabilidad Universidade de Vigo Gráficos Histogramas Universidade de Vigo Representa el comportamiento de la función de densidad empírica, estimada a partir del porcentaje de valores por tamaño del intervalo. Teóricamente debería aproximarse a una distribución normal por lo que la forma que debería presentar sería simétrica y sin exceso de curtósis, por ese motivo algunos programas representan el histograma superpuesto por una curva normal. Eso no ocurre en SHAZAM. Histograma de residuos Universidade de Vigo Grafico de residuos Universidade de Vigo Representar los residuos respecto a alguna variable. Para detectar la normalidad sirve cualquiera y por consiguiente, normalmente se utilizan los valores predichos. Debería encontrarse el grafico de forma simétrica y mas concentrado en los valores cercanos al 0, y algo disperso en los valores alejados. Los valores muy alejados seguramente son atípicos. Comportamiento de los residuos bajo normalidad 2.11 * Valores extraños al 95% de confianza * * 1.27 R e s i d u o s Bandas al 95% de confianza * * * * * * * * .30 -.42 * * .42 ** * * * 1.35 * * ** ** *** * ** * * * 2.40 * * 3.45 4.50 * * * ** Valores predichos * * * * * * * * * * * * * * * * * -1.27 Valores mas concentrados Valores mas dispersos 5.56 Universidade de Vigo Gráficos de Probabilidad 2 EXPECTED VALUE 1 0 -1 -2 -2 -1 0 1 R E ST U DE N 2 3 Universidade de Vigo Consiste en representar los residuos observados respecto a lo que se esperaría si siguieran una ley normal. El alejamiento de la diagonal, que seria cuando es una ley normal perfecta, indica las diferencias con la normalidad Método de construcción (1) Universidade de Vigo 1. Se calculan los residuos estudentizados o estandarizados. 2. Se ordenan de menor a mayor. De esta forma cada valor corresponderá al correspondiente cuantil de orden t/T. 3. Se calcula el valor crítico que corresponde en la N(0,1) a cada cuantil de orden t/T, se corrige tomando t −3/8 at = φ T +1/ 4 −1 Método de construcción (2) Universidade de Vigo 4. Se representan gráficamente los residuos estudentizados respecto a at. Si hay normalidad debe ser una diagonal. 5. A modo de comprobación se construye el coeficiente de correlación al cuadrado que nos da idea de la normalidad aproximada del grado de ajuste a la normalidad. Calculo del grafico de normalidad Universidade de Vigo OLS Y X1 X2/RESID=E PREDICT=YE RSTAT NOANOVA HATDIAG=HT GEN1 N=$N GEN1 S2=$SIG2 GENR ESTAND=E/SQRT(S2*(1-HT)) SORT ESTAND/ DESC GENR T=TIME(0) GENR CT=(T-3/8)/(N+1/4) DISTRIB CT/INVERSE CRITICAL=AT GRAPH ESTAND AT Grafico de normalidad Universidade de Vigo Valor atípico Ejemplos de Gráficos de probabilidad e interpretación (1) Gráfico de Probabilidad Gráfico de densidad ⇒ Asimetría por la izquierda Universidade de Vigo Ejemplos de Gráficos de probabilidad e interpretación (2) Gráfico de Probab ilidad Gráfico d e D ensid ad ⇒ Asimetría a la derecha Universidade de Vigo Ejemplos de Gráficos de probabilidad e interpretación (3) Universidade de Vigo G ráf ico de Probabilid ad Gráfico dedensidad ⇒ Las colas de probabilidad son más "pesadas" de lo normal, curtósis baja Ejemplos de Gráficos de probabilidad e interpretación (4) G ráf i co d e P ro b ab i l i d ad GráficodeDensidad ⇒ Las colas de probabilidad son menos "pesadas" de lo normal, excesiva curtósis Universidade de Vigo Grafico de probabilidad Universidade de Vigo Representa los valores estandarizados de la variable respecto a los valores teóricos de la normal. Debería mostrar una diagonal, es decir una línea recta de pendiente 1, puesto que indica que lo empírico coincide ocn lo esperado, o sea, la normal. Grafico de probabilidad en residuos Valor esperado si fuera exactamente normal Universidade de Vigo Test de hipótesis Bondad de ajuste Jarque-Bera Universidade de Vigo Gráficos y test de hipótesis Universidade de Vigo Los gráficos nos dan una idea de los posibles fallos, pero para contrastarlos debemos utilizar los test de hipótesis. Vamos a recordar algunas ideas de los test de hipótesis para contrastar suposiciones. Haremos uso de dos test: Paramétrico: test de Jarque-Bera No paramétrico: Test de Bondad de ajuste. Test de significación Universidade de Vigo En todos los test de significación se tienen en cuenta los siguientes aspectos: 1. 2. 3. 4. 5. 6. Definir modelo de análisis e indicar suposiciones del test Definir hipótesis nula y alternativa Fijar el nivel de significación Estadístico de la prueba Ley de distribución del estadístico Regla de decisión Test de significación para contrastar suposiciones del MRLN Universidade de Vigo Cuando se quieren contrastar las suposiciones del MRLN, siempre se parte del modelo, con alguna generalización, es decir se suponen validas todas las suposiciones excepto la que se quiere contrastar. En el caso de la normalidad se suponen todas menos la normalidad de las perturbaciones. Modelo de contraste de normalidad Yt ε t = yt − E ( X1t ... X kt Universidade de Vigo ) = yt − ( β0 + β1 X1t + ... + β k X kt ) Donde: ε son independientes e igualmente distribuidas y no dependen de las X (Independencia, homocedasticidad y exogeneidad), β son estables y estimables (Estabilidad e identificabilidad) X no están relacionadas entre sí y vienen dadas sin error (no colinealidad y mensurabilidad) Resultados del modelo Universidade de Vigo Esas suposiciones nos permiten: Estimar las perturbaciones a partir de los errores de MCO. Suponer que los residuos son aproximadamente independientes e igualmente distribuidos con leyes de media 0 y varianza constante, lo que nos permite comparar la distribución empírica con una normal teórica. Eso es el test de bondad de ajuste. Calcular el coeficiente de asimetría y curtósis de los residuos como si estos provinieran de la misma población. Eso en esencia es el test de Jarque-Bera. Test de JarqueJarque-Bera Universidade de Vigo Contrastamos la asimetría y el exceso de curtósis, que bajo normalidad deberían de ser ambos 0. Analiza por consiguiente si la distribución falla en alguna de las características básicas de la normal, si es simétrica o si tiene diferente peso los valores centrales respecto a los extremos de la normal. Se suele hacer una comparación de cada uno de ellos independientemente y otro test conjunto. Hipótesis del Test de simetría El test de simetría se realiza para contrastar: H0: γ1=0, lo que significa simetría exacta H1: γ1≠0, lo que significa que existe asimetría Donde n γ1 = ∑ε i =1 3 i σ R3 La consecuencia es que si existe asimetría falla la normalidad Universidade de Vigo Estadístico y decisión del Test de simetría. Universidade de Vigo Contrastamos si existe simetría o no γˆ 1 El estadístico t1 = 6 n sigue una ley AN(0,1) bajo la hipótesis nula, es decir cuando se supone normalidad, siendo n γˆ1 = Se rechaza si tipificada t1 > λα / 2 3 e ∑i i =1 S R3 donde λα/2 es el valor crítico de la normal Test de simetría Asimetría positiva casi nula: mediana menor que la media Universidade de Vigo Forma teórica de la normal COEFFICIENT OF SKEWNESS = 0.2031 WITH STANDARD DEVIATION OF 0.3738 |_gen1 t1=0.2031/0.3738 |_distrib t1 NORMAL DISTRIBUTION - MEAN= 0.0000 VARIANCE= 1.0000 DATA Z PDF CDF 1-CDF T1 0.54334 0.34419 0.70655 0.29345 Forma teórica de la distribución empírica Hipótesis del Test de curtósis El test de curtósis se realiza para contrastar: H0: γ2=0, lo que significa curtósis exacta H1: γ2≠0, lo que significa que existe curtósis Donde n γ2 = 4 ε ∑ i i =1 σ 4 R −3 La consecuencia es que si existe curtósis falla la normalidad Universidade de Vigo Estadístico y decisión del Test de curtósis. curtósis. Contrastamos si existe exceso de curtósis o no γˆ 2 El estadístico t2 = 24 n sigue una ley AN(0,1) bajo la hipótesis nula, es decir cuando se supone normalidad, siendo n γˆ2 = Se rechaza si normal tipificada ∑e i =1 t2 > λα / 2 S R4 4 i −3 donde λα/2 es el valor crítico de la Universidade de Vigo Test de curtósis Universidade de Vigo Forma teórica de la normal COEFFICIENT OF EXCESS KURTOSIS = -0.8323 WITH STANDARD DEVIATION OF 0.7326 gen1 t2=-0.8323/0.7326 |_ |_distrib t2 NORMAL DISTRIBUTION - MEAN= 0.0000 VARIANCE= 1.0000 DATA Z PDF CDF 1-CDF T2 -1.1361 0.20924 0.12796 0.87204 Curtósis negativa casi nula : menos apuntamiento que la normal Forma teórica de la distribución empírica Hipótesis del Test de JarqueJarque-Bera Universidade de Vigo El test de Jarque-Bera se realiza para contrastar: H0: γ1= γ2=0, lo que significa simetría y curtósis exactas H1: γ1≠0 ο γ2≠0 lo que significa que existe curtósis o asimetría Donde los coeficientes han sido calculados como en los test anteriores. La consecuencia es que si existe asimetría o curtósis falla la normalidad. Al contrastarlo conjuntamente exige un fallo mayor de alguna de ellas o de ambas para rechazarse. Estadístico y decisión del Test de JarqueJarque-Bera Universidade de Vigo Contrastamos conjuntamente la asimetría y el exceso de curtósis El estadístico 2 2 ˆ ˆ γ γ 2 2 JB = t1 + t2 = T 1 + 2 6 24 sigue una ley asintótica ji cuadrado con 2 grados de libertad bajo la hipótesis nula, puesto que ambos estadísticos t eran normales tipificadas. Se rechaza si donde χ2,α es el valorJB crítico > χ de una chi cuadrado con 2 grados e libertad 2,α Test de Jarque Bera Universidade de Vigo Forma teórica de la normal Asimetría Asimetríanegativa: positiva mediana casi nula:mayor mediana que menorlaque media la media Curtósis negativa : mas apuntamiento que la normal JARQUE-BERA NORMALITY TESTCHI-SQUARE(2 DF)= 1.5400 P-VALUE= 0.463 Forma teórica de la distribución empírica Test de Bondad de ajuste Universidade de Vigo Compara la distribución teórica con la empírica. Analiza las funciones de densidad, es decir hace uso de los histograma y la función de densidad gaussiana. Para ello hace uso de intervalos. Test de bondad de ajuste (1) Universidade de Vigo 1. Calcular los valores observados dentro de cada subconjunto Sj, j=1,...k., que denominaremos OBSj. 2. Calcular la probabilidad teórica de que la variable tome algún valor en el subconjunto Sj suponiendo una normal con los parámetros estimados por MV. Denominamos al valor esperado ESPj, que será igual al número total de valores por la probabilidad de que un valor pertenezca a ese subconjunto Test de bondad de ajuste (2) Universidade de Vigo 3. Calculamos una distancia de tipo ji cuadrado entre esos valores, que,como los observados siguen una B(n,pj), cada término es aproximadamente N(0,1), pero no son independientes, ya que existen dos tipos de relaciones, debido al número de intervalos y a las estimaciones, en total, 3 restricciones, seguirá una ji cuadrado con k-3 grados de libertad. 4. Comparar el estadístico con el valor de las tablas y se rechaza si dicho valor es mayor, porque indica que se ajusta poco a la distribución normal. Histograma teórico y empírico Diferencias positivas Universidade de Vigo Función de distribución teórica Función de distribución empírica Diferencias negativas TelasTelas-normalidad Universidade de Vigo COEFFICIENT OF SKEWNESS = 0.2031 WITH STANDARD DEVIATION OF 0.3738 COEFFICIENT OF EXCESS KURTOSIS = 0.8323 WITH STANDARD DEVIATION OF 0.7326 JARQUE-BERA NORMALITY TEST- CHI-SQUARE(2 DF)= 1.5400 P-VALUE= 0.463 GOODNESS OF FIT TEST FOR NORMALITY OF RESIDUALS - 6 GROUPS OBSERVED 0.0 8.0 10.0 15.0 7.0 0.0 EXPECTED 0.9 5.4 13.7 13.7 5.4 0.9 CHI-SQUARE = 4.5934 WITH 1 DEGREES OF FREEDOM, P-VALUE= 0.032 Visión gráfica del test de bondad de ajuste Universidade de Vigo Función de distribución teórica Función de distribución empírica Valor observado= 0 Estadístico X2=Suma=4,59 Valor esperado= 0,9 (OBS-ESP)2/ESP= 1.11 (OBS-ESP)2/ESP= 0.47 OBS-ESP= -0,9 (OBS-ESP)2/ESP= 2.27 (OBS-ESP)2/ESP= 1.11 (OBS-ESP)2/ESP=0.12 (OBS-ESP)2/ESP= 1 Tratamiento de la normalidad Universidade de Vigo 1.Si la distribución es conocida, aunque no sea normal, se aplica estimación MV. 2.Si la distribución es desconocida, se puede utilizar: a. Transformaciones buscando normalidad. b. Regresión robusta. 3.Si la no normalidad es debida a valores atípicos a. Se utilizan variables ficticias. b. Se eliminan si hay suficientes datos. Ejemplo: Fabricación de telas Universidade de Vigo El coste de fabricación de algodón en una empresa de hilaturas depende de la cantidad de tejido producido y del precio de la mano de obra que trabaja subcontratada. los datos de los últimos 40 meses se recoge en la tabla siguiente. Interesa comprobar si el comportamiento de los costes de la fabricación entre unos años y otros es normal. TelasTelas-normalidad Universidade de Vigo COEFFICIENT OF SKEWNESS = 0.2031 WITH STANDARD DEVIATION OF 0.3738 COEFFICIENT OF EXCESS KURTOSIS = 0.8323 WITH STANDARD DEVIATION OF 0.7326 JARQUE-BERA NORMALITY TEST- CHISQUARE(2 DF)= 1.5400 P-VALUE= 0.463 Variables ficticias Definición Binomiales Multinomiales Regresión con variables ficticias Aplicación para solucionar la normalidad Universidade de Vigo Definición de Variables ficticias Son variables que caracterizan comportamientos cualitativos de forma que indican si una determinada observación verifica o no una propiedad prefijada También se les denomina variables indicador de la propiedad o característica Generalmente se definen como variables dicotómicas, pero también pueden definirse para variables multinomiales Universidade de Vigo Variables ficticias dicotómicas Universidade de Vigo Supongamos que tenemos una variable cualitativa dicotómica C, es decir, que se verifica una determinada propiedad o no, que tienen una cualidad o no, etc..., por tanto únicamente puede tomar dos valores A y B. Se define la variable ficticia dicotómica como 1 si C = A IA = 0 si C = B De esta forma se cuantifica el efecto de la variable dicotómica, vale 1 si la cualidad se verifica y 0 si no. 17/12/2007 Ejemplos En una encuesta responder si o no Ser valor atípico o no serlo Saber informática o no Tener un sexo u otro Ser conductor o no Ser directivo o no ......... Universidade de Vigo Variables ficticias multinomiales Universidade de Vigo Supongamos que tenemos una variable cualitativa multinomial C, es decir, que puede tomar mas de dos valores C1, ...., Cm Se define una variable ficticia dicotómica para cada uno de los posibles valores. 1 si Ct = c j I jt = 0 si C c ≠ t j J=1,...m Ejemplo Universidade de Vigo Supongamos que queremos estudiar la estacionalidad de las ventas de un producto. La variable estación toma cuatro valores: Primavera, verano, otoño e invierno. Definimos dichas opciones como: C1= Ventas de primavera C2= Ventas de verano C3= Ventas de otoño C4= Ventas de invierno Por lo tanto definiremos cuatro variables ficticias: Una hace relación a la primavera Otra al verano Otra al otoño Y la última, al invierno Ejemplo (2) 1 si ventas ∈ C1 Primavera = 0 si no 1 si ventas ∈C2 Verano = 0 si no 1 si ventas ∈ C3 Otoño = 0 si no 1 si ventas ∈ C4 Invierno = 0 si no Universidade de Vigo Variables ficticias multinomiales (2) Universidade de Vigo Por consiguiente tendremos m variables ficticias, pero todas ellas van a verificar una restricción: la suma de todas las variables siempre vale 1, ya que siempre ocurre uno de los posibles casos. Por consiguiente una se puede poner en función del resto, lo que implica que bastaría definir m-1 variables Variables ficticias multinomales (3) Por consiguiente tendríamos 1 si Ct = c j I jt = 0 si C ≠ c t j J=1,...m-1 Universidade de Vigo Ejemplo (3) En el caso de las estaciones tendríamos sólo tres, pues el invierno sería 1 menos la suma de las otras tres. Universidade de Vigo 1 si ventas ∈ C1 Primavera = 0 si no 1 si ventas ∈C2 Verano = 0 si no 1 si ventas ∈ C3 Otoño = 0 si no Invierno= 1-Primavera-Verano-Otoño Variables ficticias en la regresión Universidade de Vigo Al incluirlas en una regresión lo hacen como cualquier otra variable, con la diferencia de que el coeficiente nos mide el cambio que se produce por estar en esa categoría en vez de en otra Ejemplo considerar el coste de producir una pieza en dos sectores diferentes A y B Coste de producción en dos sectores Universidade de Vigo El hecho de incluir o no la variable ficticia cambia los parámetros de la regresión Sector A Sector B Regresión para cada sector Conjunta sin dividir en sectores Vamos a intentar formalizarlo Ejemplos de regresión con variables dicotómicas Universidade de Vigo El caso más habitual es cuando se responde a preguntas sobre gustos, actitudes, etc., únicamente de la forma si o no, sin respuestas intermedias. También se usa para medir efectos de cambios en el tiempo por legislaciones o efectos puntuales debidos a un sólo valor o a un conjunto de valores. Este será el caso que nos interese para resolver los problemas que se plantean con los valores atípicos, pero previamente veamos como se introducen estas variables en las ecuaciones de regresión y que efectos pueden producir. Planteamiento de la regresión con variables dicotómicas Universidade de Vigo Supongamos que tenemos una variable cualquiera C que únicamente puede tomar dos valores A y B de forma que ambos son excluyentes y exhaustivos. Entones la variable ficticia se define como 1 si C = A IA = 0 si C = B Regresión con variables dicotómicas En el caso mas simple, se introduciría en el modelo de regresión como una variable cualquiera Modelo sin variable ficticia y = β0 + β1 X 1 +L+ βk X k + ε Modelo con variable ficticia y = β0 + β1 X 1 +L+ βk X k + αI A + ε Efecto de la variable ficticia Universidade de Vigo Interpretación Universidade de Vigo Las pendientes se interpretan igual, pero ahora sería el efecto independientemente del sector La constante β0 sería el coste fijo en el sector B La suma de β0 y α sería el coste fijo en el sector A Por tanto α mide la diferencia entre los costes fijos. Efecto de las variables dicotómicas en la regresión Universidade de Vigo Partiendo del modelo sin variable ficticia se puede medir el impacto de esta sobre cada uno de los coeficientes de la regresión cuando se sospecha que cada uno de los grupos tiene una relación diferente totalmente. En ese caso se definen una serie de variables auxiliares que miden el impacto sobre la pendiente X j si t ∈ A IX j = j = 1...k 0 si t ∉ A Con esas variable el modelo quedaría: y = β 0 + β1 X 1 + L + β X k + +α 0 I A + α1 IX 1 + L + α k IX k + ε Efecto de la variable ficticia sobre la pendiente de Xk Interpretación Universidade de Vigo Las pendientes se interpretan igual, pero ahora sería el efecto independientemente del sector La constante β0 sería el efecto fijo en el sector B La suma de β0 y α0 sería el efecto fijo en el sector A Por tanto α0 mide la diferencia entre los efectos fijos Cada una de las pendientes βj sería el impacto de Xj sobre Y en el sector B La suma de βj y αj nos mediría el impacto de Xj sobre Y en el sector A Por tanto cada uno de los αj nos mide la diferencia entre los impactos en los sectores A y B. Regresión en XUMA con variables ficticias Universidade de Vigo |_GENR T=TIME(0) |_GENR D12=(T.EQ.12) |_OLS Y X1 X2 D12/RESID=E INFLUENCE HATDIAG=HT REQUIRED MEMORY IS PAR= 3 CURRENT PAR= 2000 OLS ESTIMATION 20 OBSERVATIONS DEPENDENT VARIABLE= Y ...NOTE..SAMPLE RANGE SET TO: 1, 20 R-SQUARE = 0.9855 R-SQUARE ADJUSTED = 0.9828 VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.30698E-01 STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.17521 SUM OF SQUARED ERRORS-SSE= 0.49117 MEAN OF DEPENDENT VARIABLE = 13.708 LOG OF THE LIKELIHOOD FUNCTION = 8.68826 VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY NAME COEFFICIENT ERROR 16 DF P-VALUE CORR. COEFFICIENT AT MEANS X1 0.48369 0.1711E-01 28.27 0.000 0.990 0.9224 0.2085 X2 0.57535E-01 0.1477E-01 3.896 0.001 0.698 0.1183 0.0285 D12 0.88083 0.1956 4.504 0.000 0.748 0.1476 0.0032 CONSTANT 10.415 0.1499 69.47 0.000 0.998 0.0000 0.7598 Efecto en la regresión en XUMA de la variable ficticia Universidade de Vigo RESIDUAL RSTUDENT HT COVRAT DFFITS DFFIT 1 -0.31969 -2.0908 0.0779 0.5047 -0.6077 -0.27007E-01 2 -0.10402 -0.6500 0.1960 1.4407 -0.3209 -0.25351E-01 3 0.26206 1.7350 0.1635 0.7446 0.7671 0.51219E-01 4 -0.27322E-01 -0.1673 0.1835 1.5737 -0.0793 -0.61407E-02 5 0.26840 1.7640 0.1463 0.7134 0.7302 0.45991E-01 6 -0.94858E-01 -0.5485 0.0682 1.2832 -0.1483 -0.69375E-02 7 0.17410 1.0880 0.1563 1.1323 0.4683 0.32256E-01 8 0.88418E-01 0.5119 0.0729 1.3029 0.1435 0.69511E-02 9 -0.16736 -1.0261 0.1305 1.1350 -0.3975 -0.25115E-01 10 -0.85826E-01 -0.5376 0.2066 1.5117 -0.2743 -0.22345E-01 11 0.18209 1.1141 0.1167 1.0664 0.4050 0.24063E-01 12 0.64435E-14 0.0000 1.0000********* 106.9110 19.346 13 0.10515 0.7446 0.3683 1.7725 0.5686 0.61319E-01 14 -0.23246 -1.4430 0.0974 0.8528 -0.4741 -0.25090E-01 15 -0.17150 -1.0457 0.1187 1.1085 -0.3837 -0.23095E-01 16 0.12570 0.8123 0.2365 1.4273 0.4521 0.38932E-01 17 -0.30907E-01 -0.1989 0.2605 1.7322 -0.1180 -0.10887E-01 El valor atípico aparece 18 -0.19273E-01 -0.1146 0.1353 1.4918 -0.0453 -0.30148E-02 ahora como muy influyente, 19 -0.40684E-01 -0.2437 0.1456 1.4915 -0.1006 -0.69358E-02 pero no atípico 20 0.87971E-01 0.5228 0.1194 1.3676 0.1925 0.11927E-01 SUM-OF-SQUARED PREDICTION ERRORS SSPE,PRESS,CV= 374.93 SCHMIDT(1974) SUM OF SQUARES OF STANDARDIZED PREDICTION ERRORS= 0.56862 STONE(1974) CROSS-VALIDATION= 0.36193E-01 Grafico de probabilidad Ya no hay valores atípicos, es prácticamente normal Universidade de Vigo