La no normalidad de las perturbaciones

Anuncio
Universidade
de Vigo
La no normalidad de las perturbaciones
Normalidad
Curva
normal
Area
Universidade
de Vigo
Curva
normal
Cola de probabilidad
Nivel de significación
Area
Valor crítico
Valor muestral del estadístico
Introducción
Concepto, efectos del fallo y propiedades
Universidade
de Vigo
Normalidad
Universidade
de Vigo
Nos dice si los datos con los que trabajamos siguen leyes
de distribución normales o no. Su comprobación es
necesaria, para realizar los test de hipótesis exactos y los
intervalos de confianza en el MRLC.
El comportamiento normal se denomina así porque
tiende a ponderar más los valores centrales y menos los
extremos, además de ser simétrica.
Caracterizada por media y varianza
Comportamiento normal
Universidade
de Vigo
Simetría
Curva
normal
Mucha
ponderación en
valores centrales
Varianza
Area
Poca ponderación
en valores
externos
Media
Efectos de la no normalidad
Universidade
de Vigo
Si no se verifica la normalidad del modelo, entonces los
estimadores MCO dejan de ser MV y por tanto pierden
la eficiencia dentro de los estimadores insesgados, sin
embargo siguen siendo ELIO.
Mantienen la consistencia y la normalidad asintótica,
pero también pierden la eficiencia asintótica.
Los estimadores MV en general, verificarán mejores
propiedades.
Causas de la no Normalidad
1. Existencia de valores atípicos
2. Distribuciones no normales
Formas no simétricas, no están centradas en la media:
Fallo de la simetría
Mayor masa probabilística en el centro que la normal
Mayor masa en los extremos que la normal
Fallo de la curtósis
Universidade
de Vigo
Identificación de la Normalidad
Universidade
de Vigo
- Gráficos
- Histogramas
- Residuos
- Gráfico de probabilidad
- Test de hipótesis
Pretenden comprobar la distribución normal de las
perturbaciones a partir de alguna regla de decisión estadística.
Bondad de ajuste, compara la distribución teórica con la empírica, pero se
aplica a intervalos.
Jarque-Bera, que estudia la simetría y curtósis de la densidad empírica.
Histograma
Gráfico de residuos
Gráfico de probabilidad
Universidade
de Vigo
Gráficos
Histogramas
Universidade
de Vigo
Representa el comportamiento de la función de densidad
empírica, estimada a partir del porcentaje de valores por
tamaño del intervalo.
Teóricamente debería aproximarse a una distribución
normal por lo que la forma que debería presentar sería
simétrica y sin exceso de curtósis, por ese motivo
algunos programas representan el histograma
superpuesto por una curva normal. Eso no ocurre en
SHAZAM.
Histograma de residuos
Universidade
de Vigo
Grafico de residuos
Universidade
de Vigo
Representar los residuos respecto a alguna variable.
Para detectar la normalidad sirve cualquiera y por consiguiente,
normalmente se utilizan los valores predichos.
Debería encontrarse el grafico de forma simétrica y mas concentrado
en los valores cercanos al 0, y algo disperso en los valores alejados.
Los valores muy alejados seguramente son atípicos.
Comportamiento de los residuos bajo
normalidad
2.11
*
Valores extraños al 95% de confianza
*
*
1.27
R
e
s
i
d
u
o
s
Bandas al 95% de confianza
*
* *
*
*
*
*
*
.30
-.42
*
*
.42
**
*
*
*
1.35
*
* **
**
*** *
**
*
*
* 2.40
*
*
3.45
4.50
*
*
*
**
Valores predichos
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
-1.27
Valores mas
concentrados
Valores mas
dispersos
5.56
Universidade
de Vigo
Gráficos de Probabilidad
2
EXPECTED VALUE
1
0
-1
-2
-2
-1
0
1
R E ST U DE N
2
3
Universidade
de Vigo
Consiste en representar los
residuos observados respecto
a lo que se esperaría si
siguieran una ley normal.
El alejamiento de la
diagonal, que seria cuando es
una ley normal perfecta,
indica las diferencias con la
normalidad
Método de construcción (1)
Universidade
de Vigo
1. Se calculan los residuos estudentizados o estandarizados.
2. Se ordenan de menor a mayor. De esta forma cada valor
corresponderá al correspondiente cuantil de orden t/T.
3. Se calcula el valor crítico que corresponde en la N(0,1) a cada
cuantil de orden t/T, se corrige tomando
 t −3/8 
at = φ 

 T +1/ 4 
−1
Método de construcción (2)
Universidade
de Vigo
4. Se representan gráficamente los residuos estudentizados
respecto a at. Si hay normalidad debe ser una diagonal.
5. A modo de comprobación se construye el coeficiente de
correlación al cuadrado que nos da idea de la normalidad
aproximada del grado de ajuste a la normalidad.
Calculo del grafico de normalidad
Universidade
de Vigo
OLS Y X1 X2/RESID=E PREDICT=YE RSTAT
NOANOVA HATDIAG=HT
GEN1 N=$N
GEN1 S2=$SIG2
GENR ESTAND=E/SQRT(S2*(1-HT))
SORT ESTAND/ DESC
GENR T=TIME(0)
GENR CT=(T-3/8)/(N+1/4)
DISTRIB CT/INVERSE CRITICAL=AT
GRAPH ESTAND AT
Grafico de normalidad
Universidade
de Vigo
Valor
atípico
Ejemplos de Gráficos de probabilidad
e interpretación (1)
Gráfico de Probabilidad
Gráfico de densidad
⇒
Asimetría por la izquierda
Universidade
de Vigo
Ejemplos de Gráficos de probabilidad
e interpretación (2)
Gráfico de Probab ilidad
Gráfico d e D ensid ad
⇒
Asimetría a la derecha
Universidade
de Vigo
Ejemplos de Gráficos de probabilidad e
interpretación (3)
Universidade
de Vigo
G ráf ico de Probabilid ad
Gráfico dedensidad
⇒
Las colas de probabilidad son más "pesadas"
de lo normal, curtósis baja
Ejemplos de Gráficos de probabilidad e
interpretación (4)
G ráf i co d e P ro b ab i l i d ad
GráficodeDensidad
⇒
Las colas de probabilidad son menos
"pesadas" de lo normal, excesiva curtósis
Universidade
de Vigo
Grafico de probabilidad
Universidade
de Vigo
Representa los valores estandarizados de la variable
respecto a los valores teóricos de la normal.
Debería mostrar una diagonal, es decir una línea recta de
pendiente 1, puesto que indica que lo empírico coincide
ocn lo esperado, o sea, la normal.
Grafico de probabilidad en residuos
Valor esperado si
fuera exactamente
normal
Universidade
de Vigo
Test de hipótesis
Bondad de ajuste
Jarque-Bera
Universidade
de Vigo
Gráficos y test de hipótesis
Universidade
de Vigo
Los gráficos nos dan una idea de los posibles fallos, pero para
contrastarlos debemos utilizar los test de hipótesis.
Vamos a recordar algunas ideas de los test de hipótesis para
contrastar suposiciones.
Haremos uso de dos test:
Paramétrico: test de Jarque-Bera
No paramétrico: Test de Bondad de ajuste.
Test de significación
Universidade
de Vigo
En todos los test de significación se tienen en cuenta los
siguientes aspectos:
1.
2.
3.
4.
5.
6.
Definir modelo de análisis e indicar suposiciones del test
Definir hipótesis nula y alternativa
Fijar el nivel de significación
Estadístico de la prueba
Ley de distribución del estadístico
Regla de decisión
Test de significación para contrastar
suposiciones del MRLN
Universidade
de Vigo
Cuando se quieren contrastar las suposiciones del MRLN,
siempre se parte del modelo, con alguna generalización, es
decir se suponen validas todas las suposiciones excepto la que
se quiere contrastar.
En el caso de la normalidad se suponen todas menos la
normalidad de las perturbaciones.
Modelo de contraste de normalidad
Yt
ε t = yt − E (
X1t ... X kt
Universidade
de Vigo
) = yt − ( β0 + β1 X1t + ... + β k X kt )
Donde:
ε son independientes e igualmente distribuidas y no dependen
de las X (Independencia, homocedasticidad y exogeneidad),
β son estables y estimables (Estabilidad e identificabilidad)
X no están relacionadas entre sí y vienen dadas sin error (no
colinealidad y mensurabilidad)
Resultados del modelo
Universidade
de Vigo
Esas suposiciones nos permiten:
Estimar las perturbaciones a partir de los errores de MCO.
Suponer que los residuos son aproximadamente
independientes e igualmente distribuidos con leyes de media 0
y varianza constante, lo que nos permite comparar la
distribución empírica con una normal teórica. Eso es el test de
bondad de ajuste.
Calcular el coeficiente de asimetría y curtósis de los residuos
como si estos provinieran de la misma población. Eso en
esencia es el test de Jarque-Bera.
Test de JarqueJarque-Bera
Universidade
de Vigo
Contrastamos la asimetría y el exceso de curtósis, que bajo
normalidad deberían de ser ambos 0.
Analiza por consiguiente si la distribución falla en alguna de
las características básicas de la normal, si es simétrica o si
tiene diferente peso los valores centrales respecto a los
extremos de la normal.
Se suele hacer una comparación de cada uno de ellos
independientemente y otro test conjunto.
Hipótesis del Test de simetría
El test de simetría se realiza para contrastar:
H0: γ1=0, lo que significa simetría exacta
H1: γ1≠0, lo que significa que existe asimetría
Donde
n
γ1 =
∑ε
i =1
3
i
σ R3
La consecuencia es que si existe asimetría falla la
normalidad
Universidade
de Vigo
Estadístico y decisión del Test de
simetría.
Universidade
de Vigo
Contrastamos si existe simetría o no
γˆ 1
El estadístico
t1 =
6
n
sigue una ley AN(0,1) bajo la hipótesis nula, es decir cuando se supone
normalidad, siendo
n
γˆ1 =
Se rechaza si
tipificada
t1 > λα / 2
3
e
∑i
i =1
S R3
donde λα/2 es el valor crítico de la normal
Test de simetría
Asimetría positiva
casi nula: mediana
menor que la media
Universidade
de Vigo
Forma teórica de la
normal
COEFFICIENT OF SKEWNESS =
0.2031
WITH STANDARD DEVIATION OF 0.3738
|_gen1 t1=0.2031/0.3738
|_distrib t1
NORMAL DISTRIBUTION - MEAN=
0.0000
VARIANCE=
1.0000
DATA
Z
PDF
CDF
1-CDF
T1 0.54334 0.34419 0.70655 0.29345
Forma teórica de la
distribución empírica
Hipótesis del Test de curtósis
El test de curtósis se realiza para contrastar:
H0: γ2=0, lo que significa curtósis exacta
H1: γ2≠0, lo que significa que existe curtósis
Donde
n
γ2 =
4
ε
∑
i
i =1
σ
4
R
−3
La consecuencia es que si existe curtósis falla la
normalidad
Universidade
de Vigo
Estadístico y decisión del Test de
curtósis.
curtósis.
Contrastamos si existe exceso de curtósis o no
γˆ 2
El estadístico
t2 =
24
n
sigue una ley AN(0,1) bajo la hipótesis nula, es decir cuando se supone
normalidad, siendo
n
γˆ2 =
Se rechaza si
normal tipificada
∑e
i =1
t2 > λα / 2
S R4
4
i
−3
donde λα/2 es el valor crítico de la
Universidade
de Vigo
Test de curtósis
Universidade
de Vigo
Forma teórica de la
normal
COEFFICIENT OF EXCESS KURTOSIS =
-0.8323 WITH STANDARD DEVIATION OF
0.7326
gen1 t2=-0.8323/0.7326
|_
|_distrib t2
NORMAL DISTRIBUTION - MEAN=
0.0000
VARIANCE=
1.0000
DATA Z
PDF
CDF
1-CDF
T2 -1.1361 0.20924
0.12796
0.87204
Curtósis negativa casi nula
: menos apuntamiento que
la normal
Forma teórica de la
distribución empírica
Hipótesis del Test de JarqueJarque-Bera
Universidade
de Vigo
El test de Jarque-Bera se realiza para contrastar:
H0: γ1= γ2=0, lo que significa simetría y curtósis exactas
H1: γ1≠0 ο γ2≠0 lo que significa que existe curtósis o asimetría
Donde los coeficientes han sido calculados como en los test
anteriores.
La consecuencia es que si existe asimetría o curtósis falla la
normalidad.
Al contrastarlo conjuntamente exige un fallo mayor de alguna
de ellas o de ambas para rechazarse.
Estadístico y decisión del Test de
JarqueJarque-Bera
Universidade
de Vigo
Contrastamos conjuntamente la asimetría y el exceso de curtósis
El estadístico
2
2
ˆ
ˆ


γ
γ
2
2
JB = t1 + t2 = T  1 + 2 
6 24 


sigue una ley asintótica ji cuadrado con 2 grados de libertad bajo la
hipótesis nula, puesto que ambos estadísticos t eran normales tipificadas.
Se rechaza si
donde χ2,α es el valorJB
crítico
> χ de una chi cuadrado con 2 grados e libertad
2,α
Test de Jarque Bera
Universidade
de Vigo
Forma teórica de la
normal
Asimetría
Asimetríanegativa:
positiva
mediana
casi nula:mayor
mediana
que
menorlaque
media
la media
Curtósis negativa :
mas apuntamiento
que la normal
JARQUE-BERA
NORMALITY TESTCHI-SQUARE(2
DF)=
1.5400
P-VALUE= 0.463
Forma teórica de la
distribución empírica
Test de Bondad de ajuste
Universidade
de Vigo
Compara la distribución teórica con la empírica.
Analiza las funciones de densidad, es decir hace uso de los
histograma y la función de densidad gaussiana.
Para ello hace uso de intervalos.
Test de bondad de ajuste (1)
Universidade
de Vigo
1. Calcular los valores observados dentro de cada
subconjunto Sj, j=1,...k., que denominaremos OBSj.
2. Calcular la probabilidad teórica de que la variable tome
algún valor en el subconjunto Sj suponiendo una normal
con los parámetros estimados por MV. Denominamos al
valor esperado ESPj, que será igual al número total de
valores por la probabilidad de que un valor pertenezca a
ese subconjunto
Test de bondad de ajuste (2)
Universidade
de Vigo
3. Calculamos una distancia de tipo ji cuadrado entre esos valores,
que,como los observados siguen una B(n,pj), cada término es
aproximadamente N(0,1), pero no son independientes, ya que
existen dos tipos de relaciones, debido al número de intervalos y a
las estimaciones, en total, 3 restricciones, seguirá una ji cuadrado
con k-3 grados de libertad.
4. Comparar el estadístico con el valor de las tablas y se rechaza si
dicho valor es mayor, porque indica que se ajusta poco a la
distribución normal.
Histograma teórico y empírico
Diferencias
positivas
Universidade
de Vigo
Función de
distribución
teórica
Función de
distribución
empírica
Diferencias
negativas
TelasTelas-normalidad
Universidade
de Vigo
COEFFICIENT OF SKEWNESS =
0.2031 WITH
STANDARD DEVIATION OF 0.3738
COEFFICIENT OF EXCESS KURTOSIS = 0.8323 WITH STANDARD DEVIATION OF 0.7326
JARQUE-BERA NORMALITY TEST- CHI-SQUARE(2
DF)=
1.5400 P-VALUE= 0.463
GOODNESS OF FIT TEST FOR NORMALITY
OF RESIDUALS - 6 GROUPS
OBSERVED 0.0 8.0 10.0 15.0 7.0 0.0
EXPECTED 0.9 5.4 13.7 13.7 5.4 0.9
CHI-SQUARE =
4.5934 WITH 1 DEGREES
OF FREEDOM, P-VALUE= 0.032
Visión gráfica del test de bondad de
ajuste
Universidade
de Vigo
Función de distribución
teórica
Función de distribución
empírica
Valor
observado= 0
Estadístico
X2=Suma=4,59
Valor
esperado= 0,9
(OBS-ESP)2/ESP= 1.11
(OBS-ESP)2/ESP= 0.47
OBS-ESP= -0,9
(OBS-ESP)2/ESP= 2.27
(OBS-ESP)2/ESP= 1.11
(OBS-ESP)2/ESP=0.12
(OBS-ESP)2/ESP= 1
Tratamiento de la normalidad
Universidade
de Vigo
1.Si la distribución es conocida, aunque no sea normal, se
aplica estimación MV.
2.Si la distribución es desconocida, se puede utilizar:
a. Transformaciones buscando normalidad.
b. Regresión robusta.
3.Si la no normalidad es debida a valores atípicos
a. Se utilizan variables ficticias.
b. Se eliminan si hay suficientes datos.
Ejemplo: Fabricación de telas
Universidade
de Vigo
El coste de fabricación de algodón en una empresa de
hilaturas depende de la cantidad de tejido producido y
del precio de la mano de obra que trabaja subcontratada.
los datos de los últimos 40 meses se recoge en la tabla
siguiente.
Interesa comprobar si el comportamiento de los costes
de la fabricación entre unos años y otros es normal.
TelasTelas-normalidad
Universidade
de Vigo
COEFFICIENT OF SKEWNESS =
0.2031
WITH STANDARD DEVIATION OF 0.3738
COEFFICIENT OF EXCESS KURTOSIS = 0.8323 WITH STANDARD DEVIATION OF
0.7326
JARQUE-BERA NORMALITY TEST- CHISQUARE(2 DF)=
1.5400 P-VALUE=
0.463
Variables ficticias
Definición
Binomiales
Multinomiales
Regresión con variables ficticias
Aplicación para solucionar la normalidad
Universidade
de Vigo
Definición de Variables ficticias
Son variables que caracterizan comportamientos
cualitativos de forma que indican si una determinada
observación verifica o no una propiedad prefijada
También se les denomina variables indicador de la
propiedad o característica
Generalmente se definen como variables dicotómicas,
pero también pueden definirse para variables
multinomiales
Universidade
de Vigo
Variables ficticias dicotómicas
Universidade
de Vigo
Supongamos que tenemos una variable cualitativa
dicotómica C, es decir, que se verifica una
determinada propiedad o no, que tienen una cualidad
o no, etc..., por tanto únicamente puede tomar dos
valores A y B.
Se define la variable ficticia dicotómica como
1 si C = A
IA = 
0 si C = B
De esta forma se
cuantifica el efecto de
la variable
dicotómica, vale 1 si
la cualidad se verifica
y 0 si no.
17/12/2007
Ejemplos
En una encuesta responder si o no
Ser valor atípico o no serlo
Saber informática o no
Tener un sexo u otro
Ser conductor o no
Ser directivo o no
.........
Universidade
de Vigo
Variables ficticias multinomiales
Universidade
de Vigo
Supongamos que tenemos una variable cualitativa
multinomial C, es decir, que puede tomar mas de dos
valores C1, ...., Cm
Se define una variable ficticia dicotómica para cada uno
de los posibles valores.
1 si Ct = c j
I jt = 
0
si
C
c
≠
t
j

J=1,...m
Ejemplo
Universidade
de Vigo
Supongamos que queremos estudiar la estacionalidad
de las ventas de un producto. La variable estación
toma cuatro valores: Primavera, verano, otoño e
invierno. Definimos dichas opciones como:
C1= Ventas de primavera
C2= Ventas de verano
C3= Ventas de otoño
C4= Ventas de invierno
Por lo tanto definiremos cuatro variables ficticias:
Una hace relación a la primavera
Otra al verano
Otra al otoño
Y la última, al invierno
Ejemplo (2)
1 si ventas ∈ C1
Primavera = 
0 si no
1 si ventas ∈C2
Verano = 
0 si no
1 si ventas ∈ C3
Otoño = 
0 si no
1 si ventas ∈ C4
Invierno = 
0 si no
Universidade
de Vigo
Variables ficticias multinomiales (2)
Universidade
de Vigo
Por consiguiente tendremos m variables ficticias, pero todas
ellas van a verificar una restricción: la suma de todas las
variables siempre vale 1, ya que siempre ocurre uno de los
posibles casos.
Por consiguiente una se puede poner en función del resto, lo
que implica que bastaría definir m-1 variables
Variables ficticias multinomales (3)
Por consiguiente tendríamos
1 si Ct = c j
I jt = 
0
si
C
≠
c
t
j

J=1,...m-1
Universidade
de Vigo
Ejemplo (3)
En el caso de las
estaciones tendríamos
sólo tres, pues el
invierno sería 1 menos la
suma de las otras tres.
Universidade
de Vigo
1 si ventas ∈ C1
Primavera = 
0 si no
1 si ventas ∈C2
Verano = 
0 si no
1 si ventas ∈ C3
Otoño = 
0 si no
Invierno= 1-Primavera-Verano-Otoño
Variables ficticias en la regresión
Universidade
de Vigo
Al incluirlas en una regresión lo hacen como cualquier otra
variable, con la diferencia de que el coeficiente nos mide el
cambio que se produce por estar en esa categoría en vez de
en otra
Ejemplo
considerar el coste de producir una pieza en dos sectores
diferentes A y B
Coste de producción en dos sectores
Universidade
de Vigo
El hecho de incluir o no la variable ficticia cambia los parámetros
de la regresión
Sector A
Sector B
Regresión
para cada
sector
Conjunta sin
dividir en
sectores
Vamos a intentar formalizarlo
Ejemplos de regresión con variables
dicotómicas
Universidade
de Vigo
El caso más habitual es cuando se responde a preguntas sobre
gustos, actitudes, etc., únicamente de la forma si o no, sin
respuestas intermedias.
También se usa para medir efectos de cambios en el tiempo por
legislaciones o efectos puntuales debidos a un sólo valor o a un
conjunto de valores.
Este será el caso que nos interese para resolver los problemas
que se plantean con los valores atípicos, pero previamente
veamos como se introducen estas variables en las ecuaciones de
regresión y que efectos pueden producir.
Planteamiento de la regresión con
variables dicotómicas
Universidade
de Vigo
Supongamos que tenemos una variable cualquiera C que
únicamente puede tomar dos valores A y B de forma que ambos
son excluyentes y exhaustivos. Entones la variable ficticia se
define como
1 si C = A
IA = 
0 si C = B
Regresión con variables dicotómicas
En el caso mas simple, se introduciría en el modelo de
regresión como una variable cualquiera
Modelo sin variable ficticia
y = β0 + β1 X 1 +L+ βk X k + ε
Modelo con variable ficticia
y = β0 + β1 X 1 +L+ βk X k + αI A + ε
Efecto de la variable
ficticia
Universidade
de Vigo
Interpretación
Universidade
de Vigo
Las pendientes se interpretan igual, pero ahora sería el efecto
independientemente del sector
La constante β0 sería el coste fijo en el sector B
La suma de β0 y α sería el coste fijo en el sector A
Por tanto α mide la diferencia entre los costes fijos.
Efecto de las variables dicotómicas
en la regresión
Universidade
de Vigo
Partiendo del modelo sin variable ficticia se puede medir el
impacto de esta sobre cada uno de los coeficientes de la regresión
cuando se sospecha que cada uno de los grupos tiene una relación
diferente totalmente. En ese caso se definen una serie de variables
auxiliares que miden el impacto sobre la pendiente
 X j si t ∈ A
IX j = 
j = 1...k
0 si t ∉ A
Con esas variable el modelo quedaría:
y = β 0 + β1 X 1 + L + β X k +
+α 0 I A + α1 IX 1 + L + α k IX k + ε
Efecto de la variable
ficticia sobre la
pendiente de Xk
Interpretación
Universidade
de Vigo
Las pendientes se interpretan igual, pero ahora sería el efecto
independientemente del sector
La constante β0 sería el efecto fijo en el sector B
La suma de β0 y α0 sería el efecto fijo en el sector A
Por tanto α0 mide la diferencia entre los efectos fijos
Cada una de las pendientes βj sería el impacto de Xj sobre Y
en el sector B
La suma de βj y αj nos mediría el impacto de Xj sobre Y en el
sector A
Por tanto cada uno de los αj nos mide la diferencia entre los
impactos en los sectores A y B.
Regresión en XUMA con variables
ficticias
Universidade
de Vigo
|_GENR T=TIME(0)
|_GENR D12=(T.EQ.12)
|_OLS Y X1 X2 D12/RESID=E INFLUENCE HATDIAG=HT
REQUIRED MEMORY IS PAR=
3 CURRENT PAR=
2000
OLS ESTIMATION
20 OBSERVATIONS
DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO:
1,
20
R-SQUARE =
0.9855
R-SQUARE ADJUSTED =
0.9828
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.30698E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.17521
SUM OF SQUARED ERRORS-SSE= 0.49117
MEAN OF DEPENDENT VARIABLE =
13.708
LOG OF THE LIKELIHOOD FUNCTION = 8.68826
VARIABLE
ESTIMATED STANDARD
T-RATIO
PARTIAL STANDARDIZED ELASTICITY
NAME
COEFFICIENT
ERROR
16 DF
P-VALUE CORR. COEFFICIENT AT MEANS
X1
0.48369
0.1711E-01
28.27
0.000 0.990
0.9224
0.2085
X2
0.57535E-01 0.1477E-01
3.896
0.001 0.698
0.1183
0.0285
D12
0.88083
0.1956
4.504
0.000 0.748
0.1476
0.0032
CONSTANT
10.415
0.1499
69.47
0.000 0.998
0.0000
0.7598
Efecto en la regresión en XUMA de la
variable ficticia
Universidade
de Vigo
RESIDUAL
RSTUDENT
HT
COVRAT
DFFITS
DFFIT
1 -0.31969
-2.0908
0.0779
0.5047 -0.6077 -0.27007E-01
2 -0.10402
-0.6500
0.1960
1.4407 -0.3209 -0.25351E-01
3 0.26206
1.7350
0.1635
0.7446
0.7671 0.51219E-01
4 -0.27322E-01 -0.1673
0.1835
1.5737 -0.0793 -0.61407E-02
5 0.26840
1.7640
0.1463
0.7134
0.7302 0.45991E-01
6 -0.94858E-01 -0.5485
0.0682
1.2832 -0.1483 -0.69375E-02
7 0.17410
1.0880
0.1563
1.1323
0.4683 0.32256E-01
8 0.88418E-01
0.5119
0.0729
1.3029
0.1435 0.69511E-02
9 -0.16736
-1.0261
0.1305
1.1350 -0.3975 -0.25115E-01
10 -0.85826E-01 -0.5376
0.2066
1.5117 -0.2743 -0.22345E-01
11 0.18209
1.1141
0.1167
1.0664
0.4050 0.24063E-01
12 0.64435E-14
0.0000
1.0000********* 106.9110
19.346
13 0.10515
0.7446
0.3683
1.7725
0.5686 0.61319E-01
14 -0.23246
-1.4430
0.0974
0.8528 -0.4741 -0.25090E-01
15 -0.17150
-1.0457
0.1187
1.1085 -0.3837 -0.23095E-01
16 0.12570
0.8123
0.2365
1.4273
0.4521 0.38932E-01
17 -0.30907E-01 -0.1989
0.2605
1.7322 -0.1180 -0.10887E-01
El valor atípico aparece
18 -0.19273E-01 -0.1146
0.1353
1.4918 -0.0453 -0.30148E-02
ahora como muy influyente,
19 -0.40684E-01 -0.2437
0.1456
1.4915 -0.1006 -0.69358E-02
pero no atípico
20 0.87971E-01
0.5228
0.1194
1.3676
0.1925 0.11927E-01
SUM-OF-SQUARED PREDICTION ERRORS SSPE,PRESS,CV=
374.93
SCHMIDT(1974) SUM OF SQUARES OF STANDARDIZED PREDICTION ERRORS= 0.56862
STONE(1974) CROSS-VALIDATION= 0.36193E-01
Grafico de probabilidad
Ya no hay valores
atípicos, es
prácticamente
normal
Universidade
de Vigo
Descargar