I. Estadística Descriptiva de dos variables

Anuncio
I. Estadística Descriptiva de
dos variables
Objetivo:
Estudiar la posible asociación entre dos variables
Herramientas:
A. Estadísticos: Covarianza, Coeficiente de correlación
B. Representaciones gráficas: Diagramas de dispersión,
rectas de regresión
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
Guión
•
•
Ø
Ø
•
Ø
Ø
II.1 Diagramas de Dispersión
II.2 Medidas de Asociación
Covarianza
Coeficiente de correlación
II.3 Regresión
Regresión lineal
Regresión No lineal
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
2 Diagrama de dispersión
Variable explicativa x
Variable respuesta y
Suponemos que la variable y depende de la variable x.
A veces solo queremos ver si hay asociación y de que tipo
Diagrama de dispersión Gráfico en el que se representan los puntos
(x_i, y_i)
Cerebro CI Escalado
Grados Consumo
Cerebro CI
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
¿Qué se observa en el diagrama de dispersión?
Asociación: fuerte o débil
Asociación: negativa o positiva
Asociación: lineal o no lineal
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
3. Medidas de Asociación
Covarianza muestral : Muestra la relación
entre los datos
1 n
1 n
cov x , y = ∑ ( xi − x )( yi − y ) = ( ∑ xiyi ) −xy
n i =1
n i =1
Asociación positiva
cov >0
Asociación negativa
cov <0
No Asociación
cov ~0
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
¡Depende de las
Unidades!
3 Regresión
•
Regresion Lineal Se trata de buscar la recta que aproxima
mejor los datos
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
P¿Como se halla la recta de regresión?
• Se busca una recta y=a+bx, tales que los coeficientes
a y b minimizen,
1
ECM =
n
n
∑
( yi − a − bxi)2
i =1
Respuesta (Derivando)
cov xy
a=y− v x
x
cov x , y
b=
vx
cov xy
y−y =
(x − x)
vx
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
• Recta de
Regresión
3. Medidas de Asociación
Coeficiente de correlación (Pearson) :
Muestra la relación (lineal) entre los datos
C ovx, y
r =
v xv y
Asociación fuerte y positiva
r~ 1
Asociación fuerte y negativa
r ~-1
No Asociación
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
r ~0
Relación entre la recta de Regresión y el
coeficiente de correlación
E.CM = vy (1 − r )
2
1 n
cov xy
2
E .CM = ∑ ( yi − y +
( x − xi ))
n i =1
vx
vy
vx cov xy
1 n
cov xy 2
cov xy
2
2
( yi − y ) + (
) ( x − xi ) − 2( yi − y )( x − xi )
∑
n i =1
vx
vx
(cov x , y )2
= vy −
= vy − vyr 2
vx
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
Coeficiente de correlación
• No depende de las unidades
• No es robusto (depende de datos
atípicos)
•
r
2
=% de la variacion de y que se debe a la
variación de x
• Solo mide relaciones lineales
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
3 Regresión no lineal
• Regresion No Lineal Se trata de buscar una curva que
aproxime los datos de la mejor manera posible. Puede
ser exponencial polinomial,etc
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
¿Como se calcula?
y = ae
bx
Ln ( y ) = Ln ( a ) + bx
z
Se hace la regresión de la nueva variable Z sobre X
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
¿Cómo hacemos regresión
logaritmica?
z
y = a + Ln( x )
Y = a + bLn( x )
Se hace la regresión de la variable Y sobre Z
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
¿Cómo hacemos regresión
potencial?
W
y = a( x)
b
z
Ln (Y ) = Ln( a ) + bLn( x )
Se hace la regresión de la variable W sobre Z
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
¿Cómo se predice el futuro con
los modelos de regresión?
y = f ( x)
Modelo de Regresión
¿Que valor predice para un valor x de la variable respuesta?
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
Concentración de NO2 en una ciudad de Noruega (tabla parcial de datos)
Concent
3.71844
3.10009
3.31419
4.38826
4.3464
4.16044
4.01277
2.15176
3.157
2.37955
3.83298
4.48187
4.0483
4.00186
3.2308
4.67189
2.73437
3.49651
3.67122
3.67377
3.15274
3.42751
4.32413
3.65584
Cars
7.6912
7.69894
4.81218
6.95177
7.51806
7.67183
5.52545
4.68213
7.15618
4.74493
5.81114
8.10892
8.31385
5.22036
6.40853
7.3192
6.6174
7.76938
6.4677
7.65064
7.75061
5.18178
7.63964
8.00703
Temp WindSp
9.2
4.
6.4
3.5
-3.7 0.9
-7.2 1.7
-1.3 2.6
2.6
1.6
-7.9 1.6
-4.1 3.8
-12.7 5.2
-1.6 3
-3.1 1.8
1
1.2
12.2 4
-1.5 2.4
-0.9 3
-8.5 0.8
6.5
4.2
-1.1
2.5
0.8
3.4
8.2
4.5
0.2
0.4
-2.1 4.3
-2.8 6
TempDiff
8
-0.3
-0.1
1.2
-0.1
0.3
0.3
-0.1
-0.1
0.4
0.3
1.5
-2.8
0.9
0.1
2.9
4.1
7.1
1
-0.4
0.2
0.2
-0.2
-0.2
WindDir
74.4 20
56
281.3 4
74
65
224.2
211.9
63.1
64.5
58.3
78
215
230.4
82.7
235
282.4
88
19. 3
277
70
307
230
41.4 11
62.5 15
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
Hour Day
600
14
196
513
23
143
11
115
19
527
5
502
4
453
12
462
3
554
2
55
18
47
17
572
5
556
1
69
20
447
24
186
10
550
6
142
12
167
14
32
5
112
432
453
Análisis con todos los datos
r = 0.5121
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
Correlación con parte de los datos
r = 0.774
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
¡Cuidado!
• Correlaciones y datos atípicos
• Correlaciones y heterogeneidad
• Correlaciones espurias
Create PDF with GO2PDF for free, if you wish to remove this line, click here to buy Virtual PDF Printer
Descargar