Estadística Descriptiva II: Relación entre variables

Anuncio
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Estadística Descriptiva II: Relación entre
variables
Iniciación a la Investigación Ciencias de la Salud
Jesús Montanero Fernández
MUI Ciencias de la Salud, UEx
25 de octubre de 2010
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
¿De qué trata?
Descripción conjunto concreto de datos (sin generalizar)
Clasificación Tablas de frecuencia
Representación Gráficos
Resumen Valores típicos
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Tipos de variables ¿?
Según SPSS
Cualitativas (factores)
Nominales: Grupo sanguíneo
Ordinales: Grado enfermedad
Cuantitativas o de escala : Temperatura, estatura, glucemia,
no hijos...
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Problemas estadísticos: relación
Tipos de relaciones
Cualitativa (factor) ↔ Cuantitativa (Comparación de
grupos o tratamientos)
Cuantitativa ↔ Cuantitativa (Regresión)
Cualitativa (factor) ↔ Cuanlitativa (Tablas de
contingencia)
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Relación entre dos variables cuantitativas
Peso-altura
X =peso(kg)
Y =altura(cm)
80
174
45
152
Jesús Montanero Fernández
63
160
94
183
24
102
75
183
56
148
Estadística Descriptiva II: Relación entre variables
...
...
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Gráfico
Diagrama de dispersión
Y
6
200−
190−
q
180−
qq
170−
160−
q qq
q
150−
140−
q
q
q
130−
120−
110−
q
100−
|
|
q
|
|
|
|
|
|
|
|
10 20 30 40 50 60 70 80 90 100
Jesús Montanero Fernández
-
X
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Otro ejemplo
5,200
5,100
Anchura cabeza
5,000
4,900
4,800
4,700
4,600
4,500
7,800
8,100
8,400
8,700
9,000
Longitud cabeza
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Estudiamos inicialmente relaciones lineales
Concentración de calcio (mg/100ml)
11,00
10,00
9,00
8,00
7,00
6,00
5,00
0,00
1,00
2,00
3,00
4,00
5,00
Concentración de hormona paratiroidea (mug/ml)
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Valores típicos
Dos tipos
De las variables por separados.
Referentes a la relación entre las variables
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Variables por separado
x,
sx ,
y,
Jesús Montanero Fernández
sy ,
ỹ, . . .
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Referentes a la relación entre las variables: Covarianza → r
Pn
(xi − x)(yi − y)
sxy = i=1
n−1
− sx · sy ≤ sxy ≤ + sx · sy .
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Interpretación gráfica
−630,71 ≤ sxy ≤ +630,71
sxy = 577,86
200
Altura
175
150
125
100
20
40
60
80
100
Peso
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
5,200
5,100
Anchura cabeza
5,000
4,900
4,800
4,700
4,600
4,500
7,800
8,100
8,400
8,700
9,000
Longitud cabeza
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Interpretación gráfica covarianza
Y
q Y
6
q
q
qq
q
q
6
q
q
Y
q
6
q
q
q
-
X
Jesús Montanero Fernández
q
q
qq
q
q
-
X
q
q -
X
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Covarianza próxima a cero
8,00
7,00
6,00
y
5,00
4,00
3,00
2,00
1,00
2,00
4,00
6,00
8,00
x
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Covarianza negativa
Concentración de calcio (mg/100ml)
11,00
10,00
9,00
8,00
7,00
6,00
5,00
0,00
1,00
2,00
3,00
4,00
5,00
Concentración de hormona paratiroidea (mug/ml)
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Coeficiente de correlación lineal r
Medida adimensional del grado de correlación
− sx · sy ≤ sxy ≤ + sx · sy .
r=
sxy
sx · sy
−1 ≤ r ≤ 1
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
r = 0,91
Y
6
200−
190−
q
180−
qq
170−
160−
q qq
q
150−
140−
q
q
q
130−
120−
110−
q
100−
|
|
q
|
|
|
|
|
|
|
|
10 20 30 40 50 60 70 80 90 100
Jesús Montanero Fernández
-
X
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
r = 0,625
5,200
anch
5,000
4,800
4,600
7,800
8,100
8,400
8,700
9,000
longt
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
r = −0,97
Concentración de calcio (mg/100ml)
11,00
10,00
9,00
8,00
7,00
6,00
5,00
0,00
1,00
2,00
3,00
4,00
5,00
Concentración de hormona paratiroidea (mug/ml)
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Recta de regresión lineal
y = a + b · x y = 89,11 + 1,10x
Predicciones: x = 62kg → ŷ = 89,11 + 1,10 · 60 = 155,11cm
200
Altura
175
150
125
100
20
40
60
80
100
Peso
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Regresión múltiple
¿Pueden introducirse más variables explicativas en la ecuación?
y = a + b1 x1 + b2 x2 + b3 x3
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Varianza residual
Mide el error cometido por la recta de regresión
Pn
1
2
s2y←x = n−2
i=1 [yi − (a + bxi )] = 1335,32/10
xi
80
45
63
94
24
75
56
52
61
34
21
78
yi
174
152
160
183
102
183
148
152
166
140
98
160
(a + bxi )
176.80
138.44
158.17
192.15
115.42
171.32
150.50
146.11
155.98
126.38
112.12
174.61
Jesús Montanero Fernández
[yi − (a + bxi )]2
7.86
183.94
3.36
83.70
180.05
136.37
6.23
34.69
100.48
185.51
199.66
213.47
1335.32
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Coeficiciente de determinación r2
s2y←x
2
= 1 − rxy
s2y
2
1 − rxy
indica la proporción de la variabilidad total de Y no
explicada por la regresión.
2
rxy
expresa lo contrario.
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
r2 = 0,82
200
Altura
175
150
125
100
20
40
60
80
100
Peso
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
r2 ' 0
8,00
7,00
6,00
y
5,00
4,00
3,00
2,00
1,00
2,00
4,00
6,00
8,00
x
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
r2 = 0,39
5,200
5,100
Anchura cabeza
5,000
4,900
4,800
4,700
4,600
4,500
7,800
8,100
8,400
8,700
9,000
Longitud cabeza
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Regresión no lineal
Edad días-Peso embrión: Transformar variables
3.000
Peso Embrión
2.000
1.000
0
10
12
14
16
Edad embrión
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Relación entre variables cualitativas
nivel contaminación - salud árboles
Cloroplastos
(3 × 3) Alto Medio Bajo
Alto
3
4
13
5
10
5
SO2 Medio
Bajo
7
11
2
Total
15
25
20
Jesús Montanero Fernández
Total
20
20
20
60
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Vacunación-hepatitis
Vacunación
(2 × 2)
Sí
Hepatitis
No
Total
Sí
11
538
549
Jesús Montanero Fernández
No
70
464
534
Total
81
1002
1083
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Gráfico
Barras agrupadas
Gráfico de barras
Nivel de cloroplastos
Cloroplastos alto
Cloroplastos medio
Cloroplatos bajo
12,5
Recuento
10,0
7,5
5,0
2,5
0,0
SO2 alto
SO2 medio
SO2 bajo
Nivel de SO2
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Medidas del grado de dependencia
Observados vs Esperados independencia: distancia χ2
X (Oij − Eij )2
χ2exp =
Eij
i,j
0 ≤ χ2exp ≤ +∞
Coeficiente de contingencia de Pearson C
s
χ2exp
C=
χ2exp + n
s
q−1
0≤C≤
, q = min{no filas, no colunas}
q
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Ejemplo: cloropastos
Tabla 3 × 3. Por lo tanto,
r
0≤C≤
2
= 0,816
3
En este caso concreto,
C = 0,444
Grado de asociación medio
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Independencia C = 0
Cloroplastos
SO2
(3 × 3)
Alto
Medio
Bajo
Total
Alto Medio Bajo
5
8.3
6.7
5
8.3
6.7
5
8.3
6.7
15
25
20
Jesús Montanero Fernández
Total
20
20
20
60
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Máxima dependencia C = 0, 816
Los valores observados deberían ser éstos:
Cloroplastos
SO2
(3 × 3)
Alto
Medio
Bajo
Total
Alto Medio Bajo
0
0
20
0
20
0
20
0
0
20
20
20
Jesús Montanero Fernández
Total
20
20
20
60
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Cualitativa → cuantitativa
Puntuación de ansiedad de Hamilton
20,00
18,00
16,00
5
14,00
12,00
10,00
8,00
Viven solos
Viven con otras personas
Grupo
¿Influye el estilo de vida en la ansiedad?
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
¿Influye la acidosis en la glucemia?
Nivel de glucemia en el cordón umbilical
100,000
90,000
80,000
70,000
60,000
50,000
40,000
Control
Acidosis Respiratoria
Acidosis Metabólica
Acidosis Mixta
Tipo de acidosis
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Contrastes de hipótesis
H 0 : µ1 = µ2 = µ3 = µ4
Parámetros poblacionales
µ denota la media poblacional de una variable cuantitativa
Parámetros muestrales
Nosotros sólo contamos con los valores típicos (x,s, etc) de una
muestra de cada población.
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Regresión-correlación
Tablas de contingencia
Comparación de grupos o tratamientos
Inferencia Estadística
En general, ¿cómo generalizar conclusiones a partir de una
muestra?
Jesús Montanero Fernández
Estadística Descriptiva II: Relación entre variables
Descargar