Tema 2: Estadística bidimensional.

Anuncio
ESTADÍSTICA APLICADA. TEMA 2. DISTRIBUCIONES BIDIMENSIONALES
1.
Rel ac i ó n fu n ci o n al y r el ac i ó n est ad í st ic a
D o s va riab le s x e y e st án re lacion ad as f un c io n al men te cu an do
co n o cid a la p rime ra se p u ed e sab e r co n e xact it u d e l valo r d e la
se gu n da.
E j emp l o Si se de ja cae r u n a p ie d ra, e xist e u n a f ó rmu la q u e no s
p e r m ite calcu lar exact ame n te , la altu ra a la qu e se en cu e nt ra en
f u n ción d e l t ie mp o t ran scu rrid o . h = ½ g t ² .
D o s va riab le s x e y e st án re lacion adas est ad í st i c amen te cu an d o
co n o cid a la p rime ra se p u e d e e st imar ap ro ximad ame nt e e l valo r de
la se gu nd a.
E j emp l o s In gre so s y gast o s d e u n a f amilia. P ro du cció n y ve nt as de una
f á b r ica . Gast o s en pu b licid ad y b e ne f icio s d e un a e mp re sa.
2.
Di st ri b uc i on es b id imen si o n al es
S o n aq u ellas en las q ue a cad a in d ivid u o le co rre sp ond e n los
va lo r e s de do s variab le s, las re p re se nt amo s p o r e l p ar (x i , y i ).
S i r e p r e sen t amo s cad a p ar de valo re s co mo las co o rd e n adas d e un
p u nt o , e l co n ju nt o d e t o do s e llo s se llama n ub e d e pu n t o s o
d i agr ama d e d i sp ersi ó n .
S o b r e la n ub e d e pu n to s pu e d e t raz arse u n a re ct a q u e se aju st e a
e llo s lo me jo r p o sible , llamad a r ec t a d e r e gr esi ó n .
E j emp l o : Las n ot as d e 1 2 alu mn o s d e u n a clase en M ate mát icas y
F ísica so n las sigu ien t e s:
Mat em át i c as
2
3
4
4
5
6
6
7
7
8
10
10
Fí si c a
1
3
2
4
4
4
6
4
6
7
9
10
1
3.
Covarianza.
La covarianza de una variable bidimensional es la media aritmética de
los productos de las desviaciones de cada una de las variables respecto a
sus medias respectivas.
La covarianza se representa por s xy o σ xy .
La covarianza indica el sentido de la correlación entre las variables
Si σ xy > 0 la correlación es directa.
Si σ xy < 0 la correlación es inversa.
La covarianza presenta como inconveniente, el hecho de que su valor
depende de la escala elegida para los ejes.
Es decir, la covarianza variará si expresamos la altura en metros o en
centímetros. También variará si el dinero lo expresamos en euros o en
dólares.
Ejemplo 1: Las notas de 12 alumnos de una clase en Matemáticas y Física
son las siguientes:
Matemáticas
2
3
4
4
5
6
6
7
7
8
10
10
Física
1
3
2
4
4
4
6
4
6
7
9
10
Hallar la covarianza de la distribución.
2
xi
yi
xi · yi
2
1
2
3
3
9
4
2
8
4
4
16
5
4
20
6
4
24
6
6
36
7
4
28
7
6
42
8
7
56
10
9
90
10
10
100
72
60
431
Después de tabular los datos hallamos las medias aritméticas:
3
Ejemplo 2: Los valores de dos variables X e Y se distribuyen según la
tabla siguiente:
Y/X
0
2
4
1
2
1
3
2
1
4
2
3
2
5
0
Hallar la covarianza de la distribución.
En primer lugar convertimos la tabla de doble entrada en tabla simple y
calculamos las medias aritméticas.
xi
yi
fi
xi · fi
yi · fi
xi · yi · fi
0
1
2
0
2
0
0
2
1
0
2
0
0
3
2
0
6
0
2
1
1
2
1
2
2
2
4
8
8
16
2
3
5
10
15
30
4
1
3
12
3
12
4
2
2
8
4
16
20
40
41
76
4
4. Correlación.
La c o r r el aci ó n t rat a d e e stab le ce r la re lació n o de p en d en cia
q u e e xist e en t re las d o s variab le s q u e int e rvien e n en u na
d ist rib u ció n b id imen sio n a l .
E s d e cir, d e t e rmin ar si lo s camb io s e n u n a d e las variab les
in f lu yen en lo s camb io s d e la o t ra. E n caso d e q u e su ce da,
d ir e mo s q u e las variab le s e st án co rre lacio n ad as o que h ay
co r r e lació n e nt re e llas.
4.1.
T i p os d e c o rr el ac i ón
1 º Cor r el aci ó n d ir ect a
La co rre la ció n d ire ct a se d a cu and o al au me nt ar u n a d e las
va r iab le s la o t ra aume n t a. La re ct a co rre sp o nd ien t e a la nu b e de
p u nt o s d e la dist ribu ció n e s un a re ct a cre cie n te .
2 º Cor r el aci ó n i n ver sa
La co rre lació n in ve rsa se d a cu and o al au me nt ar un a de las
va r iab le s la o tra dismin u ye . La re ct a co rre sp on d ie nt e a la n ub e
d e p u nt o s d e la d istrib u ción e s u n a re cta d e cre cien t e .
5
3 º Cor r el aci ó n n ul a
La co rre lació n n u la se d a cu an d o n o h ay d e pe nd e n cia de
n in gún t ip o e nt re las va riab le s. En est e caso se d ice qu e las
va r iab le s so n in co rre lad as y la nu b e d e p u nt o s t ie ne un a fo rma
r e d on d e ad a.
4.2.
G r ad o d e c or r el ació n
E l gr ad o d e c o rr el ac i ó n in d ica la p ro ximid ad q u e h ay e nt re
lo s p un to s de la nu be d e pu nt o s. Se p ued e n d ar t re s t ip o s:
1 . Cor r el aci ó n f u erte
La co rre lación se rá fu e rte cu an to más ce rca e st é n lo s
p u nt o s d e la re ct a.
2 . Cor r el aci ó n d éb il
La co rre lació n se rá d é b il cu an t o más se p arado s e st én los
p u nt o s d e la re ct a.
6
3 . Cor r el aci ó n n ul a
Co mo ya he mo s visto , e n e ste caso la nu b e d e pu nt o s t ie ne
u n a f o rma red o nd e ad a.
5. Coeficiente de correlación.
E l c o efi c i en t e d e c o r r el aci ó n li n eal e s e l co cien te en tre la
c o var i an z a y e l p rod u ct o d e las d e sviacio n e s t íp icas de amb as
va r iab le s. S e e xp re sa me d ian te la le t ra r .
5.1.
Pr o p i ed ad es d el coef i c i en t e d e c or r el ac i ó n
1 . E l c o ef i c i ent e d e c o r r el ac i ón n o varía al h ace rlo la e scala
d e med ició n . E s d e cir, si e xpre samo s la alt u ra e n met ro s o e n
ce n t ímet ro s e l co ef icie n t e d e co rre lación no varía.
2 . E l sign o d e l co ef ic i en t e d e c o rr e l ac ió n e s e l mismo q ue e l
d e la c o var i an z a .
S i la co varian z a e s po sit iva, la co rre lació n e s d ire ct a.
S i la co varian z a e s ne gat iva, la co rre lació n e s in ve rsa.
S i la co varian z a e s nu la, no e xist e co rre lació n .
3 . E l c o ef i ci en t e de c o r r el aci ó n l in eal e s u n n ú me ro real
co mp re nd ido en t re − 1 y 1 . E st o e s: − 1 ≤ r ≤ 1
4 . Si e l c o efi c i ent e d e c o rr el ac i ón l in eal t o ma valore s
ce rcan o s a − 1 la co rre lació n e s fu er t e e i n ver sa , y será tant o
más f ue rte cu an t o más se ap ro xime r a − 1 .
7
5 . Si e l c o efi c i ent e d e c o rr el ac i ón l in eal t o ma valore s
ce rcan o s a 1 la co rre lació n e s f u ert e y d i r ec t a , y se rá t ant o
más f ue rte cu an t o más se ap ro xime r a 1 .
6 . Si e l c o efi c i ent e d e c o rr el ac i ón l in eal t o ma valore s
ce rcan o s a 0 , la co rre lació n e s d ébi l .
7 . Si r = 1 ó − 1 , los p un t o s d e la n ube e st án sob re la rect a
cre cie n t e o d e cre cie n t e . E nt re amb as variab le s h ay
d ep en d en c i a f u n ci on al .
E j emp l o 1: Las n o t as d e 1 2 al u mn o s
Mat em át i c as y Fí si ca so n l as si gui en t es:
de
una
c l ase
Mat em át i c as
2
3
4
4
5
6
6
7
7
8
10
10
Fí si c a
1
3
2
4
4
4
6
4
6
7
9
10
en
Hallar e l c o ef i c i ent e d e c o r r el ac i ón d e la d ist rib u ción e
in t e rp ret arlo .
xi
yi
xi
·yi
xi2
yi2
2
1
2
4
1
3
3
9
9
9
4
2
8
16
4
4
4
16
16
16
5
4
20
25
16
6
4
24
36
16
6
6
36
36
36
7
4
28
49
16
8
7
6
42
49
36
8
7
56
64
49
10
9
90
100
81
10 10 100 100 100
72 60 431 504 380
1 º Hallamo s las me dias arit mé t icas .
2 º Calcu lamo s la co varian z a .
3 º Calcu lamo s las de sviacio n e s t íp icas .
4 º Ap licamo s la fó rmu la d e l co ef i ci en te d e c o rr el ac i ón li neal .
Al se r e l c o efi c i ent e d e c or r el ac ió n p o sit ivo , la co rre lación e s
d ire ct a. Co mo c o ef ic i en t e d e c o r r el aci ón e st á mu y p ró ximo a
1 la co rre lació n e s mu y fu e rt e .
9
E je mp lo2 : Lo s valo re s d e d o s vari ab le s X e Y se d istribu yen
se gú n la t ab la sigu ie n t e:
Y/X
0
2
4
1
2
1
3
2
1
4
2
3
2
5
0
D e t ermin ar e l c o ef ic i en t e d e co rr el ac i ón .
Co n ve rt imo s la t ab la d e d ob le e nt rad a e n t ab la simp le .
xi yi
fi
xi ·
fi
xi2 ·
fi
yi ·
fi
yi2 ·
fi
xi · yi
· fi
0
1
2
0
0
2
2
0
0
2
1
0
0
2
4
0
0
3
2
0
0
6
18
0
2
1
1
2
4
1
1
2
2
2
4
8
16
8
16
16
2
3
5
10
20
15
45
30
4
1
3
12
48
3
3
12
4
2
2
8
32
4
8
16
20
40
120
41
97
76
10
Al se r e l c o ef ic i en te d e c o rr el ac i ó n ne gat ivo , la co rre lación
e s in ve rsa. Co mo c o ef i ci en t e d e co r r el ac ió n e st á muy
p ró ximo a 0 la co rrelació n e s mu y d é b il.
6. Recta de regresión.
La r ec t a d e r egr esi ó n e s la q ue me jo r se aju st a a la nub e d e
p u n to s . P asa p o r e l p u nt o
llamad o c en tro d e gr aved ad .
La re ct a d e re gre sió n d e Y so bre X se u t il iz a p ara e st imar
lo s valo re s d e la Y a p art ir d e lo s de la X.
La p en di en t e de la re ct a e s e l co cien t e e n t re la co varianz a y
la varianz a d e la variab le X.
E j emp l o
Las n o t as d e 12 alu mn o s de u n a clase e n M at e mát icas y
F ísica so n las sigu ien t e s:
Mat em át i c as
2
3
4
4
5
6
6
7
7
8
10
10
Fí si c a
1
3
2
4
4
4
6
4
6
7
9
10
Hallar las r ect as d e r egr esi ó n y re p re sen t arlas.
11
xi
xi
yi
xi2
yi2
·yi
2
1
2
4
1
3
3
9
9
9
4
2
8
16
4
4
4
16
16
16
5
4
20
25
16
6
4
24
36
16
6
6
36
36
36
7
4
28
49
16
7
6
42
49
36
8
7
56
64
49
10
9
90
100
81
10 10 100 100 100
72 60 431 504 380
12
1 º Hallamo s las me dias arimét icas .
2 º Calcu lamo s la co varian z a .
3 º Calcu lamo s las varian z as .
4 º Re ct a d e re gre sión de Y so b re X.
4 º Re ct a d e re gre sión de X so b re Y .
13
E j er c ic i o s d e r egr esi ó n y c o rr el ac i ón
1 . Cin co n iño s de 2 , 3 , 5 , 7 y 8 añ o s de ed ad p e san ,
r e sp e ct ivamen te , 14, 2 0 , 3 2 , 4 2 y 4 4 kilo s.
a) Hallar la e cu aci ó n d e la r ect a d e r egr esi ó n d e la edad
so b r e e l p e so .
b ) ¿Cu ál se ría e l p e so ap ro ximad o d e un n iño de se is añ o s?
2 . Un cen t ro co me rcial sab e en fu n ción d e la d ist an cia, en
kiló me t ro s, a la q ue se sit úe d e u n n úcle o d e p o b lación , acu den
lo s clie nt e s, en cient o s, q u e f igu ran e n la t ab la:
Nº d e c l i ent es (X)
8
7
6
4
2
1
Di st an c i a (Y)
15
19
25
23
34
40
a) Calcu lar e l co ef i ci en t e d e co r r el ac i ón li n eal .
b ) Si e l ce n t ro co me rcial se sit ú a a 2 km, ¿cu án t o s clie nt es
p u ed e e sp e rar?
c ) Si d e se a re cib ir a 5 0 0 clie n te s, ¿a q u é d istan cia del
n ú cle o d e p ob lació n d eb e sit u arse ?
3 . Las no t as o bt e n id as p o r cin co alu mn o s e n M at e mát icas y
Qu ímica so n :
Mat em át i c as
6
4
8
5
3. 5
Q u í mi c a
6. 5
4. 5
7
5
4
D e t ermin ar las r ec t as d e r egr esió n y calcu lar la not a
e sp e rad a e n Qu ímica p ara un alu mn o q ue t ien e 7 .5 en
M a t e mát icas.
4 . Un co nju nt o de d ato s b id ime n sio n ale s (X, Y ) t ie ne
c o ef i c i ent e d e c or rel ac i ó n r = −0 .9 , sie n d o las med ias de las
d ist rib u cio ne s margin ale s
= 1,
= 2 . Se sab e q ue u na d e las
cu a t ro e cu acio ne s sigu ie nt e s co rre sp ond e a la r ect a d e r egr esi ó n
d e Y so b re X:
y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1
Se le ccio n ar raz on adame n te e st a re ct a.
14
5 . Las e st at u ras y p e so s d e 1 0 ju gadore s d e b alo n ce st o de
u n e q uip o so n :
E s t at u r a (X)
Pes o s (Y)
186 189 190 192 193 193 198 201 203 205
85
85
86
90
87
91
93
103 100 101
Calcu lar:
a) La r ec t a d e r egr esi ó n d e Y sob re X.
b ) E l co ef i ci en t e d e c o r r el aci ó n .
c ) E l pe so e st imad o d e u n ju gado r q u e mid e 2 0 8 cm.
6 . A p art ir d e lo s sigu ien t e s d at o s re f e ren te s a h o ras
t r a b ajad as en un t alle r (X), y a u n idad e s p rod u cidas (Y ),
d e t ermin ar la r ec t a d e r egr esi ón de Y so b re X, e l c o ef i ci en t e d e
c o r r el aci ó n l in eal e in t e rp ret arlo .
Ho r as (X)
80
79
83
84
78
60
82
85
79
84
80
62
Pr o d u c ci ó n (Y) 3 0 0 3 0 2 3 1 5 3 3 0 3 0 0 2 5 0 3 0 0 3 4 0 3 1 5 3 3 0 3 1 0 2 4 0
7 . Se h a so licit ad o a u n grup o d e 5 0 ind ivid uo s inf o rmación
so b r e e l n ú me ro de h o ra s q u e d ed ican d iariame nt e a d ormir y
ve r la t e le visión . La clasif icació n d e las re spu e st as h a p e rmit ido
e la b o rar la sie nt e t ab la:
Nº d e h o r as d or mi das (X)
6
7
8
9
10
Nº d e h o r as d e t el evi si ó n (Y)
4
3
3
2
1
Fr ec u en c i as ab so l utas (f i )
3
16
20
10
1
Se p id e :
a) Calcu lar e l co ef i ci en t e d e co r r el ac i ón .
b ) D et e rmin ar la ecu ació n d e la r ec ta d e r egr esi ó n d e Y
so b r e X.
c ) Si u n a p e rson a du e rme o ch o h o ras y me d ia, ¿cu án t o cabe
e sp e rar q ue ve a la te le visió n ?
15
8 . La t ab la sigu ien te n o s d a las n ot as de l t e st de apt itu d (X)
d a d a s a se is d ep e nd ie nt e s a p ru e b a y ve n t as de l p rimer me s de
p r u eb a (Y ) en cien tos d e e u ro s.
X
25
42
33
54
29
36
Y
42
72
50
90
45
48
a) Hallar e l c o ef i ci en t e d e c o rr el ac ió n e int e rp ret ar el
r e su lt ad o o bt e n id o .
b ) Calcu lar la r ect a d e r egr esi ó n d e Y so b re X. Pre de cir las
ve n t as d e u n ve nd ed o r q u e ob t en ga 47 e n e l te st .
9 . Un a co mp añ ía de se a h ace r p re d iccio n e s d e l valo r an ual
d e su s ve nt as t ot ale s e n cie rt o p aís a p art ir de la re lació n d e
é st a s y la re n ta n acio n al. P ara in ve st igar la re lació n cu en ta co n
lo s sigu ien t e s d at o s:
X
189
190
208
227
239
252
257
274
293
308
316
Y
402
404
412
425
429
436
440
447
458
469
469
X re p re sen t a la ren t a nacio n al en millo n e s de e u ro s e Y
r e p r e sen t a las ve ntas d e la co mp añ ía e n mile s d e eu ro s e n e l
p e r iod o qu e va de sd e 19 9 0 h ast a 2 0 0 0 (amb o s in clusive ).
Ca lcu lar:
a) La r ec t a d e r egr esi ó n d e Y sob re X.
b ) E l co ef i ci en t e d e c o r r el aci ó n l in eal e in t e rp ret arlo .
c ) Si e n 20 0 1 la re nt a n acion al de l p aís f u e d e 32 5 millon es
d e e uro s. ¿Cu ál se rá la p red icció n para las ve n t as d e la co mp añ ía
e n e st e añ o ?
1 0 . La inf o rmación e st ad íst ica o bt e n ida d e un a mu e st ra de
t a m año 1 2 so b re la re lación e xiste n t e e nt re la in ve rsión
r e a liz ad a y e l re n d imie n to o bt e n id o en cie n t o s d e mile s d e e u ro s
p a r a e xp lo t acion e s agríco las, se mu e st ra e n e l sigu ie nt e cuad ro :
I n ver si ón (X)
Ren d i mi en t o (Y)
11 14 16 15 16 18 20 21 14 20 19 11
2
3
5
6
5
3
7
10
6
10
5
6
Calcu lar:
16
a) La r ec t a d e r eg r esi ó n d e l ren d imie n t o re sp e ct o de la
in ve rsió n .
b ) La p re visión de in ve rsión qu e se o bt e nd rá co n un
r e n d imie nt o d e 1 250 0 00 € .
1 1 . E l n úme ro d e h o ras d e d icad as al e st ud io d e u na
a sign at ura
y
la
calif icació n
o bt e n id a
en
el
e xame n
co r r e sp on d ien t e, de o ch o p e rson as e s:
Ho r as (X)
20
16
34
23
27
32
18
22
C al i f ic ac i ó n (Y)
6.5
6
8.5
7
9
9.5
7.5
8
Se p id e: a) Rec t a d e r egr esi ó n d e Y sob re X. b ) Calif icación
e st imad a p ara un a pe rso n a q ue hu b ie se e st ud iad o 2 8 ho ras.
1 2 . En la t ab la sigu ie nt e se in dica la e d ad (e n añ o s) y la
co n d u ct a agre siva (me d id a en un a e scala d e ce ro a 1 0 ) d e 10
n iñ o s.
E d ad
C o n d u ct a agr esi va
6 6 6.7 7 7.4
9 6
7
8
7.9 8 8.2
7
4
2
3
8.5
8.9
3
1
a) Ob t e n e r la r ec t a d e r egr esi ó n de la co n du ct a agre siva e n
f u n ción de la ed ad . b ) A p art ir de d icha re ct a, ob t en e r e l valo r d e
la co n du ct a agre siva q ue co rre sp on d e ría a un n iñ o de 7 .2 añ o s.
1 3 . Lo s valo re s de d o s variab le s X e Y se d ist rib u yen se gún
la t ab la sigu ie nt e :
Y/ X
100
50
25
14
1
1
0
18
2
3
0
22
0
1
2
Se p id e : a) Calcu lar la c o var i an z a .
b ) Ob te n e r e in te rp re t ar e l co ef icie nt e de c o rr el ac i ón l i n eal .
c ) E cu ació n d e la r ec t a d e r egr esi ón d e Y so b re X.
1 4 . Las pu nt u acion es o b t en id as p o r u n gru p o d e alu mn o s en
u n a b ate ría d e t est qu e mid e la hab ilid ad ve rb al (X) y e l
r a z o namie nt o ab stract o (Y ) son las siguie n t e s:
17
Y/ X
20 30 40 50
(2 5 - 3 5 )
6
4
0
0
(3 5 - 4 5 )
3
6
1
0
(4 5 - 5 5 )
0
2
5
3
(5 5 - 6 5 )
0
1
2
7
Se p id e : a) ¿E xist e co r r el ac ió n e nt re amb as variable s?
b ) Se gú n lo s d at o s d e la t ab la, si u no d e e st o s alu mnos
o b t ie n e u n a p un tu ació n d e 70 pu n to s e n razo n amie nto
a b st racto , ¿e n cu ánt o se e st imará su h ab ilid ad ve rb al?
1 5 . Se sabe qu e e ntre e l con su mo de pap e l y el nú me ro de
lit r o s de agu a p o r me t ro cuad rad o qu e se re co ge n en un a ciu d ad
n o e xiste relació n .
a) ¿Cu ál e s e l valo r d e la c o var i an z a d e e st as variab le s?
b ) ¿Cu án to vale e l co e f icie nt e d e c or r elac i ó n l i n eal ?
c )¿Qu é e cu acio ne s tie n e n las d o s r ec t as d e r egr esi ón y cu ál
e s su p o sició n e n e l p lan o ?
1 6 . E n un a e mpre sa d e t ran sp o rte s t rab ajan cu at ro
co n d u ct o re s. Lo s año s d e an t igüe d ad de p e rmiso s d e co ndu cir y
e l n ú mero d e in f raccio n e s co me t idas e n e l ú lt imo añ o po r cada
u n o d e e llo s so n lo s sigu ie nt e s:
A ñ o s (X)
3
4
5
6
I n f r ac ci o n es (Y)
4
3
2
1
Calcu lar e l co ef i ci en t e d e c or r el aci ó n li n eal e int e rp re t arlo .
1 7 . Un a p e rson a re lle n a se man alment e un a qu in ie la y u n
b o let o d e lot e ría p rimit iva an o t an do e l n ú me ro d e aciert os que
t ie n e . D u ran t e las cu at ro se man as d e l me s d e f eb re ro , lo s
a cie rt o s f u ero n:
Q u i ni el a (X)
6
8
6
8
Pr i mi ti va (Y)
1
2
2
1
Ob t e ne r e l c o ef i ci en t e d e c o r r el ac i ón li n eal e in t e rp ret arlo .
¿Of r e ce rían co nf ianz a las p re visio n e s h e ch as co n las re ctas d e
r e gr e sió n ?
18
Descargar