1. TEORIA DE LA PROBABILITAT EXPERIÈNCIA ALEATÒRIA: Experiència que es repeteix indefinidament en condicions idèntiques amb diferents resultats. Exemple: llançament d’un dau El resultat obtingut pertany a tots els resultats possibles (espai mostral). El resultat no es prediu amb certesa (condició d’atzar). La freqüència relativa de cada resultat tendeix a un valor fix quan augmenta el número d’assajos. Exemple: si llenço un dau 6000 vegades, podem pensar que 1000 vegades sortirà l’1, 1000 vegades sortirà el 2,..., sinó no hi hauria equilibri. EXPERIÈNCIA DETERMINÍSTICA: Experiència que es repeteix en condicions idèntiques amb els mateixos resultats. Exemple: recorregut d’un espai en un període de temps determinat a una velocitat constant. ESPAI MOSTRAL: Conjunt de tots els esdeveniments elementals. Resultats possibles d’una experiència aleatòria. Exemple: Espai mostral del llançament d’un dau E (1, 2, 3, 4, 5, 6) Espai mostral del llançament de dues monedes E (CC, CX, XC, XX) ESDEVENIMENT: Qualsevol subconjunt dels elements d’un espai mostral. Exemple: Número parell en un dau A= (2, 4, 6) Un esdeveniment es presenta quan s’obté com a resultat un dels elements que el composen. Exemple: En llançar un dau, si surt un 4, s’ha presentat un esdeveniment parell. ESDEVENIMENT ELEMENTAL: Esdeveniment format per un sol element. Exemple: En un dau, un número >2 o <5. ESDEVENIMENT COMPOST: Esdeveniment format per més d’un element. Exemple: En un dau, un número parell <6 A= (2,4) ESDEVENIMENT SEGUR: Esdeveniment format per tots els resultats possibles. Coincideix amb l’espai mostral. És un esdeveniment que es presenta sempre. Exemple: En un dau En una moneda E (1, 2, 3, 4, 5, 6) E (C, X) ESDEVENIMENT IMPOSSIBLE: Esdeveniment que no es presenta mai. Exemple: En un dau que surti el número 8. ESDEVENIMENT PROBABLE: Esdeveniment que no és segur ni impossible Exemple: En un dau que surti un 4. ESDEVENIMENTS INCOMPATIBLES: Dos esdeveniments que no es poden realitzar simultàniament o a l’hora. La intersecció entre ells és nul·la. No tenen elements comuns. Exemple: A=(2, 4, 6) B=(1) Aquests dos esdeveniments són incompatibles perquè no pot sortir un número parell >2. COMPLEMENTARI D’UN ESDEVENIMENT: Subconjunt de l’espai mostral integrat pels esdeveniments elementals no inclosos en l’esdeveniment. Exemple: A=(2, 4, 6) A’=(1, 3, 5) Aquest esdeveniment és el complementari de l’anterior. PROBABILITAT Definició clàssica o a priori: Freqüència relativa de l’esdeveniment a l’espai mostral. Exemple: La probabilitat que surti un 5 en el llançament d’un dau és d’1/6. P(A)= nº casos favorables nº casos possibles TEOREMES FONAMENTALS 1. La probabilitat d’un esdeveniment és un valor que oscil·la entre 0 i 1, on el 0 correspon a esdeveniment impossible i l’1 correspon a esdeveniment segur ( 0_< P(A)_<1 ). 2. La probabilitat d’un esdeveniment més la probabilitat de l’esdeveniment complementari val 1. P(A)+P(A’)=1 3. Quan un esdeveniment és segur, el complementari és 0 i la probabilitat val 0. Si P(A)=1 P(A’)=0 TEOREMA DE L’ADDICCIÓ Probabilitat total o unió de dos o més esdeveniments ESDEVENIMENTS COMPATIBLES: La probabilitat que es presenti A o B és igual a la probabilitat de A més la probabilitat de B menys la probabilitat de A i B (P(AUB): elements comuns entre A i B). 3) P (A B ) = P (A ) + P (B ) - P (A B ) Exemple: A=(2, 4, 6) B=(4) P(AUB)= 3/6 + 1/6 – 1/6 = 3/6 = 0,5 ESDEVENIMENTS INCOMPATIBLES: 5) P (A B ) = p (A ) + P (B ) Exemple: A=(2, 4, 6) B=(4) P(AUB)= 3/6 + 1/6 = 4/6 Definició freqüencialista o a posteriori: PROBABILITAT CONDICIONAL: La probabilitat condicional indica aquella probabilitat que es pot modificar en aconseguir una informació afegida. Exemple: P(1, 2, 3) NEGRE P(nº parell) = 3/6 P(4, 5, 6) VERMELL P(nº parell vermell) = 2/6 P(B/A) = 2/6 DAU/RESULTAT Nº Parell Nº Imparell Dau Negre 1 2 3 Dau Vermell 2 1 3 3 3 6 = 2/3 = 0,67 3/6 7) P (B /A ) = P (A B ) P (A ) Probabilitat que surti B donat que A ja ha aparegut. En aquest exemple, B és el número parell i A és la cara vermella del dau. Aquesta condició és igual a la probabilitat de A i B partit per la probabilitat de A. TEOREMA DEL PRODUCTE ESDEVENIMENTS DEPENDENTS: L’ocurrència d’un esdeveniment té relació amb un altre esdeveniment. Aquesta probabilitat d’ocurrència ve donada per: 8) P (A B ) = P (A ) P (B /A ) Exemple: Probabilitat que surti una cara vermella (A) i un número imparell (B) en llançar un dau. P(A B) = 1/2 *2/3 = 1/3 ESDEVENIMENTS INDEPENDENTS 9) P (A B ) = P (A ) P (B ) , ja que quan són independents, P(B/A) = P(B) i P(A/B) = P(A) VARIABLES ALEATÒRIES VARIABLE ALEATÒRIA (v.a): assignació d’un valor numèric que correspon al resultat d’una experiència aleatòria. Exemple: Llançament de tres monedes E(CCC, XXX, CCX, CXC, XCC, XXC, XCX, CXX) Nº de cares quan llanço tres monedes: 3, 2, 1, 0 Les variables aleatòries poden ser de dos tipus: DISCRETES: variables que adopten valors tal que poden trobar dos valors consecutius entre els quals no existeixen valors assumibles per la variable. Exemple: Una persona pot tenir 0, 1, 2, 3... germans, però mai en tindrà 1,2 o 2,5... . CONTÍNUES: entre dos valors consecutius existeixen infinits valors assumibles per la variable. Exemple: Una persona pot pesar 50,2, o 60,45... VARIABLES ALEATÒRIES DISCRETES (gràfic de barres) FUNCIÓ DE PROBABILITAT d’una v.a discreta (f): funció que associa a cada valor de la variable la probabilitat de presentació del valor. Equival a la freqüència relativa. És la probabilitat d’ocurrència (f(x) = P(X=xi)). Exemple: Nº de cares al llançar tres monedes x1 f(x1)P que es presenti el valor 0 de la variable 0 1/8 1 3/8 2 3/8 3 1/8 1 Esdeveniment segur, total de probabilitat FUNCIÓ DE DISTRIBUCIÓ d’una v.a discreta (F): funció que associa cada valor de la variable la probabilitat que es presenti aquest valor o qualssevol inferior. Equival a la freqüència relativa acumulada (F(x)= P(x<- xi)). X1 f(x1) F(x1) 0 1/8 1/8 1 3/8 4/8 2 3/8 7/8 3 1/8 8/8 1 VALOR ESPERAT I VARIÀNCIA VALOR ESPERAT (v.e): sumatori del producte de cada valor de la variable per la seva probabilitat. Equival a la mitjana aritmètica. 10) E (X ) = x i f ( x i ) VARIÀNCIA (v): Producte del quadrat dels valors de la variable per la probabilitat d’ocurrència menys el valor esperat al quadrat. 11) V (X ) = x i2 f ( x i ) - [E (X )] 2 Exemple: Llançament de tres monedes X1 f(x1) F(x1) Ex1 f(x1) x2 f(x1) 0 1/8 1/8 0 02 (1/8)= 0 1 3/8 4/8 3/8 3/8 2 3/8 7/8 6/8 12/8 3 1/8 8/8 3/8 9/8 12/8=1,5 1 (valor esperat no observable) 24/8=3 (variància) E(x) = 1.5 V(x) = 3 – 1,5 = 0,75 PROPIETATS DEL VALOR ESPERAT: 1. El valor esperat d’una suma (o resta) de v.a és igual a la suma (o resta) dels valors esperats de les v.a. 12) E (X 1 X 2 ) E(X1) (X 2 ) 2. Si sumem dues variables i calculem els seus valors esperats, serà el mateix que calcular els valors esperats de cada variable independentment i sumar-los. Exemple: Nº de cares al llançar tres monedes + Nº de cares al llançar 5 monedes. 3. Els valors esperats del producte d’una constant (K) per una v.a és igual al producte de la constant per la v.a. 13) E ( k X ) = k E (X ) És a dir que, si multipliquem una variable aleatòria per2 i calculem el valor esperat, serà el mateix que si calculem el valor esperat de la v.a original i ho multipliquem per 2. 4. El valor esperat d’una constant (K) és la pròpia constant (K) 14) E ( k ) = k 5. Els valors esperats del producte de variables aleatòries és igual al producte dels valors esperats de les variables aleatòries si són independents. 15) E ( X 1 X 2 )= E( X 1 ) E( X 2 ) És a dir que si tinc dues v.a independents i les multiplico, també multiplicaré els seus valors esperats. PROPIETATS DE LA VARIÀNCIA: 1. La variància d’una constant (K) és igual a 0. 16) V ( k ) = 0 2. La variància del producte d’una constant (K) per una v.a és igual al quadrat de la constant (K) per la variància de la v.a. 17) V ( k X ) = k 2 V(X) És a dir que si multiplico una v.a per una constant serà el mateix que multiplicar la variància per la constant (K) al quadrat. 3. La variància d’una v.a no varia si sumem (o restem) una constant (K) als seus valors. 18 )V ( X k ) V ( X ) 4. La variància d’una suma (o resta) d’una v.a és igual a la suma (en ambdós casos) 19) V(X de 1 les X 2 variàncies de ) V (X 1) (X les 2 v.a si són independents. ) És a dir que si sumo dues variables amb les seves variàncies, obtindré el mateix que si sumo les variables independentment. 5. La variància sempre és positiva 6. La desviació estàndard (o típica) es defineix com l’arrel quadrada positiva de la variància. VARIABLES ALEATÒRIES CONTÍNUES (gràfic histograma) Quan treballem amb v.a contínues, parlem de FUNCIÓ DE DENSITAT DE PROBABILITAT i no de Funció de probabilitat, al voltant d’un valor (probabilitat dins d’un interval). La probabilitat associada a un valor puntual (exemple 50) és 0. FUNCIÓ DE DENSITAT DE PROBABILITAT d’una v.a contínua: Condicions: 1. F(x) <- 0 (funció sempre positiva) + 2. 20) E (X ) = x f (x) dx (l’àrea sota la corba de l’histograma és 1, és la - probabilitat total) FUNCIÓ DE DISTRIBUCIÓ d’una v.a contínua: Funció que associa a cada valor de la variable, la probabilitat que es presenti com a molt en aquest valor. VALOR ESPERAT I VARIÀNCIA: Ambdós conceptes en una v.a contínua tenen les mateixes propietats que les indicades per a les v.a discretes. + + 21) V (X ) = x 2 2 f (x) dx - [E(X) ] 20) E (X ) = x f (x) dx - - ACTIVITAT Comprova les prediccions dels valors esperats i les variàncies si... Y = x+2 X Y = x+2 f(xi) 0 2 1/8 1 3 3/8 2 4 3/8 3 5 E(x) = 1,5 V(x) = 0,75 Prediccions: E(Y) = 1,5 + 2 = 3,5 1/8 V(Y) = 0,75 + 2 = 2,75 Y = 2x X Y = 2x f(xi) 0 0 1/8 1 2 3/8 2 4 3/8 3 6 E(x) = 1,5 V(x) = 0,75 Prediccions: E(Y) = 1,5 * 2 = 3 V(Y) = 22 * 0,75 = 3 1/8 MODELS DE DISTRIBUCIÓ DE PROBABILITAT Per a v.a discretes: DISTRIBUCIÓ BINOMIAL Per a v.a contínues: DISTRIBUCIÓ NORMAL DISTRIBUCIÓ X2 DISTRIBUCIÓ “t” DE STUDENT FISHER DISTRIBUCIÓ “F” DE SNEDECOR Model de distribució de probabilitat de v.a discretes: DISTRIBUCIÓ BINOMIAL Exemple: Tenim una aixa grossa al damunt de la taula plena de boles. Algunes d’aquestes boles són blanques i d’altres són negres. No sabem la quantitat de boles que hi ha però sabem que la proporció de boles blanques és P que pren valors entre 0 (cap bola) i 1 (una bola). Si P és la proporció de boles blanques, llavors, la proporció de boles negres és de 1-P que és Q on P+1=1. Anem extraient boles de manera que agafem una bola, mirem el seu color i la tornem a posar dins de la caixa (REPOSICIÖ). D’aquesta manera anem extraient boles fins a treure N boles on N és la quantitat de boles extretes de la caixa. D’altra banda, existeixen unes condicions d’extracció de boles: - A cada extracció, totes les boles tenen la probabilitat d’ésser triades (EXTRACCIÖ ALEATÔRIA) - Donat que hi ha reposició, el valor de proporció de P es manté constant durant totes les extraccions (EXTRACCIÓ AMB REEMPLAÇAMENT) - De les N boles, K (quantitat de boles blanques) són blanques on K<- N - La proporció de les boles blanques P(K) pot ser o no igual a la proporció de la mostra total P(N) Ara, tornem a fer una extracció de N boles de la caixa. En aquest cas pot ser que K (quantitat de boles blanques) sigui igual a K (K=K), és a dir, que hi hagi la mateixa proporció de K, o diferent (K’). D’aquesta manera, l’espai mostral resta entre 0 i N passant er un valor K no definit: E=(0, 1, ............., K, ..........., N) Finalment, si a cada valor de l’espai mostral li associo la seva probabilitat d’ocurrència, es defineix una distribució binomial. E=(0, 1, ..................., k, ..................., N) P=[P(0), P(1), .................., P(K), ..................., P(N)] La llei binomial permet calcular la probabilitat de trobar exactament, en una extracció, K boles blanques en una mostra mitjançant aquesta fòrmula: n! 22) P ( k ) = k p (1 - p ) n-k k ! (n - k)! On N= quantitat total de boles (mida de la mostra) K= proporció de boles blanques O= proporció de boles blanques a la caixa (probabilitat d’extreure una bola blanca) N! (factorial) N= 4! = 4*3*2*1 N=6! = 6*5*4*3*2*1 N=0! = 1 (per definició) Una variable s’ajusta al model binomial si: És dicotòmica (admet només dos valors) Cada assaig és independent dels anteriors (selecció amb reemplaçament o mostres infinites) Exemple: Calcular la probabilitat d’obtenir dues cares en 6 llançaments d’una moneda E=(CCCCCC, CCCCCX, CCCCXC, CCCXCC, ...) Per simplificar apliquem la llei binomial: N=6 K=2 P(K)= 6! (0’5)2 (1-0’5)6-2 = 0’2344375 2! (6-2)! P=0’5 Característiques de la distribució binomial V(e) E(X)= h*p (formula 23) V(X)= n*p*q (formula 24) Una llei binomial queda definida si coneixem els paràmetres N i P de la següent manera: B(n*p) Exemple: E=(0, 1, 2, 3, 4, 5, 6) on P(2)= 0,2344375 Model de distribució de probabilitats de v.a contínues: DISTRIBUCIÓ NORMAL: El model de distribució normal fou formulat per Gauss quan estudiava els errors de mesura. En finalitzar el treball li va sorgir una corba: Característiques: Té forma de campana És asimètrica respecte la recta vertical que passa pel punt X=mitjana) Té dos punts d’infecció (canvi de direcció) que són: Xi=i Xj=on mitjanaidesviació estàndard) La llei normal ve definida pels paràmetres i : X E N( Abans de fer cap càlcul haurem de transformar qualssevol corba normal en una corba normal tipificada amb N=(0,1). Quan es tipifica una variable, fem un canvi d’origen i d’escala. Gràficament: CANVI D’ESCALA CANVI D’ORIGEN Exemple: 1. Donat un valor, calcular la probabilitat que la variable prengui valors superiors a ell: Calcular la probabilitat que una v.a N(4, 2) prengui valors superiors a 5. Passos: Construcció de la gràfica Tipificació del valor del valor de la variable mitjançant la fórmula: z= x- Tornar a elaborar la gràfica tipificada Buscar, en les taules d’estadística el valor que correspon al nou valor tipificat 4 5 N(4,2) N(0,1)Apliquem la fórmula de la tipificació d’un valoronzx z= 5-4 = ½ = 0’5 2 P(x>5)= 0’3085 0 0’5 2. Donat un valor, calcular la probabilitat que la variable prengui valors més petits que ell (per a N(4,2), calcular P(x< -1)) 4 z= -1-4 = -5/2 = -2’5 2 -1 P(x< -1)= 0’0062 3. Donat un valor, calcular la probabilitat que la variable prengui qualsevol valor entre dos valors (per a N(4,2), calcular P1<x<5)) 1 4 5 1: 1-4/2 = -3/2 =-1’5 = 0’3085 0’3085 – 0’0668 = 0’3753 5: 5-4/2 = ½ = 0’5 = 0’0668 1 – 0’3753 = 0’6247 4. Donat un valor, calcular la probabilitat que la variable prengui qualsevol valor entre dos valors (per a N(4,2), calcular P(4’5<x<6)) 4 4’5 6 4’5: 4’5 – 4/2 = 0’5/2 = 0’25 = 0’4013 0’4013 – 0’1587 = 0’2426 6: 6-4/2 = 2/2 = 1 = 0’1587 1- 0’2426= 0’7574 ACTIVITAT A l’exemple de distribució binomial, calcula: Probabilitats associades als diferents esdeveniments elementals. V(x) i E(x) Representació gràfica Exemple: El 40% de la població adulta està a favor de l’horari comercial flexible. A una mostra de 200 subjectes seleccionats a l’atzar de la població d’adults li preguntem la seva opinió sobre el tema. Calcula la probabilitat que 70 o més dels subjectes estiguin a favor. Aproximació de la llei binomial a la llei normal En aquest exemple es pot fer ús de la llei normal per aproximar una llei biomial en el cas de tenir mostres grans. Una mostra es considerarà gran quan es doni que el `producte de N*P i N*Q sigui superior a 5. En mostres grans, la llei normal és una bona aproximació de la llei binomial. A la pràctica, es pot fer ús de la llei normal com a aproximació de la llei binomial quan el producte “NP” i “NQ” són, ambdós, superiors o iguals a 5. Transformació B(n,p) N(np, npq ) Resolució de l’exemple N= 200, P= 40%= 0’4 B(200, 0’4) N(80, 6’93) on P(x->70) z= 70-80 Transformació: (200*0’4, = -1’44 P(x_>70)= 1- 0’0749= 0’925 6’93 0’0749 70 80 0’6 (1-p=q) ) -1’44 Moltes variables psicològiques segueixen el model de distribució de la llei normal, com per exemple, el quocient intel·lectual. D’altra banda, determinades transformacions d’aquestes variables segueixen altres models de distribució. Els que tractarem en aquest temari són les següents: 2 de Pearson “t” d’Student-Fisher “F” d’Snedecor DISTRIBUCIÓ 2 DE PARSON: Suposem que tenim una sèrie de variables aleatòries (z, z1, z2, ......., zn), independents entre si i amb una distribució N(0,1). Si elevem aquestes variables, en sorgeix una nova variable amb distribució 2. 2 = (z2, z12, ......................, zn2) Aquesta nova variable aleatòria segueix una distribució 2 de Pearson amb n graus de llibertat. Un cas particular el trobem quan una variable z segueix una distribució normal tipificada N(0,1), la nova variable z2 seguirà una distribució2 de Pearson amb un grau de llibertat. Característiques: La distribució 2 de Pearson depèn només dels graus de llibertat, de manera que el seu valor màxim coincideix amb els graus de llibertat. Sempre és positiva (és una suma de quadrats) on el camp de variabilitat resta de (0, +infinit). El valor esperat E(x) i la variància (xI de la distribució, vénen donats per: 28) E ( n ) = n 2 i 29) V ( n ) = 2 n 2 La distribució és assimètrica i assímptota per la dreta però no per l’esquerra. Quan els graus de llibertat tendeixen a infinit, la distribució 2 de Pearson tendeix a llei normal. Teorema de l’addició: si sumem dues variables amb distribució 2 de Pearson, el resultat també seguirà una distribució 2 de Pearson on els graus de llibertat seran la suma dels graus de llibertat de les variables inicials (2 n1+n2 = 2 n1 + 2 n2). Ús de les taules 2 de Pearson (pàg. 17): Cada línia correspon a una distribució diferent (en funció dels graus de llibertat ). L’àrea que limita a la dreta d’un determinat valor de la variable, encapçala cada columna. Exemples: 1. Sigui una distribució 2 de Pearson amb = 29, calcula P(x<42’56) 0’05 P(x<42’56) = 1-0’05 = 0’95 42’56 2. Sigui una distribució 2 de Pearson amb = 15, calcula P(5’23 < x < 25) P(5’23 < x < 25) = 0’99-0’05 = 0’94 5’23 25 0’05 0’99 DISTRIBUCIÓ “t” DE STUDENT-FISHER: Sigui Y una variable aleatòria N(0,1) i 2 una altra variable aleatòria amb distribució 2 de Pearson amb n graus de llibertat i independent de Y. Fem operacions i sorgeix una nova variable : 30) t n = Y 2 n n Aquesta nova variable segueix una distribució “t” de Student-Fisher amb n graus de llibertat. Característiques: És simètrica i centrada en 0. És aquí (en 0) on coincideixen el valor esperat, la mediana i la moda. El valor esperat i la variància vénen donats per: 31) E ( t ) = 0 i 32) V ( t ) = n n - 2 El seu camp de variabilitat és de (- infinit, + infinit). Per a mostres a partir de n_>30, s’aproxima a la llei normal. Depèn només dels graus de llibertat. Ús de les taules “t” d’Student-Fisher (pàg. 27) Cada línia correspon a una distribució diferent ( en funció dels graus de llibertat ) La suma de l’àrea que limita a la dreta en un determinat valor de la variable positiu i que limita a l’esquerra el mateix valor negatiu, encapçala cada columna. (-) 0 (+) Exemples: 1. Sigui una distribució “t” amb =10, calcula P(x>2’23) P(x>2’23) = 0’05/2 = 0’025 0’05 2’23 2. Sigui una distribució “t” amb =30, calcular P(x<1’697) P(x<1’697) = 1- (0’10/2) = 0’95 0’10 1’697 3. Sigui una distribució “t” amb =7, calcular P(-2’365<x<3’499) DISTRIBUCIÓ “F” D’SNEDECOR: Sigui 2 1 i 2 2, des variables aleatòries independents amb distribucions 2 de Pearson amb n i n2 graus de llibertat. D’aquesta manera sorgeix la següent variable: 33) F = 2 1 n1 2 2 n2 Aquesta variable segueix una distribució “F” d’Snedecor amb n i n2 graus de llibertat F(n1, n2). Característiques: El seu camp de variació és (0, +infinit). La distribució és asimètrica i, quan n2 tendeix a infinit, coincideix amb 2 amb = n. El valor esperat i la variància vénen donats per: 34) E ( F n 1 , n 2 ) = 35) V ( F n 1 , n 2 ) = 2 n 22 ( n 1 + n 2 - 2) n 1 ( n 2 - 4) ( n 2 - 2 ) 2 n2 n2 - 2 i Ús de les taules “F” d’Snedecor (pàgs. 31-35) La intersecció de cada fila amb una columna, correspon a una distribució diferent (en funció dels graus de llibertat del numerador i del denominador). La primera columna indica l’àrea que limita a la dreta un determinat valor. Exemple: 1. Sigui una distribució “F” amb: a. (n1=5, n2= 10). Calcular el valor que limita a la dreta una àrea de 0’01 i 0’05. F(5,10) 5’64 3’33 0’01 0’05 b. (n1=6, n2=15). Calcular la P(x<4’32) i E(x) i V(x). F(6,15) 0’01 4’32 1-0’01= 0’99